Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 149
Скачиваний: 3
записывать в него сведения об объектах с различным количеством и составом характеристик. Таким образом, элементарное сообщение может выступать в. качестве основной единицы смысла в фактографической информа ционно-поисковой системе.
Для представления массива элементарных сообщений в виде ассоциативно-адресной структуры может быть использован узловой способ. По этому* способу сообще ния будут представлены узлами адресных отсылок, по три адреса в каждом узле (с учетом кодов отношений — по четыре адреса), а в процессе поиска будут просма триваться только такие сообщения, которые содержат хотя бы одно понятие из запроса. Для удобства поиска адресные узлы могут сопровождаться кодами сообщений в виде последовательностей кодов понятий.
Глав а 13 ПРИМЕРЫ АВТОМАТИЗИРОВАННЫХ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ
_ |
Автоматизированная фактографическая |
информационно-поисковая система |
|
^ |
Автоматизированная фактографическая поисковая |
система предназначена для накопления, хранения, об новления, поиска, обработки и выдачи потребителям све дений, поступающих от различных источников. Сведения, содержащие числовую и текстовую информацию, запи сываются по определенной форме на специальных блан ках (табл. 13.1), переносятся на перфоноситель и авто матически вводятся в ЭВМ.
На бланках указываются наименования объектов, наименования характеристик, значения характеристик и признаки логической связи между этими элементами со
общений (см. последнюю |
графу |
табл. |
13.1). Перечень |
|||||
|
|
Бланк формуляра сообщений |
Т а б л и ц а 13.1 |
|||||
п/п |
Наименование |
Наименование ха |
Значение |
Признак ло |
||||
объекта |
рактеристики |
характеристики |
гической связи |
|||||
ЛѴ |
||||||||
1 |
Бетонный за- |
Рабочие |
и слу- |
135 |
01 |
|||
2 |
вод |
■ |
жащие |
|
г. Бийск |
00 |
||
|
|
Местоположение |
2 2 4
№ |
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 1 3 .2 |
||
|
|
|
|
|
|
|
|
|
|
|
|
Условное |
||
|
|
|
|
|
|
Вид отношения |
|
|
|
обозначе |
||||
|
|
|
|
|
|
|
|
|
|
ние |
||||
п/п |
|
Объект X |
включает |
в свой состав элементы у |
в |
01 |
||||||||
1 |
|
|||||||||||||
2 |
количествеX |
г |
|
|
у |
|
|
объекты |
г, |
02 |
||||
|
Объект |
х |
включает |
в свой состав |
||||||||||
3 |
принадлежащиеу |
классу |
|
|
г,у |
принадлежа |
03 |
|||||||
|
Объект |
X |
имеет |
характеристику |
||||||||||
4 |
щую классу |
имеет |
z |
|
|
|
в |
количест |
04 |
|||||
|
Объект |
X |
характеристику |
г , |
||||||||||
5 |
венном выражении |
|
в состоянии у, |
|
отнесенном |
05 |
||||||||
к |
Объекту |
X |
находится |
|
||||||||||
6 |
классу |
|
|
имеет |
характеристику |
|
выраженную |
06 |
||||||
|
Объект |
X |
|
|||||||||||
7 |
кодом г . При этом код г не выражает |
количества |
07 |
|||||||||||
|
Объект |
|
|
у |
в состав объекта |
г , |
|
х , |
||||||
|
|
|
входит |
принадле |
|
|||||||||
8 |
жащегоz |
классу |
отношений |
между |
элементами |
|
00 |
|||||||
У, Прочие виды |
|
|||||||||||||
используемых |
|
в |
системе |
логических |
отношений |
дан |
||||||||
в табл. |
13.2. |
|
функционирования |
системы хранящиеся |
||||||||||
В процессе |
в ней сведения выдаются человеку по запросам, задавае мым на формализованном русском языке. Ответы на запросы вырабатываются машиной также на формали зованном русском языке и включают в качестве своих элементов наименования объектов, наименования харак теристик и числовые или текстовые значения характеристик.ДПриведем пример запроса на поиск информации и ответа на запрос.
Запрос 1 (Иванов).
А л т а й с к и й к р ай , п р о и з в о д ст в о ст р о и т е л ь н ы х м а т е р и а л о в , о б ъ е к т ы — (б ето н н ы е з а в о д ы ) , х а р а к т е р и с т и к и — (м е с т о п о л о ж е н и е или г о д о в а я п р о и з в о д и т е л ь н о с т ь ), ф о р м а в ы д а ч и — (т е к с т ) .
1 |
Ответ: * |
|
бето н н ы й з а в о д |
—(м е ст о п о л о ж е н и е ) — (г. Б и й с к );
— (го д о в а я п р о и зв о д и т е л ь н о ст ь ) — (50 000 т ) ; 2 б ето н н ы й з а в о д
—(м е ст о п о л о ж е н и е ) — (г. Б и й с к );
— (г о д о в а я п р о и зв о д и т е л ь н о ст ь ) — (150 000 т ) ; 25 б ето н н ы й з а в о д
—(м е ст о п о л о ж е н и е ) — ( г .К а м е н ь ) ;
— (го д о в а я п р о и зв о д и т е л ь н о ст ь ) — (15 000 т ) ;
* В ответе на запрос приведены условные данные.
15—310 |
225 |
137 завод железобетонных конструкций
—(местоположение) — (г. Барнаул);
—(годовая производительность) — (500 000 т).
Взапросе указывается его порядковый номер, фамилия или
адрес заказчика, признаки массивов информации (если |
они извест |
ны заказчику), наименования объектов и характеристик |
(или клас |
сов объектов и характеристик), значения характеристик, операторы обработки информации и признак формы выдачи ответа на запрос. Обязательными элементами запроса являются его порядковый номер, фамилия или адрес заказчика, наименования объектов и характе ристик и признак формы выдачи, остальные элементы — факульта тивные.
Значения характеристик указываются после их на именований. Границы между наименованиями и значе ниями характеристик обозначаются разделительными знаками. Перед числовыми значениями характеристик могут проставляться признаки «больше» или «меньше», а перед наименованиями характеристик — признаки ло гических отношений между объектами, характеристика ми и значениями характеристик. Предполагается, что характеристики и их значения относятся ко всем объек там, указанным в запросе.
Признаки массивов могут быть связаны друг с дру гом дизъюнктивной или конъюнктивной логической
связью. |
Первый вид связи обозначается сочинительным |
|||
союзом |
«или», |
второй — запятой. |
При |
одновременном |
использовании |
обоих видов связи |
более |
«тесной» счи |
тается дизъюнктивная связь. В памяти машины каждо му номеру массива сообщений ставится в соответствие его поисковый образ — перечень номеров понятий, обо значающих признаки массива. Процесс поиска номеров массивов по заданным признакам аналогичен процессу поиска номепов документов в документальных системах.
Если требуется получить сведения о нескольких объ ектах (или классах объектов), то их наименования пере числяются в запросе и отделяются одно от другого со чинительным союзом «или». Аналогично поступают и в том случае, когда требуется получить сведения о ряде характеристик объектов (или классов характеристик), но здесь наряду с дизъюнктивной используется также и конъюнктивная логическая связь.
Наименования объектов и характеристик (последние вместе с их значениями и кодами логических отноше ний) заключаются в скобки и сопровождаются словес ными признаками «объекты» и «характеристики». В тех
случаях, когда надо получить сведения о всех объектах, обладающих заданными характеристиками, или о всех характеристиках объекта или группы объектов, вместо наименований объектов и характеристик в скобках про ставляются прочерки.
Ответы на запросы могут содержать следующие све дения:
—отдельные характеристики единичных объектов;
—все характеристики одного объекта или группы 'объектов;
—все объекты, имеющие заданную характеристику
или группу характеристик;
—сведения об объектах указанного в запросе клас са, обладающих заданной характеристикой или группой характеристик;
—обобщенные характеристики объектов и классов объектов, удовлетворяющих условиям запроса.
'Сведения могут выдаваться заказчику в трех фор мах: в текстовой форме, в нерегламентной табличной форме, в регламентной табличной форме. В текстовой форме выдачи под каждым наименованием объекта ука зывается перечень наименований характеристик и зна чений этих характеристик. В табличной форме по одному входу таблицы (левому) указывается перечень наимено ваний объектов, по другому (верхнему)— перечень на именований характеристик, а на пересечении строк и столбцов указываются значения характеристик. Наиме нования объектов и характеристик объединяются в груп пы по признаку их принадлежности к более широким понятиям. Наименования более широких понятий также
"указываются в таблице. Нерегламентная табличная форма создается и заполняется автоматически по ре зультатам поиска и обработки информации. Регламент ная табличная форма создается человеком, а ее запол нение происходит автоматически. Ручная подготовка форм выдачи информации в ряде случаев позволяет улучшить качество ее оформления.
В ИПС предусмотрены следующие операторы обра ботки информации:
1)пересчет количества объектов, удовлетворяющих заданным условиям;
2)суммирование однородных значений характери стик для всех объектов, удовлетворяющих заданным условиям;
1 5 ; |
2 2 7 |
3)суммирование однородных значений характери стик, принадлежащих объектам заданных классов (от дельно для каждого класса объектов);
4)суммирование заданных классов значений харак теристик (отдельно для каждого объекта и каждого класса значений характеристик);
5)последовательное выполнение операций, указан ных в пп. 3, 4;
6)последовательное выполнение операций, указан ных в пп. 2, 3, 4.
В процессе работы системы используются следующие основные информационные массивы:
1)словарь основ слов;
2)словарь понятий;
3)классификационный словарь понятий;
4)массив сообщений;
5) массив буквенных кодов значений характеристик; I 6) массив буквенных кодов наименований понятий.
Первый словарь представляет собой упорядоченный перечень буквенных кодов основ слов, сопровождаемых грамматическими признаками, необходимыми для пра вильного распознавания различных форм слов. Каждой основе слова ставится в соответствие номер ее семан тического (смыслового) эквивалента. Одинаковые номе ра семантических эквивалентов присваиваются группам слов, элементы которых могут замещать друг друга при трансформациях словосочетаний (более подробно струк тура словаря основ описана в гл. 6, 7, 9).
Во втором словаре каждое наименование понятия представлено сочетанием номеров семантических экви валентов слов, входящих в его состав. При этом номер семантического эквивалента главного слова словосоче тания (первого слева существительного) ставится на первое место, а номера семантических эквивалентов остальных слов упорядочиваются по возрастанию их численных значений, причем в одной ячейке памяти за писывается по три номера. Пословные коды наименова ний понятий упорядочиваются по возрастанию их длины (по числу входящих в них слов), а в пределах участка словаря с кодами равной длины — по возрастанию чис ленных значений этих кодов. Каждый код словосочета ния сопровождается его номером (номером понятия) и адресной отсылкой к классификационному словарю по нятий.
2 2 8
В классификационном словаре каждому понятию ставится в соответствие перечень номеров эквивалентных ему по смыслу и подчиненных (более узких по объему) понятий. В одной ячейке памяти размещается по три но
мера |
понятия. При |
этом помер |
подчиняющего понятия |
|
пишется |
в начале |
массива |
подчиненных понятий, |
|
а в |
конце |
массива |
указывается разделительный при |
знак.
Четвертый массив состоит из последовательности эле ментарных сообщений. Каждое сообщение записывается в одной ячейке памяти и включает в свой состав номер наименования объекта, номер наименования характери стики, адресную отсылку к буквенному коду значения характеристики и код логической связи между объектом, характеристикой и значением характеристики (по табл. 13.2). Номера наименований объектов и характе ристик указываются по словарю понятий.
Пятый и шестой массивы, как это явствует из их на звания, содержат буквенные коды значений характери стик и наименований понятий, необходимые для декоди рования сообщений при их выдаче на печать. Перед буквенным кодом каждого значения характеристики ука зывается количество ячеек памяти, занимаемое этим зна чением (признак конца значения характеристики), а пе ред буквенным кодом каждого наименования понятия в отдельной ячейке записывается номер понятия. Ячей ка, отводимая под номер понятия, одновременно исполь зуется и для хранения признака начала записи его на именования (таким признаком служит нулевой код
встарших разрядах ячейки). . ПЙнформационно-поисковая система может работать
втрех режимах:
1)первоначальный ввод в машину основных инфор мационных массивов;
2)поиск сведений по запросам;
3)обновление основных информационных массивов.
Перед началом функционирования системы состав ляется словарь основ слов и словарь наименований по нятий, устанавливаются родо-видовые связи между по нятиями (для классификационного словаря) и заполня ются бланки сообщений (см. табл. 13.1). Родо-видовые связи фиксируются в классификационном словаре толь ко в тех случаях, когда они не выражены в словесных формулировках наименований понятий. Слозарь основ
2 2 9