Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 131
Скачиваний: 3
ннями, фиксирующими родо-видовые отношения между понятиями, могут рассматриваться в качестве логиче ских посылок, из которых следует условная истинность высказывания— запроса (см. пп. 2,3). Таким образом, процесс установления смысловой связи между запросом и сообщениями информационной системы можно рас сматривать как процесс логического вывода.
Высказывания, выражающие родо-видовые отноше ния между понятиями, отличаются от прочих высказыва ний информационной системы тем, что они оказываются более устойчивыми и их истинность практически не за висит от каких-либо условий (прежде всего условий пространства и времени). Обычно их выделяют в от дельные массивы сведений и оформляют в виде класси фикационных словарей, классификационных схем, теза урусов и т. п.
6. В автоматизированных документальных поиско вых системах широко используется метод установления смысловых связей между запросами и документами, при
котором признаки |
запроса |
ищутся среди |
признаков, |
описывающих содержание |
документов (метод поиска |
||
«на вхождение»). |
Существо этого метода |
заключается |
в следующем: запросы формулируются в виде перечней поисковых признаков, выраженных индексами слов или словосочетаний. Аналогичным образом представляются и формализованные описания документов. В процессе поиска документ считается релевантным (отвечающим на запрос), если поисковые признаки запроса содержат ся среди поисковых признаков, указанных в его форма
лизованном |
описании. Порядок следования признаков |
в запросе и |
сообщении, описывающем документ, не |
играет роли.
Дальнейшим шагом вперед является использование при поиске отношений эквивалентности и подчинения между признаками (так называемых «базисных» отно шений), причем эти отношения иногда трактуются до статочно широко. Так, например, в системе «Пусто — Непусто — 4» [30] эквивалентными считаются не только тождественные, но и близкие по смыслу понятия, а от ношение подчинения включает не только родо-видовые связи, но и ряд других типов отношений между поня тиями, которые могут оказаться полезными в процессе поиска. Документ считается релевантным, если перечень его поисковых признаков включает все признаки запро
68
са или признаки, эквивалентные и подчиненные призна кам запроса.
Такое правило установления смысловой связи между запросами и документами может рассматриваться в качестве некоторого приближения по отношению к пра вилам, изложенным в п. 3, 4, 5 настоящей главы, когда проверка выполнения условий (4.7) в высказываниях типа (4.5) и (4.6) производится без учета функциональ ной роли и порядка следования символов х, у, F.
Применение приближенного метода установления смысловых связей между сообщениями дает возмож ность находить сведения, удовлетворяющие запросу, но при этом возможна и выдача лишней информации (по явление поискового «шума»). Причинами возникнове ния «шумов» здесь является игнорирование синтаксиче ских связей между элементами сообщений и использо вание недостаточно строгих критериев при установле нии смысловых связей между понятиями (связей экви валентности и подчинения).
Учет синтаксических связей и. применение более строгих критериев при установлении смысловых связей между понятиями позволяют снизить уровень «шумов», но одновременно могут быть причиной потерь информа ции при поиске. Поэтому требования достижения мак симальной полноты и точности выдачи информации при поиске в некоторых случаях являются несовместимыми.
7. Сложный запрос вида |
|
|
Fi(x 1 , х2, ..., |
хт) V F2(yi, Уг, |
• Уп) |
с д и з ъ ю н к т и в н о й |
связью между |
простыми выска |
зываниями определяет класс высказываний, который яв ляется объединением классов, полученных для запросов вида Fі(хі, х2,.. .,хт) и F2(yi,y2,...,yn) в результате поис-. ка по правилам, изложенным в пп. 3, 4, 5. Сложный за прос вида
Fi(Xi, х2„ . .,xm)&Fz(y\, у2„ . „уи)
с к о н ъ ю н к т и в н о й связью между простыми выска зываниями определяет класс высказываний, который яв ляется пересечением классов, полученных для запросов
Fі(Хі, х2, . . ., Хт) и Fz(yu у2, . . ., уп).
Всложных запросах с несколькими дизъюнктивными
иконъюнктивными связями операции объединения и пе ресечения классов высказываний выполняются последо вательно. Порядок выполнения операций определяется
69
системой скобок и назначением приоритета для одного из видов логической связи (дизъюнктивной или конъ юнктивной) .
8. В различных областях практической деятельности широко используются такие формы записи информации, когда сведения об объекте могут быть представлены в виде последовательности сообщений. Например, для объектов информационных таблиц указываются перечни их характеристик, а для документальных источников информации — перечни предметных рубрик, описываю щих их содержание (см. гл. 12, 13). Последовательность сообщений, относящихся к одному и тому же объекту х , может быть записана в виде сложного высказывания
Fi(x, а ь а 2, . . .,am) & F 2(x, bit b2>. ■ -,bn) & . . . |
|
. . ,&Fq(x, Щ, Uz,. . .jUs). |
'(4.8) |
Из истинности высказывания (4.8) следует истин ность каждого элементарного высказывания и всех дизъюнкций и конъюнкций элементарных высказываний с количеством членов от 2 до q — 1 (здесь нижние индек сы символа F обозначают порядковые номера высказы ваний; при этом некоторые символы с различными по рядковыми номерами могут обозначать одинаковые от ношения) .
Процесс поиска по простому запросу выполняется в массиве элементарных высказываний согласно прави лам, изложенным в пп. 3, 4, 5. Поиск по сложному за просу, состоящему из высказываний, соединенных зна ком дизъюнкции, выполняется также в массиве элемен тарных сообщений. При этом результаты поиска, полу ченные для всех простых высказываний, объединяются.
В случае конъюнктивной связи между высказыва ниями в запросе поиск производится в массиве конъюн кций элементарных высказываний, являющихся следст вием высказываний вида (4.8). В качестве ответа выда ются такие конъюнкции, которые содержат число чле нов, равное числу простых высказываний в запросе, а составляющие их высказывания являются видовыми по отношению к родовым высказываниям запроса.
Сложный запрос, содержащий одновременно конъ юнктивные и дизъюнктивные логические связи между высказываниями, может быть представлен в дизъюнк тивной или конъюнктивной нормальной форме. Если за прос представляется в дизъюнктивной нормальной фор-
70
ме, то в процессе подготовки ответа па него объединя ются результаты поиска по каждой из конъюнкций (с исключением повторений одинаковых элементарных сообщений). Если запрос представляется в конъюнктив ной нормальной форме, то сначала производится поиск по дизъюнкциям высказываний, а в качестве ответа на запрос выдаются только такие сообіцения, у которых коды объектов содержатся во всех результатах поиска по дизъюнкциям высказываний.
9. Иногда при записи последовательности сообщений вида (4.8) коды объектов выносятся в начало этих по следовательностей и указываются только один раз. Этот прием используется при некоторых способах записи ин формационных таблиц и поисковых образов докумен тов. Такая форма записи сообщений не меняет существа логических отношений между их элементами, и на нее распространяются все положения, изложенные в п. 8.
10. Во всех предыдущих рассуждениях мы исключи ли из рассмотрения сложные высказывания со знаками отрицания. Дело в том, что в сообщениях обычно ука зываются далеко не все, а лишь наиболее существенные признаки объектов и четко не оговаривается, какие при знаки у них отсутствуют. Поэтому применение знаков отрицания в запросах часто бывает лишено смысла.
Основной мыслью настоящей главы является утвер ждение о том, что процесс поиска информации можно рассматривать как процесс логического вывода. Цен тральное место здесь занимают способы установления смысловых связей между понятиями, которые подробно излагаются в гл. 7—10. Но процесс поиска можно рас сматривать и с иных позиций — с точки зрения общих технических приемов выборки кодов из массивов закоди рованных сообщений. Эта сторона вопроса представлена в гл. 5, 6.
Г л а в а 5 СПОСОБЫ АВТОМАТИЧЕСКОГО ПОИСКА В МАССИВАХ КОДОВ
Процесс обработки информации с помощью ЭВМ обычно представляет собой чередование этапов поиска информации в различных массивах кодов и этапов вы полнения логических или арифметических операций над результатами поиска. Поиск ведется по определенным
71
признакам. При этом выбираются коды или последова
тельности кодов, |
которые мы |
назовем э л е м е н т а м и |
и н ф о р м а ц и и . |
И признаки, |
и элементы информации |
могут иметь различную структуру. Это могут быть сло ва, числа или любые буквенно-цифровые обозначения. Слова и буквенно-цифровые обозначения можно рас сматривать как целые числа, записанные в позиционной
системе счисления с |
основанием, |
равным количеству |
букв и цифр в алфавите. |
|
|
Пусть Х{хи Х2 , . . ., Хт}—конечное множество попарно |
||
различных поисковых |
признаков, а |
У{уі, у2>. . ,,уп} — ко |
нечное множество элементов информации, и пусть зада но некоторое отображение множества X на множество У
так, что каждому элементу Хі |
множества X ставится |
|
в соответствие один из элементов у^ множества |
У, т. е. |
|
имеет место функциональная зависимость |
|
|
y = f(x). |
. |
(5.1) |
Тогда функция (5.1) может быть представлена в виде перечня пар элементов Xiyj, а процесс поиска элемента Уі множества У по элементу Хі множества X можно свести к процессу идентификации заданного кода Хі с од ним из кодов левой части перечня и к выборке соответ ствующего ему кода Уі в правой части перечня.
В ЭВМ относительное положение чисел х и у, входя щих в пары ху, всегда может быть строго фиксировано, и при известном адресе числа х выборка числа у не пред ставляет никаких затруднений. Основная трудность при поиске и выборке информации состоит в определении места записи (адреса) числа х в запоминающем устрой стве ЭВМ. Для облегчения поиска адресов чисел х целе сообразно расположить эти числа в порядке возраста ния их величины. Тогда можно применить ряд эффек тивных приемов.
Пусть числа х записаны в отдельных ячейках запо минающего устройства ЭВМ. Тогда имеет место взаим но-однозначное соответствие между этими числами и их адресами К в ЗУ. Если, кроме того, числа х расположе
ны в порядке возрастания их величины, то |
функция |
K = f( x ) |
(5.2) |
будет монотонно возрастающей. |
(5.2) мож4ет |
Иногда функциональная зависимость |
быть представлена достаточно простым аналитическим
72