Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 131

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ннями, фиксирующими родо-видовые отношения между понятиями, могут рассматриваться в качестве логиче­ ских посылок, из которых следует условная истинность высказывания— запроса (см. пп. 2,3). Таким образом, процесс установления смысловой связи между запросом и сообщениями информационной системы можно рас­ сматривать как процесс логического вывода.

Высказывания, выражающие родо-видовые отноше­ ния между понятиями, отличаются от прочих высказыва­ ний информационной системы тем, что они оказываются более устойчивыми и их истинность практически не за­ висит от каких-либо условий (прежде всего условий пространства и времени). Обычно их выделяют в от­ дельные массивы сведений и оформляют в виде класси­ фикационных словарей, классификационных схем, теза­ урусов и т. п.

6. В автоматизированных документальных поиско­ вых системах широко используется метод установления смысловых связей между запросами и документами, при

котором признаки

запроса

ищутся среди

признаков,

описывающих содержание

документов (метод поиска

«на вхождение»).

Существо этого метода

заключается

в следующем: запросы формулируются в виде перечней поисковых признаков, выраженных индексами слов или словосочетаний. Аналогичным образом представляются и формализованные описания документов. В процессе поиска документ считается релевантным (отвечающим на запрос), если поисковые признаки запроса содержат­ ся среди поисковых признаков, указанных в его форма­

лизованном

описании. Порядок следования признаков

в запросе и

сообщении, описывающем документ, не

играет роли.

Дальнейшим шагом вперед является использование при поиске отношений эквивалентности и подчинения между признаками (так называемых «базисных» отно­ шений), причем эти отношения иногда трактуются до­ статочно широко. Так, например, в системе «Пусто — Непусто — 4» [30] эквивалентными считаются не только тождественные, но и близкие по смыслу понятия, а от­ ношение подчинения включает не только родо-видовые связи, но и ряд других типов отношений между поня­ тиями, которые могут оказаться полезными в процессе поиска. Документ считается релевантным, если перечень его поисковых признаков включает все признаки запро­

68


са или признаки, эквивалентные и подчиненные призна­ кам запроса.

Такое правило установления смысловой связи между запросами и документами может рассматриваться в качестве некоторого приближения по отношению к пра­ вилам, изложенным в п. 3, 4, 5 настоящей главы, когда проверка выполнения условий (4.7) в высказываниях типа (4.5) и (4.6) производится без учета функциональ­ ной роли и порядка следования символов х, у, F.

Применение приближенного метода установления смысловых связей между сообщениями дает возмож­ ность находить сведения, удовлетворяющие запросу, но при этом возможна и выдача лишней информации (по­ явление поискового «шума»). Причинами возникнове­ ния «шумов» здесь является игнорирование синтаксиче­ ских связей между элементами сообщений и использо­ вание недостаточно строгих критериев при установле­ нии смысловых связей между понятиями (связей экви­ валентности и подчинения).

Учет синтаксических связей и. применение более строгих критериев при установлении смысловых связей между понятиями позволяют снизить уровень «шумов», но одновременно могут быть причиной потерь информа­ ции при поиске. Поэтому требования достижения мак­ симальной полноты и точности выдачи информации при поиске в некоторых случаях являются несовместимыми.

7. Сложный запрос вида

 

Fi(x 1 , х2, ...,

хт) V F2(yi, Уг,

Уп)

с д и з ъ ю н к т и в н о й

связью между

простыми выска­

зываниями определяет класс высказываний, который яв­ ляется объединением классов, полученных для запросов вида Fі(хі, х2,.. .,хт) и F2(yi,y2,...,yn) в результате поис-. ка по правилам, изложенным в пп. 3, 4, 5. Сложный за­ прос вида

Fi(Xi, х2„ . .,xm)&Fz(y\, у2„ . „уи)

с к о н ъ ю н к т и в н о й связью между простыми выска­ зываниями определяет класс высказываний, который яв­ ляется пересечением классов, полученных для запросов

Fі(Хі, х2, . . ., Хт) и Fz(yu у2, . . ., уп).

Всложных запросах с несколькими дизъюнктивными

иконъюнктивными связями операции объединения и пе­ ресечения классов высказываний выполняются последо­ вательно. Порядок выполнения операций определяется

69



системой скобок и назначением приоритета для одного из видов логической связи (дизъюнктивной или конъ­ юнктивной) .

8. В различных областях практической деятельности широко используются такие формы записи информации, когда сведения об объекте могут быть представлены в виде последовательности сообщений. Например, для объектов информационных таблиц указываются перечни их характеристик, а для документальных источников информации — перечни предметных рубрик, описываю­ щих их содержание (см. гл. 12, 13). Последовательность сообщений, относящихся к одному и тому же объекту х , может быть записана в виде сложного высказывания

Fi(x, а ь а 2, . . .,am) & F 2(x, bit b2>. ■ -,bn) & . . .

 

. . ,&Fq(x, Щ, Uz,. . .jUs).

'(4.8)

Из истинности высказывания (4.8) следует истин­ ность каждого элементарного высказывания и всех дизъюнкций и конъюнкций элементарных высказываний с количеством членов от 2 до q — 1 (здесь нижние индек­ сы символа F обозначают порядковые номера высказы­ ваний; при этом некоторые символы с различными по­ рядковыми номерами могут обозначать одинаковые от­ ношения) .

Процесс поиска по простому запросу выполняется в массиве элементарных высказываний согласно прави­ лам, изложенным в пп. 3, 4, 5. Поиск по сложному за­ просу, состоящему из высказываний, соединенных зна­ ком дизъюнкции, выполняется также в массиве элемен­ тарных сообщений. При этом результаты поиска, полу­ ченные для всех простых высказываний, объединяются.

В случае конъюнктивной связи между высказыва­ ниями в запросе поиск производится в массиве конъюн­ кций элементарных высказываний, являющихся следст­ вием высказываний вида (4.8). В качестве ответа выда­ ются такие конъюнкции, которые содержат число чле­ нов, равное числу простых высказываний в запросе, а составляющие их высказывания являются видовыми по отношению к родовым высказываниям запроса.

Сложный запрос, содержащий одновременно конъ­ юнктивные и дизъюнктивные логические связи между высказываниями, может быть представлен в дизъюнк­ тивной или конъюнктивной нормальной форме. Если за­ прос представляется в дизъюнктивной нормальной фор-

70


ме, то в процессе подготовки ответа па него объединя­ ются результаты поиска по каждой из конъюнкций (с исключением повторений одинаковых элементарных сообщений). Если запрос представляется в конъюнктив­ ной нормальной форме, то сначала производится поиск по дизъюнкциям высказываний, а в качестве ответа на запрос выдаются только такие сообіцения, у которых коды объектов содержатся во всех результатах поиска по дизъюнкциям высказываний.

9. Иногда при записи последовательности сообщений вида (4.8) коды объектов выносятся в начало этих по­ следовательностей и указываются только один раз. Этот прием используется при некоторых способах записи ин­ формационных таблиц и поисковых образов докумен­ тов. Такая форма записи сообщений не меняет существа логических отношений между их элементами, и на нее распространяются все положения, изложенные в п. 8.

10. Во всех предыдущих рассуждениях мы исключи­ ли из рассмотрения сложные высказывания со знаками отрицания. Дело в том, что в сообщениях обычно ука­ зываются далеко не все, а лишь наиболее существенные признаки объектов и четко не оговаривается, какие при­ знаки у них отсутствуют. Поэтому применение знаков отрицания в запросах часто бывает лишено смысла.

Основной мыслью настоящей главы является утвер­ ждение о том, что процесс поиска информации можно рассматривать как процесс логического вывода. Цен­ тральное место здесь занимают способы установления смысловых связей между понятиями, которые подробно излагаются в гл. 7—10. Но процесс поиска можно рас­ сматривать и с иных позиций — с точки зрения общих технических приемов выборки кодов из массивов закоди­ рованных сообщений. Эта сторона вопроса представлена в гл. 5, 6.

Г л а в а 5 СПОСОБЫ АВТОМАТИЧЕСКОГО ПОИСКА В МАССИВАХ КОДОВ

Процесс обработки информации с помощью ЭВМ обычно представляет собой чередование этапов поиска информации в различных массивах кодов и этапов вы­ полнения логических или арифметических операций над результатами поиска. Поиск ведется по определенным

71

признакам. При этом выбираются коды или последова­

тельности кодов,

которые мы

назовем э л е м е н т а м и

и н ф о р м а ц и и .

И признаки,

и элементы информации

могут иметь различную структуру. Это могут быть сло­ ва, числа или любые буквенно-цифровые обозначения. Слова и буквенно-цифровые обозначения можно рас­ сматривать как целые числа, записанные в позиционной

системе счисления с

основанием,

равным количеству

букв и цифр в алфавите.

 

Пусть Х{хи Х2 , . . ., Хт}—конечное множество попарно­

различных поисковых

признаков, а

У{уі, у2>. . ,,уп} — ко­

нечное множество элементов информации, и пусть зада­ но некоторое отображение множества X на множество У

так, что каждому элементу Хі

множества X ставится

в соответствие один из элементов у^ множества

У, т. е.

имеет место функциональная зависимость

 

y = f(x).

.

(5.1)

Тогда функция (5.1) может быть представлена в виде перечня пар элементов Xiyj, а процесс поиска элемента Уі множества У по элементу Хі множества X можно свести к процессу идентификации заданного кода Хі с од­ ним из кодов левой части перечня и к выборке соответ­ ствующего ему кода Уі в правой части перечня.

В ЭВМ относительное положение чисел х и у, входя­ щих в пары ху, всегда может быть строго фиксировано, и при известном адресе числа х выборка числа у не пред­ ставляет никаких затруднений. Основная трудность при поиске и выборке информации состоит в определении места записи (адреса) числа х в запоминающем устрой­ стве ЭВМ. Для облегчения поиска адресов чисел х целе­ сообразно расположить эти числа в порядке возраста­ ния их величины. Тогда можно применить ряд эффек­ тивных приемов.

Пусть числа х записаны в отдельных ячейках запо­ минающего устройства ЭВМ. Тогда имеет место взаим­ но-однозначное соответствие между этими числами и их адресами К в ЗУ. Если, кроме того, числа х расположе­

ны в порядке возрастания их величины, то

функция

K = f( x )

(5.2)

будет монотонно возрастающей.

(5.2) мож4ет

Иногда функциональная зависимость

быть представлена достаточно простым аналитическим

72