Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 166

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

вительному) и определяющим его прилагательным на­ значается информация «именительный падеж, единст­ венное число», а на прилагательные переносится признак рода главного слова. Далее выполняется операция выде­ ления общей части наборов переменной грамматической информации в группах слов, состоящих из существитель­ ного и зависимых от него прилагательных. В результате выполнения этой операции получается либо однозначная грамматическая информация, либо наборы грамматиче­ ской информации, которые в дальнейшем используются для назначения информации к существительным и при­ лагательным.

Информация к существительным уточняется в сле­ дующем порядке. Если существительное управляется предлогом, то ему назначается первый элемент из соот­ ветствующего набора, который содержит информацию о падеже, допустимую для данного типа предлогов (см. табл. 7.1). Если же существительное управляется дру­ гим существительным, то элемент набора выбирается с учетом возможных для такого существительного зна­ чений признака падежа. При этом сначала ищется эле­ мент с признаком родительного падежа, затем с призна­ ком творительного и, наконец, с признаком дательного падежа. Информация, выбранная для существительных, распространяется и на подчиненные им прилагательные. Неизменяемым словам словосочетания назначается «ну­ левая» информация.

Заключительным этапом синтаксического анализа является приведение структуры словосочетания к кано­ ническому виду. При этом выполняются следующие опе­ рации: 1) прилагательные ставятся перед теми сущест­ вительными, которые они определяют, и упорядочивают­ ся по возрастанию номеров слов; 2) существительные, соединенные сочинительным союзом, располагаются 'по возрастанию их словарных номеров (при этом в случае необходимости изменяется расположение слов относи­ тельно союза); 3) группы слов, соединенные сочини­ тельным союзом и управляемые существительными, рас­ полагаются таким образом, чтобы управляемые слова были упорядочены по возрастанию их номеров; 4) код главного слова словосочетания выносится на первое место; 5) в соответствии с произведенными трансфор­ мациями производится перенумерация слов в словосоче­ тании и перекодировка схемы связей между ними.

172

Поиск и отождествление наименований понятий

Заключительным этапом автоматического кодирова­ ния словосочетаний является поиск по словарю понятий с целью замены кодов, полученных в результате синтак­ сического анализа, на номера понятий. Отождествление исходных и словарных наименований понятий произво­ дится в следующем порядке. Сначала сочетание номе­ ров слов и грамматическая структура кодируемого наи­ менования понятия ищутся по списку сочетаний номеров слов и по списку грамматических структур словаря по­ нятий и заменяются порядковыми номерами по этим спискам. Далее по номеру понятия из словаря выбирает­ ся соответствующий ему номер грамматической струк­ туры и сравнивается с номером, полученным в резуль­ тате поиска по списку грамматических структур. Если эти номера совпадают, то понятия тождественны друг другу. В противном случае они не тождественны.

Среди наименований понятий, используемых в раз­ личных областях практической деятельности, встречают­ ся одинаковые по смыслу словосочетания, отличающиеся

друг от друга не только порядком

следования слов, но

и морфологической структурой

их основ (примером

являются пары словосочетаний «управляющее устройст­

во— устройство управления»,

«меры защиты — защит­

ные меры», «ртутные пары —

пары ртути»). Отождест­

вление таких наименований понятий связано с необходи­ мостью применять трансформации с изменением основ слов. В результате некоторые слова переходят из одного грамматического класса в другой (например, из класса существительных в класс прилагательных или наоборот), а порядок слов в словосочетании и грамматическая ин­ формация к словам изменяются.

Возможность применения трансформаций с измене­ нием основ слов не может быть определена по грамма­ тической структуре словосочетания. Поэтому приходится вводить в словарь понятий дополнительную информацию в виде номеров т р а н с ф о р м а ц и о н н ы х к л а с с о в с л о в о с о ч е т а н и й , определяющих правила преобра­ зования их грамматических структур и словарного со­ става. Различные правила преобразования задаются списком. В словаре слов, в свою очередь, для каждого номера слова указывается номер эквивалентного ему по смыслу слова из другого грамматического класса (для

173


существительного — помер прилагательного, а для при­ лагательного — номер существительного).

Процедура поиска и отождествления наименований понятий с переводом слов из одного грамматического класса в другой выполняется путем последовательного просмотра участков словаря понятий, удовлетворяющих двум условиям:

1) количество слов в словарных словосочетаниях рав­ но количеству слов в исходном словосочетании;

2) главные слова исходного словосочетания и сло­ варных словосочетаний совпадают.

В процессе просмотра для каждого словосочетания словаря формируется его трансформационный ва­ риант, который сравнивается с кодируемым словосоче­ танием.

Слова из класса существительных в класс прилага­ тельных и обратно могут переводиться не только с по­ мощью таблицы, в которой для каждого номера слова из одного класса указывается номер слова из другого класса, по и путем использования закономерностей сло­

вообразования.

При этом номерам основ слов ставятся,

в соответствие

номера т р а н с ф о р м а ц и о н н ы х клас­

сов слов, определяющих порядок преобразования бук­ венных кодов основ. Трансформационные классы основ слов задаются списком правил, в которых указывается, сколько конечных букв следует отделить от основы при ее преобразовании и какое буквосочетание после этого присоединить. Вновь сформированные буквенные коды основ ищутся в словаре и заменяются их номерами.

Декодирование понятий

Подобно процессу кодирования наименований поня­ тий их декодирование также осуществляется в три эта­ па. Сначала по номеру понятия из словаря выбираются соответствующие ему сочетание номеров слов и номер грамматической структуры. Затем из списка грамматиче­

ских

структур

извлекается информация

о формах

слов

и о

р связях,

а также корректируется

порядок

слов

в словосочетании (номер главного слова ставится после номеров определяющих его прилагательных). На заклю­ чительном этапе формируются буквенные коды слово­ форм (см. гл. 7, 8).

174

У

і -


Алгоритмы декодирования понятии значительно про­ ще алгоритмов кодирования, в особенности если наиме­ нования понятий выдаются на печать в основной форме. Если же необходимо согласовать формы наименований понятий с их контекстным окружением, то главному сло­ ву и определяющим его прилагательным назначаются соответствующие число и падеж.

Обычно у именных словосочетаний изменяется только форма главного слова и определяющих его прилагатель­ ных. Но в некоторых случаях имеет место зависимость форм несогласованных определений и относящихся к ним прилагательных от числа главного слова (например, в словосочетаниях, «директор автомобильного завода — директора автомобильных заводов», «начальник цеха — начальники цехов» и т. п.). Возможность такого рода преобразования не может быть обнаружена по синтакси­ ческой структуре словосочетания. Поэтому для правиль­ ного синтеза различных форм словосочетаний необходи­ мо в словаре понятий указывать признак зависимости форм несогласованных определений от значения катего­ рии числа главного слова, а также количество существи­ тельных, на которое эта зависимость распространя­ ется.

Наряду со способами декодирования понятий, осно­ ванными на морфологическом синтезе слов, в АИС мо­ гут применяться и другие способы. Можно, например, хра­ нить в памяти машины таблицы соответствия между но­ мерами понятий и их буквенными кодами. Можно также представить наименования понятий в виде сочетаний

номеров

словоформ,

входящих

в

их состав,

и хранить

в памяти

машины

два словаря — словарь

пословных

кодов наименований

понятий

и

словарь

словоформ.

В этом

случае декодирование

понятий будет произво­

диться

в два этапа: сначала,

с помощью первого сло­

варя, номера понятий заменяются па их пословные коды, затем, с помощью второго словаря, пословные коды наи­ менований понятий заменяются на их буквенные коды. Последние два способа декодирования понятий очень просты, но их применение связано с необходимостью хранения в памяти машийы дополнительных словарей. Кроме того, здесь можно получать только одну форму наименований понятий.

175


Глава 10 АВТОМАТИЧЕСКОЕ УСТАНОВЛЕНИЕ СМЫСЛОВЫХ СВЯЗЕЙ МЕЖДУ п о н я т и я м и

Классификационный словарь понятий

Под термином « к л а с с и ф и к а ц и я » обычно пони­ мается распределение объектов по классам на основе присущих им признаков. Классификация имеет важное значение, так как она является обобщенным выражением опыта, накопленного человечеством в различных обла­ стях деятельности, и позволяет формулировать законы, правила и практические рекомендации для групп объек­ тов. В ряде случаев решение об использовании какоголибо единичного объекта может быть принято только на основе знаний о его принадлежности к определенному классу и характеристик этого класса.

Классификация широко используется в науке, на про­ изводстве и в быту. Она отражается в системе понятий естественного языка, являющегося универсальным сред­ ством общения людей. Как правило, понятия в языке обозначают не единичные объекты, а классы объектов Даже имена собственные обычно распространяются на группы объектов, из которых единичные элементы выде­ ляются лишь в конкретной речезой ситуации. В клас­ сификации отражаются свойства вещей и явлений. Эти

свойства

столь

же многообразны,

сколь

многообразны

взаимные

связи

между

вещами и

явлениями. Поэтому

в различных науках и

в разных

сферах

практической

деятельности одни и те же вещи и явления могут груп­ пироваться по-разному. Даже в пределах одной науки или одной сферы практической деятельности в зависимо­ сти от поставленной цели применяются различные си­ стемы классификации.

Классы объектов, как и индивидуальные объекты, могут находиться в различных отношениях друг к другу. Выявление отношений между классами объектов являет­

ся задачей специалистов в конкретных

областях знаний

и практической деятельности. В АИС

эти отношения

фиксируются в виде сообщений и используются для по­ иска сведений по запросам.

Наиболее устойчивыми являются отношения включе­ ния по объему (родо-видовые отношения) и отношения типа «целое—часть». Эти и некоторые другие отношения

176


Ме&Лу классами Часто выделяются в специальные мас­

сивы

сообщений, которые носят название

к л а с с и ф и ­

к а ц и о н н ы х

схем, к л а с с и ф и к а ц и о н н ы х т а б ­

лиц

или

к л а с с и ф и к а ц и о н н ы х

с л о в а р е й .

В классификационных схемах фиксируются также отно­ шения эквивалентности между классами, которые можно рассматривать в качестве частного случая родо-видовых отношений (каждый из двух эквивалентных классов включает в свой состав другой класс).

Свойство, принадлежащее некоторому классу объек­ тов, принадлежит и всем более узким классам, входя­ щим в его состав. Поэтому какова бы ни была тема за­

проса при

поиске информации, всегда

можно

наряду

с данными,

в точности

соответствующими сформулиро­

ванной теме, выдавать

потребителю также данные по

более узким темам.

 

 

 

Аналогичное правило может быть распространено и

на отношения типа «целое — часть». Но

здесь

его при­

менение может привести к неверным результатам, так как далеко не всегда свойства объектов являются свой­ ствами и частей этих объектов. Тем не менее, отношения типа «целое — часть» широко используются для поиска информации. При этом в классификационных схемах стремятся фиксировать не все возможные связи между понятиями, а только такие, которые могут быть полезны при выполнении поисковых операций.

Наряду с родо-видовыми отношениями и отношения­ ми типа «целое — часть» в классификационных схемах иногда отображаются и так называемые а с с о ц и а т и в ­ ные с вяз и . В основе ' ассоциативных связей могут лежать самые различные отношения между понятиями. Важно лишь, чтобы эти отношения были устойчивыми и отражали характер мышления человека при поиске ин­ формации. Использование ассоциативных связей расши­ ряет поисковые возможности АИС, но одновременно при­ водит к увеличению доли ненужных сведений в ответах на запросы.

Будем считать понятие В подчиненным понятию А, если первое поня'тие является более узким по объему, чем второе, или если оно обозначает составную часть объекта, соответствующего второму понятию. В памяти машины система отношений подчинения между понятия­ ми обычно представляется в виде таблицы, в которой каждому номеру понятия ставится в соответствие пере­

12— 310'

177