Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 166
Скачиваний: 3
вительному) и определяющим его прилагательным на значается информация «именительный падеж, единст венное число», а на прилагательные переносится признак рода главного слова. Далее выполняется операция выде ления общей части наборов переменной грамматической информации в группах слов, состоящих из существитель ного и зависимых от него прилагательных. В результате выполнения этой операции получается либо однозначная грамматическая информация, либо наборы грамматиче ской информации, которые в дальнейшем используются для назначения информации к существительным и при лагательным.
Информация к существительным уточняется в сле дующем порядке. Если существительное управляется предлогом, то ему назначается первый элемент из соот ветствующего набора, который содержит информацию о падеже, допустимую для данного типа предлогов (см. табл. 7.1). Если же существительное управляется дру гим существительным, то элемент набора выбирается с учетом возможных для такого существительного зна чений признака падежа. При этом сначала ищется эле мент с признаком родительного падежа, затем с призна ком творительного и, наконец, с признаком дательного падежа. Информация, выбранная для существительных, распространяется и на подчиненные им прилагательные. Неизменяемым словам словосочетания назначается «ну левая» информация.
Заключительным этапом синтаксического анализа является приведение структуры словосочетания к кано ническому виду. При этом выполняются следующие опе рации: 1) прилагательные ставятся перед теми сущест вительными, которые они определяют, и упорядочивают ся по возрастанию номеров слов; 2) существительные, соединенные сочинительным союзом, располагаются 'по возрастанию их словарных номеров (при этом в случае необходимости изменяется расположение слов относи тельно союза); 3) группы слов, соединенные сочини тельным союзом и управляемые существительными, рас полагаются таким образом, чтобы управляемые слова были упорядочены по возрастанию их номеров; 4) код главного слова словосочетания выносится на первое место; 5) в соответствии с произведенными трансфор мациями производится перенумерация слов в словосоче тании и перекодировка схемы связей между ними.
172
Поиск и отождествление наименований понятий
Заключительным этапом автоматического кодирова ния словосочетаний является поиск по словарю понятий с целью замены кодов, полученных в результате синтак сического анализа, на номера понятий. Отождествление исходных и словарных наименований понятий произво дится в следующем порядке. Сначала сочетание номе ров слов и грамматическая структура кодируемого наи менования понятия ищутся по списку сочетаний номеров слов и по списку грамматических структур словаря по нятий и заменяются порядковыми номерами по этим спискам. Далее по номеру понятия из словаря выбирает ся соответствующий ему номер грамматической струк туры и сравнивается с номером, полученным в резуль тате поиска по списку грамматических структур. Если эти номера совпадают, то понятия тождественны друг другу. В противном случае они не тождественны.
Среди наименований понятий, используемых в раз личных областях практической деятельности, встречают ся одинаковые по смыслу словосочетания, отличающиеся
друг от друга не только порядком |
следования слов, но |
и морфологической структурой |
их основ (примером |
являются пары словосочетаний «управляющее устройст
во— устройство управления», |
«меры защиты — защит |
ные меры», «ртутные пары — |
пары ртути»). Отождест |
вление таких наименований понятий связано с необходи мостью применять трансформации с изменением основ слов. В результате некоторые слова переходят из одного грамматического класса в другой (например, из класса существительных в класс прилагательных или наоборот), а порядок слов в словосочетании и грамматическая ин формация к словам изменяются.
Возможность применения трансформаций с измене нием основ слов не может быть определена по грамма тической структуре словосочетания. Поэтому приходится вводить в словарь понятий дополнительную информацию в виде номеров т р а н с ф о р м а ц и о н н ы х к л а с с о в с л о в о с о ч е т а н и й , определяющих правила преобра зования их грамматических структур и словарного со става. Различные правила преобразования задаются списком. В словаре слов, в свою очередь, для каждого номера слова указывается номер эквивалентного ему по смыслу слова из другого грамматического класса (для
173
существительного — помер прилагательного, а для при лагательного — номер существительного).
Процедура поиска и отождествления наименований понятий с переводом слов из одного грамматического класса в другой выполняется путем последовательного просмотра участков словаря понятий, удовлетворяющих двум условиям:
1) количество слов в словарных словосочетаниях рав но количеству слов в исходном словосочетании;
2) главные слова исходного словосочетания и сло варных словосочетаний совпадают.
В процессе просмотра для каждого словосочетания словаря формируется его трансформационный ва риант, который сравнивается с кодируемым словосоче танием.
Слова из класса существительных в класс прилага тельных и обратно могут переводиться не только с по мощью таблицы, в которой для каждого номера слова из одного класса указывается номер слова из другого класса, по и путем использования закономерностей сло
вообразования. |
При этом номерам основ слов ставятся, |
в соответствие |
номера т р а н с ф о р м а ц и о н н ы х клас |
сов слов, определяющих порядок преобразования бук венных кодов основ. Трансформационные классы основ слов задаются списком правил, в которых указывается, сколько конечных букв следует отделить от основы при ее преобразовании и какое буквосочетание после этого присоединить. Вновь сформированные буквенные коды основ ищутся в словаре и заменяются их номерами.
Декодирование понятий
Подобно процессу кодирования наименований поня тий их декодирование также осуществляется в три эта па. Сначала по номеру понятия из словаря выбираются соответствующие ему сочетание номеров слов и номер грамматической структуры. Затем из списка грамматиче
ских |
структур |
извлекается информация |
о формах |
слов |
и о |
р связях, |
а также корректируется |
порядок |
слов |
в словосочетании (номер главного слова ставится после номеров определяющих его прилагательных). На заклю чительном этапе формируются буквенные коды слово форм (см. гл. 7, 8).
174
У
.ы
і -
Алгоритмы декодирования понятии значительно про ще алгоритмов кодирования, в особенности если наиме нования понятий выдаются на печать в основной форме. Если же необходимо согласовать формы наименований понятий с их контекстным окружением, то главному сло ву и определяющим его прилагательным назначаются соответствующие число и падеж.
Обычно у именных словосочетаний изменяется только форма главного слова и определяющих его прилагатель ных. Но в некоторых случаях имеет место зависимость форм несогласованных определений и относящихся к ним прилагательных от числа главного слова (например, в словосочетаниях, «директор автомобильного завода — директора автомобильных заводов», «начальник цеха — начальники цехов» и т. п.). Возможность такого рода преобразования не может быть обнаружена по синтакси ческой структуре словосочетания. Поэтому для правиль ного синтеза различных форм словосочетаний необходи мо в словаре понятий указывать признак зависимости форм несогласованных определений от значения катего рии числа главного слова, а также количество существи тельных, на которое эта зависимость распространя ется.
Наряду со способами декодирования понятий, осно ванными на морфологическом синтезе слов, в АИС мо гут применяться и другие способы. Можно, например, хра нить в памяти машины таблицы соответствия между но мерами понятий и их буквенными кодами. Можно также представить наименования понятий в виде сочетаний
номеров |
словоформ, |
входящих |
в |
их состав, |
и хранить |
|
в памяти |
машины |
два словаря — словарь |
пословных |
|||
кодов наименований |
понятий |
и |
словарь |
словоформ. |
||
В этом |
случае декодирование |
понятий будет произво |
||||
диться |
в два этапа: сначала, |
с помощью первого сло |
варя, номера понятий заменяются па их пословные коды, затем, с помощью второго словаря, пословные коды наи менований понятий заменяются на их буквенные коды. Последние два способа декодирования понятий очень просты, но их применение связано с необходимостью хранения в памяти машийы дополнительных словарей. Кроме того, здесь можно получать только одну форму наименований понятий.
175
Глава 10 АВТОМАТИЧЕСКОЕ УСТАНОВЛЕНИЕ СМЫСЛОВЫХ СВЯЗЕЙ МЕЖДУ п о н я т и я м и
Классификационный словарь понятий
Под термином « к л а с с и ф и к а ц и я » обычно пони мается распределение объектов по классам на основе присущих им признаков. Классификация имеет важное значение, так как она является обобщенным выражением опыта, накопленного человечеством в различных обла стях деятельности, и позволяет формулировать законы, правила и практические рекомендации для групп объек тов. В ряде случаев решение об использовании какоголибо единичного объекта может быть принято только на основе знаний о его принадлежности к определенному классу и характеристик этого класса.
Классификация широко используется в науке, на про изводстве и в быту. Она отражается в системе понятий естественного языка, являющегося универсальным сред ством общения людей. Как правило, понятия в языке обозначают не единичные объекты, а классы объектов Даже имена собственные обычно распространяются на группы объектов, из которых единичные элементы выде ляются лишь в конкретной речезой ситуации. В клас сификации отражаются свойства вещей и явлений. Эти
свойства |
столь |
же многообразны, |
сколь |
многообразны |
|
взаимные |
связи |
между |
вещами и |
явлениями. Поэтому |
|
в различных науках и |
в разных |
сферах |
практической |
деятельности одни и те же вещи и явления могут груп пироваться по-разному. Даже в пределах одной науки или одной сферы практической деятельности в зависимо сти от поставленной цели применяются различные си стемы классификации.
Классы объектов, как и индивидуальные объекты, могут находиться в различных отношениях друг к другу. Выявление отношений между классами объектов являет
ся задачей специалистов в конкретных |
областях знаний |
и практической деятельности. В АИС |
эти отношения |
фиксируются в виде сообщений и используются для по иска сведений по запросам.
Наиболее устойчивыми являются отношения включе ния по объему (родо-видовые отношения) и отношения типа «целое—часть». Эти и некоторые другие отношения
176
Ме&Лу классами Часто выделяются в специальные мас
сивы |
сообщений, которые носят название |
к л а с с и ф и |
|
к а ц и о н н ы х |
схем, к л а с с и ф и к а ц и о н н ы х т а б |
||
лиц |
или |
к л а с с и ф и к а ц и о н н ы х |
с л о в а р е й . |
В классификационных схемах фиксируются также отно шения эквивалентности между классами, которые можно рассматривать в качестве частного случая родо-видовых отношений (каждый из двух эквивалентных классов включает в свой состав другой класс).
Свойство, принадлежащее некоторому классу объек тов, принадлежит и всем более узким классам, входя щим в его состав. Поэтому какова бы ни была тема за
проса при |
поиске информации, всегда |
можно |
наряду |
|
с данными, |
в точности |
соответствующими сформулиро |
||
ванной теме, выдавать |
потребителю также данные по |
|||
более узким темам. |
|
|
|
|
Аналогичное правило может быть распространено и |
||||
на отношения типа «целое — часть». Но |
здесь |
его при |
менение может привести к неверным результатам, так как далеко не всегда свойства объектов являются свой ствами и частей этих объектов. Тем не менее, отношения типа «целое — часть» широко используются для поиска информации. При этом в классификационных схемах стремятся фиксировать не все возможные связи между понятиями, а только такие, которые могут быть полезны при выполнении поисковых операций.
Наряду с родо-видовыми отношениями и отношения ми типа «целое — часть» в классификационных схемах иногда отображаются и так называемые а с с о ц и а т и в ные с вяз и . В основе ' ассоциативных связей могут лежать самые различные отношения между понятиями. Важно лишь, чтобы эти отношения были устойчивыми и отражали характер мышления человека при поиске ин формации. Использование ассоциативных связей расши ряет поисковые возможности АИС, но одновременно при водит к увеличению доли ненужных сведений в ответах на запросы.
Будем считать понятие В подчиненным понятию А, если первое поня'тие является более узким по объему, чем второе, или если оно обозначает составную часть объекта, соответствующего второму понятию. В памяти машины система отношений подчинения между понятия ми обычно представляется в виде таблицы, в которой каждому номеру понятия ставится в соответствие пере
12— 310' |
177 |