Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 150
Скачиваний: 3
При морфологическом анализе вариантная форма основы типа III заменяется на каноническую с помощью табл. 7.8 по специальным признакам, внесенным в сло
|
|
|
|
т а |
б л и ц а 7.8 |
С п и с о к подст ановоь |
д л я основ типа |
I I I при морф ологическом |
|||
|
|
|
анализе |
|
|
|
|
Конечные буквы |
|
|
|
|
|
канонических форм |
|
|
|
|
Конечные буквы |
основ слов |
Ьікѵімеры |
||
п/п. |
вариантных форм |
|
|
||
№ |
основ слов |
вариант 0 |
вариант 1 |
|
|
1 |
|
|
|
||
Щж |
С |
3 |
Сижу—сидиг, вожу— возит |
||
2 |
д |
||||
ш |
|
— |
Ношу — носит |
||
3 |
ч |
ст |
т |
Очищу — очистит, сокра |
|
4 |
ч |
т |
— |
щу — сокоатит |
|
Лечу — летит |
|||||
5 |
г |
ж |
— |
Могу — может |
|
6 |
к |
ч |
— |
Отсеку — отсечет |
|
7 |
л |
+ |
|
Ставлю — ставит |
|
8 |
|
— |
|
|
|
9 |
т |
ч |
— |
Хотят — хочет |
|
+ |
л |
Вез —^везли |
|
||
|
|
||||
варь основ. Табл. |
7.8 содержит список подстановок букв |
||||
и .примеры использования этих подстановок. |
конечные |
||||
Во втором столбце таблицы перечислены |
|||||
буквы вариантных форм основ слов типа III, а в треть |
|||||
ем и |
четвертом столбцах — конечные буквы |
соответст |
вующих канонических форм. В последнем столбце при ведены примеры для каждого варианта подстановок букв.
Словарными признаками, используемыми при морфо логическом анализе слов с основами типа III, являются признак вида основы и признак варианта подстановки. При этом каноническая форма основы сопровождается индексом «О», а вариантная — индексом «1». Различные варианты подстановок также обозначаются индексами «О» и «1» (табл. 7.8).
Анализ основ слов типа III производится следующим образом. Сначала основа словаря, найденная в резуль тате флективного анализа, проверяется на наличие при знака вариантной формы. Если у основы такой признак есть, то выделяется ее последняя буква п сравнивается
121
последовательно со |
всеми буквами второго столбца |
табл. 7.8 (исключая |
букву «+ »). При совпадении выде |
ленной буквы с одной из букв таблицы она заменяется на букву (или сочетание букв) третьего или четвертого столбца в зависимости от значения признака варианта подстановки. Далее полученная основа ищется в слова ре. Если трансформированная основа отождествляется с одной из основ словаря, то последняя проверяется на совместимость с окончанием и на наличие у нее призна ка канонической формы основы типа III. При положи тельном результате проверки первоначальный номер ва риантной формы основы заменяется на номер ее канони ческой формы.
В этом случае, когда выделенная буква анализируе мой основы не совпадает ни с одной из букв второго столбца табл. 7.8, к этой основе приформировывается буква «л» (см. девятую строку табл. 7.8) и далее вы полняются операции, перечисленные в предыдущем абзаце.
|
|
|
|
|
Т а б л и ц а |
7.9 |
С п и со к подст ановок д л я |
основ |
т ипа |
I I I npU морф ологическом |
|||
|
|
|
синт езе |
|
|
|
п/п. |
|
Конечные буквы вари |
|
|||
Конечные буквы |
антных форм основ |
Примеры |
|
|||
канонических форм |
|
слов |
|
|||
основ слов |
вариант „0“ | |
вариант „1* |
|
|||
№ |
Щ |
|
Очистит — очищу |
|
||
1 |
СТ |
|
|
|||
2 |
Ж |
Г |
|
щ |
Летит — лечу, сократит— |
|
3 |
Т |
Ч |
|
|
сокращу |
|
|
|
|
— |
|
||
|
|
|
— |
Может — могу |
|
|
4 |
3 |
ж |
|
— |
Возит — вожу |
|
|
— |
|
||||
5 |
д |
ж |
|
|
Сидит •— сижу |
|
с |
|
— |
|
|||
6 |
ш |
|
—. |
Носит — ношѵ |
|
|
7 |
ч |
к |
|
|
Отсечет — отсеку |
|
8 |
л |
+ |
|
|
Везли — вез |
|
9 |
+ |
л |
|
— |
Ставит — ставлю |
|
Формирование буквенного кода основ слов типа III |
||||||
при |
морфологическом |
синтезе |
осуществляется с |
по |
мощью табл. 7.9 и 7.10. Табл. 7.9 служит для преобра
зования |
канонических форм |
основ в вариантные, |
|
а табл. |
7.10 — для определения |
необходимости |
такого |
преобразования. Структура табл. |
7.9 аналогична |
струк- |
13?
Т а б л и ц а 7.1Ü
Типы р а сп р ед ел ен и я канонических и вариан т н ы х ф орм основ слов
Тип распределения |
|
Грамматическая информация |
|
||||
I |
2 |
3 |
4 |
3 |
6 |
||
|
|||||||
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
1 |
1 |
0 |
0 |
0 |
0 |
0 |
|
2 |
0 |
0 |
0 |
1 |
1 |
1 |
|
3 |
1 |
0 |
0 |
0 |
0 |
1 |
туре табл. 7.8. В табл. 7.10 перечислены различные типы
распределения |
канонических и вариантных форм |
основ |
|
в зависимости |
от |
грамматической информации |
слов. |
Строкам табл. |
7.10 |
поставлены в соответствие коды ти |
|
пов распределения, |
а столбцам — коды грамматической |
информации (см. табл. 7.3). На пересечении строк и столбцов указаны индексы канонических и вариантных форм основ.
Сочетание кода типа распределения и кода грамма тической информации однозначно определяет необходи мость введения в синтезируемое слово канонической или вариантной формы основы. Код типа распределения ука зывается в словаре для каждой канонической формы основы слова типа III, наряду с индексом канонической формы и индексом варианта подстановки. Смысл индек са варианта подстановки для канонических форм основ определяется табл. 7.9, а для вариантных — табл. 7.8.
Формирование буквенного кода слова начинается с выборки из словаря буквенного кода его основы. За тем по табл. 7.10 определяется необходимость замены канонической формы основы на вариантную. Если такой необходимости нет, то к основе цриформировывается окончание. Если замена необходима, то она произво дится с помощью табл. 7.9.
Каноническая форма основы заменяется на вариант ную в следующем порядке. Сначала две последние бук вы основы проверяются на совпадение с сочетанием букв «ст». Если совпадение имеет место, то эти буквы заменяются на букву «щ» (см. подстановку 1 табл. 7.9), если нет, то конечная буква основы отыскивается среди ненулевых букв второго столбца табл. 7.9. При отож дествлении конечной буквы основы с одной из букв вто-
123
porö столбца она заменяется на соответствующую букву третьего или четвертого столбца (в зависимости от зна чения признака варианта подстановки). В противном случае к словарной основе приформировывается буква «л» (применяется подстановка 9). Анализ обратного сло варя показывает, что описанный порядок замены кано нических форм основ на вариантные не приводит к лож ным результатам.
Морфологический анализ и синтез слов с изменяемой основой типа IV
Среди слов с изменяемой основой типа IV следует различать слова, способные иметь различные окончания, и слова, у которых выделять окончания трудно или прак тически нецелесообразно. Слова первого вида далее на
зываются |
с л о в а м и |
с |
с у п п л е т и в н ы м и |
о с но |
вами, слова второго |
вида — с л о в а м и с с у п п л е |
|||
т и в н ы м и |
ф о р м а м и . |
Примерами слов первого вида |
||
являются слова «знамя», |
«время», «человек», |
«судно», |
примерами слов второго вида — слова «кто», «что», «чей». Супплетивные формы основ и супплетивные фор мы слов заносятся в машинный словарь во всех своих вариантах и отмечаются специальным признаком, кото рый используется при морфологическом анализе и син тезе.
Морфологический анализ слов с изменяемой основой типа IV начинается с их флективного анализа, причем слова с супплетивными формами сначала рассматрива ются как неизменяемые. Далее с помощью табл, типа 7.11 и 7.12 вариантные формы основ заменяются на ка нонические, а по супплетивным формам слов выраба тывается соответствующая им грамматическая инфор мация.
Табл. 7.11 иллюстрирует структуру словаря суппле тивных основ слов. Во втором ее столбце перечислены буквенные коды канонических и вариантных форм основ слов, а в третьем столбце — отсылки, указывающие для каждого варианта основы соответствующий ему поряд ковый номер канонической формы основы (согласно ну мерации первого столбца). Буквенные коды канониче ских и вариантных форм основ в табл. 7.11 записаны рядом: сначала идет код канонической формы основы, а вслед за ним — код ее вариантной формы. Следует за-
124
|
Т а б л и ц а |
7.11 |
|
Т а б л и ц а |
7.13 |
|||
С л о в а р ь суп п л ет и в н ы х основ |
С л о в а р ь суп п л ет и в н ы х |
форм |
||||||
|
изм ен яем ы х слов дл я |
|
слов д л я м орф ологического |
|||||
морф ологического |
а н а л и за и |
|
ан ал иза |
|
|
|||
№ |
синт еза |
|
|
|
|
|
Номер на |
|
|
|
|
|
Входная |
Отсыл |
|||
|
|
Тип рас |
|
бора грам* |
||||
Варианты основ |
Отсыл |
п/п. |
форма слов |
ка |
матической |
|||
п/п. |
слов |
ка |
преде |
№ |
|
|
информаций |
|
ления |
кто |
|
||||||
3 |
англичанин |
3 |
0 |
3 |
1 |
|
17 |
|
1 |
англичан |
1 |
1 |
1 |
кого |
1 |
|
01 |
2 |
1 |
1 |
2 |
1 |
|
13 |
||
4 |
3 |
0 |
4 |
1 |
|
22 |
||
5 |
врем |
5 |
1 |
5 |
кому |
1 |
|
26 |
6 |
времен |
5 |
|
|
кем |
6 |
|
41 |
7 |
друг |
7 |
0 |
7 |
ком |
6 |
|
43 |
|
ДРУЗ |
7 |
01 |
6 |
чей |
|
44 |
|
8 |
знам |
9 |
0 |
108 |
чьего |
66 |
|
47 |
10 |
знамен |
|
0 |
чьему |
6 |
|
50 |
|
119 |
им |
11 |
1 |
119 |
чьим |
6 |
|
53 |
12 |
имен |
119 |
1 |
12 |
чьем |
6 |
|
54 |
13 |
крестьянин |
13 |
1 |
13 |
чья |
6 |
|
55 |
14 |
крестьян |
13 |
1 |
14 |
чьей |
в |
|
51 |
15 |
суды |
15 |
1 |
15 |
чью |
6 |
|
56 |
16 |
суд |
15 |
1 |
16 |
чье |
6 |
|
57 |
|
человек |
|
|
17 |
чьи |
|
|
|
|
люд |
|
|
|
чьих |
6 |
|
60 |
|
|
|
|
|
чьими |
|
|
|
метить, что в табл. 7.11, равно как и в других таблицах настоящего раздела, буквенные коды основ приведены для наглядности. В действительности в памяти информа ционно-логической машины вместо этих кодов должны быть записаны их порядковые номера по машинному словарю основ.
В четвертом столбце табл. 7.11 для каждой основы слова указан тип распределения канонических и вари антных форм основ по различным формам слова. Слова с типом распределения «О» имеют каноническую форму
основы в именительном падеже единственного |
числа, |
а в остальных формах — вариантную. Слова с |
типом |
распределения «1» в единственном числе имеют канони ческую, а во множественном числе — вариантную форму основы. Сведения о типе распределения необходимы для морфологического синтеза слов.
Пример словаря супплетивных форм слов, используе мого при морфологическом анализе, дан в табл. 7.12. Во втором столбце этой таблицы перечислены все формы слов, отличающиеся друг от друга по буквенному соста-
125