Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 146
Скачиваний: 3
Возможно благодаря тому, что, как указывалось выше, каждой основе словаря поставлен в соответствие номер флективного класса, а для омонимичных основ указы вается сочетание номеров флективных классов (приме ром омонимичной основы является основа «осмотр», вхо
дящая в состав |
форм |
двух различных |
слов — «осмотр» |
и «осмотреть»). |
начала |
слова с одной |
из основ слова |
Совпадение |
ря, а его конца с одним из окончаний возможно и при неправильном членении слова. Примером могут слу жить формы слов «знаков» и «управляем» с основами
«знак» и «управля». |
Эти формы слов могут совпасть |
с основами «знаков» |
и «управляем» слов «знаковый» |
и «управляемый» и неправильно расчлениться на осно вы «знаков» и «управляем» и нулевые окончания. По этому требуется проверка правильности членения слова Правильность членения слова определяется по мор фологической таблице путем проверки найденных осно вы и окончания слова на совместимость. Основа и окон чание слова считаются совместимыми, если клетка морфологической таблицы, соответствующая номеру флективного класса и номеру окончания слова, не пуста (или, .применительно к структуре табл. 7.4, если -номер окончания слова содержится в левой части столбца пар чисел, соответствующего номеру флективного класса). В противном случае основа и окончание несовместимы и следует продолжать поиск правильного членения сло ва. При омонимии основ на совместимость проверяются все возможные сочетания признаков «флективный класс» и «окончание», полученные в результате анали
за слова.
Проверка основы и окончания слова на совмести мость позволяет в основном преодолеть трудности мор фологического анализа, связанные с омонимией основ слов. Однако при этом остается неразрешенной такая омонимия основ -слов, которая может приводить к сов падению некоторых форм различных слов. Например, у слов «техник» и «техника» совпадают несколько форм единственного и множественного числа, и вне контекста
по |
одной |
форме |
слова нельзя определить, о каком |
|
слове |
идет |
речь. |
Такого рода омонимия может быть |
|
Da-зрешена |
только средствами синтаксического анализа, |
|||
а |
в |
некоторых |
случаях потребуется и семантический |
анализ контекста. Поэтому при морфологическом ана
111
лизе необходимо сохранять нее возможные классы и н а
боры морфологической информации омонимичных сло воформ.
Описанный выше процесс членения на основу и окон чание применим к словам, не имеющим в своем составе возвратной частицы и мягкого знака между основой и окончанием. Наличие одного из этих элементов или обоих одновременно несколько осложняет процесс чле нения слова, из-за необходимости их обнаружения и вы деления из состава основы или окончания. При этом обнаружение возвратной частицы «ся» или «сь» отме чается признаком возвратности, а внутренний мягкий знак исключается из состава слова.
Включение в состав слова возвратной частицы вле чет за собой изменение его синтаксической роли в пред ложении и обычно придает ему новый смысловой отте нок (сравни слова «оборонять—обороняться», «управ ляющий — управляющийся», «пытал — пытался»). Есте ственно поэтому рассматривать возвратную частицу как составную часть основы слова с внутренней флек сией (с внутренним окончанием). Чтобы отличить осно ву слова с возвратной частицей от основы слова без возвратной частицы, к порядковому номеру основы, по лученному по словарю, прибавляется некоторое посто янное число. Величина этого постоянного числа должна быть выбрана такой, чтобы результирующее число не совпадало ни с одним номером словарной основы. С этой целью в код номера основы слова можно ввести дополнительный разряд и отмечать цифрой «1» наличие признака возвратности.
Результатом разрешения омонимии основы слова является выделение из серии флективных классов т о г о класса, который соответствует условиям контекста. Этот результат, как и факт наличия возвратной частицы, можно отображать в номере основы слова. Для этого вводят в код номера основы два дополнительных двоич ных разряда, в которых записывается порядковый номер (слева направо) выделенного класса в серии но меров флективных классов, соответствующих омони
мичной основе. |
производится |
Флективный синтез изменяемых слов |
|
с помощью словаря основ, обращенной |
морфологиче |
ской таблицы (табл. 7.5) и списка окончаний (табл. 7.2). Обращенная морфологическая таблица состоит из не-
112
|
|
|
|
|
|
|
|
Т а б л и ц а |
?.5 |
||
О |
Б Р |
А Щ Е Н |
Н А Я |
М О Р Ф О Л О Г И Ч Е С К А Я |
Т А Б Л И Ц А |
|
|
||||
11 |
12 |
13 |
А . |
С у щ е с т в и т е л ь н ы е |
22 |
23 |
24 |
25 |
|
||
14 |
15 |
16 |
21 |
22 |
|||||||
001—65 |
66 |
73 |
65 |
45 |
67 |
74 |
42 |
20 |
74 |
01 |
26 |
63 |
|||||||||||
002—65 |
66 |
73 |
65 |
45 |
67 |
70 |
26 |
20 |
70 |
01 |
22 |
63 |
|||||||||||
003—75 |
77 |
76 |
75 |
27 |
67 |
70 |
26 |
61 |
70 |
17 |
63 |
004—71 |
77 |
76 |
71 |
27 |
67 |
70 |
24 |
61 |
70 |
17 |
22 |
005—71 |
77 |
76 |
71 |
27 |
70 |
70 |
24 |
61 |
70 |
17 |
22 |
006—65 |
66 |
73 |
65 |
45 |
67 |
70 |
42 |
20 |
70 |
01 |
22 |
007—65 |
66 |
73 |
65 |
45 |
67 |
70 |
65 |
20 |
70 |
01 |
22 |
010—65 |
66 |
73 |
65 |
45 |
67 |
66 |
42 |
20 |
66 |
01 |
63 |
01 1 -6 5 66 |
73 |
65 |
27 |
67 |
74 |
24 |
20 |
74 |
01 |
63 |
|
012—75 |
70 |
70 |
75 |
27 |
70 |
70 |
26 |
61 |
70 |
17 |
63 |
013—71 |
77 |
76 |
71 |
27 |
67 |
77 |
24 |
61 |
77 |
17 |
22 |
014—65 |
66 |
73 |
65 |
45 |
67 |
77 |
24 |
61 |
77 |
17 |
22 |
015—65 |
66 |
73 |
65 |
45 |
67 |
66 |
65 |
20 |
66 |
01 |
22 |
016—65 |
66 |
73 |
65 |
27 |
67 |
70 |
26 |
20 |
70 |
01 |
63 |
017—65 |
66 |
73 |
65 |
45 |
67 |
74 |
65 |
20 |
74 |
01 |
22 |
020—75 |
77 |
76 |
75 |
27 |
67 |
77 |
26 |
61 |
77 |
17 |
22 |
021—65 |
66 |
73 |
66 |
45 |
67 |
74 |
42 |
20 |
42 |
01 |
63 |
022—65 |
66 |
73 |
66 |
45 |
67 |
74 |
65 |
20 |
65 |
01 |
22 |
023—65 |
66 |
73 |
66 |
45 |
67 |
70 |
26 |
61 |
26 |
17 |
63 |
024—65 |
66 |
73 |
66 |
45 |
67 |
70 |
26 |
20 |
26 |
01 |
63 |
025—71 |
77 |
76 |
77 |
27 |
70 |
70 |
24 |
61 |
24 |
17 |
63 |
026—26 |
77 |
76 |
77 |
27 |
67 |
70 |
24 |
61 |
24 |
17 |
63 |
027—75 |
77 |
76 |
77 |
27 |
67 |
70 |
26 |
61 |
26 |
17 |
22 |
030—75 |
77 |
76 |
77 |
27 |
67 |
77 |
26 |
61 |
26 |
17 |
22 |
031—65 |
66 |
73 |
66 |
45 |
67 |
70 |
42 |
20 |
42 |
01 |
22 |
032—65 |
66 |
73 |
66 |
27 |
67 |
74 |
24 |
20 |
24 |
01 |
|
033—66 |
70 |
67 |
77 |
26 |
67 |
70 |
26 |
20 |
26 |
01 |
63 |
034—66 |
74 |
67 |
73 |
44 |
67 |
74 |
65 |
20 |
65 |
01 |
22 |
0 3 5 -7 7 |
70 |
67 |
76 |
26 |
67 |
70 |
26 |
61 |
26 |
17 |
22 |
036—65 |
66 |
73 |
66 |
27 |
67 |
70 |
26 |
20 |
26 |
01 |
22 |
037—65 |
66 |
73 |
66 |
45 |
67 |
67 |
65 |
20 |
65 |
01 |
63 |
040—65 |
66 |
73 |
66 |
45 |
67 |
66 |
42 |
20 |
42 |
01 |
56 |
041—65 |
66 |
73 |
66 |
27 |
67 |
77 |
26 |
61 |
26 |
17 |
63 |
042—65 |
66 |
73 |
66 |
55 |
67 |
74 |
56 |
55 |
56 |
16 |
22 |
043—65 |
66 |
73 |
66 |
45 |
70 |
77 |
26 |
61 |
26 |
17 |
22 |
044—66 |
74 |
67 |
73 |
44 |
67 |
74 |
65 |
20 |
65 |
01 |
63 |
045—66 |
74 |
67 |
73 |
26 |
67 |
74 |
65 |
20 |
65 |
01 |
63 |
046—77 |
70 |
70 |
76 |
26 |
70 |
70 |
71 |
61 |
71 |
17 |
63 |
26 |
|||||||||||
047—77 |
70 |
67 |
76 |
26 |
67 |
70 |
71 |
61 |
71 |
17 |
22 |
050—77 |
70 |
67 |
76 |
44 |
67 |
70 |
75 |
61 |
75 |
17 |
22 |
051—66 |
70 |
67 |
73 |
76 |
67 |
70 |
65 |
20 |
65 |
01 |
56 |
052—75 |
70 |
70 |
75 |
70 |
70 |
26 |
20 |
26 |
01 |
22 |
|
053—66 |
44 |
44 |
73 |
44 |
44 |
74 |
56 |
55 |
56 |
16 |
63 |
054—75 |
70 |
70 |
75 |
76 |
70 |
70 |
26 |
20 |
70 |
01 |
22 |
055—75 |
70 |
70 |
75 |
76 |
70 |
70 |
26 |
61 |
70 |
17 |
|
056—66 |
74 |
67 |
73 |
44 |
67 |
74 |
65 |
20 |
74 |
01 |
113 |
8—310 |
|
|
|
|
|
|
|
|
|
|
|
Іі |
12 |
13 |
14 |
15 |
16 |
П р о д о л ж е н и е т а б л . 7.6 |
|||||
21 |
22 |
23 |
24 |
25 |
26 |
||||||
057—66 |
70 |
67 |
73 |
26 |
67 |
70 |
65 |
20 |
70 |
01 |
22 |
060—66 |
70 |
67 |
73 |
44 |
67 |
70 |
65 |
20 |
70 |
01 |
22 |
061—77 |
70 |
70 |
76 |
26 |
70 |
70 |
71 |
61 |
70 |
17 |
63 |
062—77 |
70 |
67 |
76 |
26 |
67 |
70 |
71 |
61 |
70 |
17 |
63 |
063—77 |
70 |
67 |
76 |
26 |
67 |
70 |
75 |
61 |
70 |
17 |
63 |
064—77 |
70 |
67 |
76 |
26 |
67 |
70 |
34 |
61 |
70 |
17 |
63 |
065—77 |
70 |
67 |
76 |
26 |
67 |
70 |
26 |
61 |
70 |
17 |
63 |
066—77 |
70 |
67 |
76 |
26 |
67 |
70 |
65 |
61 |
70 |
17 |
63 |
067—66 |
74 |
67 |
73 |
26 |
67 |
74 |
65 |
20 |
74 |
01 |
22 |
070—72 |
66 |
73 |
72 |
45 |
67 |
66 |
65 |
20 |
66 |
01 |
22 |
071—72 |
66 |
73 |
72 |
45 |
67 |
66 |
42 |
20 |
66 |
01 |
22 |
072—67 |
77 |
76 |
67 |
27 |
67 |
77 |
26 |
61 |
77 |
17 |
63 |
073— 67 |
77 |
76 |
67 |
27 |
70 |
77 |
71 |
61 |
77 |
17 |
63 |
074—67 |
66 |
73 |
67 |
27 |
67 |
66 |
65 |
20 |
66 |
01 |
22 |
075—72 |
66 |
73 |
72 |
45 |
67 |
77 |
24 |
61 |
77 |
17 |
63 |
076—77 |
70 |
70 |
77 |
27 |
70 |
66 |
65 |
20 |
66 |
01 |
22 |
077—67 |
77 |
76 |
67 |
27 |
67 |
77 |
34 |
61 |
77 |
17 |
63 |
100—72 |
66 |
73 |
72 |
45 |
67 |
70 |
26 |
61 |
70 |
17 |
63 |
101— 72 |
66 |
73 |
72 |
45 |
67 |
70 |
42 |
20 |
70 |
01 |
22 |
102—67 |
77 |
76 |
67 |
27 |
67 |
77 |
26 |
61 |
77 |
17 |
63 |
103 |
104 |
105 |
Б . |
П рилагательны е |
112 |
|
113 |
114 |
115 |
||
106 |
107 |
ПО |
111 |
|
|||||||
11—54 |
34 |
34 |
34 |
44 |
44 |
34 |
65 |
|
71 |
65 |
75 |
12— 13 |
02 |
02 |
13 |
13 |
13 |
02 |
13 |
|
02 |
02 |
02 |
14 |
14 |
14 |
04 |
14 |
|
04 |
04 |
04 |
|||
13— 14 |
04 |
04 |
34 |
44 |
44 |
34 |
65 |
|
71 |
65 |
75 |
14—54 |
34 |
34 |
35 |
55 |
35 |
35 |
35 |
|
35 |
35 |
27 |
15—55 |
35 |
35 |
45 |
45 |
45 |
27 |
45 |
|
27 |
27 |
27 |
16—45 |
27 |
27 |
|
||||||||
21—43 |
25 |
25 |
43 |
43 |
43 |
67 |
72 |
|
67 |
67 |
67 |
22— 13 |
02 |
02 |
13 |
13 |
13 |
02 |
13 |
|
02 |
02 |
02 |
23— 14 |
04 |
04 |
14 |
14 |
14 |
04 |
14 |
|
04 |
04 |
04 |
24—43 |
25 |
25 |
43 |
43 |
43 |
67 |
72 |
|
67 |
67 |
67 |
35 |
|
35 |
35 |
27 |
|||||||
25—55 |
35 |
35 |
35 |
55 |
35 |
35 |
|
27 |
|||
26—45 |
27 |
27 |
45 |
45 |
45 |
27 |
45 |
|
27 |
27 |
|
31—23 |
64 |
23 |
23 |
23 |
23 |
77 |
66 |
|
77 |
66 |
77 |
32—44 |
26 |
26 |
44 |
44 |
44 |
26 |
44 |
|
26 |
26 |
26 |
33—44 |
26 |
26 |
44 |
44 |
44 |
26 |
44 |
|
26 |
26 |
26 |
34—52 |
60 |
52 |
52 |
52 |
52 |
76 |
73 |
|
76 |
73 |
76 |
35—44 |
26 |
26 |
44 |
44 |
44 |
26 |
44 |
|
26 |
26. |
26 |
44 |
44 |
44 |
26 |
44 |
|
26 |
26 |
26 |
|||
36—44 |
26 |
26 |
53 |
33 |
70 |
70 |
|
70 |
70 |
67 |
|
41—53 |
33 |
33 |
33 |
37 |
37 |
37 |
|
37 |
37 |
31 |
|
42—56 |
37 |
37 |
37 |
56 |
|
||||||
43—55 |
35 |
35 |
35 |
55 |
35 |
35 |
35 |
|
35 |
35 |
27 |
44—53 |
33 |
33 |
33 |
53 |
33 |
70 |
70 |
|
70 |
70 |
67 |
45— 16 |
10 |
10 |
10 |
16 |
10 |
10 |
10 |
|
10 |
10 |
03 |
46—56 |
37 |
37 |
37 |
56 |
37 |
37 |
37 |
|
37 |
37 |
31 |
114
П р о д о л ж е н и е т а б л . 7 .5
ПС |
В . Глаголы в личной форме |
124 |
||||
117 |
120 |
121 |
122 |
123 |
||
1—76 |
76 |
73 |
73 |
73 |
73 |
73 |
2—07 |
12 |
07 |
12 |
12 |
07 |
12 |
3—30 |
36 |
30 |
36 |
36 |
30 |
36 |
4—27 |
35 |
27 |
35 |
35 |
35 |
35 |
5—06 |
И |
06 |
11 |
11 |
11 |
11 |
6—57 |
62 |
50 |
21 |
50 |
62 |
62 |
Г . Глаголы прошедшего времени и краткие прилагательные
|
|
125 |
126 |
127 |
130 |
|
|
|
|
1—65 |
65 |
65 |
65 |
|
|
|
|
2— 72 |
72 |
67 |
72 |
|
|
|
|
3— 66 |
66 |
66 |
66 |
|
|
|
|
4—70 |
74 |
70 |
70 |
|
|
131 |
д . Количественные |
числительные |
140 |
||||
132 |
133 |
134 |
135 |
136 |
137 |
||
1—66 |
70 |
67 |
67 |
72 |
75 |
72 |
65 |
2—51 |
31 |
31 |
37 |
56 |
70 |
37 |
37 |
3—47 |
27 |
27 |
35 |
55 |
70 |
35 |
35 |
4 - 6 6 |
70 |
67 |
67 |
72 |
75 |
72 |
65 |
5— 15 |
05 |
41 |
10 |
16 |
76 |
10 |
10 |
6—51 |
31 |
31 |
37 |
56 |
70 |
37 |
37 |
скольких частей, число которых определяется количест вом синтаксических классов изменяемых слов.
Часть таблицы с индексом «А» используется для син теза форм существительных. Здесь по одному входу таблицы (левому) перечислены коды морфологических классов, а по другому (верхнему)— морфологическая информация («оды морфологической информации под черкнуты). На пересечении строк и столбцов указаны номера окончаний. Другие части обращенной морфо логической таблицы (с индексами Б, В, Г, Д) построе ны аналогично части «А», с тем лишь отличием, что здесь переставлены входы таблицы: верхние входы со ответствуют флективным классам, а левые — морфоло гической информации.
8* |
115 |