Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 141
Скачиваний: 3
восьмеричных цифр указывает на грамматическую ка тегорию числа, вторая—на падеж слова. При этом циф
ра 1 |
на первом месте означает единственное число, |
цифра |
2—множественное число. Цифры 1, 2, 3, 4, 5, 6, |
стоящие на втором месте, обозначают соответственно именительный, родительный, дательный, винительный, творительный и предложный надежи. Последователь ность пар восьмеричных цифр описывает случаи много значности информации о формах слов.
Для синтаксического класса «-прилагательные» пер вая цифра в каждой паре восьмеричных цифр обознача ет род и число, а вторая—падеж слова. Цифра 1 на первом месте означает, что прилагательное имеет фор му мужского рода единственного числа, цифра 2 яв ляется признаком среднего рода единственного числа, цифра 3 — признаком женского рода единственного чис ла; цифра 4 — признаком множественного числа. Паде жи прилагательных обозначаются так же, как и падежи существительных.
Морфологическая информация слов, принадлежа щих к синтаксическим классам «глаголы в личной фор ме», «глаголы прошедшего времени, краткие прилага тельные и причастия», «количественные числительные», обозначается в табл. 7.3 одной цифрой, а в случае многозначности — последовательностью цифр. При этом для .синтаксического класса «глаголы в личной форме» цифры 1, 2, 3 обозначают первое, второе и третье лицо единственного числа, а цифры 4, 5, 6—первое, второе и третье лицо множественного числа. Для синтаксиче ского класса «глаголы прошедшего времени, краткие прилагательные и причастия» цифры 1, 2, 3 обозначают формы мужского, среднего и женского рода единствен ного числа, а цифра 4—форму множественного числа. Формы слов синтаксического класса «количественные числительные» характеризуются только падежом, кото рый кодируется так же, как и у существительных и при лагательных.
Двумерная морфологическая таблица содержит мно го пустых клеток. Поэтому при ее линейной записи сле дует принимать специальные меры для экономии места в запоминающем устройстве ЭВМ. Один из возможных способов линейной записи морфологической таблицы иллюстрирует табл. 7.4. Здесь каждому номеру класса (см. подчеркнутые числа) поставлен в соответствие
106
Т а б л и ц а 7.4
МОРФОЛОГИЧЕСКАЯ ТАБЛИЦА
001 |
002 |
003 |
004 |
005 |
006 |
007 |
010 |
|
01—37 |
01—37 |
17—37 |
17—37 |
17—37 |
01—37 |
01—37 |
01—37 |
|
20 -3 6 |
20—36 26—33 24—33 |
24—33 |
20—36 |
20—36 |
20—36 |
|||
22—40 |
22—40 |
27—22 |
27—22 |
27—22 |
22—40 |
22—40 |
22—40 |
|
42—33 |
26—33 |
61—36 |
61—36 |
61—36 |
42—33 |
45—22 |
42—33 |
|
45—22 |
45—22 |
63—40 |
63—40 |
63—40 |
45—22 |
65—04 |
45—22 |
|
65—02 |
65—02 |
67—26 |
67—26 |
70—30 |
65—02 |
66—06 |
65—02 |
|
66—06 |
66—06 |
70—32 |
70—32 |
71—02 |
66—06 |
67—26 |
66— 16 |
|
67—26 |
67—26 |
75—02 |
71—02 |
76— 17 |
67—26 |
70—32 |
67—26 |
|
73— 17 |
70—32 |
76— 17 |
76— 17 |
77—06 |
70—32 |
73— 17 |
73— 17 |
|
74—32 |
73— 17 |
77—06 |
77—06 |
— |
73— 17 |
— |
— |
|
011 |
012 |
013 |
014 |
015 |
016 |
017 |
020 |
|
01—37 |
17—37 |
17—37 |
17—37 |
01—37 |
01—37 |
01—37 |
17—37 |
|
20—36 |
26—33 |
24—33 |
24—33 |
20—36 |
20—36 |
20—36 |
26—33 |
|
22—40 |
27—22 |
27—22 |
45—22 |
22—40 |
22—40 |
22—40 |
27—22 |
|
24—33 |
61—36 |
61—36 |
61—36 |
45—22 |
26—33 |
45 -22 |
61—36 |
|
27—22 |
63—40 |
63—40 |
63—40 |
65—04 |
27—22 |
65—04 |
63—40 |
|
65—02 |
70— 12 |
67—26 |
65—02 |
6 6 -1 6 |
65—02 |
66—06 |
67—26 |
|
66—06 |
75—02 |
71—02 |
66—06 |
67—26 |
66—06 |
67—26 |
75—02 |
|
67—26 |
— |
76— 17 |
67—26 |
73— 17 |
67—26 |
73— 17 |
76— 17 |
|
73— 17 |
— |
77— 16 |
73— 17 |
— |
70—32 |
74—32 |
77— 16 |
|
74—32 |
— |
— |
77—32 |
— |
73— 17 |
— |
— |
|
021 |
022 |
023 |
024 |
025 |
026 |
027 |
030 |
|
01—37 |
01—37 |
17—37 |
01—37 |
17—37 |
17—37 |
17—37 |
17—37 |
|
20—36 |
20—36 |
26—34 |
20—36 |
24—34 |
24—34 |
26—34 |
26—34 |
|
22—40 |
22—40 |
45—22 |
22—40 |
27—22 |
2 6 —01 |
27—22 |
27—22 |
|
42—34 |
45—22 |
61—36 |
26—34 |
61—36 |
27—22 |
61—36 |
61—36 |
|
45—22 |
65—05 |
63—40 |
45—22 |
63—40 |
61—36 |
63—40 |
63—40 |
|
65—01 |
66— 13 |
65—01 |
65—01 |
70—27 |
63—40 |
67—26 |
67—26 |
|
66— 13 |
67—26 |
66— 13 |
66— 13 |
71—01 |
67—26 |
70—31 |
75—01 |
|
67—26 |
73— 17 |
67—26 |
67—26 |
76— 17 |
70—31 |
75—01 |
76—■ |
17 |
73— 17 |
74—31 |
70—31 |
70—31 |
77— 13 |
76— 17 |
76— 17 |
77— 14 |
|
74—31 |
— |
73— 17 |
73— 17 |
•— |
77— 13 |
77— 13 |
— |
|
031 |
032 |
033 |
034 |
035 |
036 |
037 |
040 |
|
01—37 |
01—37 |
01—37 |
01— 37 |
17—37 |
01—37 |
01—37 |
01—37 |
|
20—36 20—36 20—36 20—36 |
2 6 -2 4 |
20—36 |
20—36 |
20—36 |
||||
22—40 |
22—40 |
22—40 |
22—40 |
61—36 |
22—40 |
22—40 |
22—40 |
|
42—34 |
24—34 |
26—24 |
44—22 |
63—40 |
26—34 |
45—22 |
42—34 |
|
45—22 |
2 7 -2 2 |
66—01 |
65—34 |
67—20 |
27—22 |
6 5 -0 5 |
45—22 |
|
65—01 |
65—01 |
67—20 |
66—01 |
70— 15 |
65—01 |
66— 13 |
65—01 |
|
66— 13 |
66— 13 |
70— 15 |
67—20 |
76—21 |
66— 13 |
67—27 |
66— 14 |
|
67—26 |
67—26 |
73—21 |
73—21 |
77—01 |
67—26 |
7 3 -1 7 |
67—26 |
|
70—31 |
73— 17 |
— |
74— 15 |
— 1 |
70—31 |
— |
73— 17 |
|
73— 17 |
74—31 |
— |
— |
— |
73— 17 |
— |
— |
|
107
041 |
042 |
043 |
044 |
045 |
Г І родолж ение т а б л . 7 .4 |
||
046 |
047 |
050 |
|||||
17—37 |
16—37 |
17—37 |
01—37 |
01—37 |
17—37 |
17—37 |
1 7 - 37 |
26—34 |
55—25 |
2 6 -3 4 |
20—36 |
20—36 |
26—22 |
26—22 |
26—22 |
27—22 |
56—35 |
45—22 22—40 22—40 |
61---1136 61—36 |
61—36 |
|||
61 —36 |
65—01 |
61—36 44—22 26—22 |
63—40 |
6 3 -4 0 |
63—40 |
||
63—40 |
66— 13 |
63—40 |
65—34 |
6 5 -3 4 |
70- |
67— 20 |
67—20 |
65—01 |
6 7 -2 6 |
65—01 |
66—01 |
66—0) |
71—34 |
70— 15 |
70— 15 |
66— 13 |
73— 17 |
66— 13 |
67—20 |
67— 20 |
76—21 |
71—34 |
7 5 -3 4 |
67—26 |
74—31 |
67—26 |
73—21 |
73—21 |
77 -01 |
76—21 |
76-21 |
73— 17 |
— |
73— 17 |
74— 15 |
74— 15 |
— |
77—01 |
77—01 |
77—31 |
— |
77—31 |
— |
055 |
056 |
057 |
060 |
051 |
052 |
053 |
054 |
||||
01—37 |
01—37 |
16—37 |
0 1 -3 7 |
17 -37 |
01—37 01—37 01—37 |
||
20—36 |
20—35 |
44—07 |
20—36 |
26—33 |
20—36 |
20—36 |
20—36 |
22—40 |
22—40 |
55—36 |
22—40 |
61—36 |
22—40 |
22—40 |
22—40 |
44—22 |
26—34 |
56—35 |
26—33 |
63—40 |
44—22 |
26—22 |
44—22 |
65—34 |
70— 11 |
66—01 |
70— 12 |
70— 12 |
6 5 -3 3 |
65—33 |
65—33 |
66—01 |
75—02 |
73 -21 |
75—02 |
7 5 -0 2 |
66—01 |
66—01 |
66—01 |
67—20 |
76—22 |
74—31 |
76—22 |
76—22 |
67—20 |
67—20 |
67—20 |
70— 15 |
— |
— |
.— |
.— |
73—21 |
70— 16 |
70--16 |
73—21 |
— |
— |
— |
— |
7 4 -1 6 |
73—21 |
73—21 |
061 |
062 |
063 |
064 |
065 |
066 |
067 |
070 |
17—37 |
17—37 |
17—37 |
17—37 |
17—37 |
17—37 |
01—37 |
01—37 |
26—22 |
26—22 |
26—22 |
26—22 |
26—23 |
26—23 |
20—36 |
20—36 |
61—36 |
61—36 |
61—36 |
34—33 |
61—36 |
61—36 |
22—40 |
22—40 |
63—40 |
63—40 |
63—40 61—36 6 3 -4 0 |
63—40 |
26—22 |
45—22 |
||
70— 12 |
67—20 |
67—20 |
63—40 |
67—20 |
65—33 |
65—33 |
65—33 |
71—33 |
70— 16 |
70— 16 |
67—20 |
70— 16 |
67—20 |
66—01 |
66— 16 |
— |
71—33 |
75—33 |
70— 16 |
76—21 |
70— 16 |
67—20 |
67—26 |
76—21 |
76—21 |
76—21 |
|||||
77 -01 |
76—21 |
77—01 |
76—21 |
73—21 |
72—02 |
||
071 |
77 -01 |
77—01 |
77—01 |
— |
77—01 |
74— 16 |
73--17 |
072 |
073 |
074 |
075 |
076 |
077 |
100 |
|
01—37 |
17—37 |
17—37 |
01—37 |
17—37 |
01—37 |
17—37 |
17—37 |
20—36 |
26—33 |
27— 22 |
20—36 |
24—33 |
20—36 |
27—22 |
26—33 |
22—40 |
27—22 |
61—36 |
22—40 |
45—22 |
22—40 |
34—33 |
45—22 |
42—33 |
61—36 |
63—40 |
27—22 |
61—36 |
27—22 |
61—36 |
61—36 |
45—22 |
63—40 |
67—02 |
65—33 |
63—40 |
65—33 |
63—40 |
63—40 |
66— 16 |
67—03 |
70—26 |
66— 16 |
66—06 |
66—32 |
67—03 |
66—06 |
67—26 |
76— 17 |
71—33 |
67—03 |
67—26 |
70— 10 |
76— 17 |
67—26 |
72—02 |
77— 16 |
76— 17 |
73— 17 |
72—02 |
77—02 |
77— 16 |
70—32 |
73— 17 |
— |
77— 16 |
— |
73— 17 |
— |
— |
72—02 |
|
|
|
|
77—32 |
— |
— |
73— 17 |
|
|
|
|
|
|
|
108
101 |
102 |
103 |
104 |
105 |
П р о д о л ж ен и е т а б л . 7 .4 |
|||
106 |
107 |
ПО |
||||||
01—37 |
17—37 |
13—43 |
02—43 |
02—43 10—60 13-43 |
10—60 |
|||
20—36 26—33 1 4-44 |
04—44 |
04—44 13—43 14—44 13—43 |
||||||
22—40 |
27—22 |
16—60 |
10—60 |
10—60 |
14—44 |
16—60 |
14—44 |
|
42—33 61—36 2 3 -5 3 |
25—51 |
23—53 |
23 -5 3 |
2 3 -5 3 |
23—53 |
|||
45—22 |
63—40 |
43—51 |
26—54 |
25—51 |
33—56 |
43—51 |
33—56 |
|
66—06 |
67—03 |
44—54 |
27—50 |
2 6 -5 4 34—41 44—42 |
35—47 |
|||
6 7 -2 6 |
76— 17 |
45—50 |
4 3 -5 6 |
27—50 35—47 45—50 37—57 |
||||
70—32 |
77— 16 |
52—55 |
34—41 |
33—56 |
37—57 |
53—56 |
43—51 |
|
72—02 |
.— |
53—56 |
35—47 |
34—41 |
43—51 |
— |
— |
|
— |
55—47 |
44—42 |
||||||
73—— 17 |
— |
54—41 |
37—57 |
35—47 |
44—54 |
56—57 |
45—50 |
|
— |
— |
55—47 |
60—55 |
37—57 |
45—50 |
52—55 |
52—55 |
|
56—57 |
64—53 |
52—55 |
5 2 -5 5 |
117 |
120 |
|||
111 |
112 |
113 |
114 |
115 |
116 |
|||
02—43 |
10—60 |
02—43 |
02—43 |
02—43 |
06—65 |
11—65 |
06—65 |
|
04—44 |
13—43 |
04—44 |
04—44 |
03—60 |
07—62 |
12—62 |
07—62 |
|
27—64 |
||||||||
10—60 14—44 1 0-60 |
1 0 -6 0 04—44 27—64 35—64 |
30—63 |
||||||
26—54 |
3 5 -4 7 |
26—54 |
26—54 |
26—54 |
30—63 |
36—63 |
||
27—50 |
37—57 |
27—50 |
27—50 |
27—45 |
57—66 |
— |
50—66 |
|
62—66 |
73—61 |
|||||||
34—41 |
44—54 |
35—47 |
35—47 |
31—57 |
_ |
.— |
||
76—61 |
76—61 |
|
||||||
35—47 |
4 5 -5 0 |
37—57 |
37—57 |
67—52 |
— |
.— |
— |
|
37—57 |
65—41 |
67—51 |
65—41 |
75—41 |
|
|
— |
|
|
|
— |
||||||
67—51 |
66—53 |
70—56 |
66—53 |
76—55 |
— |
— |
— |
|
7 0 -5 6 |
70—56 |
71—41 |
67—51 |
77—53 |
||||
76—55 |
72-51 |
76—55 |
70—56 |
|
|
|
_ |
|
77—53 |
73—55 |
77—53 |
7 3 -5 5 |
|
|
|
||
125 |
126 |
127 |
130 |
|||||
121 |
122 |
123 |
124 |
|||||
11—65 |
11—65 |
07—62 |
11—65 |
65—67 |
65—67 |
65—67 |
6 5 -6 7 |
|
12—62 |
12—62 |
11—65 |
12 —62 |
66—71 |
66—71 |
66—71 |
66—71 |
|
21—66 |
3 5 -6 4 |
30—63 |
3 5 -6 4 |
70—72 |
72—70 |
67—70 |
70— 72 |
|
3 5 -6 4 |
36—63 |
35—64 |
36—63 |
72—70 |
74—72 |
70—72 |
72—70 |
|
36—63 |
50—66 |
62—66 |
62— 66 |
■— |
■— |
— |
— |
|
73—61 |
73—61 |
73—61 |
73-61 |
— |
— |
— |
_ |
|
135 |
136 |
137 |
140 |
|||||
131 |
132 |
133 |
134 |
|||||
15—77 |
05—77 |
27—76 |
10—77 |
16—77 |
70—74 |
10—77 |
10—77 |
|
47—76 |
27—76 |
31—75 |
35—76 |
55—76 |
75—73 |
35—76 |
35—76 |
|
51—75 |
31—75 |
41—77 |
37—75 |
56—75 |
76—77 |
37—75 |
37—75 |
|
66—73 |
70—73 |
67—73 |
67—73 |
72—73 |
— |
72—73 |
65—73 |
|
65—73 |
— |
— |
— |
— |
.-- |
— |
— |
|
|
109
с голбец пар чисел, разделенных тире. Число, стоящее в каждой паре чисел слева от тире, является номером окончания (по табл. 7.2), а число, стоящее справа от тире—номером морфологической информации (по табл. 7,3), соответствующей сочетанию номера флективного класса и номера окончания слова. Общее количество пар чисел в табл. 7.4 равно количеству непустых кле ток двумерной морфологической таблицы.
При известном флективном классе и окончании сло ва его флективный анализ может быть сведен к выбор ке информации из табл. 7.2, 7.3, 7.4 в следующем по рядке. Сначала по табл. 7.2 буквенный код окончания заменяется его номером. Затем по номеру флективного класса и номеру окончания из табл. 7.4 выбирается но мер морфологической информации о слове. Наконец, с помощью табл. 7.3 номер морфологической информации заменяется соответствующим набором морфологических характеристик.
Приведем пример флективного анализа слов. Пусть требуется проанализировать формы слов «тираж», «стола», «переднего», «вы
ступала», |
которые принадлежат к флективным классам 002, 001, |
|||
104, 125 и |
имеют окончания « + » (нуль), |
«а», «его» |
и «а» |
соответ- |
ст вечно. |
|
окончаний |
на их |
номера |
Заменив по табл. 7.2 буквенные коды |
||||
65. 66, 02, |
66, входим в табл. 7.4, и для сочетаний номеров классов |
|||
и номеров |
окончаний (002, 65), (001, 66), |
(104, 02), |
(125, 66) опре |
деляем номера 02, 06, 43, 71 наборов морфологической информации. По табл. 7.3 находим, что морфологическая информация к слову «тираж» определяется набором 11, 14 (именительный и винительный
падеж единственного числа), |
к |
слову |
«стола» — набором 12 |
(роди |
||
тельный |
падеж |
единственного |
числа), |
к слову «переднего» — набо |
||
ром 12, |
14, 22 |
(родительный |
и |
винительный падеж мужского |
рода |
и родительный падеж среднего рода единственного числа) и, нако нец, к слову «выступала» — набором, состоящим из одной цифры 3 (женский род, единственное число).
Номер флективного класса основы определяется пос ле ее выделения из состава анализируемого слова. Чле нение слова производится путем последовательного отделения его конечных букв и поиска сочетания от деленных букв в списке окончаний. Если оказывается, что сочетание отделенных букв содержится в списке окончаний, то начальная часть слова ищется в словаре основ.
При совпадении начальной части слова с одной из основ словаря определяется номер совпавшей основы и номер ее флективного класса или, для омонимичных основ, сочетание номеров флективных классов. Это
ПО