Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 141

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

восьмеричных цифр указывает на грамматическую ка­ тегорию числа, вторая—на падеж слова. При этом циф­

ра 1

на первом месте означает единственное число,

цифра

2—множественное число. Цифры 1, 2, 3, 4, 5, 6,

стоящие на втором месте, обозначают соответственно именительный, родительный, дательный, винительный, творительный и предложный надежи. Последователь­ ность пар восьмеричных цифр описывает случаи много­ значности информации о формах слов.

Для синтаксического класса «-прилагательные» пер­ вая цифра в каждой паре восьмеричных цифр обознача­ ет род и число, а вторая—падеж слова. Цифра 1 на первом месте означает, что прилагательное имеет фор­ му мужского рода единственного числа, цифра 2 яв­ ляется признаком среднего рода единственного числа, цифра 3 — признаком женского рода единственного чис­ ла; цифра 4 — признаком множественного числа. Паде­ жи прилагательных обозначаются так же, как и падежи существительных.

Морфологическая информация слов, принадлежа­ щих к синтаксическим классам «глаголы в личной фор­ ме», «глаголы прошедшего времени, краткие прилага­ тельные и причастия», «количественные числительные», обозначается в табл. 7.3 одной цифрой, а в случае многозначности — последовательностью цифр. При этом для .синтаксического класса «глаголы в личной форме» цифры 1, 2, 3 обозначают первое, второе и третье лицо единственного числа, а цифры 4, 5, 6—первое, второе и третье лицо множественного числа. Для синтаксиче­ ского класса «глаголы прошедшего времени, краткие прилагательные и причастия» цифры 1, 2, 3 обозначают формы мужского, среднего и женского рода единствен­ ного числа, а цифра 4—форму множественного числа. Формы слов синтаксического класса «количественные числительные» характеризуются только падежом, кото­ рый кодируется так же, как и у существительных и при­ лагательных.

Двумерная морфологическая таблица содержит мно­ го пустых клеток. Поэтому при ее линейной записи сле­ дует принимать специальные меры для экономии места в запоминающем устройстве ЭВМ. Один из возможных способов линейной записи морфологической таблицы иллюстрирует табл. 7.4. Здесь каждому номеру класса (см. подчеркнутые числа) поставлен в соответствие

106

Т а б л и ц а 7.4

МОРФОЛОГИЧЕСКАЯ ТАБЛИЦА

001

002

003

004

005

006

007

010

01—37

01—37

17—37

17—37

17—37

01—37

01—37

01—37

20 -3 6

20—36 26—33 24—33

24—33

20—36

20—36

20—36

22—40

22—40

27—22

27—22

27—22

22—40

22—40

22—40

42—33

26—33

61—36

61—36

61—36

42—33

45—22

42—33

45—22

45—22

63—40

63—40

63—40

45—22

65—04

45—22

65—02

65—02

67—26

67—26

70—30

65—02

66—06

65—02

66—06

66—06

70—32

70—32

71—02

66—06

67—26

66— 16

67—26

67—26

75—02

71—02

76— 17

67—26

70—32

67—26

73— 17

70—32

76— 17

76— 17

77—06

70—32

73— 17

73— 17

74—32

73— 17

77—06

77—06

73— 17

 

011

012

013

014

015

016

017

020

01—37

17—37

17—37

17—37

01—37

01—37

01—37

17—37

20—36

26—33

24—33

24—33

20—36

20—36

20—36

26—33

22—40

27—22

27—22

45—22

22—40

22—40

22—40

27—22

24—33

61—36

61—36

61—36

45—22

26—33

45 -22

61—36

27—22

63—40

63—40

63—40

65—04

27—22

65—04

63—40

65—02

70— 12

67—26

65—02

6 6 -1 6

65—02

66—06

67—26

66—06

75—02

71—02

66—06

67—26

66—06

67—26

75—02

67—26

76— 17

67—26

73— 17

67—26

73— 17

76— 17

73— 17

77— 16

73— 17

70—32

74—32

77— 16

74—32

77—32

73— 17

 

021

022

023

024

025

026

027

030

01—37

01—37

17—37

01—37

17—37

17—37

17—37

17—37

20—36

20—36

26—34

20—36

24—34

24—34

26—34

26—34

22—40

22—40

45—22

22—40

27—22

2 6 —01

27—22

27—22

42—34

45—22

61—36

26—34

61—36

27—22

61—36

61—36

45—22

65—05

63—40

45—22

63—40

61—36

63—40

63—40

65—01

66— 13

65—01

65—01

70—27

63—40

67—26

67—26

66— 13

67—26

66— 13

66— 13

71—01

67—26

70—31

75—01

67—26

73— 17

67—26

67—26

76— 17

70—31

75—01

76—

17

73— 17

74—31

70—31

70—31

77— 13

76— 17

76— 17

77— 14

74—31

73— 17

73— 17

•—

77— 13

77— 13

 

031

032

033

034

035

036

037

040

01—37

01—37

01—37

01— 37

17—37

01—37

01—37

01—37

20—36 20—36 20—36 20—36

2 6 -2 4

20—36

20—36

20—36

22—40

22—40

22—40

22—40

61—36

22—40

22—40

22—40

42—34

24—34

26—24

44—22

63—40

26—34

45—22

42—34

45—22

2 7 -2 2

66—01

65—34

67—20

27—22

6 5 -0 5

45—22

65—01

65—01

67—20

66—01

70— 15

65—01

66— 13

65—01

66— 13

66— 13

70— 15

67—20

76—21

66— 13

67—27

66— 14

67—26

67—26

73—21

73—21

77—01

67—26

7 3 -1 7

67—26

70—31

73— 17

74— 15

— 1

70—31

73— 17

73— 17

74—31

73— 17

 

107


041

042

043

044

045

Г І родолж ение т а б л . 7 .4

046

047

050

17—37

16—37

17—37

01—37

01—37

17—37

17—37

1 7 - 37

26—34

55—25

2 6 -3 4

20—36

20—36

26—22

26—22

26—22

27—22

56—35

45—22 22—40 22—40

61---1136 61—36

61—36

61 —36

65—01

61—36 44—22 26—22

63—40

6 3 -4 0

63—40

63—40

66— 13

63—40

65—34

6 5 -3 4

70-

67— 20

67—20

65—01

6 7 -2 6

65—01

66—01

66—0)

71—34

70— 15

70— 15

66— 13

73— 17

66— 13

67—20

67— 20

76—21

71—34

7 5 -3 4

67—26

74—31

67—26

73—21

73—21

77 -01

76—21

76-21

73— 17

73— 17

74— 15

74— 15

77—01

77—01

77—31

77—31

055

056

057

060

051

052

053

054

01—37

01—37

16—37

0 1 -3 7

17 -37

01—37 01—37 01—37

20—36

20—35

44—07

20—36

26—33

20—36

20—36

20—36

22—40

22—40

55—36

22—40

61—36

22—40

22—40

22—40

44—22

26—34

56—35

26—33

63—40

44—22

26—22

44—22

65—34

70— 11

66—01

70— 12

70— 12

6 5 -3 3

65—33

65—33

66—01

75—02

73 -21

75—02

7 5 -0 2

66—01

66—01

66—01

67—20

76—22

74—31

76—22

76—22

67—20

67—20

67—20

70— 15

.—

.—

73—21

70— 16

70--16

73—21

7 4 -1 6

73—21

73—21

061

062

063

064

065

066

067

070

17—37

17—37

17—37

17—37

17—37

17—37

01—37

01—37

26—22

26—22

26—22

26—22

26—23

26—23

20—36

20—36

61—36

61—36

61—36

34—33

61—36

61—36

22—40

22—40

63—40

63—40

63—40 61—36 6 3 -4 0

63—40

26—22

45—22

70— 12

67—20

67—20

63—40

67—20

65—33

65—33

65—33

71—33

70— 16

70— 16

67—20

70— 16

67—20

66—01

66— 16

71—33

75—33

70— 16

76—21

70— 16

67—20

67—26

76—21

76—21

76—21

77 -01

76—21

77—01

76—21

73—21

72—02

071

77 -01

77—01

77—01

77—01

74— 16

73--17

072

073

074

075

076

077

100

01—37

17—37

17—37

01—37

17—37

01—37

17—37

17—37

20—36

26—33

27— 22

20—36

24—33

20—36

27—22

26—33

22—40

27—22

61—36

22—40

45—22

22—40

34—33

45—22

42—33

61—36

63—40

27—22

61—36

27—22

61—36

61—36

45—22

63—40

67—02

65—33

63—40

65—33

63—40

63—40

66— 16

67—03

70—26

66— 16

66—06

66—32

67—03

66—06

67—26

76— 17

71—33

67—03

67—26

70— 10

76— 17

67—26

72—02

77— 16

76— 17

73— 17

72—02

77—02

77— 16

70—32

73— 17

77— 16

73— 17

72—02

 

 

 

 

77—32

73— 17

 

 

 

 

 

 

 

108


101

102

103

104

105

П р о д о л ж ен и е т а б л . 7 .4

106

107

ПО

01—37

17—37

13—43

02—43

02—43 10—60 13-43

10—60

20—36 26—33 1 4-44

04—44

04—44 13—43 14—44 13—43

22—40

27—22

16—60

10—60

10—60

14—44

16—60

14—44

42—33 61—36 2 3 -5 3

25—51

23—53

23 -5 3

2 3 -5 3

23—53

45—22

63—40

43—51

26—54

25—51

33—56

43—51

33—56

66—06

67—03

44—54

27—50

2 6 -5 4 34—41 44—42

35—47

6 7 -2 6

76— 17

45—50

4 3 -5 6

27—50 35—47 45—50 37—57

70—32

77— 16

52—55

34—41

33—56

37—57

53—56

43—51

72—02

.—

53—56

35—47

34—41

43—51

55—47

44—42

73— 17

54—41

37—57

35—47

44—54

56—57

45—50

55—47

60—55

37—57

45—50

52—55

52—55

56—57

64—53

52—55

5 2 -5 5

117

120

111

112

113

114

115

116

02—43

10—60

02—43

02—43

02—43

06—65

11—65

06—65

04—44

13—43

04—44

04—44

03—60

07—62

12—62

07—62

27—64

10—60 14—44 1 0-60

1 0 -6 0 04—44 27—64 35—64

30—63

26—54

3 5 -4 7

26—54

26—54

26—54

30—63

36—63

27—50

37—57

27—50

27—50

27—45

57—66

50—66

62—66

73—61

34—41

44—54

35—47

35—47

31—57

_

.—

76—61

76—61

 

35—47

4 5 -5 0

37—57

37—57

67—52

.—

37—57

65—41

67—51

65—41

75—41

 

 

 

 

67—51

66—53

70—56

66—53

76—55

7 0 -5 6

70—56

71—41

67—51

77—53

76—55

72-51

76—55

70—56

 

 

 

_

77—53

73—55

77—53

7 3 -5 5

 

 

 

125

126

127

130

121

122

123

124

11—65

11—65

07—62

11—65

65—67

65—67

65—67

6 5 -6 7

12—62

12—62

11—65

12 —62

66—71

66—71

66—71

66—71

21—66

3 5 -6 4

30—63

3 5 -6 4

70—72

72—70

67—70

70— 72

3 5 -6 4

36—63

35—64

36—63

72—70

74—72

70—72

72—70

36—63

50—66

62—66

62— 66

■—

■—

73—61

73—61

73—61

73-61

_

135

136

137

140

131

132

133

134

15—77

05—77

27—76

10—77

16—77

70—74

10—77

10—77

47—76

27—76

31—75

35—76

55—76

75—73

35—76

35—76

51—75

31—75

41—77

37—75

56—75

76—77

37—75

37—75

66—73

70—73

67—73

67—73

72—73

72—73

65—73

65—73

.--

 

109



с голбец пар чисел, разделенных тире. Число, стоящее в каждой паре чисел слева от тире, является номером окончания (по табл. 7.2), а число, стоящее справа от тире—номером морфологической информации (по табл. 7,3), соответствующей сочетанию номера флективного класса и номера окончания слова. Общее количество пар чисел в табл. 7.4 равно количеству непустых кле­ ток двумерной морфологической таблицы.

При известном флективном классе и окончании сло­ ва его флективный анализ может быть сведен к выбор­ ке информации из табл. 7.2, 7.3, 7.4 в следующем по­ рядке. Сначала по табл. 7.2 буквенный код окончания заменяется его номером. Затем по номеру флективного класса и номеру окончания из табл. 7.4 выбирается но­ мер морфологической информации о слове. Наконец, с помощью табл. 7.3 номер морфологической информации заменяется соответствующим набором морфологических характеристик.

Приведем пример флективного анализа слов. Пусть требуется проанализировать формы слов «тираж», «стола», «переднего», «вы­

ступала»,

которые принадлежат к флективным классам 002, 001,

104, 125 и

имеют окончания « + » (нуль),

«а», «его»

и «а»

соответ-

ст вечно.

 

окончаний

на их

номера

Заменив по табл. 7.2 буквенные коды

65. 66, 02,

66, входим в табл. 7.4, и для сочетаний номеров классов

и номеров

окончаний (002, 65), (001, 66),

(104, 02),

(125, 66) опре­

деляем номера 02, 06, 43, 71 наборов морфологической информации. По табл. 7.3 находим, что морфологическая информация к слову «тираж» определяется набором 11, 14 (именительный и винительный

падеж единственного числа),

к

слову

«стола» — набором 12

(роди­

тельный

падеж

единственного

числа),

к слову «переднего» — набо­

ром 12,

14, 22

(родительный

и

винительный падеж мужского

рода

и родительный падеж среднего рода единственного числа) и, нако­ нец, к слову «выступала» — набором, состоящим из одной цифры 3 (женский род, единственное число).

Номер флективного класса основы определяется пос­ ле ее выделения из состава анализируемого слова. Чле­ нение слова производится путем последовательного отделения его конечных букв и поиска сочетания от­ деленных букв в списке окончаний. Если оказывается, что сочетание отделенных букв содержится в списке окончаний, то начальная часть слова ищется в словаре основ.

При совпадении начальной части слова с одной из основ словаря определяется номер совпавшей основы и номер ее флективного класса или, для омонимичных основ, сочетание номеров флективных классов. Это

ПО