Файл: Белоногов Г.Г. Автоматизированные информационные системы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 146

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Возможно благодаря тому, что, как указывалось выше, каждой основе словаря поставлен в соответствие номер флективного класса, а для омонимичных основ указы­ вается сочетание номеров флективных классов (приме­ ром омонимичной основы является основа «осмотр», вхо­

дящая в состав

форм

двух различных

слов — «осмотр»

и «осмотреть»).

начала

слова с одной

из основ слова­

Совпадение

ря, а его конца с одним из окончаний возможно и при неправильном членении слова. Примером могут слу­ жить формы слов «знаков» и «управляем» с основами

«знак» и «управля».

Эти формы слов могут совпасть

с основами «знаков»

и «управляем» слов «знаковый»

и «управляемый» и неправильно расчлениться на осно­ вы «знаков» и «управляем» и нулевые окончания. По­ этому требуется проверка правильности членения слова Правильность членения слова определяется по мор фологической таблице путем проверки найденных осно­ вы и окончания слова на совместимость. Основа и окон­ чание слова считаются совместимыми, если клетка морфологической таблицы, соответствующая номеру флективного класса и номеру окончания слова, не пуста (или, .применительно к структуре табл. 7.4, если -номер окончания слова содержится в левой части столбца пар чисел, соответствующего номеру флективного класса). В противном случае основа и окончание несовместимы и следует продолжать поиск правильного членения сло­ ва. При омонимии основ на совместимость проверяются все возможные сочетания признаков «флективный класс» и «окончание», полученные в результате анали­

за слова.

Проверка основы и окончания слова на совмести­ мость позволяет в основном преодолеть трудности мор­ фологического анализа, связанные с омонимией основ слов. Однако при этом остается неразрешенной такая омонимия основ -слов, которая может приводить к сов­ падению некоторых форм различных слов. Например, у слов «техник» и «техника» совпадают несколько форм единственного и множественного числа, и вне контекста

по

одной

форме

слова нельзя определить, о каком

слове

идет

речь.

Такого рода омонимия может быть

Da-зрешена

только средствами синтаксического анализа,

а

в

некоторых

случаях потребуется и семантический

анализ контекста. Поэтому при морфологическом ана­

111


лизе необходимо сохранять нее возможные классы и н а ­

боры морфологической информации омонимичных сло­ воформ.

Описанный выше процесс членения на основу и окон­ чание применим к словам, не имеющим в своем составе возвратной частицы и мягкого знака между основой и окончанием. Наличие одного из этих элементов или обоих одновременно несколько осложняет процесс чле­ нения слова, из-за необходимости их обнаружения и вы­ деления из состава основы или окончания. При этом обнаружение возвратной частицы «ся» или «сь» отме­ чается признаком возвратности, а внутренний мягкий знак исключается из состава слова.

Включение в состав слова возвратной частицы вле­ чет за собой изменение его синтаксической роли в пред­ ложении и обычно придает ему новый смысловой отте­ нок (сравни слова «оборонять—обороняться», «управ­ ляющий — управляющийся», «пытал — пытался»). Есте­ ственно поэтому рассматривать возвратную частицу как составную часть основы слова с внутренней флек­ сией (с внутренним окончанием). Чтобы отличить осно­ ву слова с возвратной частицей от основы слова без возвратной частицы, к порядковому номеру основы, по­ лученному по словарю, прибавляется некоторое посто­ янное число. Величина этого постоянного числа должна быть выбрана такой, чтобы результирующее число не совпадало ни с одним номером словарной основы. С этой целью в код номера основы слова можно ввести дополнительный разряд и отмечать цифрой «1» наличие признака возвратности.

Результатом разрешения омонимии основы слова является выделение из серии флективных классов т о г о класса, который соответствует условиям контекста. Этот результат, как и факт наличия возвратной частицы, можно отображать в номере основы слова. Для этого вводят в код номера основы два дополнительных двоич­ ных разряда, в которых записывается порядковый номер (слева направо) выделенного класса в серии но­ меров флективных классов, соответствующих омони­

мичной основе.

производится

Флективный синтез изменяемых слов

с помощью словаря основ, обращенной

морфологиче­

ской таблицы (табл. 7.5) и списка окончаний (табл. 7.2). Обращенная морфологическая таблица состоит из не-

112


 

 

 

 

 

 

 

 

Т а б л и ц а

?.5

О

Б Р

А Щ Е Н

Н А Я

М О Р Ф О Л О Г И Ч Е С К А Я

Т А Б Л И Ц А

 

 

11

12

13

А .

С у щ е с т в и т е л ь н ы е

22

23

24

25

 

14

15

16

21

22

001—65

66

73

65

45

67

74

42

20

74

01

26

63

002—65

66

73

65

45

67

70

26

20

70

01

22

63

003—75

77

76

75

27

67

70

26

61

70

17

63

004—71

77

76

71

27

67

70

24

61

70

17

22

005—71

77

76

71

27

70

70

24

61

70

17

22

006—65

66

73

65

45

67

70

42

20

70

01

22

007—65

66

73

65

45

67

70

65

20

70

01

22

010—65

66

73

65

45

67

66

42

20

66

01

63

01 1 -6 5 66

73

65

27

67

74

24

20

74

01

63

012—75

70

70

75

27

70

70

26

61

70

17

63

013—71

77

76

71

27

67

77

24

61

77

17

22

014—65

66

73

65

45

67

77

24

61

77

17

22

015—65

66

73

65

45

67

66

65

20

66

01

22

016—65

66

73

65

27

67

70

26

20

70

01

63

017—65

66

73

65

45

67

74

65

20

74

01

22

020—75

77

76

75

27

67

77

26

61

77

17

22

021—65

66

73

66

45

67

74

42

20

42

01

63

022—65

66

73

66

45

67

74

65

20

65

01

22

023—65

66

73

66

45

67

70

26

61

26

17

63

024—65

66

73

66

45

67

70

26

20

26

01

63

025—71

77

76

77

27

70

70

24

61

24

17

63

026—26

77

76

77

27

67

70

24

61

24

17

63

027—75

77

76

77

27

67

70

26

61

26

17

22

030—75

77

76

77

27

67

77

26

61

26

17

22

031—65

66

73

66

45

67

70

42

20

42

01

22

032—65

66

73

66

27

67

74

24

20

24

01

 

033—66

70

67

77

26

67

70

26

20

26

01

63

034—66

74

67

73

44

67

74

65

20

65

01

22

0 3 5 -7 7

70

67

76

26

67

70

26

61

26

17

22

036—65

66

73

66

27

67

70

26

20

26

01

22

037—65

66

73

66

45

67

67

65

20

65

01

63

040—65

66

73

66

45

67

66

42

20

42

01

56

041—65

66

73

66

27

67

77

26

61

26

17

63

042—65

66

73

66

55

67

74

56

55

56

16

22

043—65

66

73

66

45

70

77

26

61

26

17

22

044—66

74

67

73

44

67

74

65

20

65

01

63

045—66

74

67

73

26

67

74

65

20

65

01

63

046—77

70

70

76

26

70

70

71

61

71

17

63

26

047—77

70

67

76

26

67

70

71

61

71

17

22

050—77

70

67

76

44

67

70

75

61

75

17

22

051—66

70

67

73

76

67

70

65

20

65

01

56

052—75

70

70

75

70

70

26

20

26

01

22

053—66

44

44

73

44

44

74

56

55

56

16

63

054—75

70

70

75

76

70

70

26

20

70

01

22

055—75

70

70

75

76

70

70

26

61

70

17

 

056—66

74

67

73

44

67

74

65

20

74

01

113

8—310

 

 

 

 

 

 

 

 

 

 

 


Іі

12

13

14

15

16

П р о д о л ж е н и е т а б л . 7.6

21

22

23

24

25

26

057—66

70

67

73

26

67

70

65

20

70

01

22

060—66

70

67

73

44

67

70

65

20

70

01

22

061—77

70

70

76

26

70

70

71

61

70

17

63

062—77

70

67

76

26

67

70

71

61

70

17

63

063—77

70

67

76

26

67

70

75

61

70

17

63

064—77

70

67

76

26

67

70

34

61

70

17

63

065—77

70

67

76

26

67

70

26

61

70

17

63

066—77

70

67

76

26

67

70

65

61

70

17

63

067—66

74

67

73

26

67

74

65

20

74

01

22

070—72

66

73

72

45

67

66

65

20

66

01

22

071—72

66

73

72

45

67

66

42

20

66

01

22

072—67

77

76

67

27

67

77

26

61

77

17

63

073— 67

77

76

67

27

70

77

71

61

77

17

63

074—67

66

73

67

27

67

66

65

20

66

01

22

075—72

66

73

72

45

67

77

24

61

77

17

63

076—77

70

70

77

27

70

66

65

20

66

01

22

077—67

77

76

67

27

67

77

34

61

77

17

63

100—72

66

73

72

45

67

70

26

61

70

17

63

101— 72

66

73

72

45

67

70

42

20

70

01

22

102—67

77

76

67

27

67

77

26

61

77

17

63

103

104

105

Б .

П рилагательны е

112

 

113

114

115

106

107

ПО

111

 

11—54

34

34

34

44

44

34

65

 

71

65

75

12— 13

02

02

13

13

13

02

13

 

02

02

02

14

14

14

04

14

 

04

04

04

13— 14

04

04

34

44

44

34

65

 

71

65

75

14—54

34

34

35

55

35

35

35

 

35

35

27

15—55

35

35

45

45

45

27

45

 

27

27

27

16—45

27

27

 

21—43

25

25

43

43

43

67

72

 

67

67

67

22— 13

02

02

13

13

13

02

13

 

02

02

02

23— 14

04

04

14

14

14

04

14

 

04

04

04

24—43

25

25

43

43

43

67

72

 

67

67

67

35

 

35

35

27

25—55

35

35

35

55

35

35

 

27

26—45

27

27

45

45

45

27

45

 

27

27

31—23

64

23

23

23

23

77

66

 

77

66

77

32—44

26

26

44

44

44

26

44

 

26

26

26

33—44

26

26

44

44

44

26

44

 

26

26

26

34—52

60

52

52

52

52

76

73

 

76

73

76

35—44

26

26

44

44

44

26

44

 

26

26.

26

44

44

44

26

44

 

26

26

26

36—44

26

26

53

33

70

70

 

70

70

67

41—53

33

33

33

37

37

37

 

37

37

31

42—56

37

37

37

56

 

43—55

35

35

35

55

35

35

35

 

35

35

27

44—53

33

33

33

53

33

70

70

 

70

70

67

45— 16

10

10

10

16

10

10

10

 

10

10

03

46—56

37

37

37

56

37

37

37

 

37

37

31

114


П р о д о л ж е н и е т а б л . 7 .5

ПС

В . Глаголы в личной форме

124

117

120

121

122

123

1—76

76

73

73

73

73

73

2—07

12

07

12

12

07

12

3—30

36

30

36

36

30

36

4—27

35

27

35

35

35

35

5—06

И

06

11

11

11

11

6—57

62

50

21

50

62

62

Г . Глаголы прошедшего времени и краткие прилагательные

 

 

125

126

127

130

 

 

 

 

1—65

65

65

65

 

 

 

 

2— 72

72

67

72

 

 

 

 

3— 66

66

66

66

 

 

 

 

4—70

74

70

70

 

 

131

д . Количественные

числительные

140

132

133

134

135

136

137

1—66

70

67

67

72

75

72

65

2—51

31

31

37

56

70

37

37

3—47

27

27

35

55

70

35

35

4 - 6 6

70

67

67

72

75

72

65

5— 15

05

41

10

16

76

10

10

6—51

31

31

37

56

70

37

37

скольких частей, число которых определяется количест­ вом синтаксических классов изменяемых слов.

Часть таблицы с индексом «А» используется для син­ теза форм существительных. Здесь по одному входу таблицы (левому) перечислены коды морфологических классов, а по другому (верхнему)— морфологическая информация («оды морфологической информации под­ черкнуты). На пересечении строк и столбцов указаны номера окончаний. Другие части обращенной морфо­ логической таблицы (с индексами Б, В, Г, Д) построе­ ны аналогично части «А», с тем лишь отличием, что здесь переставлены входы таблицы: верхние входы со­ ответствуют флективным классам, а левые — морфоло­ гической информации.

8*

115