Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.04.2024

Просмотров: 64

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

45

Т а б л и ц а 2.1

Способ

образования

Звонрие

Смычковые

Глухие

Звонкие

Щелевые

Глухие

Слитные Глухие

Смычково­ Боковое проходные Носовое

Дрожэщие

По действующему органу

губные язычные

дву­ губнопереднесреднезадне­ губные зубные язычные язычные язычные

 

ТВ. мяг. ТВ. мяг. ТВ.

мяг.

мяг. ТВ.

мяг.

 

б

б ’

Д

д 1

г

г 1

 

п

п'

т

т 1

к

к'

 

 

в

в' зж

з'ж 1

i

 

 

 

 

 

c V

 

 

 

ф

ф1 СИ

X

X 1

 

 

 

ц

ч 1

 

 

Сонорные

 

 

л

л 1

 

 

м

и'

р

. р 1

 

 

 

н

н'

 

 

таблицы 2.2 и 2 .3 сводных данных по длительности гласных и согласных звуков речи [25], а тэкже графин (рис.2 .3) частот­ ных областей сплошных спентров гласных и соглэоных звуков ре­ чи [26].

Для моделирования восприятия звуков необходимо иметь чет­ кое представление о сущности моделируемого процесса звукооб­ разования и восприятия. Известно, что речевые сигналы можно представить как реализации нестационарного случайного процес­ са. Из осциллограмм речевого сигнала видно, что длительность сигналов, а тэкже разрывы их в предложениях и словах носят случайный характер. Однако случайность речевого сигнала отра­ жается лишь в виде особенностей и закономерностей физического процесса и в малой степени влияет на его информационное содер­ жание. Высокая достоверность опознавания фонетических элемен­ тов речи человеком объясняется значительной избыточностью ре­ чевого сигнала, которая используется при выделении признаков и опознавании фонем. Использование же априорной информации лингвистического характера позволяет компенсировать ошибки восприятия, вызванные различными дефектами произношения, 8


46

также посторонними шумами. Этот вопрос подробно освещен Ю.Г.Рон стовцевым в работе по исследованию методов повышения достовер­ ности связи за счет использования статистической избыточности сигналов [27].

Не останавливаясь на существующих методах изучения физиче­ ской ' структуры речевых сигналов, рассмотрим результаты изуче­ ния временных характеристик, к которым относится анализ рече­ вых сигналов, предельно ограниченных по амплитуде и преобразо­

ванных в последовательность прямоугольных импульсов, т .е . ана­ лиз нлиппировэнной речи. Несмотря на тэное предельное ограни­ чение речевого сигнала, разборчивость его остается достаточно

По участию

 

 

 

 

По степени

гу5-

неладилизооанные,

ладилизтнные

подъёма

 

языка '■

И

 

 

Ы |

.

у ^Верхнего

 

 

 

 

- я

 

 

 

I I

I

I

\ о

^среднего

 

\

|

у

1

 

 

!

'- Ц - f

т

и\ ,нижнего

 

 

 

 

I

 

 

По месту

переднего

среднего

заднего

 

 

подъема

ряда

 

ряда

ряда

 

 

языка:

 

 

 

 

 

 

Рис.2.2

высокой, что объясняется содержанием основной информации в чис­ ленных значениях временных интервалов переходов через нуль. Однако исследования клиппировэнной речи проводились лишь в основном с целью определения таких параметров речевого сигналЗ) как частота перехода исходного и продифференцированного сигна­ лов через нуль на промежутке времени Т, а также распределение этих промежутков времени между нулями [28]. Не получив желаемо­ го результата, авторы исследований пришли к заключению о необ-


47

ходимости одновременного применения как спектральных, так и временных методов для распознавания всех звуков определенного языка. При этом высокая надежность опознавания не гарантирова­ лась, в то время как человек достаточно хорошо разбирает клиппировзнную речь. Следовательно, напрашивается вывод, что иссле­ дования клиппировэнной речи были проведены далеко неполно. Не был открыт способ декодирования речевого сигнале, а танже не были обнаружены какие-либо инвариантные признаки, обеспечиваю­ щие решение этой проблемы.

 

 

 

 

 

Т а б л и ц а

2.2

Положение

 

Длительность гласных, мсен

 

 

гласного

Ударные

гласные

Не ударные гласные

 

 

 

 

 

В

словах

 

 

 

а

 

э

и

81

32

э

 

230

200

 

 

Срединное

180

. 140

80

80

 

 

 

 

 

 

 

 

0

 

У

ы

и

У

ы

 

220

190

190

100

НО

100

Начальное и

а

 

3

и

81

э

и

260

250

260

180

190

160

конечное

о

 

 

 

 

ы

 

 

 

У

ы

э

-

 

250

250

-

-

170 '

 

 

 

 

Во фрззэх

 

 

 

а

 

э

и

а 1

а2

3

Разное

180

140

140

120

80

НО

0

 

У

ы

и

У

ы

 

 

 

170

170

180

90

100

80

П р и м е ч а н и е .

Э т - в

слогэх, соседних с удар­

ным; во - в слогах,

удаленных от ударных слогов более чем

на один

слог.

 

 

 

 

 

 

Несомненно, использование временных характеристик совмест­ но с амплитудными характеристиками речевого сигнала в значительной степени расширяет объем воспринимаемой и обрабатываемой информации, что, в свою очередь, ведет


Типы согласных

© Звонние аз

п

о

as

ё Глухие

Звонкие

©

as

т

Ф

к

© Глухие

т

Аффрикаты

Носовые

Я

И

И Щелевые

К

О

О

Дрожащие

 

 

48

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц е

2. 3

 

Длительность согласных,

мсек

 

 

 

Твердые

 

 

Мягкие

 

б

Д

г

 

б

 

Д

 

Г

100

100

10

 

90

 

90

 

100

п

т

в

 

п

 

т

 

к

2 0

30

30

 

30

 

100

 

40

в

ж

3

 

в

 

Ж

 

3

100

ПО

НО

 

80

 

 

30

ф

0

С

X

Ф

ш

 

с

X

150

140

140

120

120

240

150

 

 

Ц

 

 

 

 

ч

 

 

 

140

 

 

 

90

 

 

н

 

н

 

 

м

 

н

 

90

 

90

 

 

90

 

100

 

 

л

 

 

 

л

 

й

 

 

80

 

 

 

80

 

80

 

 

Р

 

 

 

 

Р

 

 

 

10

 

 

 

40

 

 

к повышению надежности опознавания. Особое значение амплитудных характеристик состоит в окраске речевого сигнала, отражающей индивидуальные особенности говорящего, интонацию произносимых слов и др.

Известно, что наиболее экономичная форма фонетического представления устной речи есть упорядоченная последовательность фонем. В русском языке имеется 35 согласных и 6 гласных фонем. Однако автоматическое опознавание устной речи рациональней про­ изводить не только с помощью фонем, но и определенных звуков


г

49

и признаков. Например, в качестве определенного звуке можно использовать "Я", а признака - мягкость звука.

Изучение экспериментальных работ биологов и психологов по­ зволило выдвинуть гипотезу‘о наличии у человека идентичных "ме­ ханизмов" вторичной обработки зрительной и речевой информации. Первичная обработке зрительной и речевой информации безуслов­ но отличается по принципу выделения признаков, но сходна тем, что в обоих случаях используются признаки, инвариантные отно­ сительно их групповых преобразований, а выделение этих призна­ ков осуществляется с помощью врожденных "механизмов" обработки воспринимаемой информации.

Моделируя процесс опознавания, первичную й вторичную обра­ ботку информации необходимо осуществвять с помощью предпрограммированных опознающих устройств, которые отличаются четкой фик­ сацией нэборэ нлассов признаков и строгой определенностью всех особенностей процесса их выделения. В процессе первичной.обра­ ботки производится анализ опознаваемого объекта, т . е . членение его на инвариантные признаки. В процессе же вторичной обработ­ ки на основании результатов сравнения выделенных признаков с