Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.04.2024
Просмотров: 64
Скачиваний: 0
45
Т а б л и ц а 2.1
Способ
образования
Звонрие
Смычковые
Глухие
Звонкие
Щелевые
Глухие
Слитные Глухие
Смычково Боковое проходные Носовое
Дрожэщие
По действующему органу
губные язычные
дву губнопереднесреднезадне губные зубные язычные язычные язычные
|
ТВ. мяг. ТВ. мяг. ТВ. |
мяг. |
мяг. ТВ. |
мяг. |
||
|
б |
б ’ |
Д |
д 1 |
г |
г 1 |
|
п |
п' |
т |
т 1 |
к |
к' |
|
|
в |
в' зж |
з'ж 1 |
i |
|
|
|
|
|
c V |
|
|
|
|
ф |
ф1 СИ |
X |
X 1 |
|
|
|
|
ц |
ч 1 |
|
|
Сонорные |
|
|
л |
л 1 |
|
|
м |
и' |
р |
. р 1 |
|
|
|
|
н |
н' |
|
|
таблицы 2.2 и 2 .3 сводных данных по длительности гласных и согласных звуков речи [25], а тэкже графин (рис.2 .3) частот ных областей сплошных спентров гласных и соглэоных звуков ре чи [26].
Для моделирования восприятия звуков необходимо иметь чет кое представление о сущности моделируемого процесса звукооб разования и восприятия. Известно, что речевые сигналы можно представить как реализации нестационарного случайного процес са. Из осциллограмм речевого сигнала видно, что длительность сигналов, а тэкже разрывы их в предложениях и словах носят случайный характер. Однако случайность речевого сигнала отра жается лишь в виде особенностей и закономерностей физического процесса и в малой степени влияет на его информационное содер жание. Высокая достоверность опознавания фонетических элемен тов речи человеком объясняется значительной избыточностью ре чевого сигнала, которая используется при выделении признаков и опознавании фонем. Использование же априорной информации лингвистического характера позволяет компенсировать ошибки восприятия, вызванные различными дефектами произношения, 8
46
также посторонними шумами. Этот вопрос подробно освещен Ю.Г.Рон стовцевым в работе по исследованию методов повышения достовер ности связи за счет использования статистической избыточности сигналов [27].
Не останавливаясь на существующих методах изучения физиче ской ' структуры речевых сигналов, рассмотрим результаты изуче ния временных характеристик, к которым относится анализ рече вых сигналов, предельно ограниченных по амплитуде и преобразо
ванных в последовательность прямоугольных импульсов, т .е . ана лиз нлиппировэнной речи. Несмотря на тэное предельное ограни чение речевого сигнала, разборчивость его остается достаточно
По участию |
|
|
|
|
По степени |
|
гу5- |
неладилизооанные, |
ладилизтнные |
подъёма |
|||
|
языка '■ |
|||||
И |
|
|
Ы | |
. |
у ^Верхнего |
|
|
|
|
|
- я |
|
|
|
I I |
I |
I |
\ о ‘ |
^среднего |
|
|
\ |
| |
у |
“ |
1 |
|
|
! |
'- Ц - f |
т |
и\ ,нижнего |
||
|
|
|
|
I |
|
|
По месту |
переднего |
среднего |
заднего |
|
|
|
подъема |
ряда |
|
ряда |
ряда |
|
|
языка: |
|
|
|
|
|
|
Рис.2.2
высокой, что объясняется содержанием основной информации в чис ленных значениях временных интервалов переходов через нуль. Однако исследования клиппировэнной речи проводились лишь в основном с целью определения таких параметров речевого сигналЗ) как частота перехода исходного и продифференцированного сигна лов через нуль на промежутке времени Т, а также распределение этих промежутков времени между нулями [28]. Не получив желаемо го результата, авторы исследований пришли к заключению о необ-
47
ходимости одновременного применения как спектральных, так и временных методов для распознавания всех звуков определенного языка. При этом высокая надежность опознавания не гарантирова лась, в то время как человек достаточно хорошо разбирает клиппировзнную речь. Следовательно, напрашивается вывод, что иссле дования клиппировэнной речи были проведены далеко неполно. Не был открыт способ декодирования речевого сигнале, а танже не были обнаружены какие-либо инвариантные признаки, обеспечиваю щие решение этой проблемы.
|
|
|
|
|
Т а б л и ц а |
2.2 |
|
Положение |
|
Длительность гласных, мсен |
|
|
|||
гласного |
Ударные |
гласные |
Не ударные гласные |
||||
|
|||||||
|
|
|
|
В |
словах |
|
|
|
а |
|
э |
и |
81 |
32 |
э |
|
230 |
200 |
|
|
|||
Срединное |
180 |
. 140 |
80 |
80 |
|||
|
|
|
|
|
|
|
|
|
0 |
|
У |
ы |
и |
У |
ы |
|
220 |
190 |
190 |
100 |
НО |
100 |
|
Начальное и |
а |
|
3 |
и |
81 |
э |
и |
260 |
250 |
260 |
180 |
190 |
160 |
||
конечное |
о |
|
|
|
|
ы |
|
|
|
У |
ы |
э |
- |
||
|
250 |
250 |
- |
- |
170 ' |
“ |
|
|
|
|
|
Во фрззэх |
|
|
|
|
а |
|
э |
и |
а 1 |
а2 |
3 |
Разное |
180 |
140 |
140 |
120 |
80 |
НО |
|
0 |
|
У |
ы |
и |
У |
ы |
|
|
|
||||||
|
170 |
170 |
180 |
90 |
100 |
80 |
|
П р и м е ч а н и е . |
Э т - в |
слогэх, соседних с удар |
|||||
ным; во - в слогах, |
удаленных от ударных слогов более чем |
||||||
на один |
слог. |
|
|
|
|
|
|
Несомненно, использование временных характеристик совмест но с амплитудными характеристиками речевого сигнала в значительной степени расширяет объем воспринимаемой и обрабатываемой информации, что, в свою очередь, ведет
Типы согласных
© Звонние аз
п
о
as
ё Глухие
Звонкие
©
as
т
Ф
к
© Глухие
т
Аффрикаты
Носовые
Я
И
И Щелевые
К
О
О
Дрожащие
|
|
48 |
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц е |
2. 3 |
||
|
Длительность согласных, |
мсек |
|
|||||
|
|
Твердые |
|
|
Мягкие |
|
||
б |
Д |
г |
|
б |
|
Д |
|
Г |
100 |
100 |
10 |
|
90 |
|
90 |
|
100 |
п |
т |
в |
|
п |
|
т |
|
к |
2 0 |
30 |
30 |
|
30 |
|
100 |
|
40 |
в |
ж |
3 |
|
в |
|
Ж |
|
3 |
100 |
ПО |
НО |
|
80 |
|
— |
|
30 |
ф |
0 |
С |
X |
Ф |
ш |
|
с |
X |
150 |
140 |
140 |
120 |
120 |
240 |
150 |
|
|
|
Ц |
|
|
|
|
ч |
|
|
|
140 |
|
|
|
90 |
|
|
|
н |
|
н |
|
|
м |
|
н |
|
90 |
|
90 |
|
|
90 |
|
100 |
|
|
л |
|
|
|
л |
|
й |
|
|
80 |
|
|
|
80 |
|
80 |
|
|
Р |
|
|
|
|
Р |
|
|
|
10 |
|
|
|
40 |
|
|
к повышению надежности опознавания. Особое значение амплитудных характеристик состоит в окраске речевого сигнала, отражающей индивидуальные особенности говорящего, интонацию произносимых слов и др.
Известно, что наиболее экономичная форма фонетического представления устной речи есть упорядоченная последовательность фонем. В русском языке имеется 35 согласных и 6 гласных фонем. Однако автоматическое опознавание устной речи рациональней про изводить не только с помощью фонем, но и определенных звуков
г |
49 |
и признаков. Например, в качестве определенного звуке можно использовать "Я", а признака - мягкость звука.
Изучение экспериментальных работ биологов и психологов по зволило выдвинуть гипотезу‘о наличии у человека идентичных "ме ханизмов" вторичной обработки зрительной и речевой информации. Первичная обработке зрительной и речевой информации безуслов но отличается по принципу выделения признаков, но сходна тем, что в обоих случаях используются признаки, инвариантные отно сительно их групповых преобразований, а выделение этих призна ков осуществляется с помощью врожденных "механизмов" обработки воспринимаемой информации.
Моделируя процесс опознавания, первичную й вторичную обра ботку информации необходимо осуществвять с помощью предпрограммированных опознающих устройств, которые отличаются четкой фик сацией нэборэ нлассов признаков и строгой определенностью всех особенностей процесса их выделения. В процессе первичной.обра ботки производится анализ опознаваемого объекта, т . е . членение его на инвариантные признаки. В процессе же вторичной обработ ки на основании результатов сравнения выделенных признаков с