Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.04.2024

Просмотров: 63

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

 

67

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

2. 7

Опознавание

Се

Со

Су

Си

Ча

Чо

Чу

Чи

Обучение

 

 

 

 

 

 

 

 

Са

22

19

29

23

7

7

7

13

Ча

14

15

II

I I

I I

16

15

16

 

 

 

 

 

 

Т а б

я и ц

а 2 .8

Опознавание

П]_

ш2

m

 

 

 

Шаj

Шу

Обучение

Ш1

шз

 

 

* 3

 

 

 

 

 

 

 

 

 

 

 

 

 

Ш

13

10

14

12

9

10

4

5

Ша

12

4

4

8

9

8

7

3

Шу

6

4

6

5

8

8

3

7

Ви

II

4

10

15

10

16

5

3

словах Москва и Минск

при

к =

0 ,2 и

г = 3. Так же как

и рань­

ше, опознаванию подвергались лишь первое части сигналов дли­

тельностью в 50 нсек.

 

 

 

 

 

 

Аналогичные эксперименты проводились и с другими звуками.

В таблицах 2 .7 и 2 .8

приведены примеры опознавания пилящих зву­

ков при К =

0,05 и

Г = 3. Здесь низкий процент

опознанных при­

знаков объясняется тем, что опознавание производилось с исполь­ зованием информации о сигнале на нвчвльном участка при длина его не болев 10 мсек. Для выяснения динамики изменения процен­ та опознанных признаков в процессе приема сигнала были прове­ дены эксперименты по опознаванию сигналов на интервалах в 3 мсек и при своль8яцеи суммировании опознанных признаков на интервале в 10 мсек. В качестве примеров на рио.2.23 и 2.24 приведены результаты исследований звунов Цн, Чи, из которых

следует, что расширение интервала скользящего суммирования при­ знаков позволяет добиться плавного изменения во времени резуль­ татов опознавания.


68

Метод свокзящ его суммирования прианаков на определенном

небольшом интервале применялся для вычленения отдельных звуков

ни ома. Таи, для опоеневания олова "Мир" в ЭВМ по программе

"обучение" были введены привнани звуков Ри, Нн, Ир, Ми с ис­ пользованием яивь первой их части длиной в 50 мсен. Не рис.2.25 приведены результаты членения слова "Мир”, произнесенного -од­ ним из дикторов. Последовательное появление экстремумов дня звуков М, И, Р позволяет обеспечить опознавание звуков в сло­ вах, 8 следовательно, и самих слов. Характерным является то, что начальный участок реализации сигналов, полученных от прои8-

 

69

несенных олов, начинающихся с

сопасных звуков, часто несет

в себе ихн неопределенность,

или ложную информацию. К сожале­

нию, исключить этот учвстон из рассмотрения без предваритель­ ного вналяга нельзя из-за возможности расположения на нем при­ знаков взрывных звуков.

Все экспериментальные исследования проводились с помощью упрощенного алгоритма, т .е . не учитывалось расположение груп­ повых признаков в сигнале, а также частоте их встречаемости.

Учет этих параметров, безусловно, позволил бы улучшить резуль­ таты.

Одной из характеристик речевых сигналов может использо­ ваться зависимость информационной избыточности сигналов Ф от параметре к , определяющего в процессе опознавания ширину до­ верительного интервала, в котором рассматриваются инвариант­ ные признаки, т .е .

V = f ( я ) .

Отдельные значения этой функции

9

*

где п - общее число признаков в сигнале, а п. - число признаков, которые остались после исключения дубликатов. Операция


70

Рис.2.26

Р ис.2.27

71

по исклечению дубликатов инвариантных признаков, рассматривае­ мых в определенных доверительных интервалах, выполнялась на ЦВМ по программе "свертка признаков", которая позволяла полу­ чить зависимость

п*= f (и) .

Очевидно, что информационная избыточность будет также за­

висеть

от

величины п , т

.е . связности

инвариантных признаков,

а также

от

длины речевого

сигнала п ,

следовательно:

V ~ f ( n , г, п )

Практически п может выбираться на основании известных

длительностей сигналов, а для

п можно ограничиться

получением

значений V при п= 2;3 и 4.

Необходимость получения твких

характеристик вызвана следующими обстоятельствами.

Они нужны

Рис.2.28

при определении возможности сокращения эталонных описаний сиг­ налов, при проведении логических оперэций конъюнкции с целью выделения наиболее информативных групповых признаков в клаооах,

72

а также при проведении логических операций отрицания имплика­ ции- (запрета) для разделения классов.

В качестве примеров на рис.2.26 приведены зависимости ин­ формационной избыточности от вирины доверительного интервале для гласных звуков, на рис.2.27 - для звонких согласных и аф­ фрикат, на рис.2.28 - для глухих согласных (целевых), 8 на рис.2.29 - для сонорных звуков. Приведенные на этих рисунках кривые принадлежат одному диктору и получены при г - 2.

Рио.2.29

Анализ кривых функции V = f(n) , полученных для нескольких дикторов, показал, что они имеот разброс и в некоторой степе­ ни характеризуют особенности речевых сигналов определенных дикторов. В качестве примера на рис.2 .30 приведены кривые функции Y =f(H) для 8вука А шести дикторов.

Кривые функции V=f{n)t полученные для других значений п . имеют существенные отличия, которые характеризуют речевые сиг­ налы зависимостью информационной избыточности от связности инвариантных признаков, т .е .

Y = f ( r )

при к = const .


73

В таблице 2.9 приведены значения функции Y - f ( r ) для нескольних звуков при к = 0, 1.

Для исследования влияния различной предварительной фильтра дик сигналов на надежность опознавания проводились следующие эксперименты. Во-первых,это опознавание сигналов бее примене­ ния каких-либо фильтров на входа, во-вторых, опознавание сиг­ налов после их дифференцирования, в-третьих, в полосах частот пропускания фильтров 100 - 5000 гц, 100 - 1000 гц и 1000 - 5000 гц. Кроме того, были проведены исследования использова­ ния на входе порогового ограничителя.

Выбор фильтра должен производится на основании спектраль­ ных характеристик опознаваемых сигналов. Для некоторых звуков

можно рекомендовать производить опознавание

параллельно по

двум каналам. К таким звукам можно отнести,

например, Э, И, Н

и др. Применение дифференцирования сигналов

позволяет значи­

тельно уменьиить разброс параметров нлиппнроввнных сигналов, произносимых различными дикторами, а следовательно, улучинть результаты опознавания.

 

 

 

 

74

 

 

 

 

 

 

 

 

Т а б л и ц а

2. 9

¥

г - г

г = 3

 

У

г = 2

г = 3

 

н

0,85

0,79

 

с

0,42

0,05

 

к

0,55

0,13

 

ф

0,42

0,05

 

3

0,51

0,23

 

X

0,75

0,51

 

ч

0,66

0,18

 

I

0,77

0,49

 

ц

0,52

0,06

'

9

0,65

0,19

 

Для сокращения комплекса характеристик звуков речи некото­ рые исследователи используют предельно ограниченные по уровню речевые сигналы, т .е . клиппировэнную речь. При атом такие сиг­ налы имеют только один параметр - временные интервалы между переходами сигнала через ноль. До настоящего времени отсут­ ствует единая точка зрения, объясняющая достаточно высокую разборчивость этих сигналов. На наш взгляд, это объясняется, по-видимому, тем, что человек в процессе восприятия и опозна­

вания клишированных речевых сигналов использует не один пара­ метр - временные интервалы переходов сигнала черев ноль, а также значения амплитуды, которые получаются в результате ин­ тегрирования воздействия двух возможных значений амплитуды


75

клиппировэнного сигнала.Проведенные исследования показали, что 8Н8Ч6НИЯ амплитуды, полученные в результате интегрирования клиппиров8иного сигнала, с успехом могут использоваться в качестве дополнительного параметра при автоматическом опознавании рече­ вых сигналов. На ри с.2.31 приведены кривые, етражаюцие резуль­ таты интегрирования кяиппированного сигнала звука А. Подтверж­ дением данного предположения также могут служить эксперимен­ тальные исследования, проведенные Ю.Г.Ростовцевым [40] и пока­ завшие, что интегрирование на выходе клнппировэнной речи повы­ шает ее разборчивость.

Проводимый анализ таких характеристик позволил установить, что большинство преобразованных сигналов подвержено перспек­ тивно-аффинным групповым преобразованиям. Осталась неясной при­ рода их возникновения. Возможно, что данного виде искажения

происходили в аппаратуре, применяемой в ходе

экспериментов.

В связи с этим были проведены эксперименты по

опознаванию ре­

чевых сигналов с использованием признаков, инвариантных отно­ сительно аффинных групповых преобразований, что привело в зна­ чительному повышению Seneca надежного опознавания. Белл для клнппированного сигнала признаками инвариантных относительно подобных групповых преобразований являются отношения первых разностей временных интервалов переходов черев ноль

76

то признаками инвариантных относительно аффинных групповых преобразований буду» отношения пяощадей (рис.2.32)

£+'

Тан нан здесь эти площади образованы прямоугольными тре­ угольниками, то справедливо следующее равенство:

Pi

 

A U

1+1

* h +z

$

на основании которого и производилось вычисление признаков. Проведенные исследования по применению разработанного ме­

тода для опознавания речевых сигналов человека, понавели, что выделяемые инвариантные акустические признаки позволяют обес­ печить надежное опознавание и разделение на классы различных звуков речи, в том числе и фонем. При распознавании слогов окончательное решение о фонеме может приниматься лишь после анализа последующего звука, о чем указывалось ранее в работах Л.А.Чистович.

Однако к применению данного метода необходимо подходить творчески, учитывая в каждом конкретном случае стоящие зада­ чи, так как несмотря не свою простоту техническая реализация его в настоящее время связанв с определенными трудностями. По­ этому данный метод должен применяться тан, где более простые известные методы не могут обеспечить положительных результа­ тов. При этом особый интерес представляет комплексное исполь­ зование различных методов, что дает возможность получить оп­ тимальное решение при создании опознающих автоматов. Пример­ ная последовательность процессов обработки речевой информации представлена на р и с .2.33. Здесь с помощью фильтров обеспечи­ вается предварительное разделение сигналов, а также подавле­ ние в определенной отепенн воздействия помех. Практически т э - кие фильтры должны обладать определенной динамичностью, позво­ ляющей осуществлять их перестройку в зависимости от той инфор­ мации, которую необходимо опознать. Так, например, поступает слуховая система человека, когда необходимо выделить звуки . одного и8 инструментов, хотя бы гобоя, на фоне звуков других оркестровых инструментов. Такое выделение определенных клас­ сов звуков может, конечно, осуществляться и на более выооких уровнях.