Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.04.2024

Просмотров: 60

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

32

Алгоритмы работы вычислительной машины должны обеспечить выполнение следующих основных операций:

1) вычисление значений инвариантных элементарных призна­ ков сигнала;

2) маркировка инвариантных признаков, т .е . присвоение им порядковых номеров, а в процессе "обучения" также присвоение им номера эталонного сигнала;

3) в процессе "обучения" расстановка полученных признаков в запоминающем устройстве.вычислительной машины, позволяющей исключить переборы всей хранящейся информации в процессе опо­ знавания сигналов;

4)в процессе опознавания выделение номера эталонного сиг­ нала, совокупность признаков которого подобна совокупности при­ знаков опознаваемого сигнале;

5)проведение операции минимизации описаний эталонов, хра­ нящихся в памяти машины, при условии полной определенности ал­ фавита сигналов.

Рассмотрим алгоритм обработки информации при получении эталонных описаний сигналов (процесс "обучения" ЭВМ), пред­ ставленный на р и с .1 .7 . Исходные сигналы с помощью устройства ввода преобразуются в электрические сигналы с параметрами за­ данного диапазона, а также подвергаются предварительной филь­ трации. Одновременно производится преобразование непрерывных сигналов в цифровые коды в соответствии о методикой, описан­ ной в § 2. В результате на выходе преобразователя получаются две упорядоченные последовательности цифровых кодов, характе­ ризующих значения амплитуды сигнала в определенные дискретные моменты времени. Получаемые цифровые коды подвергаются иден­ тичной обработке, осуществляемой параллельно. Прежде всего,

вычисляются значения инвариантных признаков в соответствии с методикой, описанной в § 3, и формирование эталонных кодов,' содержащих не только значения инвариантных признаков и исход­ ных цифровых кодов, но и частоту их встречаемости.

Необходимость вычисления тех или иных инвариантных признэ-. ,ков, а также сохранение исходных цифровых кодов определяется конкретными начальными условиями, т .е . постановкой зэдачи.

Для того чтобы в процессе опознавания была возможность учесть связность признаков, т .е . сформировать групповые при­ знаки, применяется маркировка сформированных эталонных кодов порядкбвыми номерами, а также номерами соответствующих эталон­

33

ных сигналов. Для исключения в процессе опознавания перебора всей хранящейся информации об эталонных сигналах применяется расстановка эталонных кодов в запоминающем устройстве в поряд­ ке возрастания их величины, независимо от их порядкового номе­ ре и номера эталонного сигнала. Для этих массивов кодов форми­ руются постоянные табличные характеристики (ПТХ), которые в процессе опознавания обеспечивают оперативный поиск необходи­ мых зон в массивах эталонных кодов, соответствующих величинам

Рис.1.7

 

вычисленных признаков опознаваемых сигналов.

осущест­

вляется минимизация эталонных описаний сигналов,

что позволяет

в определенных пределах сократить их информационную избыточ­ ность.

Здесь алгоритм вычисления инвариантных признаков заранее


34

определен, но величины признаков становятся известными лишь после определения алфавите опознаваемых фигур, т .е . в процес­ се "обучения" опознающего автомата.

Рис.1.8

35

При "обучении" опознающего автомата заданному алфавиту эта­

лонов в данном случае не требуется предъявления тренировочной последовательности изображений эталона, что имеет место при ра­ боте с опознающими устройствами со стохастическими связями, и имеется возможность ограничиться в процессе "обучения" предъ­ явлением опознающему автомату лишь одного изображения каждого эталона.

Рассмотрим теперь алгоритм обработки информации, получае­ мой от опознаваемых сигналов (процесс опознавания), представ­ ленный на ри с .1 .8 . Вплоть до маркировки кодов все операции ана­ логичны операциям, проводимым в процессе "обучения". Операция опознавания предусматривает последовательное использование раз­ личных признаков. Вначале используются признаки, инвариантные по от­ ношению в аффинным групповым преобразованиям. Если же сигналы аффин­

но подобны и их признаки совпадают, то используются признаки инвариантные по отношению подобных преобразований и т .д . В не­ которых случаях переход к инвариантным признакам приводит в потере основной информации, например частоты сигнала. Поэтому исходные цифровые коды могут также использоваться в тех случаях, ногда это является целесообразным.

В процессе опознавания для каждого сформированного призна­ ка в соответствии с его величиной при помощи ПТХ выбирается определенная зона в массиве эталонных признаков, хранящихся в запоминающем устройстве. Из выбранной зоны в соответствии с за­ данной шириной доверительного интервала, который определяется величиной ожидаемых или измеренных помех, получаем группу ко­ дов, содержащих подобные эталонные признаки. Из последних вы­ деляются номера эталонных сигналов, которые в дальнейшем наде­ ляются поощрительными единицами, что позволяет сформировать ве­ се выделенных номеров эталонных сигналов. Однако, если опозна­ вание ведется при связности признаков г > I,- то опознавание осуществляется при помощи пар смежных признаков сигнала, для ноторых выделяются две группы подобных эталонных признаков.

У всех возможных пар признаков, полученных из этих двух групп, вычисляются разности их порядковых номеров и номеров сигналов. При этом та пара признаков, у которой разность порядковых но­ меров равна единице, а разность номеров сигналов равна нулю, считается подобной. Соответствующий эталонный сигнал наделяет­ ся поощрительной единицей лишь в том случае, если все смежные


36

пвры признаков, образующие групповой признак, подобны смежным парам признаков опознаваемого сигнала.

После обработки всех признаков опознаваемого сигнала и вы­ числения степеней подобия анализируются суммарные веса выде­ ленных номеров эталонных сигналов. Тот номер эталонного сиг­ нала, у которого суммарный вес максимальный, будет свидетель­ ствовать о наибольшей степени подобия опознаваемого сигнала данному эталонному сигналу.

Несмотря на то, что во многих случаях, применяя данный ме­ тод, можно опознать сигналы по их одиночным реализациям (эта­ лонам), в тех случаях, когда имеются статистические данные об опознаваемых сигналах, необходимо использовать их, что дает возможность повысить надежность опознавания. Прежде всего в каждом классе сигналов необходимо произвести операцию конъюнк­ ции, что позволяет выделить наиболее информативные признаки этих классов. Далее между классами сигналов следует произве­ сти операцию запрета, инверсную импликации, что позволяет в свою очередь осуществить разделение классов сигналов. Лучшие результаты разделения классов сигналов получаются, если снача­ ла произвести операцию запрета между реализациями различных

классов сигналов, а

затем уже производить операцию конъюнкции

в классах сигналов.

В заключение хочется заметит^, что приме­

нение тех или иных логических операций зависит в основном от составе классов сигналов. Так, например, возможны случаи, когда признаки одного клэсса сигнала будут являться подмножеством другого класса сигнала, т .е . будет иметь место полное пересе­ чение классов. В этом случае операция запрета проводится лишь

для

второго класса сигнала, признаки же первого класса сигна­

ла

полностью сохраняются.

37

Г я а в а П

АВТОМАТИЧЕСКОЕ ОПОЗНАВАНИЕ РЕЧЕВЫХ СИГНАЛОВ•ЧЕЛОВЕКА

§ 2 .1 . Постановка задачи и основные предпосылки к проведению экспериментальных иссяедований

Для проверни разработанного метода автоматического опозна­ вания электрических сигналов, представляющих собой реализации нестационарных случайных процессов, было решено испытать его не речевых сигналах человека. Тем более, что необходимость ре­ шения такой актуальной проблемы, как автоматическое опознава­ ние речевой информации, в нестоящий момент является одной и8 первоочередных задач технической кибернетики. Кроме того, со­ здание такого рода опознающих устройств, являющихся своеобраз­ ными моделями восприятия речевых сигналов человеком, позволяет в какой-то степени дать объяснение возможного функционирования биологической системы.

Прежде всего остановимся на тех задачах, которые можно, бу­ дет решать после того, как такие автоматические опознающие уст­ ройстве будут созданы. Во-первых, это речевое управление маши­ нами, когда обстановка требует оперативности в отдавзнии коман­ ды или когдэ кроме устного общения отсутствует непосредствен­ ный контакт оператора с машиной. Во-вторых, это создание пере­ водческих машин-полиглотов, способных без промежуточного пере­ кодирования осуществлять непосредственный перевод речевой ин­ формации с одного языка на другой. В-третьих, это создание вокодеров, позволяющих значительно разгрузить каналы связи.

В-четвертых, диагностические машины, которые за последнее вре­ мя начинают находить широкое применение, и т .п .

Интенсивные работы, которые ведут в этом направлении мно­


 

 

 

38

гие

научные

коллективы как

в нашей стране, так и за рубежом,

не

привели

еще к желаемому

результату. Цель их исследований

можно было бы сформулировать следующим образом: надежное авто­ матическое опознавание большого объема речевых сигналов, про­ износимых любым количе'ством операторов (дикторов), независимо от их физиологического состояния.

Основные причины, которые до настоящего времени не давали возможности найти решение этой проблемы, нам кажутся, следую­ щие. Прежде всего, попытки решить достаточно сложную проблему с помощью элементарных технических средств без применения элек­ тронных цифровых вычислительных устройств. В тех же случаях, когда применяются ЦВМ, как правило, с помощью их моделируются ранее известные методы. Следующая причина и, пожалуй, не менее важная, это отсутствие глубокого анализа работ физиологов и психологов, направленных на изучение слухового анализатора че­ ловека.

Принцип работы таких приемнинов информации, как ухо и глаз, давно привлекает внимание ученых, но в силу целого ряда труд­ ностей работа зрительного и слухового анализаторов до сих пор до конца не понята, а имеющиеся гипотезы зачастую противоре­ чат друг другу. Однако физиологией и психологией накоплено большое количество фактов, Которые позволяют в известной сте­ пени составить представление о структуре и общей картине рабо­ ты этих анализаторов. Характерно, что результаты эксперимен­ тальных работ биологов переплетаются с работами психологов. Многие выводы совпадают, и это может являться подтверждением правильности полученных результатов. Безусловно, что точное моделирование функционирования биологических систем нельзя признать всегда полезным, однако использование отдельных ра­ циональных зерен, посеянных природой, всегда оказывает неоце­ нимую услугу.

Основной трудностью при решении проблемы автоматического опознавания образов является выбор полезных признаков, харак­ теризующих свойства и параметры образов. Многие авторы работ, посвященных распознаванию образов, при выборе полезных призна­ ков в основном ориентируются на интуицию и свой опыт. В резуль­ тате чего признаки выбираются произвольно и, нэк правило, по­ зволяют решать лишь отдельные частные задачи.

Сложность решаемой проблемы требует на первом этэпе сокра­


39

тить до минимума количество используемых параметров речевого сигнала и упростить до максимума начальные условия. В дальней­ шем, конечно, постепенно усложняя задачу, имеется возможность произвести моделирование реальных условий, но все это возможно лишь тогда, когда на каждом рассматриваемом этапе получены по­ ложительные результаты.

В данном случае проведение экспериментов при одновременном участии биологов, психологов, инженеров и математиков может яв­ ляться гарантией объективности проводимых экспериментов, а так­ же достоверности полученных результатов.

Исходным материалом, из которого строится устная речь, яв­ ляются звуки. Однако количество звуков речи практически неограничено. Произнесенные звуки, соответствующие определенной бук­ ве, отличаются уже тогда, когда они произносятся одним и тем же человеком. Эти отличия увеличиваются, если звуки произнесе­ ны разными людьми, мужчиной и женщиной, ребенком или подрост­ ком. Здесь звуки характеризуются различной высотой, тембром и силой. При этом существенное влияние оказывают соседние зву­ ки, в результате чего произношение звунов меняется. В качест­ ве исходных единиц речи используются фонемы, под которыми по­ нимают определенные звуки, играющие одинаковую смысловую роль в словах. Фонемы являются строительным материалом для состав­

ления морфем, являющихся наименьшими единицами языка и в сово­ купности образующими слове, из которых в дальнейшем строятся предложения. При создании устройств автоматического опознава­ ния речевых сигналов человека наибольший интерес представляет использование фонем, число которых невелико и в различных язы­ ках колеблется от 12 до 80 [20]. Использование же морфем свя­ зано с определенными трудностями, так кэк последних в любом языке насчитывается несколько тысяч. Использование слов, кото­ рых в языке насчитывается несколько сот тысяч, возможно лишь при решении отдельных частных задач, когда мы имеем дело с ограниченным словарем слов.

Иэ всех существующих методов исследования речевых сигналов наибольший интерес представляет метод визуализации речи,осно­ ванный на использовании динамических спектрограмм (видеограмм) речи. Здесь речевой сигнал представляется,в виде диаграммы, отражающей зависимости силы звука и частоты от времени. Резуль­ таты исследований показали, что, используя видеограммы речи, можно легко научиться "читать" речь. При этом имеется возмож-