Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.04.2024
Просмотров: 60
Скачиваний: 0
32
Алгоритмы работы вычислительной машины должны обеспечить выполнение следующих основных операций:
1) вычисление значений инвариантных элементарных призна ков сигнала;
2) маркировка инвариантных признаков, т .е . присвоение им порядковых номеров, а в процессе "обучения" также присвоение им номера эталонного сигнала;
3) в процессе "обучения" расстановка полученных признаков в запоминающем устройстве.вычислительной машины, позволяющей исключить переборы всей хранящейся информации в процессе опо знавания сигналов;
4)в процессе опознавания выделение номера эталонного сиг нала, совокупность признаков которого подобна совокупности при знаков опознаваемого сигнале;
5)проведение операции минимизации описаний эталонов, хра нящихся в памяти машины, при условии полной определенности ал фавита сигналов.
Рассмотрим алгоритм обработки информации при получении эталонных описаний сигналов (процесс "обучения" ЭВМ), пред ставленный на р и с .1 .7 . Исходные сигналы с помощью устройства ввода преобразуются в электрические сигналы с параметрами за данного диапазона, а также подвергаются предварительной филь трации. Одновременно производится преобразование непрерывных сигналов в цифровые коды в соответствии о методикой, описан ной в § 2. В результате на выходе преобразователя получаются две упорядоченные последовательности цифровых кодов, характе ризующих значения амплитуды сигнала в определенные дискретные моменты времени. Получаемые цифровые коды подвергаются иден тичной обработке, осуществляемой параллельно. Прежде всего,
вычисляются значения инвариантных признаков в соответствии с методикой, описанной в § 3, и формирование эталонных кодов,' содержащих не только значения инвариантных признаков и исход ных цифровых кодов, но и частоту их встречаемости.
Необходимость вычисления тех или иных инвариантных признэ-. ,ков, а также сохранение исходных цифровых кодов определяется конкретными начальными условиями, т .е . постановкой зэдачи.
Для того чтобы в процессе опознавания была возможность учесть связность признаков, т .е . сформировать групповые при знаки, применяется маркировка сформированных эталонных кодов порядкбвыми номерами, а также номерами соответствующих эталон
33
ных сигналов. Для исключения в процессе опознавания перебора всей хранящейся информации об эталонных сигналах применяется расстановка эталонных кодов в запоминающем устройстве в поряд ке возрастания их величины, независимо от их порядкового номе ре и номера эталонного сигнала. Для этих массивов кодов форми руются постоянные табличные характеристики (ПТХ), которые в процессе опознавания обеспечивают оперативный поиск необходи мых зон в массивах эталонных кодов, соответствующих величинам
Рис.1.7 |
|
вычисленных признаков опознаваемых сигналов. |
осущест |
вляется минимизация эталонных описаний сигналов, |
что позволяет |
в определенных пределах сократить их информационную избыточ ность.
Здесь алгоритм вычисления инвариантных признаков заранее
34
определен, но величины признаков становятся известными лишь после определения алфавите опознаваемых фигур, т .е . в процес се "обучения" опознающего автомата.
Рис.1.8
35
При "обучении" опознающего автомата заданному алфавиту эта
лонов в данном случае не требуется предъявления тренировочной последовательности изображений эталона, что имеет место при ра боте с опознающими устройствами со стохастическими связями, и имеется возможность ограничиться в процессе "обучения" предъ явлением опознающему автомату лишь одного изображения каждого эталона.
Рассмотрим теперь алгоритм обработки информации, получае мой от опознаваемых сигналов (процесс опознавания), представ ленный на ри с .1 .8 . Вплоть до маркировки кодов все операции ана логичны операциям, проводимым в процессе "обучения". Операция опознавания предусматривает последовательное использование раз личных признаков. Вначале используются признаки, инвариантные по от ношению в аффинным групповым преобразованиям. Если же сигналы аффин
но подобны и их признаки совпадают, то используются признаки инвариантные по отношению подобных преобразований и т .д . В не которых случаях переход к инвариантным признакам приводит в потере основной информации, например частоты сигнала. Поэтому исходные цифровые коды могут также использоваться в тех случаях, ногда это является целесообразным.
В процессе опознавания для каждого сформированного призна ка в соответствии с его величиной при помощи ПТХ выбирается определенная зона в массиве эталонных признаков, хранящихся в запоминающем устройстве. Из выбранной зоны в соответствии с за данной шириной доверительного интервала, который определяется величиной ожидаемых или измеренных помех, получаем группу ко дов, содержащих подобные эталонные признаки. Из последних вы деляются номера эталонных сигналов, которые в дальнейшем наде ляются поощрительными единицами, что позволяет сформировать ве се выделенных номеров эталонных сигналов. Однако, если опозна вание ведется при связности признаков г > I,- то опознавание осуществляется при помощи пар смежных признаков сигнала, для ноторых выделяются две группы подобных эталонных признаков.
У всех возможных пар признаков, полученных из этих двух групп, вычисляются разности их порядковых номеров и номеров сигналов. При этом та пара признаков, у которой разность порядковых но меров равна единице, а разность номеров сигналов равна нулю, считается подобной. Соответствующий эталонный сигнал наделяет ся поощрительной единицей лишь в том случае, если все смежные
36
пвры признаков, образующие групповой признак, подобны смежным парам признаков опознаваемого сигнала.
После обработки всех признаков опознаваемого сигнала и вы числения степеней подобия анализируются суммарные веса выде ленных номеров эталонных сигналов. Тот номер эталонного сиг нала, у которого суммарный вес максимальный, будет свидетель ствовать о наибольшей степени подобия опознаваемого сигнала данному эталонному сигналу.
Несмотря на то, что во многих случаях, применяя данный ме тод, можно опознать сигналы по их одиночным реализациям (эта лонам), в тех случаях, когда имеются статистические данные об опознаваемых сигналах, необходимо использовать их, что дает возможность повысить надежность опознавания. Прежде всего в каждом классе сигналов необходимо произвести операцию конъюнк ции, что позволяет выделить наиболее информативные признаки этих классов. Далее между классами сигналов следует произве сти операцию запрета, инверсную импликации, что позволяет в свою очередь осуществить разделение классов сигналов. Лучшие результаты разделения классов сигналов получаются, если снача ла произвести операцию запрета между реализациями различных
классов сигналов, а |
затем уже производить операцию конъюнкции |
в классах сигналов. |
В заключение хочется заметит^, что приме |
нение тех или иных логических операций зависит в основном от составе классов сигналов. Так, например, возможны случаи, когда признаки одного клэсса сигнала будут являться подмножеством другого класса сигнала, т .е . будет иметь место полное пересе чение классов. В этом случае операция запрета проводится лишь
для |
второго класса сигнала, признаки же первого класса сигна |
ла |
полностью сохраняются. |
37
Г я а в а П
АВТОМАТИЧЕСКОЕ ОПОЗНАВАНИЕ РЕЧЕВЫХ СИГНАЛОВ•ЧЕЛОВЕКА
§ 2 .1 . Постановка задачи и основные предпосылки к проведению экспериментальных иссяедований
Для проверни разработанного метода автоматического опозна вания электрических сигналов, представляющих собой реализации нестационарных случайных процессов, было решено испытать его не речевых сигналах человека. Тем более, что необходимость ре шения такой актуальной проблемы, как автоматическое опознава ние речевой информации, в нестоящий момент является одной и8 первоочередных задач технической кибернетики. Кроме того, со здание такого рода опознающих устройств, являющихся своеобраз ными моделями восприятия речевых сигналов человеком, позволяет в какой-то степени дать объяснение возможного функционирования биологической системы.
Прежде всего остановимся на тех задачах, которые можно, бу дет решать после того, как такие автоматические опознающие уст ройстве будут созданы. Во-первых, это речевое управление маши нами, когда обстановка требует оперативности в отдавзнии коман ды или когдэ кроме устного общения отсутствует непосредствен ный контакт оператора с машиной. Во-вторых, это создание пере водческих машин-полиглотов, способных без промежуточного пере кодирования осуществлять непосредственный перевод речевой ин формации с одного языка на другой. В-третьих, это создание вокодеров, позволяющих значительно разгрузить каналы связи.
В-четвертых, диагностические машины, которые за последнее вре мя начинают находить широкое применение, и т .п .
Интенсивные работы, которые ведут в этом направлении мно
|
|
|
38 |
гие |
научные |
коллективы как |
в нашей стране, так и за рубежом, |
не |
привели |
еще к желаемому |
результату. Цель их исследований |
можно было бы сформулировать следующим образом: надежное авто матическое опознавание большого объема речевых сигналов, про износимых любым количе'ством операторов (дикторов), независимо от их физиологического состояния.
Основные причины, которые до настоящего времени не давали возможности найти решение этой проблемы, нам кажутся, следую щие. Прежде всего, попытки решить достаточно сложную проблему с помощью элементарных технических средств без применения элек тронных цифровых вычислительных устройств. В тех же случаях, когда применяются ЦВМ, как правило, с помощью их моделируются ранее известные методы. Следующая причина и, пожалуй, не менее важная, это отсутствие глубокого анализа работ физиологов и психологов, направленных на изучение слухового анализатора че ловека.
Принцип работы таких приемнинов информации, как ухо и глаз, давно привлекает внимание ученых, но в силу целого ряда труд ностей работа зрительного и слухового анализаторов до сих пор до конца не понята, а имеющиеся гипотезы зачастую противоре чат друг другу. Однако физиологией и психологией накоплено большое количество фактов, Которые позволяют в известной сте пени составить представление о структуре и общей картине рабо ты этих анализаторов. Характерно, что результаты эксперимен тальных работ биологов переплетаются с работами психологов. Многие выводы совпадают, и это может являться подтверждением правильности полученных результатов. Безусловно, что точное моделирование функционирования биологических систем нельзя признать всегда полезным, однако использование отдельных ра циональных зерен, посеянных природой, всегда оказывает неоце нимую услугу.
Основной трудностью при решении проблемы автоматического опознавания образов является выбор полезных признаков, харак теризующих свойства и параметры образов. Многие авторы работ, посвященных распознаванию образов, при выборе полезных призна ков в основном ориентируются на интуицию и свой опыт. В резуль тате чего признаки выбираются произвольно и, нэк правило, по зволяют решать лишь отдельные частные задачи.
Сложность решаемой проблемы требует на первом этэпе сокра
39
тить до минимума количество используемых параметров речевого сигнала и упростить до максимума начальные условия. В дальней шем, конечно, постепенно усложняя задачу, имеется возможность произвести моделирование реальных условий, но все это возможно лишь тогда, когда на каждом рассматриваемом этапе получены по ложительные результаты.
В данном случае проведение экспериментов при одновременном участии биологов, психологов, инженеров и математиков может яв ляться гарантией объективности проводимых экспериментов, а так же достоверности полученных результатов.
Исходным материалом, из которого строится устная речь, яв ляются звуки. Однако количество звуков речи практически неограничено. Произнесенные звуки, соответствующие определенной бук ве, отличаются уже тогда, когда они произносятся одним и тем же человеком. Эти отличия увеличиваются, если звуки произнесе ны разными людьми, мужчиной и женщиной, ребенком или подрост ком. Здесь звуки характеризуются различной высотой, тембром и силой. При этом существенное влияние оказывают соседние зву ки, в результате чего произношение звунов меняется. В качест ве исходных единиц речи используются фонемы, под которыми по нимают определенные звуки, играющие одинаковую смысловую роль в словах. Фонемы являются строительным материалом для состав
ления морфем, являющихся наименьшими единицами языка и в сово купности образующими слове, из которых в дальнейшем строятся предложения. При создании устройств автоматического опознава ния речевых сигналов человека наибольший интерес представляет использование фонем, число которых невелико и в различных язы ках колеблется от 12 до 80 [20]. Использование же морфем свя зано с определенными трудностями, так кэк последних в любом языке насчитывается несколько тысяч. Использование слов, кото рых в языке насчитывается несколько сот тысяч, возможно лишь при решении отдельных частных задач, когда мы имеем дело с ограниченным словарем слов.
Иэ всех существующих методов исследования речевых сигналов наибольший интерес представляет метод визуализации речи,осно ванный на использовании динамических спектрограмм (видеограмм) речи. Здесь речевой сигнал представляется,в виде диаграммы, отражающей зависимости силы звука и частоты от времени. Резуль таты исследований показали, что, используя видеограммы речи, можно легко научиться "читать" речь. При этом имеется возмож-