Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.04.2024
Просмотров: 62
Скачиваний: 0
|
40 |
|
|
ность опознавать человека по видеогрэммам |
его голоса, тан как |
||
формы и размеры полости рта, |
горла и носа |
влияют не |
концентра |
цию звуковой энергии в точно |
определенных |
частотных |
полосах. |
Несмотря не использование обобщенных спектральных характери стик, полученных на небольшом временном интервале, можно лег ко и с достаточно высокой точностью "читать" видеогрэммн речи, благодаря учету человеком взаимосвязей изменений частот и ам плитуд во времени. Автоматическая классификация таких видеограмм, связанная с их автоматическим опознаванием, представ ляет собой достаточно сложную проблему. Научиться понимать речь можно также, и по осциллограммам речевых сигналов. На пер вый взгляд это кажется трудно осуществимым из-за малой нагляд ности и кажущейся хаотичности, но при рассмотрении этих осцил лограмм в крупном масштабе обнаруживаются относительно устой чивые повторяющиеся признаки. Аналогичную картину можно наблю дать при рассмотрении звуковой дорожки киноленты. И действи тельно, известны киномеханики, которые могут разбирать текст на звуновой дорожке.
Все вышеприведенное свидетельствует о том, что анализ не только огибающей речевого сигнала, но и детальный энзлиз само го сигнала с учетом взаимосвязей его отдельных элементов по зволяет человеку осуществить опознавание сигналов по его изо бражениям и, оледовательно, выделять определенные признаки сигналов, позволяющие отнести эти сигналы к тем или иным клас сам эталонов.
Особый интерес представляют вопросы, связанные с анализом звукового восприятия, т .е . с нейродинзмикой слуховой системы человека, дающей представление об отражении нервной системой человена быстро меняющихся во времени звуков, а также разли чении их основных качеств в зависимости от интервала времени между ними [21]. В монографии С.Н. Гольдбурта вскрывается зн а-' чение временных (динамических) характеристик слухе для пра вильного понимания деятельности органов слуховой системы че ловека. Здесь, прежде всего, отмечается, что слуховой аппарат человека реагирует на временную характеристику звука, так нэк те задачи, которые он осуществляет, анализатор спектра выпол нить не может. Это положение, подтвержденное оригинально по ставленными экспериментами, имеет, на наш взгляд, чрезвычайно важное значение, так как заставляет отказаться от применения спектрального анализа при опознавании речевых сигналов и искать
41
другие пути решения этой проблемы. Создавая опознающие автома ты необходимо учесть те временные параметры, которыми опериру ет человек. Во-первых, это минимальный интервал различения двух звуков типа треск, который равен 0 , ^ - 3 мсек. Во-вторых, при точном опознавании звуке в его нотном обозначении необходи мая длительность звука равнв 100 - НО мсек. В-третьих, для правильного восприятия высоты звука необходимо, чтобы опозна ваемый тон длился SO - 40 мсек, что для средних частот соответ ствует 8 - 12 периодам, а для низких - не менее 4. В-четвертых, для различения последовательности между началами звуков времен ной интервал между ними должен равняться 10 - 30 мсен. В-пятых, сокращение длительности анализируемого тона до нескольких мсек должно компенсироваться повышением уровня его интенсивности. Кроме того, отмечается возможность различения бинауральных слу ховых образов при интервале между стимулами в 0,1 мсек, кото рое осуществляется на более высоких уровнях слуховой системы. Интересные данные из работы Чау, позволяющие в какой-то сте пени представить процессы, протекающие в слуховой системе.Под считав количество нервных волокон на различных уровнях слухо вой системы, получили следующие их отношения: I - слуховой нерв (30 000 волокон), 2 - кохлеэрное ядро, 13 - нижнее чет верохолмие, 14 - внутреннее коленчатое тело и 34 - уровень ко ры. Если же учесть взаимосвязи нейронов, а также их многочис ленные функции, то можно представить себе те возможности, ко торыми обладает слуховая система, состоящая из такого большого числа нервных элементов. Сложность слуховой системы человека объясняется А.А.Ухтомским необходимостью в натуральных усло виях работы слуха выполнять задачу восприятия шорохов и шумов, позволяющих достаточно точно ориентироваться в направлениях и расстояниях до источников звучания [22]. Для музыкального же восприятия высоты тона сложность слуховой системы человека
намного превосходит необходимый анатомический минимум. Не оста навливаясь на других положениях нейродинэмики слуховой системы,
приведем еще одну мысль из монографии С.Н.Гольдбуртэ: |
"Актив |
|
ность, лежащая в основе различных форм дискретности, |
непрерыв |
|
на, |
накопление информации о параметрах стимула также происхо |
|
дит |
непрерывно, но процесс различения на выходе образует не |
сколько узловых точек, благодаря |
которым его можно квантовать |
и описать как дискретную ступенчатую функцию". |
|
Особый интерес представляют |
работы профессора Загребского |
42
университете П.1Уберинэ (Югослэвия), предложившего тек назы ваемый верботональный метод восстановления слухе у полностью
или частично глухих, а также у глухонемых. |
Он утверждает, что |
||
на теле человека, кроме ушей, |
есть месте, |
способные восприни |
|
мать колебания звуковых волн. |
После |
специальной тренировки эти |
|
месте, представляющие собой точки на |
коленях, ладонях, кончиках! |
пальцев, ключицах и т .д ., могут воспринимать звуки аналогично ушам. Тренировка избранной точки производится с помощью специ ального аппарата "Суваж", у которого в качестве выходных уст ройств используются специальные вибраторы. Процесс лечения
длится |
1 -1,5 |
года и зависит от степени потери слуха. Действи |
||
тельно, различные нервные окончания, |
дающие все многообразие |
|||
осязательных |
ощущений, распределены |
по поверхности тела |
весьма |
|
неравномерно |
и, как уже отмечалось, |
имеют сосредоточение |
на |
|
кончике языка, на подушечках пальцев |
рук, на середине ладони |
|||
и т .д . |
Здесь |
приемниками информации |
являются особые осязатель |
ные диски, располагающиеся в наружных слоях кожного понрова. Эти осязательные диски, названные по имени открывших их ученых тельцами Меркеля и тельцами Мейснера, обеспечивают восприятие легких прикосновений. При этом характерно то, что латентный период простой сенсорной реакции на такой сигнал-раздражитель, как прикосновение, является наименьшим по сравнению с латент ными периодами всех других анализаторов человеке. Следователь но, по природе своей тактильный анализатор человека обладает высокими потенциальными возможностями, но, к сожалению, не всегдэ нами полностью используется. Неверно было бы думать, что передаче тактильной информации осуществляется лишь с по мощью осязательных дисков. Вероятней всего, это комплексный процесс, объединяющий сигналы, идущие от различных нервных окончаний кожного покрова. Не останавливаясь на взаимосвязи отдельных видов ножной чувствительности, перечислим лишь на звания и назначение этих нервных окончаний. На тепло реагируют
тельца Руффини и тельца Гольдши - Маццони. Тельца Фатер - Пзчини, заложенные в глубоких слоях кожи и мышцах, передают инфор мацию в мозг о сильном давлении на кожу, а также о сокращении мышц. Тан называемые свободные нервные окончания воспринимают чувство боли, а колбы Краузе - действие холода.
Большое теоретическое значение работы П.Губерина состоит в том, что она позволяет приблизиться к пониманию функциониро
вания слуховых центров мозга. Здесь, прежде всего, напрашивает'
43
ся вывод о второстепенной роли спентрапьного анализа речевых сигналов, маловероятного на уровне ножного покрова,' а возмож ность "слышать" с помощью нервных окончаний свидетельствует о наличии других принципов обработки исходной информации. Кроне того, неверно бы было думать, что звуковым центрам безразлич но, откуда получать сигналы. Также неверным является то, что проводимое лечение восстанавливает слух. Правильнее было бы говорить о развитии тантильного слуха, основанного на тактиль ной чувствительности. Способность слышать действительно восста навливается, но это происходит за счет обучения речевыми сиг налами тактильных центров мозга. Здесь наиболее интересным яв ляется то, что алгоритмы обработки тактильной информации в оп ределенной степени совпадают с алгоритмом обработки речевой информации, а следовательно, и зрительной (согласно выдвигаемой нами гипотезе об идентичности алгоритмов обработки вторичной ре чевой и зрительной информации). Здесь очевидно наличие процес сов, связанных с преобразованием ощушоний, возникающих в мо мент прикосновений и давлений, в импульсные коды, характери зующие силу, фазу и время прикосновения. В дальнейшем, по-ви димому, выделяются инвариантные признаки и формируются груп повые, обеспечивающие учет связности признаков. Аналогичный принцип действия тактильных органов чувотв мы наблюдаем при передаче информации с помощью кода Морзе между людьми, имеющи ми непосредственное соприкосновение. В данном случае имеют ме сто не микро, 8 макродвижения. Длительность тире, точек и пауз произвольна. Однако следование их носит строго упорядоченный характер, т .е . обеспечивается связность знаков.
Существующие спектрально-временные методы опознавания зву ков речи находят практическое применение для решения отдельных частных задач. Так, они успешно могут применяться в разработан ной Якобсоном, Фантом и Халле схеме бинарного разделения звуков речи по фонетическим признакам, которая, по-видимому, в даль нейшем нейдет применение. Не ри с.2.1 представлена эта охема в некоторой модификации Е.Н.Мясниковой [23]. Схема бинарного раз деления звуков речи в настоящее время не реализована, тан как отсутствуют необходимые признаки для надежного разделения мно гих соглэсных. Однако применение принципа дихотомии при авто матическом опознавании речевых сигналов должно быть обязатель ным.
Учитывая повышенную сложность опознавания согласных звуков,
приведем |
таблицу |
2. 1, наглядно отражающую их образование [24]. |
В этой же |
книге |
приводится и классификация гласных звуков, |
основанная на |
работе губ и языка. |
Классификацию можно предста |
|
вить в виде схемы приведенной на |
(ри с.2 .2 ). Данная |
схема нагляД' |
|
но показывает |
цикличность плавного перехода одного |
гласного |
|
звука в другой и, следовательно, |
отражает их наиболее возмож |
||
ные взаимные |
преобразования. |
|
|
Рис.2.1
Большое значение при проведении экспериментов имеет зна ние основных характеристик звуков речи. К сожалению, резуль таты исследований различных экспериментаторов имеют значитель ные расхождения, что объясняется своеобразностью постановки проводимых экспериментов, составом дикторов, а также исполь зуемой аппаратурой. В наших экспериментах были использованы