Файл: Виноградов Р.И. Автоматическое опознавание электрических сигналов.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.04.2024

Просмотров: 62

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

40

 

 

ность опознавать человека по видеогрэммам

его голоса, тан как

формы и размеры полости рта,

горла и носа

влияют не

концентра­

цию звуковой энергии в точно

определенных

частотных

полосах.

Несмотря не использование обобщенных спектральных характери­ стик, полученных на небольшом временном интервале, можно лег­ ко и с достаточно высокой точностью "читать" видеогрэммн речи, благодаря учету человеком взаимосвязей изменений частот и ам­ плитуд во времени. Автоматическая классификация таких видеограмм, связанная с их автоматическим опознаванием, представ­ ляет собой достаточно сложную проблему. Научиться понимать речь можно также, и по осциллограммам речевых сигналов. На пер­ вый взгляд это кажется трудно осуществимым из-за малой нагляд­ ности и кажущейся хаотичности, но при рассмотрении этих осцил­ лограмм в крупном масштабе обнаруживаются относительно устой­ чивые повторяющиеся признаки. Аналогичную картину можно наблю­ дать при рассмотрении звуковой дорожки киноленты. И действи­ тельно, известны киномеханики, которые могут разбирать текст на звуновой дорожке.

Все вышеприведенное свидетельствует о том, что анализ не только огибающей речевого сигнала, но и детальный энзлиз само­ го сигнала с учетом взаимосвязей его отдельных элементов по­ зволяет человеку осуществить опознавание сигналов по его изо­ бражениям и, оледовательно, выделять определенные признаки сигналов, позволяющие отнести эти сигналы к тем или иным клас­ сам эталонов.

Особый интерес представляют вопросы, связанные с анализом звукового восприятия, т .е . с нейродинзмикой слуховой системы человека, дающей представление об отражении нервной системой человена быстро меняющихся во времени звуков, а также разли­ чении их основных качеств в зависимости от интервала времени между ними [21]. В монографии С.Н. Гольдбурта вскрывается зн а-' чение временных (динамических) характеристик слухе для пра­ вильного понимания деятельности органов слуховой системы че­ ловека. Здесь, прежде всего, отмечается, что слуховой аппарат человека реагирует на временную характеристику звука, так нэк те задачи, которые он осуществляет, анализатор спектра выпол­ нить не может. Это положение, подтвержденное оригинально по­ ставленными экспериментами, имеет, на наш взгляд, чрезвычайно важное значение, так как заставляет отказаться от применения спектрального анализа при опознавании речевых сигналов и искать


41

другие пути решения этой проблемы. Создавая опознающие автома­ ты необходимо учесть те временные параметры, которыми опериру­ ет человек. Во-первых, это минимальный интервал различения двух звуков типа треск, который равен 0 , ^ - 3 мсек. Во-вторых, при точном опознавании звуке в его нотном обозначении необходи­ мая длительность звука равнв 100 - НО мсек. В-третьих, для правильного восприятия высоты звука необходимо, чтобы опозна­ ваемый тон длился SO - 40 мсек, что для средних частот соответ­ ствует 8 - 12 периодам, а для низких - не менее 4. В-четвертых, для различения последовательности между началами звуков времен­ ной интервал между ними должен равняться 10 - 30 мсен. В-пятых, сокращение длительности анализируемого тона до нескольких мсек должно компенсироваться повышением уровня его интенсивности. Кроме того, отмечается возможность различения бинауральных слу­ ховых образов при интервале между стимулами в 0,1 мсек, кото­ рое осуществляется на более высоких уровнях слуховой системы. Интересные данные из работы Чау, позволяющие в какой-то сте­ пени представить процессы, протекающие в слуховой системе.Под­ считав количество нервных волокон на различных уровнях слухо­ вой системы, получили следующие их отношения: I - слуховой нерв (30 000 волокон), 2 - кохлеэрное ядро, 13 - нижнее чет­ верохолмие, 14 - внутреннее коленчатое тело и 34 - уровень ко­ ры. Если же учесть взаимосвязи нейронов, а также их многочис­ ленные функции, то можно представить себе те возможности, ко­ торыми обладает слуховая система, состоящая из такого большого числа нервных элементов. Сложность слуховой системы человека объясняется А.А.Ухтомским необходимостью в натуральных усло­ виях работы слуха выполнять задачу восприятия шорохов и шумов, позволяющих достаточно точно ориентироваться в направлениях и расстояниях до источников звучания [22]. Для музыкального же восприятия высоты тона сложность слуховой системы человека

намного превосходит необходимый анатомический минимум. Не оста­ навливаясь на других положениях нейродинэмики слуховой системы,

приведем еще одну мысль из монографии С.Н.Гольдбуртэ:

"Актив­

ность, лежащая в основе различных форм дискретности,

непрерыв­

на,

накопление информации о параметрах стимула также происхо­

дит

непрерывно, но процесс различения на выходе образует не­

сколько узловых точек, благодаря

которым его можно квантовать

и описать как дискретную ступенчатую функцию".

Особый интерес представляют

работы профессора Загребского


42

университете П.1Уберинэ (Югослэвия), предложившего тек назы­ ваемый верботональный метод восстановления слухе у полностью

или частично глухих, а также у глухонемых.

Он утверждает, что

на теле человека, кроме ушей,

есть месте,

способные восприни­

мать колебания звуковых волн.

После

специальной тренировки эти

месте, представляющие собой точки на

коленях, ладонях, кончиках!

пальцев, ключицах и т .д ., могут воспринимать звуки аналогично ушам. Тренировка избранной точки производится с помощью специ­ ального аппарата "Суваж", у которого в качестве выходных уст­ ройств используются специальные вибраторы. Процесс лечения

длится

1 -1,5

года и зависит от степени потери слуха. Действи­

тельно, различные нервные окончания,

дающие все многообразие

осязательных

ощущений, распределены

по поверхности тела

весьма

неравномерно

и, как уже отмечалось,

имеют сосредоточение

на

кончике языка, на подушечках пальцев

рук, на середине ладони

и т .д .

Здесь

приемниками информации

являются особые осязатель­

ные диски, располагающиеся в наружных слоях кожного понрова. Эти осязательные диски, названные по имени открывших их ученых тельцами Меркеля и тельцами Мейснера, обеспечивают восприятие легких прикосновений. При этом характерно то, что латентный период простой сенсорной реакции на такой сигнал-раздражитель, как прикосновение, является наименьшим по сравнению с латент­ ными периодами всех других анализаторов человеке. Следователь­ но, по природе своей тактильный анализатор человека обладает высокими потенциальными возможностями, но, к сожалению, не всегдэ нами полностью используется. Неверно было бы думать, что передаче тактильной информации осуществляется лишь с по­ мощью осязательных дисков. Вероятней всего, это комплексный процесс, объединяющий сигналы, идущие от различных нервных окончаний кожного покрова. Не останавливаясь на взаимосвязи отдельных видов ножной чувствительности, перечислим лишь на­ звания и назначение этих нервных окончаний. На тепло реагируют

тельца Руффини и тельца Гольдши - Маццони. Тельца Фатер - Пзчини, заложенные в глубоких слоях кожи и мышцах, передают инфор­ мацию в мозг о сильном давлении на кожу, а также о сокращении мышц. Тан называемые свободные нервные окончания воспринимают чувство боли, а колбы Краузе - действие холода.

Большое теоретическое значение работы П.Губерина состоит в том, что она позволяет приблизиться к пониманию функциониро­

вания слуховых центров мозга. Здесь, прежде всего, напрашивает'


43

ся вывод о второстепенной роли спентрапьного анализа речевых сигналов, маловероятного на уровне ножного покрова,' а возмож­ ность "слышать" с помощью нервных окончаний свидетельствует о наличии других принципов обработки исходной информации. Кроне того, неверно бы было думать, что звуковым центрам безразлич­ но, откуда получать сигналы. Также неверным является то, что проводимое лечение восстанавливает слух. Правильнее было бы говорить о развитии тантильного слуха, основанного на тактиль­ ной чувствительности. Способность слышать действительно восста­ навливается, но это происходит за счет обучения речевыми сиг­ налами тактильных центров мозга. Здесь наиболее интересным яв­ ляется то, что алгоритмы обработки тактильной информации в оп­ ределенной степени совпадают с алгоритмом обработки речевой информации, а следовательно, и зрительной (согласно выдвигаемой нами гипотезе об идентичности алгоритмов обработки вторичной ре­ чевой и зрительной информации). Здесь очевидно наличие процес­ сов, связанных с преобразованием ощушоний, возникающих в мо­ мент прикосновений и давлений, в импульсные коды, характери­ зующие силу, фазу и время прикосновения. В дальнейшем, по-ви­ димому, выделяются инвариантные признаки и формируются груп­ повые, обеспечивающие учет связности признаков. Аналогичный принцип действия тактильных органов чувотв мы наблюдаем при передаче информации с помощью кода Морзе между людьми, имеющи­ ми непосредственное соприкосновение. В данном случае имеют ме­ сто не микро, 8 макродвижения. Длительность тире, точек и пауз произвольна. Однако следование их носит строго упорядоченный характер, т .е . обеспечивается связность знаков.

Существующие спектрально-временные методы опознавания зву­ ков речи находят практическое применение для решения отдельных частных задач. Так, они успешно могут применяться в разработан­ ной Якобсоном, Фантом и Халле схеме бинарного разделения звуков речи по фонетическим признакам, которая, по-видимому, в даль­ нейшем нейдет применение. Не ри с.2.1 представлена эта охема в некоторой модификации Е.Н.Мясниковой [23]. Схема бинарного раз­ деления звуков речи в настоящее время не реализована, тан как отсутствуют необходимые признаки для надежного разделения мно­ гих соглэсных. Однако применение принципа дихотомии при авто­ матическом опознавании речевых сигналов должно быть обязатель­ ным.

Учитывая повышенную сложность опознавания согласных звуков,

приведем

таблицу

2. 1, наглядно отражающую их образование [24].

В этой же

книге

приводится и классификация гласных звуков,

основанная на

работе губ и языка.

Классификацию можно предста­

вить в виде схемы приведенной на

(ри с.2 .2 ). Данная

схема нагляД'

но показывает

цикличность плавного перехода одного

гласного

звука в другой и, следовательно,

отражает их наиболее возмож­

ные взаимные

преобразования.

 

 

Рис.2.1

Большое значение при проведении экспериментов имеет зна­ ние основных характеристик звуков речи. К сожалению, резуль­ таты исследований различных экспериментаторов имеют значитель­ ные расхождения, что объясняется своеобразностью постановки проводимых экспериментов, составом дикторов, а также исполь­ зуемой аппаратурой. В наших экспериментах были использованы