Файл: Галушкин, А. И. Синтез многослойных систем распознавания образов.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.10.2024

Просмотров: 92

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

по разомкнутому циклу, условная плотность может иметь вид любого типового распределения, рассматриваемого математической статистикой. Классификация таких рас­ пределений приведена в книге в соответствующей главе. Приведены также результаты построения СР, настраиваю­ щихся по разомкнутому циклу и оптимальных для неко­ торых типовых распределений, а также для совокупности распределений. Построение СР, настраивающихся по ра­ зомкнутому циклу, методологически проводится в режи­ мах обучения, самообучения и при произвольной квалифи­ кации учителя. Реализация СР, настраивающихся по ра­ зомкнутому циклу, является самостоятельной задачей. Значительное сокращение объема памяти и времени вычис­ лений при этом достигается за счет использования рекур­ рентных методов реализации оптимальных фильтров оценки моментов нестационарных дискретных многомерных случайных процессов [Л. 48].

Проблема аналитической оценки точности СР, настраи­ вающихся по разомкнутому циклу, является мало иссле­ дованной. Общая методика оценки точности таких СР со­ стоит из следующих этапов:

1) для априорных характеристик входного сигнала ис­

следуется точность оценки

параметров

распределений;

2) с учетом общего вида

условных

распределений, и

в частности общего вида разделяющей поверхности, оце­ нивается точность вычисления настраиваемых параметров СР;

3) по результатам предыдущего этапа и характеристи­ кам входного сигнала СР определяется распределение ве­ роятности правильного распознавания.

Вкниге данная методика определяется и иллюстри­ руется на случае нестационарных образов с частными ти­ повыми распределениями.

Вслучае конечной памяти СР (блока настройки СР) имеем дело с системой со случайными в текущий момент времени параметрами, настраивающимися по характери­ стикам входного сигнала. Вычисленное в текущий момент времени значение вероятности правильного распознавания даже по генеральной совокупности образов является слу­ чайной величиной, распределение которой получается ус­ реднением по множеству всех состояний системы со слу­ чайными параметрами. При этом основной целью исследо­ вания являются параметры распределения (математическое ожидание, дисперсия и т. д.) вероятности правильного рас­

9



познавания в зависимости от характеристик нестационар­ ных образов, памяти СР, времени упреждения решения СР. Необходимо отметить, что аналитическая оценка точ­ ности СР, настраивающихся по разомкнутому циклу, яв­ ляется трудной математической задачей.

Рассмотрим основные этапы синтеза системы распозна­ вания с фиксированной структурой, настраивающейся по замкнутому циклу (гл. 4). Под структурой разомкнутых СР понимается структура преобразования, осуществляе­ мого СР на этапе распознавания. Описание и выбор струк­ туры разомкнутых СР, как следует из табл. В-1, являются первыми при рассмотрении направления, связанного с син­ тезом СР с фиксированной структурой, настраивающихся по замкнутому циклу. При настройке по замкнутому циклу в данном случае мы отказываемся от необходимости апри­ орного задания вида условных плотностей для совокупно­ стей образов внутри классов и считаем их произвольными. Вместо априорной информации о виде условных плотно­ стей при рассматриваемом подходе задается априорная информация об общем виде и структуре преобразования, осуществляемого системой на этапе распознавания.

Нейрон в настоящее время признается основным эле­ ментом нервной системы человека и животных. Изучение организации нейронов показало, что их расположение в нервной ткани и взаимосвязь подчиняются некоторым, пока еще мало изученным законам. Одним из таких зако­ нов является расположение нейронов по слоям с элемен­ тами связи между различными слоями нейронов. Подобное топологическое свойство достаточно хорошо изучено на примерах головного мозга, а также зрительного анализа­ тора. Данное свойство нейронной сети является мало изу­ ченным с формальной точки зрения. Основная цель на­ стоящей книги заключается в получении ответа на во­ просы: почему система распознавания образов должна строиться как нейронная сеть? Как выбрать топологию этой сети (число слоев, число элементов в слое, характер свя­ зей, характер структуры)? Как, наконец, синтезировать алгоритм адаптации нейронной сети?

Объективная необходимость построения многослойных

СР различной

структуры в книге обосновывается только

с формальной

точки зрения. Однако это позволяет не

только приблизиться к конкретным нейронным структурам [Л. 11, 21, 24], введенным с точки зрения нейрофизиоло­ гического, а не формального аспекта, но и рассматривать

Ю


намного более сложные структуры, работающие в более общих режимах, чем режим распознавания. С этих пози­ ций автором на одном из этапов исследований была выдви­ нута рабочая гипотеза: однородная многослойная нейрон­ ная сеть может выполнить любую операцию. Конечно, дан­ ная гипотеза выражена несколько упрощенно. Однако она позволила показать возможность применения излагаемой методики синтеза для решения с помощью многослойных систем следующих задач: обращение матриц, скалярное перемножение векторов, реализация преобразователей чи­ сел из двоичной системы в десятичную и обратно.

Очевидно, задача пороговой логики является частной по отношению к задаче, рассматриваемой в книге, так как представляет собой случай двоичных пространств призна­ ков, указаний учителя и решений. Уже сейчас очевидны ограничения формальных подходов к синтезу сетей из ли­ нейных пороговых элементов (ЛПЭ), реализующих логи­ ческие функции, в плане ограниченности размерности ло­ гических функций и структуры сетей из ЛПЭ [Л. 12, 66J. Те частные применения неформальных методов синтеза систем, реализующих пороговые функции [Л. 5, 12], по­ казывают, по нашему мнению, единственность неформаль­ ного подхода к решению задачи с помощью многослойных систем из пороговых элементов для логических функций большого числа переменных. Это открывает широкие воз­ можности применения разработанных ниже методов син­ теза многослойных СР для синтеза узлов и блоков совре­ менных ЦВМ на пороговых элементах с настраиваемыми на этапе синтеза коэффициентами, узлов и блоков мини­ мальной сложности и максимальной надежности.

В заключение вопроса, связанного с выбором и описа­ нием структуры разомкнутых СР, отметим три основных перспективных направления применения теории много­ слойных систем распознавания образов:

1)построение многослойных специализированных си­ стем распознавания образов;

2)построение блоков и узлов современных ЦВМ в виде многослойных структур на пороговых элементах с настраи­ ваемыми коэффициентами;

3)построение формальных моделей функций мозга, основываясь на том, что формальный и нейрофизиологичес­ кий аспекты независимо друг от друга привели к необ­ ходимости построения некоторых частных моделей (а именно СР) в виде многослойных систем с однородной структурой.

11


Формальным аппаратом, используемым при анализе разомкнутых СР, является аппарат, основанный на точных методах вероятностного анализа многомерных нелиней­ ных систем. Переход в основном к анализу распределений и моментов распределений ошибок СР обусловливается тем, что результаты данного анализа, как показано ниже, формально не зависят от сложности и вида разомкнутой СР, за исключением характеристик пространства призна­ ков и пространства решений. Этот существенный момент в дальнейшем широко используется на этапах выбора или формирования функционала вторичной оптимизации, а также построения замкнутой СР (гл. 5, 6, 7).

Под функционалом вторичной оптимизации понимается функционал, выражаемый через параметры распределений текущих сигналов в СР и непосредственно минимизируе­ мый в многослойных СР при настройке по замкнутому циклу. На данном этапе синтеза рассматриваются в основ­ ном два вопроса. Первый вопрос связан с исследованием соответствия используемых в известных работах функцио­ налов вторичной оптимизации некоторым критериям пер­ вичной оптимизации. Предметом рассмотрения здесь яв­ ляются известные адаптивные СР, такие как АДАЛИН, матрица Штайнбуха, трехслойной персептрон Розенблатта (вернее, его настраиваемый выходной блок), а также не­ которые СР с функционалами вторичной оптимизации, рассмотренными Я- 3. Цыпкиным. В качестве основного недостатка таких подходов отмечается, что в большинстве случаев не рассматривается соответствие выбираемых функ­ ционалов вторичной оптимизации конкретным критериям первичной оптимизации. Это приводит к практическому отсутствию работоспособности некоторых СР при много­ модальных распределениях входного сигнала.

Вторым, основным на данном этапе синтеза вопросом является формирование в СР функционала вторичной оп­ тимизации, соответствующее заданному критерию первич­ ной оптимизации. Соответствие здесь понимается в смысле совпадения параметров СР при обеспечении минимума функ­ ционалов первичной и вторичной оптимизации. В книге изложена общая методика формирования функционала вторичной оптимизации, соответствующего заданному кри­ терию первичной оптимизации. Приведены результаты применения данной методики для многослойных СР

различной структуры и критериев первичной оптими- . зации.

12

Вопросу организации процедуры поиска экстремума функционала вторичной оптимизации СР в литературе уде­ ляется значительное внимание. Нас в основном будут ин­ тересовать вопросы правомочности и целесообразности применения той или иной градиентной процедуры (Нью­ тона, релаксационной, наискорейшего спуска, стохастиче­ ской аппроксимации и т. д.) поиска локального экстре­ мума.

Применение итерационных методов при составлении стандартных программ поиска экстремума функций многих переменных имеет свои особенности при построении адап­ тивных систем. Они связаны в основном с тем, что при не­ известных характеристиках входного сигнала в условиях так называемой априорной недостаточности даже при фик­ сированной структуре разомкнутой СР ничего нельзя ска­ зать о виде функционала вторичной оптимизации кроме того, что он имеет несколько локальных экстремумов, все или по крайней мере некоторые из которых должны быть найдены в процессе настройки по замкнутому циклу. Именно этот факт делает необходимым введение элементов случайности в процедуру поиска, связанных с выбором множества случайных начальных условий для некоторой градиентной процедуры. Основным вопросом исследования при этом является вероятность нахождения некоторого числа локальных экстремумов функционала вторичной оптимизации в зависимости от числа выбросов случайных начальных условий градиентной процедуры поиска локаль­ ного экстремума. Одна из задач, которую нужно решать на этапе построения замкнутых систем, заключается в том, чтобы оценить вектор градиентов функционала вторичной

оптимизации

в СР. Это

можно сделать двумя путями:

1) введением

поисковых

колебаний и детектированием;

2) нахождением оценки вектора градиентов в виде вы­ ражения через сигналы в СР (выходные и промежу­ точные) .

Впервом случае имеем дело с поисковой СР, во втором—

саналитической. Естественно, предпочтительнее построе­ ние СР в виде аналитических систем, настраивающихся по замкнутому циклу, так как введение поисковых колебаний вводит дополнительные шумы в систему. Однако построе­ ние СР аналитическими средствами не всегда возможно. Ограничения аналитического подхода показаны ниже при подробном рассмотрении этапа построения. Основное вни­ мание на этапе построения замкнутых СР уделяется реали­

13