Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 78

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

—1, ..., т, превышает меру его близости с дру­

гими классами, то принимается решение о принадлеж­

ности

данного

объекта к классу ilg. Другими словами,

в е й g, если

 

 

 

 

 

L (ш,

Qtf) =

extr L (ш,Гйг),

i — 1,...,

т,

 

 

 

І

 

 

где L — мера

близости.

 

 

В

алгоритмах

распознавания

находят

применение

различные меры близости, однако наиболее распростра ценными из них являются:

1.Среднеквадратическое расстояние между данным

объектом со и совокупностью объектов {шЙ1, , со k },

представляющих g-и класс £2Ä, т. е.

L (со, =

wg s ) '

причем метод измерения расстояния между объектами с/(со, cogs) остается свободным для выбора.

Если необходимо учитывать веса Wj признаков Xj, /= = 1, ..., N, объекта w и признаков Xgsj всех объектов

(Ogs класса Qg, то может быть применена метрика сле­

дующего вида:

Г , N

L(C0, £2в) = у

к гЕ Е а д Xgsj)

Гs= 1/=1

2.Средний риск из теории статистических решений

MX,, ..., x N) d x l t ...t d x h

k-\ 1=1

где P(Qi) — априорная вероятность принадлежности объекта /-му классу; Wki — элементы платежной матри­

цы^ т. е. плата системы распознавания, если она отно­ сиобъект к k-му классу, когда в действительности объ­

ект

принадлежит к

I-му классу,

k, 1= 1, ..., т;

fi(Xi,

..., Хіу ) — условная плотность

вероятности значе-

ий признаков Xlt . .

XN в классе Qi; Dk — область про­

странства признаков,

соответствующая классу

16

. -

-

-•


Очередная задача — оценка эффективности системы распознавания. Под эффективностью подразумевается

величина, характеризующая процент правильных реше­ ний задачи распознавания. Оценка эффективности мо­ жет быть произведена только после окончательного ре­ шения вопроса о технических средствах наблюдения системы распознавания, выбора алгоритма распознава­ ния и правила принятия решения. Оценка эффективно­ сти, как правило, проводится на основе эксперименталь­ ных исследований либо реальной системы распознава­ ния, либо с помощью ее физической или математической модели.

И, наконец, в связи с тем, что функционирование систем распознавания сопряжено с определенными рас­ ходами,— последняя задача состоит в том, чтобы обес­

печить такую организацию процесса распознавания, при

 

которой эти затраты были бы минимальны.

 

 

Процесс распознавания можно оптимизировать, так

 

как для определения признаков распознаваемых объек­

 

тов или явлений могут быть в принципе привлечены

 

различные технические средства наблюдения. Эти сред­

 

ства могут быть использованы в той или другой после­

 

довательности. Кроме того, с помощью

технических

 

средств

могут быть определены

различные

признаки,

 

обладающие в каждой конкретной ситуации определен­

 

ной информативностью или требующие различных за­

 

трат для их нахождения и т. д. Эти возможности связа­

 

ны также с тем, что риск недостоверного распознавания

 

объектов различных классов может быть существенно

 

различен.

 

 

 

 

 

 

Таким образом, процесс распознавания следует рас­

 

сматривать как процесс управляемый, а значит, управ­

 

лять им следует оптимально. Задача оптимизации про­

 

цесса распознавания может быть сформулирована сле­

 

дующим образом. Пусть планирование экспериментов,

 

связанных с определением признаков распознаваемых

 

объектов или явлений, проводится в соответствии с не­

 

которым последовательным правилом R. Обозначим че:

 

рез

величину расходов на проведение эксперимешов,

 

усредненную по всем возможным цепочкам плана, опре­

 

деляемого избранным правилом R,

т.

е.

Üa = Üw{R).

 

Ввиду того, что заранее неизвестно, объект какого

 

класса подвергается распознаванию, величина

Um долж-

 

2— 452

Гфм. п, вличнап

 

17

 

 

 

j

 

 

Я *у ч и *- тели*

в

»

!

С

 

в и Л л

г

п

• » «


На быть усредпёна по всем классам объектов с помощью априорной вероятности появления объектов определен­ ных классов P(Qi), і = 1, . . т.

Качество каждого алгоритма, определяющего после­ довательное правило к, в соответствии с которым реали­

зуется процесс распознавания, может быть охарактери­ зован следующим функционалом:

т

u;.(R) = I > ü m ( R ) P № .

і~\

Требуется определить такое оптимальное правило К,

которое минимизировало бы средние расходы на прове­ дение экспериментальных работ, т. е.

и р (к) = rain Up {к). R

Процесс накопления информации о распознаваемом объекте следует прекратить в том случае, когда вы­ игрыш от увеличения достоверности полученного реше­ ния оказывается ниже затрат на проведение эксперимен­ тов. Именно эти соображения должны быть учтены в алгоритме, определяющем рациональную продолжи­ тельность процесса распознавания в каждой конкретной системе.

Таковы вкратце основные задачи, возникающие при разработке систем распознавания объектов и явлений практически любой физической или социальной при­ роды. В книге рассматриваются постановка и возможные методы решения этих задач.

1.3.КЛАССИФИКАЦИЯ СИСТЕМ РАСПОЗНАВАНИЯ

Внастоящее время теорию распознавания объектоз и явлений, так же как и теорию построения систем

распознавания, ни в коей мере нельзя считать завершен­ ной. В связи с этим дать законченную и подробную классификацию систем распознавания практически не­ возможно. Тем не менее разработка и изложение теории и основ построения систем распознавания требуют раз^ работки определенных классификаций распознающих си­ стем.

Любая классификация основывается на определен­ ных классификационных принципах. С точки зрения общности классификации систем распознавания наиболее

18


рациональным классификационным принципом является используемая информация о распознаваемых объектах.

Если в качестве классификационного принципа из­ брать количество первоначальной априорной информа ции о распознаваемых объектах или явления^, то систе­ мы распознавания могут быть разделены на системы без обучения, системы с обучением и самообучающиеся си­ стемы.

В системах без обучения количество первоначальной

информации достаточно для того, чтобы в соответствии с выбранным принципом классификации объектов раз­ делить все множество объектов на классы £2і, ..., Qm, определить словарь признаков Хі, . . XN и описать

каждый класс объектов на языке этих признаков, т. е.

определить зависимости X ^ D ,, і=1, ..., m,

/ =

1, ..., N,

если признаки являются логическими,

и

функции

fi(Xі, .. ., XN), P(Qi), если признаки являются стохасти­

ческими. Будем считать, что для построения систем рас­ познавания без обучения необходимо располагать пол­ ной первоначальной априорной информацией.

В системах с обучением количество первоначальной

априорной информации также достаточно для того, что­ бы в соответствии с избранным классификационным принципом разделить все множество объектов на классы Qi, .. . , Qm, однако количество первоначальной инфор­

мации недостаточно (либо

ее нецелесообразно из тех

или других соображений

использовать) для описания

классов. При этом количество первоначальной априор­ ной информации позволяет различать конкретные объ­ екты, принадлежащие различным классам. Именно это обстоятельство и используется для формирования рас­ сматриваемого класса систем с помощью обучения, ко­ торое состоит в многократном предъявлении системе распознавания различных объектов с указанием клас­ сов, к которым эти объекты принадлежат [1].

Системы распознавания с обучением до начала функ­ ционирования в качестве распознающих систем «работа­ ют с учителем». Эта работа заключается в том, что «учитель» многократно предъявляет системе обучающие объекты всех выделенных классов и указывает, к каким классам они принадлежат. Затем «учитель» начинает «экзаменовать» систему распознавания, корректируя ее ответы до тех пор, пока количество ошибок в среднем не достигнет желаемого уровня.

2*

19


В системах распознавания с самообучением на ста­

дии их формирования также производится показ объек­ тов различных классов; однако система ввиду крайне ограниченной первоначальной априорной информации не получает указаний о том, к какому классу они принад­ лежат. Эти указания заменяются некоторым набором правил, в соответствии с которыми на стадии самообуче­ ния система распознавания сама вырабатывает некото­ рую классификацию (которая, вообще говоря, отлича­

ется от естественной классификации)

и

в дальнейшем

ее всегда придерживается.

с обучением или

Не следует думать, что системы

с самообучением вообще обходятся

без

недостающей

априорной информации. Напротив, они ее получают в процессе обучения или самообучения. Более того, цель обучения или самообучения и состоит в том, чтобы вы­ работать такое количество информации, которое необ ходимо для функционирования системы распознавания.

Появление систем распознавания названных классоз обусловлено тем, что на практике при построении реаль­ ных систем распознавания достаточно часто приходится сталкиваться с такими ситуациями, когда отсутствует полная первоначальная априорная информация. Именно такие ситуации и привели к необходимости создавать системы распознавания с обучением и самообучением. При этом необходимо подчеркнуть, что наименование «полная первоначальная априорная информация» харак­ теризует не абсолютное, а относительное количество необходимой информации. Это название указывает на то, что в системах, без обучения при всех прочих рав­ ных условиях количество первоначальной информации больше, чем у систем распознавания других названных классов. В то же время для систем распознавания оди­ наковых классов абсолютное количество первоначальной информации может быть совершенно различным при необходимости распознавать объекты или явления раз­ личной естественной или социальной природы.

Мы рассмотрели классификацию систем распознава­ ния, в которой в качестве принципа классификации используется количество первоначальной априорной ин­ формации. В качестве другого возможного принципа классификации систем распознавания может быть ис­ пользован характер информации о признаках паспозиаваемых объектов, которые, как известно, могут быть под­

20