Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 78
Скачиваний: 1
—1, ..., т, превышает меру его близости с дру
гими классами, то принимается решение о принадлеж
ности |
данного |
объекта к классу ilg. Другими словами, |
|||
в е й g, если |
|
|
|
|
|
|
L (ш, |
Qtf) = |
extr L (ш,Гйг), |
i — 1,..., |
т, |
|
|
|
І |
|
|
где L — мера |
близости. |
|
|
||
В |
алгоритмах |
распознавания |
находят |
применение |
различные меры близости, однако наиболее распростра ценными из них являются:
1.Среднеквадратическое расстояние между данным
объектом со и совокупностью объектов {шЙ1, , со k },
представляющих g-и класс £2Ä, т. е.
L (со, =
wg s ) '
причем метод измерения расстояния между объектами с/(со, cogs) остается свободным для выбора.
Если необходимо учитывать веса Wj признаков Xj, /= = 1, ..., N, объекта w и признаков Xgsj всех объектов
(Ogs класса Qg, то может быть применена метрика сле |
||
дующего вида: |
Г , N |
|
L(C0, £2в) = у |
||
к гЕ Е а д Xgsj) |
Гs= 1/=1
2.Средний риск из теории статистических решений
MX,, ..., x N) d x l t ...t d x h
k-\ 1=1
где P(Qi) — априорная вероятность принадлежности объекта /-му классу; Wki — элементы платежной матри
цы^ т. е. плата системы распознавания, если она отно сиобъект к k-му классу, когда в действительности объ
ект |
принадлежит к |
I-му классу, |
k, 1= 1, ..., т; |
fi(Xi, |
..., Хіу ) — условная плотность |
вероятности значе- |
|
ий признаков Xlt . . |
XN в классе Qi; Dk — область про |
||
странства признаков, |
соответствующая классу |
16 |
. - |
- |
-• |
Очередная задача — оценка эффективности системы распознавания. Под эффективностью подразумевается
величина, характеризующая процент правильных реше ний задачи распознавания. Оценка эффективности мо жет быть произведена только после окончательного ре шения вопроса о технических средствах наблюдения системы распознавания, выбора алгоритма распознава ния и правила принятия решения. Оценка эффективно сти, как правило, проводится на основе эксперименталь ных исследований либо реальной системы распознава ния, либо с помощью ее физической или математической модели.
И, наконец, в связи с тем, что функционирование систем распознавания сопряжено с определенными рас ходами,— последняя задача состоит в том, чтобы обес
печить такую организацию процесса распознавания, при |
|
||||||
которой эти затраты были бы минимальны. |
|
|
|||||
Процесс распознавания можно оптимизировать, так |
|
||||||
как для определения признаков распознаваемых объек |
|
||||||
тов или явлений могут быть в принципе привлечены |
|
||||||
различные технические средства наблюдения. Эти сред |
|
||||||
ства могут быть использованы в той или другой после |
|
||||||
довательности. Кроме того, с помощью |
технических |
|
|||||
средств |
могут быть определены |
различные |
признаки, |
|
|||
обладающие в каждой конкретной ситуации определен |
|
||||||
ной информативностью или требующие различных за |
|
||||||
трат для их нахождения и т. д. Эти возможности связа |
|
||||||
ны также с тем, что риск недостоверного распознавания |
|
||||||
объектов различных классов может быть существенно |
|
||||||
различен. |
|
|
|
|
|
|
|
Таким образом, процесс распознавания следует рас |
|
||||||
сматривать как процесс управляемый, а значит, управ |
|
||||||
лять им следует оптимально. Задача оптимизации про |
|
||||||
цесса распознавания может быть сформулирована сле |
|
||||||
дующим образом. Пусть планирование экспериментов, |
|
||||||
связанных с определением признаков распознаваемых |
|
||||||
объектов или явлений, проводится в соответствии с не |
|
||||||
которым последовательным правилом R. Обозначим че: |
|
||||||
рез |
величину расходов на проведение эксперимешов, |
|
|||||
усредненную по всем возможным цепочкам плана, опре |
|
||||||
деляемого избранным правилом R, |
т. |
е. |
Üa = Üw{R). |
|
|||
Ввиду того, что заранее неизвестно, объект какого |
|
||||||
класса подвергается распознаванию, величина |
Um долж- |
|
|||||
2— 452 |
Гфм. п, вличнап |
|
17 |
|
|||
|
|
j |
|
||||
|
Я *у ч и *- тели* |
в |
» |
! |
С |
||
|
в и Л л |
г |
п |
• » « |
На быть усредпёна по всем классам объектов с помощью априорной вероятности появления объектов определен ных классов P(Qi), і = 1, . . т.
Качество каждого алгоритма, определяющего после довательное правило к, в соответствии с которым реали
зуется процесс распознавания, может быть охарактери зован следующим функционалом:
т
u;.(R) = I > ü m ( R ) P № .
і~\
Требуется определить такое оптимальное правило К,
которое минимизировало бы средние расходы на прове дение экспериментальных работ, т. е.
и р (к) = rain Up {к). R
Процесс накопления информации о распознаваемом объекте следует прекратить в том случае, когда вы игрыш от увеличения достоверности полученного реше ния оказывается ниже затрат на проведение эксперимен тов. Именно эти соображения должны быть учтены в алгоритме, определяющем рациональную продолжи тельность процесса распознавания в каждой конкретной системе.
Таковы вкратце основные задачи, возникающие при разработке систем распознавания объектов и явлений практически любой физической или социальной при роды. В книге рассматриваются постановка и возможные методы решения этих задач.
1.3.КЛАССИФИКАЦИЯ СИСТЕМ РАСПОЗНАВАНИЯ
Внастоящее время теорию распознавания объектоз и явлений, так же как и теорию построения систем
распознавания, ни в коей мере нельзя считать завершен ной. В связи с этим дать законченную и подробную классификацию систем распознавания практически не возможно. Тем не менее разработка и изложение теории и основ построения систем распознавания требуют раз^ работки определенных классификаций распознающих си стем.
Любая классификация основывается на определен ных классификационных принципах. С точки зрения общности классификации систем распознавания наиболее
18
рациональным классификационным принципом является используемая информация о распознаваемых объектах.
Если в качестве классификационного принципа из брать количество первоначальной априорной информа ции о распознаваемых объектах или явления^, то систе мы распознавания могут быть разделены на системы без обучения, системы с обучением и самообучающиеся си стемы.
В системах без обучения количество первоначальной
информации достаточно для того, чтобы в соответствии с выбранным принципом классификации объектов раз делить все множество объектов на классы £2і, ..., Qm, определить словарь признаков Хі, . . XN и описать
каждый класс объектов на языке этих признаков, т. е.
определить зависимости X ^ D ,, і=1, ..., m, |
/ = |
1, ..., N, |
если признаки являются логическими, |
и |
функции |
fi(Xі, .. ., XN), P(Qi), если признаки являются стохасти
ческими. Будем считать, что для построения систем рас познавания без обучения необходимо располагать пол ной первоначальной априорной информацией.
В системах с обучением количество первоначальной
априорной информации также достаточно для того, что бы в соответствии с избранным классификационным принципом разделить все множество объектов на классы Qi, .. . , Qm, однако количество первоначальной инфор
мации недостаточно (либо |
ее нецелесообразно из тех |
или других соображений |
использовать) для описания |
классов. При этом количество первоначальной априор ной информации позволяет различать конкретные объ екты, принадлежащие различным классам. Именно это обстоятельство и используется для формирования рас сматриваемого класса систем с помощью обучения, ко торое состоит в многократном предъявлении системе распознавания различных объектов с указанием клас сов, к которым эти объекты принадлежат [1].
Системы распознавания с обучением до начала функ ционирования в качестве распознающих систем «работа ют с учителем». Эта работа заключается в том, что «учитель» многократно предъявляет системе обучающие объекты всех выделенных классов и указывает, к каким классам они принадлежат. Затем «учитель» начинает «экзаменовать» систему распознавания, корректируя ее ответы до тех пор, пока количество ошибок в среднем не достигнет желаемого уровня.
2* |
19 |
В системах распознавания с самообучением на ста
дии их формирования также производится показ объек тов различных классов; однако система ввиду крайне ограниченной первоначальной априорной информации не получает указаний о том, к какому классу они принад лежат. Эти указания заменяются некоторым набором правил, в соответствии с которыми на стадии самообуче ния система распознавания сама вырабатывает некото рую классификацию (которая, вообще говоря, отлича
ется от естественной классификации) |
и |
в дальнейшем |
ее всегда придерживается. |
с обучением или |
|
Не следует думать, что системы |
||
с самообучением вообще обходятся |
без |
недостающей |
априорной информации. Напротив, они ее получают в процессе обучения или самообучения. Более того, цель обучения или самообучения и состоит в том, чтобы вы работать такое количество информации, которое необ ходимо для функционирования системы распознавания.
Появление систем распознавания названных классоз обусловлено тем, что на практике при построении реаль ных систем распознавания достаточно часто приходится сталкиваться с такими ситуациями, когда отсутствует полная первоначальная априорная информация. Именно такие ситуации и привели к необходимости создавать системы распознавания с обучением и самообучением. При этом необходимо подчеркнуть, что наименование «полная первоначальная априорная информация» харак теризует не абсолютное, а относительное количество необходимой информации. Это название указывает на то, что в системах, без обучения при всех прочих рав ных условиях количество первоначальной информации больше, чем у систем распознавания других названных классов. В то же время для систем распознавания оди наковых классов абсолютное количество первоначальной информации может быть совершенно различным при необходимости распознавать объекты или явления раз личной естественной или социальной природы.
Мы рассмотрели классификацию систем распознава ния, в которой в качестве принципа классификации используется количество первоначальной априорной ин формации. В качестве другого возможного принципа классификации систем распознавания может быть ис пользован характер информации о признаках паспозиаваемых объектов, которые, как известно, могут быть под
20