Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 92

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Уравнение областей состояний при г=0,1

 

(а—0,03)2/0,122 + (ß—0,08)2/0,42 = 1;

при г=0,2

 

 

(ф—0,55)2/0,672 + (ф +1,1) 2/2,242= 1,

где а = 16,7ф+ф,

ß = —ф+16,7ф.

Наконец, при г= 0,3

 

(Ф + 0,34) 2/10,392 + (ф + 0,61) 2/1,42 = 1,

где а = —10ф+ф,

р=ф+10ф.

3.НЕКОТОРЫЕ МЕТОДЫ ОПРЕДЕЛЕНИЯ СЛОВАРЯ ПРИЗНАКОВ, ИСПОЛЬЗУЕМОГО ПРИ ПОСТРОЕНИИ СИСТЕМЫ

РАСПОЗНАВАНИЯ

Выбор словаря признаков, используемого при по­ строении системы распознавания, представляет собой са­ мостоятельную и подчас достаточно сложную задачу. Мы уже говорили о том, что при разработке словаря признаков приходится сталкиваться с рядом ограничений. Одно из них состоит в том, что в словарь могут быть, включены только те признаки, о которых имеется апри­ орная информация, достаточная для описания классов на языке этих признаков. Будем называть словарь при­ знаков, построенный с учетом этого ограничения, апри­ орным словарем. Другое ограничение связано с тем, что

некоторые из признаков нецелесообразно включать в ап­ риорный словарь ввиду того, что они малоинформатив­ ны. И, наконец, последнее ограничение связано с тем, что некоторые признаки и притом, как правило, наиболее информативные, не могут быть определены, ввиду отсут­ ствия соответствующих измерителей, а ресурсы, ассиг­ нованные на создание системы распознавания, не без­ граничны. Именно поэтому априорный словарь призна­ ков, в общем случае, может быть использован лишь в качестве основы для построения реально используемо­ го в системе распознавания рабочего словаря признаков.

В рабочем словаре следует использовать лишь те

признаки, которые, с одной стороны, наиболее инфор­ мативны и, с другой — могут быть в принципе определе­ ны имеющимися или специально созданными средствами наблюдения.

4—452

4&


Таким образом, задача разработки рабочего словаря признаков системы распознавания в общем случае сво­ дится к тому, чтобы в пределах выделенных ресурсов определить перечень технических средств наблюдений, создание которых обеспечивает получение наиболее ин­ формативных признаков априорного словаря. Построен­ ный таким образом рабочий словарь признаков, в свою очередь, в принципе позволяет реализовать максимально возможную эффективность системы распознавания. Ниже наряду с достаточно общим подходом к построению ра­ бочего словаря признаков рассмотрен ряд частных методов сравнительной оценки отдельных признаков, позволяющих производить отбор признаков априорного ■словаря в рабочий словарь признаков системы распозна­ вания.

-3.1. ОПРЕДЕЛЕНИЕ СЛОВАРЯ ПРИЗНАКОВ В УСЛОВИЯХ ОГРАНИЧЕНИИ НА СТОИМОСТЬ

СОЗДАНИЯ ТЕХНИЧЕСКИХ СРЕДСТВ НАБЛЮДЕНИЙ

Пусть в результате классификации все множество объектов ß —{ш} разбито на ряд непересекающихся под­ множеств iQj, П2, . • ßm, каждое из которых и состав­ ляет соответствующий класс. Обозначим объекты, отно­ сящиеся к каждому классзу (і= 1, ..., т), следующим

■образом:

Ql

°^12» *•>

 

Q2 =

{(o21 ш22,

°ч}>

 

 

Qp

{Шр1 »ШР2* *•*’ °ѴР

Qm —:

 

Обозначим признаки объектов через Xj, / = 1 , 2 , . . . , N.

Тогда каждый объект в ААмерном пространстве призна­ ков может быть представлен в виде вектора Х =( Х і , Ä2, . . XN), координаты которого количественно харак­

теризуют свойства объектов.

Для определения меры близости или подобия между объектами в ААмерном векторном пространстве призна­ ков необходимо ввести метрику. Выбор метрики, вообще

.50

говоря, произволен, необходимо лишь, чтобы она удов­ летворяла обычным аксиомам расстояний:

d(ä, Ь) = é(b, й),

d(ä, c)^d (ä, b)+d(b, с),

d(ä, Ъ) > 0 , d(ä, Ъ)=0.

(3.2)

тогда и только тогда, когда ä=b.

В дальнейшем, не нарушая общности рассуждений,,

будем пользоваться эвклидовой метрикой, т. е.

 

 

 

 

M

=

 

 

 

(3.3>

 

 

 

/=1

 

 

 

 

 

где р, (7=

1 , 2,

.. ., т,

k — \, 2,

. ..,

kp,

1=1, 2,

...,

kq.

Здесь Хрь

есть

• значения /-го

признака

k-ro

объекта

р-го класса, т. е. объекта <орк, а

— значение

/-га

признака /-го объекта q-ro класса, т.

е. объекта

<%.

 

В дальнейшем нам понадобится рассматривать меру близости между всеми объектами данного класса и меру близости между всеми объектами данной пары классов.

В качестве меры близости между объектами

данного-

класса й р,

р —1, 2,

..., т, будем использовать величину

S ( Q p ) = 1 /

«ТъЬЕЕ d2 («Bps, шяг),

(3.4)

 

Г

k=\ 1=1

 

которую

назовем

среднеквадратическим разбросом

объектов внутри класса й р или просто среднеквадрати­ ческим разбросом класса.

В качестве меры близости между объектами данной пары классов ЙР и Йд, р, q—1, ..., т, будем использо­

вать величину

 

 

 

Я ( О р , 0 , ) =

КрКд

d2К * . °ty),

(З.б>

 

 

k=\ i=1

 

которую назовем среднеквадратическим разбросом объектов классов й р и Qg.

Совокупность признаков объектов, используемых в ра­ бочем словаре, можно описать ІѴ-мерным вектором %—

4* 5£


-='(А,ь Хг, . .., XN), компоненты которого принимают зна­

чения 1 или 0 в зависимости от того, имеется или отсут­ ствует возможность определения соответствующего при­

знака объекта, т. е. Aj=j Q.C учетом X квадрат расстоя­

ния между двумя объектами сори и a qi равен

с і* ы , «>,*)= S М * * - * « ) * ■

(3.6)

/=1

 

Следовательно, среднеквадратический разброс класса может быть записан так:

 

 

 

(3.7)

а среднеквадратический разброс объектов классов й р и

следующим образом:

 

 

 

К Р Kg N

 

 

Д(йр, Ü,) =

ш ъ ъ

р<*і.я

Х ' " у . (3.8)

Будем исходить/

 

к=\ 1=1/=I

 

 

из того, что затраты на создание тех­

нических средств наблюдений пропорциональны их ин­ формативности, иначе тому количеству признаков объек­ тов, которые с их помощью могут быть определены. Та­ кое предположение (оставляя в стороне вопрос о точно­ стных характеристиках средств наблюдений) носит до­ статочно общий характер.

Таким образом, затраты на создание средств наблю­ дений равны

N

 

С = С (Aj..., Am) = 2] CjXj,

(3.9)

j=i

 

где Cj — затраты на создание технического средства,

обеспечивающего определение /-го признака. И, наконец, в качестве показателя качества или эффективности про­ ектируемой системы распознавания рассмотрим функ­ ционал, зависящий в общем случае от функций 5( ЙР), R(QP, fig), решающего правила /.(&){(%}, т. е.

J=^[S(Qp); R(QP, Qg); Ц со, {ca*})]. (3.10)

.52


Пусть величина L (со, {cog}) представляет меру близости между распознаваемым объектом © и классом f i g , g = = 1, 2, . т, заданным своими объектами {cog}. В каче­

стве этой меры близости будем рассматривать величину

£(®> {®*})= у

^*(®. ®в) ,

(3.11)

представляющую собой среднеквадратическое расстояние между данным объектом ю и объектами класса fig .

Решающее правило состоит в следующем:

(ö^ ü g, если L (со {<oÄ}) =

extr L (со, {шг-}).

Здесь важно подчеркнуть, что

уменьшение величины

.S(fip), т. е. «сжатие» объектов, принадлежащих каждо­ му данному классу, при одновременном увеличении R(QP, fig), т. е. «разведение» объектов, принадлежащих

разным классам, и обеспечивает в конечном счете улуч­ шение качества системы распознавания. Именно поэтому повышение эффективности системы будем связывать с достижением экстремума функционала J.

Постановка задачи может быть сформулирована следующим образом. Пусть все множество объектов под­ разделено на классы fi*, і'=1, 2, .. ., т, и априорно опи­ саны все классы на языке признаков Xj, /= 1, 2, . .., N.

Пусть на создание технических средств наблюдений в распоряжении создателей системы распознавания име­ ются ассигнования, величина которых равна С0. Требу­ ется, не превышая выделенной суммы средств, построить рабочий словарь признаков системы распознавания, обеспечивающий максимально возможную эффектив­ ность системы. Таким образом, задача сводится к на­ хождению условного экстремума функционала вида

(3.10), т. е. к определению Я,0, реализующего

extr J = extr F [S (Qp); R (fip, fi,); L (©, {<ofi})]

T

T

 

N

при C =

Cj2j < C0.

i=1

Рассматриваемая подстановка задачи имеет геомет­ рический смысл. Однако, если учесть, что функция S (fip)

.характеризует эмпирический статистический ряд распре­

53


деления объектов в р-м классе, а функция R(ÜP, Qq)

взаимное расположение эмпирических статистических рядов, соответствующих классам р и q(p, q= 1,

то тем самым обнаруживается связь рассматриваемого подхода со статистическим подходом к распознаванию объектов.

В частных случаях построения рабочего словаря при­ знаков конкретных систем распознавания функционал (3.10) приобретает соответствующий вид. В том случае, когда требуемая эффективность системы распознавания может быть достигнута за счет более компактного рас­

положения

объектов

каждого класса, задача

сводится

к нахождению

 

 

 

min max [S(ü/)j.

(3-12)

 

X

/ = І , . . а, т

 

N

и R(Op, Q.q) ^ R 0.

 

при

 

/=1

Если требуемая эффективность системы может быть достигнута за счет «удаления» друг от друга объектов* принадлежащих разным классам, то задачей является определение

max min [^(Qp, ü 9)]

(3.13)

X p, q—\ ......m

 

N

также при ^ C jÄ j<C 0.

/=і

Еслинадлежащая эффективность системыможет быть достигнута только увеличением отношениярасстояний между классами к среднеквадратическим разбросам объектов внутри класса, то задача сводится к опре­ делению

[ в д э д ] (ЗЛ4>

N

при ^]C j2j<C 0.

І=і

Возможны и другие постановки задачи и соответствую­ щие им виды функционалов.

Решим задачу определения набора признаков, макси­ мизирующего минимальное расстояние между парами классов при ограничении на общую сумму стоимостей

54