Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 92
Скачиваний: 1
Уравнение областей состояний при г=0,1
|
(а—0,03)2/0,122 + (ß—0,08)2/0,42 = 1; |
при г=0,2 |
|
|
(ф—0,55)2/0,672 + (ф +1,1) 2/2,242= 1, |
где а = 16,7ф+ф, |
ß = —ф+16,7ф. |
Наконец, при г= 0,3 |
|
|
(Ф + 0,34) 2/10,392 + (ф + 0,61) 2/1,42 = 1, |
где а = —10ф+ф, |
р=ф+10ф. |
3.НЕКОТОРЫЕ МЕТОДЫ ОПРЕДЕЛЕНИЯ СЛОВАРЯ ПРИЗНАКОВ, ИСПОЛЬЗУЕМОГО ПРИ ПОСТРОЕНИИ СИСТЕМЫ
РАСПОЗНАВАНИЯ
Выбор словаря признаков, используемого при по строении системы распознавания, представляет собой са мостоятельную и подчас достаточно сложную задачу. Мы уже говорили о том, что при разработке словаря признаков приходится сталкиваться с рядом ограничений. Одно из них состоит в том, что в словарь могут быть, включены только те признаки, о которых имеется апри орная информация, достаточная для описания классов на языке этих признаков. Будем называть словарь при знаков, построенный с учетом этого ограничения, апри орным словарем. Другое ограничение связано с тем, что
некоторые из признаков нецелесообразно включать в ап риорный словарь ввиду того, что они малоинформатив ны. И, наконец, последнее ограничение связано с тем, что некоторые признаки и притом, как правило, наиболее информативные, не могут быть определены, ввиду отсут ствия соответствующих измерителей, а ресурсы, ассиг нованные на создание системы распознавания, не без граничны. Именно поэтому априорный словарь призна ков, в общем случае, может быть использован лишь в качестве основы для построения реально используемо го в системе распознавания рабочего словаря признаков.
В рабочем словаре следует использовать лишь те
признаки, которые, с одной стороны, наиболее инфор мативны и, с другой — могут быть в принципе определе ны имеющимися или специально созданными средствами наблюдения.
4—452 |
4& |
Таким образом, задача разработки рабочего словаря признаков системы распознавания в общем случае сво дится к тому, чтобы в пределах выделенных ресурсов определить перечень технических средств наблюдений, создание которых обеспечивает получение наиболее ин формативных признаков априорного словаря. Построен ный таким образом рабочий словарь признаков, в свою очередь, в принципе позволяет реализовать максимально возможную эффективность системы распознавания. Ниже наряду с достаточно общим подходом к построению ра бочего словаря признаков рассмотрен ряд частных методов сравнительной оценки отдельных признаков, позволяющих производить отбор признаков априорного ■словаря в рабочий словарь признаков системы распозна вания.
-3.1. ОПРЕДЕЛЕНИЕ СЛОВАРЯ ПРИЗНАКОВ В УСЛОВИЯХ ОГРАНИЧЕНИИ НА СТОИМОСТЬ
СОЗДАНИЯ ТЕХНИЧЕСКИХ СРЕДСТВ НАБЛЮДЕНИЙ
Пусть в результате классификации все множество объектов ß —{ш} разбито на ряд непересекающихся под множеств iQj, П2, . • ßm, каждое из которых и состав ляет соответствующий класс. Обозначим объекты, отно сящиеся к каждому классзу (і= 1, ..., т), следующим
■образом:
Ql |
°^12» *•> |
|
Q2 = |
{(o21 ш22, |
°ч}> |
|
|
|
Qp |
{Шр1 »ШР2* *•*’ °ѴР |
|
Qm —: |
■ |
|
Обозначим признаки объектов через Xj, / = 1 , 2 , . . . , N.
Тогда каждый объект в ААмерном пространстве призна ков может быть представлен в виде вектора Х =( Х і , Ä2, . . XN), координаты которого количественно харак
теризуют свойства объектов.
Для определения меры близости или подобия между объектами в ААмерном векторном пространстве призна ков необходимо ввести метрику. Выбор метрики, вообще
.50
говоря, произволен, необходимо лишь, чтобы она удов летворяла обычным аксиомам расстояний:
d(ä, Ь) = é(b, й),
d(ä, c)^d (ä, b)+d(b, с),
d(ä, Ъ) > 0 , d(ä, Ъ)=0. |
(3.2) |
тогда и только тогда, когда ä=b.
В дальнейшем, не нарушая общности рассуждений,,
будем пользоваться эвклидовой метрикой, т. е. |
|
|
||||||
|
|
M |
= |
|
|
|
(3.3> |
|
|
|
|
/=1 |
|
|
|
|
|
где р, (7= |
1 , 2, |
.. ., т, |
k — \, 2, |
. .., |
kp, |
1=1, 2, |
..., |
kq. |
Здесь Хрь |
есть |
• значения /-го |
признака |
k-ro |
объекта |
|||
р-го класса, т. е. объекта <орк, а |
— значение |
/-га |
||||||
признака /-го объекта q-ro класса, т. |
е. объекта |
<%. |
|
В дальнейшем нам понадобится рассматривать меру близости между всеми объектами данного класса и меру близости между всеми объектами данной пары классов.
В качестве меры близости между объектами |
данного- |
||
класса й р, |
р —1, 2, |
..., т, будем использовать величину |
|
S ( Q p ) = 1 / |
«ТъЬЕЕ d2 («Bps, шяг), |
(3.4) |
|
|
Г |
k=\ 1=1 |
|
которую |
назовем |
среднеквадратическим разбросом |
объектов внутри класса й р или просто среднеквадрати ческим разбросом класса.
В качестве меры близости между объектами данной пары классов ЙР и Йд, р, q—1, ..., т, будем использо
вать величину |
|
|
|
Я ( О р , 0 , ) = |
КрКд |
d2К * . °ty), |
(З.б> |
|
|
k=\ i=1 |
|
которую назовем среднеквадратическим разбросом объектов классов й р и Qg.
Совокупность признаков объектов, используемых в ра бочем словаре, можно описать ІѴ-мерным вектором %—
4* 5£
-='(А,ь Хг, . .., XN), компоненты которого принимают зна
чения 1 или 0 в зависимости от того, имеется или отсут ствует возможность определения соответствующего при
знака объекта, т. е. Aj=j Q.C учетом X квадрат расстоя
ния между двумя объектами сори и a qi равен
с і* ы , «>,*)= S М * * - * « ) * ■ |
(3.6) |
/=1 |
|
Следовательно, среднеквадратический разброс класса может быть записан так:
|
|
|
(3.7) |
а среднеквадратический разброс объектов классов й р и |
|||
следующим образом: |
|
|
|
|
К Р Kg N |
|
|
Д(йр, Ü,) = |
ш ъ ъ |
р<*і.я |
Х ' " у . (3.8) |
Будем исходить/ |
|
||
к=\ 1=1/=I |
|
|
|
из того, что затраты на создание тех |
нических средств наблюдений пропорциональны их ин формативности, иначе тому количеству признаков объек тов, которые с их помощью могут быть определены. Та кое предположение (оставляя в стороне вопрос о точно стных характеристиках средств наблюдений) носит до статочно общий характер.
Таким образом, затраты на создание средств наблю дений равны
N |
|
С = С (Aj..., Am) = 2] CjXj, |
(3.9) |
j=i |
|
где Cj — затраты на создание технического средства,
обеспечивающего определение /-го признака. И, наконец, в качестве показателя качества или эффективности про ектируемой системы распознавания рассмотрим функ ционал, зависящий в общем случае от функций 5( ЙР), R(QP, fig), решающего правила /.(&){(%}, т. е.
J=^[S(Qp); R(QP, Qg); Ц со, {ca*})]. (3.10)
.52
Пусть величина L (со, {cog}) представляет меру близости между распознаваемым объектом © и классом f i g , g = = 1, 2, . т, заданным своими объектами {cog}. В каче
стве этой меры близости будем рассматривать величину
£(®> {®*})= у |
^*(®. ®в) , |
(3.11) |
представляющую собой среднеквадратическое расстояние между данным объектом ю и объектами класса fig .
Решающее правило состоит в следующем:
(ö^ ü g, если L (со {<oÄ}) = |
extr L (со, {шг-}). |
Здесь важно подчеркнуть, что |
уменьшение величины |
.S(fip), т. е. «сжатие» объектов, принадлежащих каждо му данному классу, при одновременном увеличении R(QP, fig), т. е. «разведение» объектов, принадлежащих
разным классам, и обеспечивает в конечном счете улуч шение качества системы распознавания. Именно поэтому повышение эффективности системы будем связывать с достижением экстремума функционала J.
Постановка задачи может быть сформулирована следующим образом. Пусть все множество объектов под разделено на классы fi*, і'=1, 2, .. ., т, и априорно опи саны все классы на языке признаков Xj, /= 1, 2, . .., N.
Пусть на создание технических средств наблюдений в распоряжении создателей системы распознавания име ются ассигнования, величина которых равна С0. Требу ется, не превышая выделенной суммы средств, построить рабочий словарь признаков системы распознавания, обеспечивающий максимально возможную эффектив ность системы. Таким образом, задача сводится к на хождению условного экстремума функционала вида
(3.10), т. е. к определению Я,0, реализующего
extr J = extr F [S (Qp); R (fip, fi,); L (©, {<ofi})]
T |
T |
|
N |
при C = |
Cj2j < C0. |
i=1
Рассматриваемая подстановка задачи имеет геомет рический смысл. Однако, если учесть, что функция S (fip)
.характеризует эмпирический статистический ряд распре
53
деления объектов в р-м классе, а функция R(ÜP, Qq) —
взаимное расположение эмпирических статистических рядов, соответствующих классам р и q(p, q= 1,
то тем самым обнаруживается связь рассматриваемого подхода со статистическим подходом к распознаванию объектов.
В частных случаях построения рабочего словаря при знаков конкретных систем распознавания функционал (3.10) приобретает соответствующий вид. В том случае, когда требуемая эффективность системы распознавания может быть достигнута за счет более компактного рас
положения |
объектов |
каждого класса, задача |
сводится |
к нахождению |
|
|
|
|
min max [S(ü/)j. |
(3-12) |
|
|
X |
/ = І , . . а, т |
|
N |
и R(Op, Q.q) ^ R 0. |
|
|
при |
|
/=1
Если требуемая эффективность системы может быть достигнута за счет «удаления» друг от друга объектов* принадлежащих разным классам, то задачей является определение
max min [^(Qp, ü 9)] |
(3.13) |
X p, q—\ ......m |
|
N
также при ^ C jÄ j<C 0.
/=і
Еслинадлежащая эффективность системыможет быть достигнута только увеличением отношениярасстояний между классами к среднеквадратическим разбросам объектов внутри класса, то задача сводится к опре делению
[ в д э д ] (ЗЛ4>
N
при ^]C j2j<C 0.
І=і
Возможны и другие постановки задачи и соответствую щие им виды функционалов.
Решим задачу определения набора признаков, макси мизирующего минимальное расстояние между парами классов при ограничении на общую сумму стоимостей
54