Файл: Горелик, А. Л. Некоторые вопросы построения систем распознавания.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 95
Скачиваний: 1
технических средств измерения признаков [8]. Квадрат расстояния между парой классов определяется по фор муле
|
|
|
|
кѵ |
Kq |
|
|
я Ча е, а |
, ) ^ |
х , |
|
|
, |
(3.15) |
|
|
|
/=і |
k=\ /=і |
|
|
||
где р, q—1, |
.. |
т; |
l j = l , |
если /-й признак используется |
|||
в словаре признаков, или |
Я,3- = 0 — в противном случае. |
||||||
Все пары из т классов можно перенумеровать, вводя |
|||||||
один индекс |
г = 1 , |
где п = С2т = т ( т — 1)/2. |
|
||||
Если выражение в квадратных скобках (3.15) обозна |
|||||||
чить через |
, |
где |
г — номер |
пары классов, |
/ — номер |
||
признака, то расстояние для r-й пары |
|
|
|||||
|
|
|
N |
|
|
|
|
|
|
/ ? ; = Ѵ і іР; , г = і , . . . , й . |
|
(3.16) |
|||
Величина р1 |
характеризует |
информативность |
/-го |
при |
знака для г-н пары классов. Теперь нашу задачу можно
записать в следующем виде:
max |
min |
i^=^maxmin (Я • pr), |
Х3- = 0 , 1 |
] |
ХЕ Е Е і ' Г "_п |
(3.17)
N
V 3 С ■ < Г
/= 1
где
Я—-(Я„ ..., Я^); Рг—- (рдч ..., рг ),
Е = {Я; Я., = 0,1; (Я-С)<С0).
Таким образом, сформулированная задача является сложной и нетрадиционной. Она состоит в нахождении максмина с ограничением дискретной функции. В про стейших случаях, когда N-n сравнительно невелико, за
дача может быть решена простым перебором. В против ном случае для ее решения может быть применен метод штрафных функций, позволяющий приближенно свести задачу определения максмина с ограничением функции к безусловному экстремуму непрерывной функции.
55
Идея метода штрафных функций состоит в замене задачи отыскания относительного максимума функции F (X) при условиях фФ(Х) = 0 , і = 1, . . т, задачей отыс
кания абсолютного максимума функции
|
т |
|
ф (X) = |
F (X) - 2 Аі [?<« (X)]2, |
(3.18) |
где А і -— некоторые |
і=і |
|
положительные постоянные [9]. |
Функции Лфр^Х)]2 называются штрафными функциями.
Если условия связи выполнены, то Е ( Х )= ф ( Х) . Если нет, то второе слагаемое в правой части (3.18) характе ризует меру отклонения точки от поверхности фФ(Х)=0. Если теперь для отыскания максимума функции Ф(Х) применить градиентный метод, т. е. использовать рекур рентное соотношение
ТП
X k + i = |
X h + t v F |
(Xft) - |
t ' Z A i V [?<« (Xft)]2, |
(3.19) |
где t — величина шага, |
i=i |
|
||
|
|
|||
то второе |
слагаемое |
будет |
направлено таким |
образом* |
чтобы компенсировать дефект в выполнении условий свя зи. Чем больше будут числа Аі, тем больше будет штраф' за нарушение условий связи.
Рассмотрим задачу отыскания максимума функции F(X), определенной и ограниченной сверху на некотором, компактном множестве Е, при условии, что X удовлетво ряет условию ф(X) = 0 . Множество точек X ^ R , удов летворяющих этому условию, обозначим через М. Будемполагать, что множество М замкнутое. Построим функ
цию ф(Х)
|
_ |
I |
0, |
если |
Х ^ М |
|
|
|
|
|
( <[0, |
если |
X 0 |
М. |
|
|
|
Например, в качестве |
ф(Х) |
можно |
взять |
функцию |
||||
■—Ф2(Х). Введем |
в |
рассмотрение |
функцию |
/(X, |
X) = |
|||
= F(X) +лф (X). |
Обозначим |
через |
Х х |
точки, в |
кото |
рых функция /(X, X) достигает своего максимального значения на R при данном X. Обозначим через N множе ство точек Х х, когда X изменяется от 0 до оо. Так как
множество Е компактно, то можно выделить сходя
щиеся подпоследовательности точек {Хх}, обладаю
щие следующим свойством: lim Хх = Х^. |
Восполь- |
>.->00 |
|
5G
зовавшись теоремой три, доказанной в [10], можно ут верждать, что точки Хоо принадлежат множеству М и в этих точках функция F(X) достигает на М своего мак
симального значения, причем
F (X ) = Ііш max / (X, Я).
Х->оо X^zzE
Возвращаясь к нашей задаче, введем в рассмотрение функцию
ф (Ä) = И (Я- - |
h) - ІСо -(Я -С) - IСо - (Г- С) И2, (3.20) |
где X принадлежит УѴ-мерному единичному кубу |
|
L = |
{Х:0<ЯІ <1; |
Функция Ф(Х) = 0 тогда и только тогда, когда Х е£ , т. е. совокупность ограничений на к заменена одним ограни
чением Ф(X) =0. На |
векторах X, не удовлетворяющих |
|
условиям задачи, т. е. |
для X e L \ £ , |
функция Ф(Х)<0. |
Так как функция |
min (Х-рг) |
есть непрерывная |
_ |
1^г<я |
|
функция аргумента X, то к ней применима сформулиро ванная выше теорема о штрафных функциях.
Таким образом,
max min |
(Я- p^) == lim max [тіп(Я-pr) -f- ХФ(Я)]. (3.21) |
aGEE |
k-±oo X€E/- |
Так как слагаемое КФ (Я) не зависит от г, то его можно
ввести под знак min, т. е.
max min (Я-рг) ^lim jnax min [(Я-рг) Х Ф |
(Я)]. |
(3.22) |
|||
УЕЕкЕІг<Г ^Ln |
£->00 |
IzZ/^n |
|
|
|
Далее, воспользовавшись методом сведения |
максмина |
||||
к простому максимуму [11], имеем |
|
|
|||
max [min [(Я-рг) + |
ХФ (Я)] = |
|
|
||
= lim |
max |
| С — X, X [(Я • рг) + |
|
|
|
/<1-»00 (Х,£/)€Е£і I |
r_[ |
|
|
||
Ч- ХФ (Я) — С/ — |
I(Я- Pr) + ХФ (я) — и |]2 |
(3.23) |
57
где |
Lj = L • |
0, |
max- |
p(,! |
, T . |
e. L, |
представляет |
|
|
|
j=l |
' |
|
|
|
собой |
прямое |
произведение |
двух |
множеств: УѴ-мерного |
|||
куоа |
и отрезка |
|
N |
~ |
|
|
|
О, max |
Р(,) |
|
|
||||
|
|
|
1 |
)=1 |
|
|
|
Объединяя (3.22) и (3.23), имеем |
( |
|
|||||
max min |
___ |
|
|
п ___ |
|||
(Я- pr) = lim lim max |
<С7 — К, |
[(Я- рг) + |
|||||
л£ЕЕ l ^ r ^ n |
|
k~>oc ki^oo |
(K,U)£E~L I |
r _ I |
|||
|
+ K Ф(Я) — U - |
I (Я- Рг) + |
КФ(Я) - |
U\ f j. (3.24) |
Таким образом, искомый максмин с ограничением све ден к повторному пределу простого максимума некото рой функции. Однако пользоваться формулой (3.24) трудно в связи с необходимостью осуществлять предель ные переходы в определенной последовательности. Это затруднение удается преодолеть, если иметь в виду, что повторный предел в (3.24) равен двойному пределу вида
|
|
lim |
max |
Ш — |
|(Я- рг) ф |
|
||
|
|
|
GO (X .t/jG z Z -i ^ |
Г ~ 1 |
|
|
||
|
|
+/СФ(Я)—С/—I (Я-7г) + ^ф (я) - |
и |]2 1. |
(3.25) |
||||
Докажем это. Обозначим максимизируемую |
функцию |
|||||||
в (3.24) |
через |
?(Я, 17); |
ее |
производная |
по U равна |
|||
|
|
ду (Я, U)[dU = |
1 -ф 4Kl |
[(Я- |
pr) -ф |
|
||
|
|
|
|
|
|
r=1 |
|
|
|
|
+ КФ (Я) - U - |
I (Я-fc) + |
КФ (Я) - U |], |
(3.26) |
|||
при этом, если |
t/>maxmin |
[(Я- рг) -ф КФ(Я)] -ф 1/8/С,, то |
||||||
|
|
|
X^=:Ll^r^n |
|
|
|
||
d'f (Я, |
U)JdU < |
0 для любого Я £) L. Кроме того, |
f (Я, 17) ^ |
|||||
<17 |
для 'любого X ^ L . |
Следовательно, |
|
|||||
max |
<р(Я, U) < max min |
[(Я-рг) -ф КФ (Я)) -ф 1/8/С,. |
||||||
(T.U) |
|
х& |
1=&- |
|
|
|
(3.27) |
|
|
|
|
|
|
|
|
|
58