Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 191

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 8. ДВОЙСТВЕННАЯ ЗАДАЧА

319

а) точка ф0, с0 удовлетворяла (14.20) и б) градиент функции в этой точке раскладывался с по­

ложительными коэффициентами по градиентам ограни­ чений, которые достигаются в точке ф0, с0.

Иными словами, необходимо и достаточно, чтобы су­ ществовали такие числа а* 0 и ß7- 0, что

Фо •— 2 i=i

и, кроме того,

д (гр, гр)

дс

- 2 *і -

 

г=1

причем

2

(14.25)

 

з= і

ь

2 ßi = о,

3=1

«г (1 + со — (Фо- х і)) = 0,

(14.26)

ßl ((Фо- + 1 — c0) = 0.

Рассмотрим теперь функцию

 

b

W (а, ß) = 2 аі +

2 ßj — 4 "

i=l

3=1

где положено

аЪ

Ф= 2 aixi

2 ß^j-

г~1

?=1

Будем искать максимум этой функции при ограниче­ ниях

С&г ^ и,

аb

2 «і =

2 ßi-

(14-2V)

i = l

3=1

 

Согласно условиям Куна — Таккера, для того чтобы мак­ симум функции W (ос, ß) при ограничениях (14.27) до­ стигался в точке а0, ß°, необходимо и достаточно, чтобы:

а) точка ос0, ß° удовлетворяла условиям (14.27) и


320 ГЛ. XIV. ПОСТРОЕНИЕ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ

 

б) существовали числа qx <1 0,

. . ., qa

0, qx

0, . . .

. . qb ^

0; с *) такие,

что

 

 

 

 

 

 

dW

(1 — (ф0, Жі)) ■= q{ — с,

dW

— (1 + ('Фоі Xj)) — <7j +

c

да.

"^ß“

 

 

 

 

 

 

 

 

 

и g;aj = 0, q $ j — 0, где положено ф0 =

2

а&і +

2 ßp®r

 

Ввиду

 

 

 

 

i=l

i—1

 

 

произвольности положительных

чисел

q h

qj

условие б) равносильно

существованию числа с такого,

что

 

(Хі,

'фо) >

с + 1,

 

 

 

 

 

 

 

 

(14.28)

 

 

№> Ф«) < с — 1

 

 

и

 

 

 

 

 

 

(1 + С — (ф0, Т ;) ) а°і

 

 

 

 

 

 

0 ,

 

(14.29)

 

 

(1 — с + (ф0,

2ß) ßj =

0.

 

 

 

 

 

 

Сопоставляя условия Куна — Танкера для минимума функции (ф,ф) при ограничениях (14.20) и для максимума функции W (а, ß) при ограничениях (14.27), получаем следующую теорему.

Теорема 14.10. Точка а 0, ß°, в которой достигается мак­ симум функции W (а, ß) при ограничениях (14.27), и век­ тор фо, доставляющий минимум функции (ф, ф) при огра­ ничениях (14.20), связаны соотношением

а

Ь

 

Фо = 2 а°х* -

2

(14.30)

i=l

3=1

 

Таким образом, для нахождения оптимальной разде­ ляющей гиперплоскости достаточно найти максимум функции W (а , ß) при ограничениях (14.27), определить ф0 из (14.30) и задать гиперплоскость уравнением

(х,

 

min (хр фо) + max (x-, фо)

фо) = -!

----------- ----------------•

а

 

Ь

 

*) Условие 2

а. =

2

можно рассматривать как два нера-

і =

1

3 = 1

 

веиства 2оц — 2ß,- 0 и 2сц — 2ßj <J0.


равно В, то «зазор» не превосходит

§ 8. ДВОЙСТВЕННАЯ ЗАДАЧА

321

Отметим, что функция W (а, ß) имеет, вообще говоря, не единственный максимум. Ио все точки а 0, ß°, достав­ ляющие максимум этой функции при ограничениях (14.27), соответствуют одному и тому же вектору ф0.

Значение максимума функции W (а, ß) позволяет су­ дить о расстоянии между выпуклыми оболочками мно­ жеств X и X, которое равно

П(фопт) = Ш "

Действительно,

 

(Фо. Фо) = (Фо. S a ? Xi + 2 ß ? Xj ) .

Напомним, что значения a° и ß° отличны от нуля толь­

ко для тех векторов x t (Xj),

для которых

( * г , Фо) = с + 1,

( x h фо) = с — 1.

Поэтому с учетом (14.27)

 

(Фо. Фо) = 2 ai "Ь 2 ßy

+ с (2 ai

—2 ß?)= 2 a*

i = l

J = 1

Vi= l

j = l '

i —l

;'=1

Следовательно,

 

 

 

 

 

 

 

a

b

 

 

 

 

W (a0i ßo) =

2

2 ß?--------------------грСФо? 'Фо) = 'фо).

Наконец,

г— 1

J=1

 

 

 

 

 

 

 

VW (et»,

 

 

 

 

2

 

 

 

П (фонт)

ІФоІ

 

ß») •

 

Последнее соотношение позволяет в ходе практиче­ ского вычисления оптимальной разделяющей гиперпло­ скости оценивать зазор между разделяемыми множествами. А именно, если найдена точка а, ß, удовлетворяющая ус­ ловиям (14.27), и значение функции W (a, ß) з этой точке

2

в

Для множеств, не разделимых гиперплоскостью, т. е. таких, выпуклые оболочки которых пересекаются, функ­ ция W (a, ß) в области, определяемой соотношениями (14.27), возрастает неограниченно.

11 В. Н. Вапник, А- Я. Червонеикис


322 гл . XIV. ПОСТРОЕНИЕ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ

§ 9. Методы вычисления оптимальной разделяющей гиперплоскости

Вычислять оптимальную разделяющую гиперплоскость на ЦВМ не многим сложнее, чем находить обобщенный портрет.

Для этого достаточно в градиентных методах макси­ мизации функции W (а, ß) заменить условный градиент функции W (а, ß) в положительном квадранте на условный градиент функции при ограничениях

« і > 0, ßj > 0 = 1, 2,

а) (J = 1,2, . . ., Ъ),

аЬ

2

«і = 2 ßi

i=l

3=1

и в качестве начальной точки выбрать точку, удовлетво­ ряющую (14.27). В соответствии с теоремой П. 4, дока­ занной в приложении, условный градиент функции W (а, ß) на многообразии, задаваемом условиями (14.27), однозначно определяется формулой

 

1 — (Xi, ф) +

d, если 1 — (xh ф)4-

Ѵусл W (а, ß) =

 

+ d 0, oCj 0,

 

0

 

в противном случае,

 

1 + (Xj, ф) — d,

(14 ЗЦ

 

если 1 +(Xj, ф) — v

V U

W (а, ß) =

 

- d > 0,ß, > 0 ,

 

0

 

в противном случае

при

условии

 

 

2ѴуСЛW - 2Ѵусл w = 0 .

Теперь остается подобрать величину d так, чтобы это

условие выполнялось. Будем рассматривать VyCn, ѴуСЛ в (14.31) как функции d и обозначим

L(d) = ЗѴуол (d) - 2ѴуСП(d)*

Очевидно, что для нахождения условного градиента до­ статочно найти корень уравнения

L (d) = 0,