Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

Скачать файл (11,72Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 191

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 8. ДВОЙСТВЕННАЯ ЗАДАЧА

319

а) точка ф0, с0 удовлетворяла (14.20) и б) градиент функции в этой точке раскладывался с по

ложительными коэффициентами по градиентам ограни чений, которые достигаются в точке ф0, с0.

Иными словами, необходимо и достаточно, чтобы су ществовали такие числа а* 0 и ß7- 0, что

Фо •— 2 i=i

и, кроме того,

д (гр, гр)

дс	- 2 *і -
	г=1

причем

2	(14.25)

з= і

2 ßi = о,

3=1

«г (1 + со — (Фо- х і)) = 0,

(14.26)

ßl ((Фо- + 1 — c0) = 0.

Рассмотрим теперь функцию

	b
W (а, ß) = 2 аі +	2 ßj — 4 "
i=l	3=1

где положено

аЪ

Ф= 2 aixi	2 ß^j-
г~1	?=1

Будем искать максимум этой функции при ограниче ниях

С&г ^ и,

аb

2 «і =	2 ßi-	(14-2V)
i = l	3=1

Согласно условиям Куна — Таккера, для того чтобы мак симум функции W (ос, ß) при ограничениях (14.27) до стигался в точке а0, ß°, необходимо и достаточно, чтобы:

а) точка ос0, ß° удовлетворяла условиям (14.27) и

320 ГЛ. XIV. ПОСТРОЕНИЕ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ

	б) существовали числа qx <1 0,				. . ., qa		0, qx	0, . . .
. . qb ^		0; с *) такие,	что
dW	(1 — (ф0, Жі)) ■= q{ — с,			dW	— (1 + ('Фоі Xj)) — <7j +				c
да.	(1 — (ф0, Жі)) ■= q{ — с,			"^ß“	— (1 + ('Фоі Xj)) — <7j +				c
да.
и g;aj = 0, q $ j — 0, где положено ф0 =						2	а&і +	2 ßp®r
	Ввиду					i=l	i—1
	Ввиду	произвольности положительных					чисел	q h	qj
условие б) равносильно			существованию числа с такого,
что		(Хі,	'фо) >	с + 1,
		(Хі,	'фо) >	с + 1,				(14.28)
		№> Ф«) < с — 1						(14.28)
и		№> Ф«) < с — 1
и		(1 + С — (ф0, Т ;) ) а°і
		(1 + С — (ф0, Т ;) ) а°і				0 ,		(14.29)
		(1 — с + (ф0,		2ß) ßj =		0.		(14.29)
		(1 — с + (ф0,		2ß) ßj =		0.

Сопоставляя условия Куна — Танкера для минимума функции (ф,ф) при ограничениях (14.20) и для максимума функции W (а, ß) при ограничениях (14.27), получаем следующую теорему.

Теорема 14.10. Точка а 0, ß°, в которой достигается мак симум функции W (а, ß) при ограничениях (14.27), и век тор фо, доставляющий минимум функции (ф, ф) при огра ничениях (14.20), связаны соотношением

а	Ь
Фо = 2 а°х* -	2	(14.30)
i=l	3=1

Таким образом, для нахождения оптимальной разде ляющей гиперплоскости достаточно найти максимум функции W (а , ß) при ограничениях (14.27), определить ф0 из (14.30) и задать гиперплоскость уравнением

(х,		min (хр фо) + max (x-, фо)
(х,	фо) = -!		----------- ----------------•
а		Ь
*) Условие 2	а. =	2	можно рассматривать как два нера-
і =	1	3 = 1

веиства 2оц — 2ß,- 0 и 2сц — 2ßj <J0.

равно В, то «зазор» не превосходит

§ 8. ДВОЙСТВЕННАЯ ЗАДАЧА

321

Отметим, что функция W (а, ß) имеет, вообще говоря, не единственный максимум. Ио все точки а 0, ß°, достав ляющие максимум этой функции при ограничениях (14.27), соответствуют одному и тому же вектору ф0.

Значение максимума функции W (а, ß) позволяет су дить о расстоянии между выпуклыми оболочками мно жеств X и X, которое равно

П(фопт) = Ш "
Действительно,
(Фо. Фо) = (Фо. S a ? Xi + 2 ß ? Xj ) .
Напомним, что значения a° и ß° отличны от нуля толь
ко для тех векторов x t (Xj),	для которых
( * г , Фо) = с + 1,	( x h фо) = с — 1.
Поэтому с учетом (14.27)

(Фо. Фо) = 2 ai "Ь 2 ßy			+ с (2 ai		—2 ß?)= 2 a*
i = l	J = 1	Vi= l		j = l '	i —l	;'=1
Следовательно,
	a	b
W (a0i ßo) =	2	2 ß?--------------------грСФо? 'Фо) = 'фо).
Наконец,	г— 1	J=1
Наконец,				VW (et»,
		2
П (фонт)		— ІФоІ			ß») •

Последнее соотношение позволяет в ходе практиче ского вычисления оптимальной разделяющей гиперпло скости оценивать зазор между разделяемыми множествами. А именно, если найдена точка а, ß, удовлетворяющая ус ловиям (14.27), и значение функции W (a, ß) з этой точке

в •

Для множеств, не разделимых гиперплоскостью, т. е. таких, выпуклые оболочки которых пересекаются, функ ция W (a, ß) в области, определяемой соотношениями (14.27), возрастает неограниченно.

11 В. Н. Вапник, А- Я. Червонеикис

322 гл . XIV. ПОСТРОЕНИЕ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ

§ 9. Методы вычисления оптимальной разделяющей гиперплоскости

Вычислять оптимальную разделяющую гиперплоскость на ЦВМ не многим сложнее, чем находить обобщенный портрет.

Для этого достаточно в градиентных методах макси мизации функции W (а, ß) заменить условный градиент функции W (а, ß) в положительном квадранте на условный градиент функции при ограничениях

« і > 0, ßj > 0 (і = 1, 2,

а) (J = 1,2, . . ., Ъ),

аЬ

2	«і = 2 ßi
i=l	3=1

и в качестве начальной точки выбрать точку, удовлетво ряющую (14.27). В соответствии с теоремой П. 4, дока занной в приложении, условный градиент функции W (а, ß) на многообразии, задаваемом условиями (14.27), однозначно определяется формулой

	1 — (Xi, ф) +	d, если 1 — (xh ф)4-
Ѵусл W (а, ß) =			+ d 0, oCj 0,
	0		в противном случае,
	1 + (Xj, ф) — d,		(14 ЗЦ
	1 + (Xj, ф) — d,		если 1 +(Xj, ф) — v
V U	W (а, ß) =		- d > 0,ß, > 0 ,
	0		в противном случае
при	условии