Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 199

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

300 ГЛ. XIV . ПОСТРОЕНИЕ РАЗДЕЛЯЮ Щ ЕЙ ГИПЕРПЛОСКОСТИ

И обратно, если для некоторой точки х 0 выполняются условия (14.8) и можно найти числа А,г!>0, удовлетворяю­ щие условиям (14.9) и (14.10), то в точке х 0 достигается условный минимум F (X) при ограничениях (14.8).

Доказательство этой теоремы приведено в приложении. Введем еще одно определение.

Определение. Будем говоритъ, что вектор x t (xf) явля­ ется крайним вектором множества X (X) для вектора і|), удовлетворяющего (14.3) при константе к, если вы­ полняется равенство

і, і|?) = 1

((Xj, i|)) = к) .

Справедлива следующая важная для дальнейшего теорема.

Теорема 14.5. Обобщенный портрет может бытъ представлен в виде линейной комбинации крайних векто­ ров. Причем крайние векторы множества X входят в это разложение вектора с неотрицательными коэффициента­ ми, а крайние векторы множества X — с неположитель­ ными коэффициентами.

Иначе говоря, минимальный по модулю вектор "ф, удов­ летворяющий (14.3) может бытъ представлен как

аЬ

 

 

Ч5=

2

« л — 2

РА'-

 

 

 

 

 

 

i ~

l

j = l

 

 

 

 

 

 

а * > 0

 

(г = 1 , 2 , . . ., а),

 

 

 

 

ßi > 0

'

(/ — 1 , 2 , . . . ,

Ъ),

 

(14Л1)

причем

 

 

 

 

 

 

 

 

 

«г {(х і> Ч?) — 1) =

0(г

= 1, 2, . .., а),

(14 12)

 

ßj (&—(xJt 40) =

0(/

=1 , 2 ,.. ., Ь).

 

 

Д о к а з а т е л ь с т в о .

Для

доказательства

тео­

ремы

14.5

воспользуемся

теоремой 14.4, где

положим

ft

 

F (40 =

(4?, 4?).

 

1, 2, . . ., a),

(4?) = ((*i. 4?) — 1) > 0

(i =

f i

(4?) =

(ko (Xj,

4?))

> 0

(/ =

1 , 2 , . . .,

b).

 


§ 3. НЕКОТОРЫ Е СВОЙСТВА ОБОБЩ ЕННОГО ПОРТРЕТА 301

Согласно утверждению теоремы 14.4 существуют такие

неотрицательные І,- (1 <

і <

а) и

(1 < /

^ Ъ), что

М ь ’Ю — 1) = 0 = 1, 2, . .

а),

Xj (к (Xj, ф))

= 0

(/ =

1, 2, . .

b)

И

 

 

 

 

а

 

 

Ь

 

grad (ф, ф) = 2

grad ({х{, ф) — 1) + 2 h grad (к — (ж,-, ф)).

І= 1

j = 1

Вычисляя градиент, имеем

аЬ

2т|) = 2 M i — 2 Mi-

i —1

; = i

Полагая

 

 

получаем

 

b

a

 

ф = 2

ал — 2

i =

l

j ~ l

 

а* >

0,

 

ß, >

0;

«iMplO — l] = o,

ß;- [к — (ж/ф)] = 0.

Теорема доказана.

Справедлива обратная теорема.

Теорема 14.6. Всякий вектор ф, удовлетворяющий (14.3) и допускающий разложение вида (14.11) по своим крайним векторам, совпадает с обобщенным портретом.

Д о к а з а т е л ь с т в о немедленно следует из об­ ратного утверждения теоремы 14.4 (Куна — Танкера) и единственности обобщенного портрета, если функции F (X) и / г (х) интерпретировать так же, как при доказатель­ стве предыдущей теоремы.

Замечание. В теореме 14.2 была доказана един­ ственность обобщенного портрета. Однако обобщенный портрет, вообще говоря, не единственным образом разла­ гается по своим крайним векторам- в виде (14.11).


302 ГЛ. XIV . ПОСТРОЕНИЕ РАЗДЕЛЯЮ Щ ЕЙ ГИПЕРПЛОСКОСТИ

§4. Двойственная задача

Вэтом параграфе будет рассмотрена частная задача квадратичного программирования, решение которой эк­ вивалентно построению обобщенного портрета.

Введем пространство параметров а, ß и рассмотрим в нем функцию

аЬ

w > ,ß ) = S

ß ; - 4-О М О ’

i=l

3—1

где вектор ф есть

 

а

Ь

ф = 2 щщ — 2 ßj% -

І= 1

3=1

Будем искать максимум этой функции в положитель­

ном квадранте а г > 0, ß^ >

0.

Для построения разделяющих гиперплоскостей су­

щественным оказывается то,

что точка максимума а 0, ß0

функции W (а, ß) в положительном квадранте определяет

обобщенный портрет для заданного параметра к, а значе­ ние максимума W (сс0, ß0) определяет расстояние между проекциями векторов первого и второго классов на нап­ равление обобщенного портрета.

Итак, рассмотрим точку максимума а, ß функции

W(а, ß) в положительном квадранте.

Необходимыми и достаточными условиями максимума

функции W (а, ß) в точке а? > 0, ß? > 0 являются ус­ ловия:

dW(a°, ß°)

j

0’

если af^>0,

даі

 

0, если а? = 0,

dW (я», ß?)

_ j

0,

если

ß? >

0,

ößj

i<^ 0 ,

если

ß ° =

0 .

Выпишем эти условия, обозначив

ф° = 2 « ? x t S ß ?


 

§ 4. ДВОЙСТВЕННАЯ

 

ЗАДАЧА

 

303

получим

 

 

 

 

 

 

! - < * „ - r t - L J ;

если а? >

О,

( 1 4 .1 3 )

если а? = О,

 

 

 

 

 

I

0,

 

если ß°

О,

 

 

(Х}, “Ф0) — к

0,

 

если ß“ =

0.

 

 

 

 

 

Условия

(14.13) могут быть переписаны в виде нера­

венств (14.3)

 

 

 

 

 

 

і.

Ф°) >

1,

 

 

 

(xj,

ф°) <

к

 

 

и равенств

(14.12)

 

 

 

 

 

 

«г ((*і, Ф°) — 1) = О,

 

 

 

ß;(к — (Xj, Ф0))= 0.

 

 

Согласно утверждению теоремы 14.6, эти

условия одно­

значно определяют обобщенный портрет ф°.

Таким образом, связь между обобщенным портретом и максимумом функции W (а, ß) в положительном квад­ ранте устанавливает следующая теорема.

Теорема 14.7. Для того чтобы функция W (а, ß) была ограничена сверху в положительном квадранте, необхо­ димо и достаточно, чтобы к имело допустимое значение. При допустимом к точка а„, ß0, в которой достигается условный максимум W {а, ß) в положительном квадранте, задает обобщенный портрет соотношением

аЬ

Ф(к) = 2 а?я4—2

1=1 3=1

Существует также связь между значением этого мак­ симума W (а, ß) и модулем обобщенного портрета.

Теорема 14.8. При допустимом к максимум функции W (а, ß) в положительном квадранте равен половине квад­ рата модуля обобщенного портрета ф (к).

Д о к а з а т е л ь с т в о . Действительно, по теоре­ ме 14.7

аb

Ф (к) = фо = 2 “ fci 2 РзЧ‘>

1=1 3=1


304 ГЛ. XIV. ПОСТРОЕНИИ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ

поэтому

а

Ъ

I ф (ft) I2 = 2 « і ( « і » ф ) —

2 ß ? (г з> ф )

і=1

3=1

 

и, вспоминая, что отличны от нуля лишь коэффициенты при крайних векторах х и X, имеем

а ъ

И’(Л)і2= іф6і* = 2 « ? -*2 $•

Таким образом,

аЪ

W (а0, ß0) = 2 а? - * 2 ßi - 4 " ^ ° ’ ^0) =

Теорема доказана.

Из теоремы 14.8 вытекает важное для конструирования алгоритмов построения разделяющих гиперплоскостей следствие.

Следствие. В случае, когда среди крайних векторов обоб­ щенного портрета ф (к) встречаются векторы обоих клас­ сов, справедливо соотношение

( а > 0 , ß <0) , (14.14)

причем равенство достигается при а = а 0, ß = ß0.

есть расстояние между проекциями

классов X и I на направление обобщенного портрета. Действительно, в силу теоремы 14.8

/ 2 W > 0,ßo) = I ф (к) |.

Далее, по условию

j M

=

_1_

І Ф І I

 

ІФ І ’

ф \

_

к

і ф і Г

і ф і '