Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 198

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 4. ДВОЙСТВЕННАЯ ЗАДАЧА

305

Поэтому

 

1 - к

 

VW JpbTW

 

Отсюда, учитывая, что

 

W{a, ß ) < W ( a 0, ß0),

 

получаем (14.14).

Это следствие используется для конструирования кри­ терия неделе_ния. В самом деле, будем считать, что два мно­ жества X и X не могут быть разделены с допустимым «за­ зором» с помощью обобщенного портрета ф (к), < 1),

если соответствующая величина П

меньше заданной

константы р

0.

 

Тогда существование такой точки а > 0 , ß>0, что

 

W ( a , ß ) > - ^ ß - ,

(14.15)

и будет означать, что множества неразделимы с заданным

зазором с помощью обобщенного портретаф (к).

максимум

Итак, согласно теоремам

14.7 и 14.8,

W (а,

ß) в положительном квадранте определяет обобщен­

ный

портрет,

а, согласно

следствию, тот факт, что при

W (а,

ß) = В

максимум

еще

не достигнут,

означает,

что множества

неразделимы с

зазором, большим, чем

1 —к

 

 

 

 

 

V 2 B

Таким образом, проблема построения обобщенного портрета свелась к поиску максимума функции W (а, ß) в положительном квадранте или оценке снизу величины максимума этой функции.

Оказывается, что и другие методы построения разделяющей гиперплоскости в определенном смысле реализуют различные алгоритмы поиска максимума функции W (а, ß) в положительном квадранте. Это об­ стоятельство дает возможность сравнивать их между

собой: тот алгоритм построения разделяющей гипер­

плоскости эффективнее, в основе которого

лежит бо­

лее эффективная процедура максимизации

функции

W(a, ß).


306гл. XIV. ПОСТРОЕНИЕ РАЗДЕЛЯЮЩЕЙ ГИПЕРПЛОСКОСТИ

§5. Алгоритмы персептронного типа

1.В главе I был сформулирован алгоритм построени разделяющей гиперплоскости персептрона. В этом па­ раграфе рассмотрим различные модификации метода Га­ усса—Зайделя для поиска максимума W (а, ß) в положи­ тельном квадранте и покажем, что алгоритм построения разделяющей гиперплоскости персептрона отражает одну из модификаций этого метода.

Итак, пусть задана функция F (z1, . . ., z”) от п аргу­ ментов z1, . . ., z". Поиск максимума функции методом Гаусса — Зайделя состоит в следующем: из начальной

точки zj, . . ., Zq делается первый шаг вдоль первой ко­ ординаты при фиксированных значениях остальных ко­ ординат до достижения функцией F (z) условного макси­ мума по этому направлению, затем ищется условный мак­ симум по второй координате при фиксированных значе­ ниях остальных координат и т. д. После того как сделаны шаги вдоль всех координат, поиск максимума вновь на­ чинается по первой координате и т. д. Процесс поиска максимума оканчивается, когда выполняется система неравенств

d F ( z \ .

те.

 

* ) < е (і = 1,2,

и).

dz1

 

 

Рассмотрим модифицированный метод Гаусса—Зайделя. Модификация метода направлена на то, чтобы искать макси­ мум функции F (z1, . . ., z") в положительном квадранте. Изменение метода Гаусса—Зайделя состоит в следующем:

1)в качестве начальной точки выбирается точка, рас­ положенная в положительном квадранте (в дальнейшем всегда в качестве такой точки будем выбирать начало ко­ ординат);

2)движение вдоль каждой из координат происходит либо до точки, где достигается максимум функции на этом направлении, либо, если этот максимум достигается при отрицательном значении координаты, до обращения в нуль этой координаты;

3)процесс поиска максимума прекращается, когда вы­ полнятся неравенства

d F ( z \ . . . , z n)

Р op.TTW

О


§ 5. АЛГОРИТМЫ ПЕРСЕПТРОННОГО ТИПА

307

и

dF(zx.....zn)

о >

если z* = 0.

dz1

 

 

2. Применение модифицированного метода Гаусса— Зайделя для максимизации функции W (а, ß) в области

«г > 0, ßj ^ 0 приводит к следующему алгоритму по­ строения обобщенного портрета. Если на t-м шаге произ­ водится движение вдоль координаты а*, то

щ (t) = c£j (t — 1) + Ааi.

Аналогично в случае движения вдоль координаты ß^

ß/ (0 = ß/ (t — 1) + Aß;-

Значения остальных координат сохраняются. Приращения Ааг (Aßу), доставляющие максимум по

направлению шага, определяются из условий

= [і_ (ф(f_ 1),а:г)]- IXiI2Ащ = 0

І

( öA ßT

1 ) ’ ®j)

I Щ|2 A ßj — ,

где положено

а Ъ

— 1) = 2 аі(^ — і )жі — 2 — i)^i-

3=1

Учитывая, что шаг не должен выводить за пределы огра­ ничений, получаем

Даг =

max

1 — W>(г —1),

, — Vi{t — 1)) .

 

 

l*t l*

 

Aßj =

max

(Ф(*-1), *j)- k

, - ß H f - i ) ) •

Іг;Іг

 

 

 

Процесс подъема продолжается до тех пор, пока не бу­ дет построен обобщенный портрет, либо не будет установ­ лено, что множества не могут быть разделены с помощью обобщенного портрета ф (А) с допустимым зазором (§ 4).


308 гл. XIV . ПОСТРОЕНИЕ РАЗДЕЛЯЮ Щ ЕЙ ГИПЕРПЛОСКОСТИ

В первом случае останов производится по условию

I 1 — (Хі,

ф) | <

е, если

<хг

 

0,

1 — (Xi,

ф) <

е, если

а г

=

0

Л {Я}, я)?) к |< е, если ß/ > 0,\

\(xt, ф) — к < е, если ß;- = 0 ) ’

Во втором случае критерием останова служит выпол­ нение неравенства (14.15)

где р — допустимый зазор.

Алгоритм можно реализовать и в такой форме:

ф (t) = ф (t — 1) + ХіАосі при движении вдоль осг,

ф (t) = ф (t — 1) — г^Дß^ при движении вдоль ßj-.

3. С помощью метода Гаусса — Зайделя удается до­ стигнуть максимума W (а, ß) и тем самым построить обоб­ щенный портрет. Однако часто требуется найти просто разделяющую гиперплоскость (х , ф) = с (не обязательно экстремальную) такую, что

X Ф) > ,

(14.16)

(** ф к Ц ± .

Построение такой гиперплоскости обеспечит следую­ щая огрубленная модификация метода Гаусса — Зай­ деля:

1) движение вдоль каждой из координат а *(ßj) проис ходит только в сторону от ограничений тогда, когда

(Хі, ф) <

1

 

2

(xh ф) >

1 + к

 

2

В случае выполнения этих условий значение вектора ф вычисляется по формулам

ф (0 = Ф (t —- 1) + ДаіХі

(0 = ф (t — 1) — Aßj Xj ) ,