Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 208

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 4. УСЛОВИЯ СХОДИМОСТИ

191

условиям

М ( І I а, z) = О,

Будем

М

(£2

I а, z ) < Z > < оо.

 

 

 

 

 

считать,

что величины у (г)

О, образующие

бесконечную последовательность неотрицательных чисел, таковы, что

2

Т (0 =

І—1

 

оо

 

2

та(0 < °°-

і= 1

 

Процедура (9.13) для заданного начального условия а = = а нач определяет случайный процесс. Реализации этого случайного процесса индуцируются последователь­ ностями точек zx, . . ., zn, . . ., которые появляются неза­ висимо в соответствии с распределением Р (z). Распре­ деление же Р (z) таково, что для любого а существует

R ( а ) =

§ (z . а)dP (z ) =

{<? (2 . а )}

и

 

 

D (а) = $ I Ѵо<? (2, а) I2 ^ (2) =

Мг(| Ѵ0<? (z, а) |®}.

Справедлива

теорема

[44]): Если:

Теорема 9.1.

(Б. М. Литваков

1)функционал R (а) ограничен снизу,

2)функция D (а) ограничена сверху, т. е. D (а) ^ D,

3)дисперсия помехи % ограничена сверху, т. е. D (%) D , то при любом начальном векторе а н;1Ч последователь­

ность R [ а ( і ) ] —> i n f

R (а) с вероятностью 1 .

і —*оо а

теоремы опирается на _ .следующие

Доказательство

леммы.

Лемма 1. Для любых N и б > 0 можно подобрать такое г > 0, чтобы вероятность того, что вектор а (N) ока­ жется внутри гипершара Gn с центром в а нач и радиусом г, была больше 1 — б.

Д о к а з а т е л ь с т в о . Покажем сначала, что для любого і существует ограниченная величина Г (г) =


Ü92 ГЛ. IX . О СХОДИМОСТИ РЕК У РРЕН ТН Ы Х а л г о р и т м о в

*=М{(а (г) — а нач)2} *). Согласно процедуре (9.13) спра­ ведливо равенство

М {(а (і) — а нач)2} = М {(а (і — 1) — а нач)2} — 2у (і) х

X М {((а - 1 ) -

а Нач ), (Ѵ0 Q (zit

а (г -

1 )) +

5 , ) ) } +

+ V2 (ОМ {

I Vo Q (z;,

(i

1)) +

U I 2}.

(9.14)

Увеличим правую часть этого равенства. Согласно условию

теоремы

 

 

 

a

-

 

 

 

 

М {I I a,

z } =

О,

 

 

 

 

 

 

 

 

 

 

 

 

М {[Ѵ0<?А,

а (і — I))]2} <

D,

 

 

 

 

М {£2 [ а (г — 1),

 

 

 

 

 

 

Поэтому у2 (i)M

{[Ѵ0 Q {zu а (i — 1)) +

g{]2} <

2y2 (i) D.

Кроме того,

используя

то,

что

для выпуклой

функции

и любых z,

а х и а 2 справедливо неравенство

 

 

 

((«і — а 2), Ѵ0 Q (z,

«!)) > Q (z,

а х) — Q (z,

а 2),

оценим величину

М {((а (г — 1) — а нач),

Ѵ0 Q (z,

a (i —

 

 

 

 

 

 

 

 

 

-

1)))}:

М {((а (г — 1) — а нач),

Vo Q (z,

a

(i — 1)))} >

 

 

> М {<? (г,

а (і —

1))} — M{Q (z, а нач)} =

 

 

 

 

=

Л (а (і — 1)) —Л (анач)

А

Л (аНач),

где

А — inf Л (а).

 

 

 

 

 

а)

 

а

 

 

 

 

 

 

 

 

 

 

Таким образом, оказывается справедливым неравенство

М {(а (г) — а нач)2} < М {[а (г — 1) — а нач]2} + с (г),

(9.15)

где

с (і) =

2у (г) (Л (ана,,) — А)

+ 2Dy2 (і).

что

 

Используя неравенство

(9.15) и учитывая,

 

 

М {(а (1) — а нач)2}

=

с (1),

 

 

 

непосредственно получаем,

что

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

М {(а(7Ѵ )-анач)2} <

2

с (і) =

Г№,

 

 

 

 

 

 

 

 

г = і

 

 

 

 

т. е. величина М {(а (N ) — а нач)2} ограничена числом Tjv.

*) Для сокращения записи здесь и дальше используются обод, начения а2 := (а* в),


§ 4. УСЛОВИЯ СХОДИМОСТИ

193

Для доказательства леммы воспользуемся неравен­ ством Чебышева для нецентрированных случайных ве­ личин

Р ( |а ( Л 0 - а нач|> г ) < М {[ а (N) — «нач I2}

г2

Усилим это неравенство; учитывая, что

М {| а (N) — анач I2} < TN,

получим

Р ( |а ( У ) - а нач |> г ) < - ^ - .

Потребуем, чтобы эта вероятность не превосходила б. Это произойдет, если величины г, TN, б будут связаны соотношением

£jv

г2

откуда следует, что с вероятностью, превышающей 1 — б, точка а (N ) будет находиться внутри гипершара G с цен­ тром в а нач и радиусом

Лемма 1 доказана.

Пусть, далее,

А = inf R (а).

а

Обозначим через Gz область значений а:

Gt = {a: R ( а ) < А + е}.

Лемма 2.

Для

любых

г

0 и N последовательность

а х, . . ., a N,

. .

.,

а г, . . .

с вероятностью 1 жотгеьраз вой­

дет в область

Gz при і ^

N.

 

Утверждение леммы 2 эквивалентно такому: вероят­

ность того,

что

подпоследовательность а#, . . .,

a t ни

разу не заходит в область Gt, стремится к нулю при і

оо.

Д о к а з а т е л ь с т в о .

Для доказательства

удоб­

но рассмотреть процедуру, отличающуюся от (9.13)

только

тем, что

если

последовательность при г

N

входит

в область

Gt,

то она там и остается.

 

7 В. Н. Вапник, А. Я. Червонешшс


194 ГЛ.

IX .

О СХОДИМОСТИ

РЕ К У РРЕ Н Т Н Ы Х

АЛГОРИТМОВ

 

Для

этого будем считать, что соотношение

 

а (г) = а (г — 1) — у

(і) [Ѵ0 Q (z, а (і — 1)) + У

 

выполняется всегда при і

N + 1, а при і !> N +

1 —

лишь для

а (і — 1) ф Gt . В случае же,

когда при

і ^

> N +

1

элемент а (і — 1) принадлежит

бге, последова­

тельность

«залипает», т. е.

 

 

 

 

а (і) = а (і — 1).

 

 

Очевидно, что если последовательность а (1), ..., а (N), ...

..., а(і), построенная в силу исходного алгоритмами разу не заходит в Gt при і > N , то последовательность, постро­ енная по новому правилу, ничем не отличается от исход­ ной и, в частности, не заходит в GEпри і ^ N. Поэтому достаточно оценить вероятность того, что новая последо­ вательность ни разу не войдет в Gt при і > N.

Вобласти Gt выберем точку а*, для которой і?(а‘) < Л + |

(это всегда можно сделать), и оценим величину М {(а (г)—

— а*)3} для процедуры

а (і)

'а(і — 1), если

і > N + 1 и

а ( і - 1 ) е С і ,

 

а (і -

1) -

Г (і) [ Ѵ0Q (zu а (і -

1)) + У

(9.16)

 

 

 

 

в противном случае.

 

Согласно

этой

процедуре при

а (і — 1) ф. Gt

М ((а (і) — а*)2 I а (і

— 1)} =tf(а (г — 1) — а*)2 —

—2у

(і) [М {Ѵ0<2 (z, os

(i — 1)) I а (i — 1)}, (а — 1) —

— а*)] — 2у (і) {It

I а (і — 1)}, (а (і — 1) — а*)] +

 

+ у2 (і) М {І2 -f

[Ѵ0 Q (z, а (і — I))]31а

— 1)}.

В

силу условий теоремы

 

 

 

 

 

 

М { I t I а} =

О,

 

атакже

М{ІѴ0 Q (z, а)]2} < Л и М { ? 2 | а } < 0 .


 

 

 

§ 4.

УСЛОВИЯ

СХОДИМОСТИ

 

 

195

Поэтому

справедливо

неравенство

 

 

 

 

М {(а (і) — а*)2

I а

— 1)} ^ f( a

(i — 1) — а*)2—

 

—2у (t) (М {V0

(z,

а (i — 1))},

(i

— 1) — а*)) +

 

 

 

 

 

 

 

 

 

 

+

2у2 (i) D.

(9.17)

Далее, поскольку функция Q (z, а (і — 1)) выпукла, то

(Vo Q (z, а

— 1)), (а (і — 1) — а*)) >

Q (z, а (і — 1)) —

 

 

 

 

 

 

 

 

 

 

 

Q (z, а*)

и поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

(М {Ѵ0 Q (z,

а — 1)) I а ( і— 1)},

(а (і — 1 )—

а*)) >

 

 

 

 

 

> Л (а (і -

1)) -

Л (а*).

 

(9.18)

Но точки а (і — 1) и а*

выбраны так, что

 

 

 

 

 

Л (а (і — 1))

А +

е

 

 

 

(поскольку

а (і — 1) ф. Gt)

и

 

 

 

 

 

 

 

 

 

 

Л (а*)< Л +

!

 

 

 

 

 

и, следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

Л ( а ( і - 1 ) ) - Л ( а ‘) >

I

.

 

(9.19)

Объединяя (9.17),

(9.18)

и (9.19),

получаем,

что при

а (і — 1)

 

Gt

 

 

 

 

 

 

 

 

 

 

 

М {(а (і) -

 

а*)2

I а (г -

1)}

 

(г -

1) - а*)2 -

 

 

 

 

 

 

 

 

 

 

У (0 е + 2у2 (і) D.

Если же

при і

 

N

+

1 элемент

а

— 1) ЕЕ Ge,

то

М {(а (і) — а*)2 I а

— 1)} = (а

— 1) — а*)2.

 

Пусть

бг — вероятность

того,

что

а (і — 1) ф Gz.

Тогда, переходя к безусловному математическому ожида­ нию, получим для і > N + 1

М{(а (і) — а*)2} ^ М {(а — 1) — а*)2} — s8,y (і) +

+2Т2 (і) D.

7*