Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 211

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

196 ГЛ. IX. О СХОДИМОСТИ РЕКУРРЕНТНЫХ АЛГОРИТМОВ

Из этого рекуррентного соотношения, очевидно, сле­

дует, что

при

£ > ІѴ + 1

 

М {(а (£) -

а*)2} <

М {(а (N ) — а*)2} —

 

 

 

г

г

 

 

8 2 tyr(y') +

2D 2 Т2(Л-

 

 

j=N+l

3=JV+l

Всилу леммы 1 величина

М( а (N ) — а * )2

ограничена, и по условию

теоремы ряд

2

Т2(0 схо-

дится. Поэтому

 

І=ІѴ+1

 

і

 

 

 

 

 

М { ( а ( 0 - с О 2} <

С - е 2

(7),

(9.20)

 

j=jv+l

 

 

где с — константа, не зависящая от г.

Далее, поскольку процедура (9.16) организована так, что, попав в Ge, последовательность «залипает», вероят­ ность 6і не возрастает с ростом і.

Если

бы при этом öj оставалась больше некоторого

б Д> 0,

то величина

 

І

 

2 бя(у)

 

J=IV+1

с ростом і неограниченно возрастала, поскольку при этом

 

 

1

і

 

 

2 öiT (7)>Ö

2 Т(Л,

 

СО

i = N - f l

3=ІѴ+1

а ряд

2

Т (І) расходится.

 

Но

jWV-f-l

невозможно, потому что тогда правая часть

это

неравенства (9.20) становилась бы отрицательной при достаточно больших £, тогда как левая часть положитель­

на. Следовательно,

последовательность

бг

стремится

к нулю при і -V оо.

 

 

 

Остается отметить, что последовательность а (і) орга­

низована процедурой

(9.16) так, что если

она

хоть раз


§

4. УСЛОВИЯ

сходимости

197

войдет в 6ге при і

N + 1,

то она там и останется к мо­

менту і. Следовательно, вероятность того, что последо­

вательность a N, . . .,

а г ни разу не заходит в Gu равна

6г и стремится к нулю при t — ОО.

Лемма

доказана.

 

О и б )> 0 существует такое

Лемма 3. Для любых е

N lt что

при

всех

N

Д N t

вероятность последователь­

ности ам,

. .

., а г,

. . . выйти из области

 

 

G%t =

{а: М (а) ^ А -|- 2е},

при условии а (N ) 6= Gt, меньше б.

Д о к а з а т е л ь с т в о . Оценим вероятность б* того, что в последовательности aN, . . ., а, хотя бы один эле­

мент

не

принадлежит

(г2е при условии,

что

а n Gr Gt.

Для этого' изменим процедуру (9.13) при і

N + 1,

положив

 

 

 

 

 

 

а

(г — 1), если

а (і — 1)

Git,

 

 

а (і) =

а (і — 1) — у (i) [V0 Q (z, а (i — 1)) +

£,],

(9.21)

 

 

 

если а (i — 1) e

G2E.

 

Очевидно, что величина б* равна вероятности того, что ссі ZjÉ G2s при условии ajy £Е Ge, если, начиная с i = = N + 1, действует процедура (9.21).

Обозначим через а£ (£) точку множества Ge, ближай­ шую к а (г), и оценим величину

М {(а (і) — а е (і))2}.

Очевидно, справедливо неравенство

(а (і) — а е (г))2 < [а (г) — а е (г — I)]2.

Поэтому при а (г — 1) е G2e в силу процедуры (9.21)

М {(а (і) — а £ (і))21а — 1)} <

М {(а (г) —

 

- «е (і - I))21 а (і - 1)}

< (а

(Ä — 1) —

(і -

I))2 -

—2у (г) (М (Ѵ0<? (z, а (г — 1))}, (а (і —1) — а е (і —

1))) +

 

 

 

+ 2Пу2 (г).

В силу выпуклости (? (г,

а) справедливо неравенство

(М {Ѵ0<2 (z, а (і — 1))}, (а (г — 1) — а е (£ — 1))) >

 

>

R

(г - 1)) -

R (а, (і - 1)).


198 гл . IX . О СХОДИМОСТИ РЕ К У РРЕ Н Т Н Ы Х АЛГОРИТМОВ

Но при

а (і — 1) <= Gz элементы а (і) г оЕ(і) совпадают,

а при

а (і — 1) ф

G&

 

 

 

 

 

 

 

R (а

— 1))^> R

(се£

1)).

 

Поэтому

 

 

 

 

 

 

 

 

 

R (а (і

1)) — R (а£ (і

— 1))

0.

 

Следовательно,

 

 

 

 

 

 

 

 

М {(а (і) — а £ (і))2

I а

(і — 1)} <

— 1) —

 

 

 

 

 

— at (i — I))2 +

2у2 (г) D.

Если же а — 1) ф

G2£

при і ;> ІѴ + 1, то

 

М {(а (і) — а £ (г))2

| а

(і — 1)} =

(а (і — 1) —а £ — I))2.

Таким

образом, всегда

 

 

 

 

 

 

М {(а (і) — а £ (г)) I а (і — 1 )} <

 

 

 

 

 

 

<

(« (і

- 1) -

а е (і

-

I))2 +

2у2 (і) £>.

Из этого рекуррентного

соотношения

следует,

что при

і ]> N

справедливо

 

 

 

 

І

 

 

 

 

 

 

 

 

 

 

 

 

M { (a (i)-a £(0 )2|a(iV0 eEGE} < 2 D

2

т20 ')<

 

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

< 2 D

2

Т2 0)і (9.22)

 

 

 

 

 

 

 

j=N+x

 

поскольку при а (/V) ЕЕ Gt имеет место

 

 

(N) - а £ (ІѴ))2 = 0.

Далее, оценим расстояние Л между произвольным эле­ ментом а ф С2е и множеством G£, т. е. ширину зоны, которую должна пройти точка а (£), чтобы из Gt уйти за пределы G2£. Так как функция R (а) выпукла,

Ѵ0Я ( а) = М (I Ѵ0 Q(z, а) |} < / Я ,

для всякой точки a g C j выполняется неравенство

R (а) А + е

и для всякой точки а ф Ga — неравенство

R (а) > А + 2в,



§ 4.

УСЛОВИЯ

СХОДИМОСТИ

199

то

 

 

 

 

Поэтому

 

л >

Y d '

(9.23)

 

 

 

 

бг = р (а (0 ф GSg

I а

{N) е

Ge) <

 

< Р {(I а

(г) — сг6 (г) | > Л) | а

(N) е Gt }.

Воспользуемся неравенством Чебышева

^{|« (0 — « е (0|> Л |а (ЛГ )еС ,> <

М{(а(0-«е(і))*|а(Л0еСІ}

Ч---------------- Л2----------------

Учитывая далее (9.22) и (9.23), получаем

2 Т- (О-

i = N + l

Правая часть неравенства не зависит от і, поэтому, выбрав N достаточно большим, можно добиться, чтобы бг было меньше б при всех і N, а это и значит, что последова­ тельность выходит из бг2е с вероятностью, меньшей б.

Лемма доказана.

Докажем теперь теорему 9.1.

Для заданных е и б подберем N x так, чтобы для всякого N N-l вероятность последовательности выйти за пре­ делы области

G2t = {а: R (а) < А + 2е}

при условии, что а (N ) ge Gz, была меньше б. Это можно сделать в силу леммы 3.

Далее, в силу леммы 2 последовательность а (1),...

. . ., а (N), . . . с вероятностью 1 хоть раз войдет в G, после момента N x и, следовательно, выйдет из G2t с ве­ роятностью, меньшей б. Ввиду произвольности б и е это означает, что

R (і)) — ^ inf R (а)

І-КЯ а

свероятностью единица.

Теорема доказаңа,