Файл: Вапник В.Н. Теория распознавания образов. Статистические проблемы обучения.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 218

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

256 ГЛ. XI. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ

обязательно делятся точно пополам при делении полной выборки X 1, но при достаточно больших I (а значит, и г) это условие почти всегда выполняется достаточно точно. Приводимое дальше формальное доказательство позволя­ ет строго учесть все сделанные здесь допущения и прибли­ жения.

4.

Д о к а з а т е л ь с т в оу т в е р ж д е н и я б).

Итак,

пусть

я5 (I)

 

 

 

Н т

с > 0.

 

1—>СО

I

 

 

При доказательстве достаточных условий (§ 6 главы X)

было установлено, что

 

 

 

Р{рЯ(п1, . . . , Жгг)> 2 0 } =

1і уг

$

[ S e ^ x V s ö j d P C X 2'),

 

 

xW

1

 

 

 

 

(11.18)

где Ті — всевозможные перестановки последовательности

Ху,

..., х21. Обозначив

через К (хг,

..., х2І) подынтеграль­

ное выражение, сократим область интегрирования:

P |p s (x1, . . ., х2і) > -|- j

>

 

 

 

 

 

> Щ і -

5

 

 

 

K ( x y , . . . , x 2l)dP(X21).

 

1Ң2(x,t .

.

^

c

 

 

 

21

 

^

Y

 

Оценим величину К, полагая, что

 

 

lga As (xi,. . . ,

ж2г)

^

с

т.

е.

21

 

 

' >~2'

 

 

 

 

 

 

As {ху, ...,

х21) >

 

2е'.

 

При этом выберем -ft Д> Q(с)

 

0 так, чтобы в соот­

ветствии с леммой 3 при достаточно больших I существо­ вала подвыборка Хп длины п ]> ql, на которой система S индуцирует все возможные подвыборки (т. е. As (Ху, ...

..., хп) =2"), и положим б (с) = • Примем, что п

I,

и заметим, что числа q и б не зависят от I.


s 4. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМОСТИ

257

Сгруппируем перестановки Tt так, что в каждую груп­ пу Rs входят перестановки, соответствующие одному и тому же разбиению на первую и вторую^ полувыборку. Очевидно, что

Р ® (7Ѵ *і, • • -I *8|) =

=sup |v '(4 ; Tr xu ..., xt) — V(A\ Тѵ хь ..., x2l)\ Aes

зависит только от Rs и в пределах [каждой группы постоян­ на. Поэтому

К = —(—2® ІР8 (^s’ жі» • • •>*az) — 26]. °аг. s

Сумма берется по всем возможным разбиениям хѵ . . .

. . ., Xzi на первую и вторую полувыборки.

Пусть, далее, Х п — та самая подвыборка длины п, на

которой S

индуцирует все возможные подвыборки. Обоз­

начим ее

дополнение в

X 21 через

X (длина X

равна

21 — п).

 

полностью

задано, если

заданы

Разбиение Rs будет

разбиение

R h подвыборки Х п на часть, попадающуюся

первую полувыборку, и часть, попадающую во вторую полувыборку, и соответствующие разбиение R j подвы­ борки X .

Обозначим для данного разбиения число элементов из Х п, попадающее в первую полувыборку, через г и пред­ ставим К (X1) в следующей форме:

К = ^21 г к і

І Р { R k R j '* х ъ •••> х ы ) 26].

 

 

Здесь суммирование'по г ведется в пределах 0

г

п.

Суммирование по к ведется по всем разбиениям Хп6таким, что к первой полувыборке]^относится точно г элементов из"Х", суммирование по / — по всем разбиениям X таким, что к первой полувыборке относится I г элементов из X .

Для фиксированного к, т.

е. разбиения подвыборки

Х п, иайдется^такое А (к) е* S,

что все элементы хи отно­

симые этим разбиением к первой полувыборке, принадле­ жат А (к), а все элементы x t, отнесенные ко второй полувыборке, не принадлежат А (к). Это следует из того,

9 В. Ң. Вапник, А. Я. Червонещщс


258 ГЛ. XI. НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ

что

S индуцирует

на Х п все

подвыборки. При этом

ps (RhRj; X lf

. . .,

X 2l) > ps (A

(k); R hRj; хг ,

. . . ,x2l)

и,

следовательно,

 

 

 

 

 

к > - i - S

S

2

Ѳ[ps (А (к); В Д ; ^ , ..., x2l) -

25].

 

^ 2 1 r

Je

j

 

 

 

Пусть, далее, P (к) — число элементов подвыборки X, принадлежащих"^ г(к), и t — число элементов подвыборки X, принадлежащих А (к) и отнесенных разбиением R j к первой полувыборке. Тогда для фиксированных г, к, j

\'(А(к)і хъ ..., xt) =

,

 

у"{А (к); хиі, ..., x2l) =

,

 

I ѵ' (А (к); хъ ..., хі) — ѵ"(к); хм , ..., х21) | = 1г + 2*— —

Соответственно

 

 

I г -j- 21р [

 

 

1,

если

> 2 5 ,

Ѳ[ps (А (к); хъ ..., х2{) — 25]

 

 

► №

 

л

если

I **“Ь 2^ — Р I

о ч

 

О,

—2__— —

25.

Наконец, сгруппируем разбиения Rj, соответствующие одному и тому же t (при фиксированных г л к). Число

таких

разбиений равно

а

 

 

 

 

 

 

f\t

/nl—T—t

 

 

 

 

 

 

*Wl-n-p(/c)«

 

 

 

Тогда оценка для К примет вид

 

 

 

 

V

^ ^

XI XI

(il—T—t

 

 

 

л

 

2л Za

*^2г-п-р(*с).

 

 

 

 

°2І г к t

 

 

 

 

После

элементарных преобразований получим

 

 

V

/^Г /-г/-Г

V 1

/і(

f t l - r - t

 

 

 

°n°2!-n

V

ril—2

(11.19)

 

71 ^ Z l

^2?

Z j

Z i

 

r

й

t

° 2f-n

 

 

где суммирование по t ведется в пределах, задаваемых выражением

| / + 2 t - p l

(11.20)

 



§ 4. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМОСТИ

259

Положим теперь0

8

и рассмотрим величину К',

отличающуюся от

правой

части

(11.19)

лишь иными

пределами суммирования,

 

 

 

Г,

р Т р І - Г

.

p t p l - r - t

 

 

 

1 V

°P(kVv 2l-n-p(k)

Л

Z j

p l

p r Z j

p l - r

'

 

r

к

 

l-n

 

где г и t пробегают значения, удовлетворяющие следую щим неравенствам:

 

п

< еп ,

(11.21)

 

г — ~2

t

р(к) ( 1 - г )

<^81.

(11.22)

21-

 

 

 

 

 

При r u t , удовлетворяющих (11.21) и (11.22), автомати­ чески выполняется (11.20). Действительно, при этом

r | 2 l - f .

і Г л

.

2р

[j

п

\

 

 

----- 1—

 

+

 

 

 

 

»)]

 

 

- 2 d - P\ > - r [ i r - B(n + 2l+wz:

 

Поскольку было принято, что] ql<C.n<^l, 6 =

, е

,

то

Так как область суммирования в выражении для К ' вкла­ дывается в область суммирования (11.19), то

 

К > К '.

 

Далее, для всякого г] > 0 найдется

10, зависящее

только от ц и д, такое, что для всех Z>

10

2

С;' т :П> 1 - П

(11.23)

г

°21

 

(суммирование ведется по г, удовлетворяющим (11.21)) и

2

Ctp(S Lp > 1 - 4

(11.24)

t

° 2 l - n

 

(суммирование ведется по t, удовлетворяющим (11.22)).

9*