Файл: Мания, Г. М. Статистическое оценивание распределения вероятностей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 120

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

E

 

\fn(x,y)-f(x,y)]2dxdy=

 

 

 

 

Rz

 

 

 

 

 

= - 1

i / A

(AJI* А2ач*+А1а)Ч* п-*1*+о(п-Ч>).

 

4

( /

2

 

 

 

 

 

 

 

Яры равных h и l оптимальное Л0 равно

 

 

K =

 

9

(Ли + 2 Л 12+ Л 22)

V i / «

 

 

 

Е j j

[?„(*, У) - f ( xг у) ]2dxdy=

 

 

 

 

 

 

 

 

 

 

i

/ -

i

п + 2Л12+ Л 22)1/3 tt'2/3+ o (п~213).

 

4 V

4

 

 

 

 

 

 

 

Поскольку

 

 

 

 

 

 

 

 

 

2

( Л ^

Л221/24-Л12) ^ ЛП+ 2 Л 12+ Л 22г

 

то коэффициент

при н~2/3 для

одинаковых Л и / больше,

чем

при разных.

Поэтому выбор разных Л и /

лучше учитывает осо­

бенности, которые

возникают при оценке

двумерной плотности

распределения.

 

 

 

 

 

 

 

 

Очевидно, что

(2.4.4) является частным случаем статистики

 

 

 

 

1

 

'x - X t y~ Y t'

 

f(x,y) =

nhl

 

h

(2.4.17)

 

/

 

при

 

 

 

K{x, y)=K 0(x) К0(у).

 

 

 

 

 

 

 

 

Для общего класса ядер К(х, у)

оценки типа (2.4.17)

для

многомерных плотностей изучены

Э'. А. Н а д а р а я [46, 50],

К а-

к о у л о с о м

[72], В.

А.

Е п а н е ч н и к о в ы м . [7] и др.

 

10 4


Г Л А В А III

НЕПАРАМЕТРИЧЕСКАЯ ОЦЕНКА ПЛОТНОСТИ

РАСПРЕДЕЛЕНИЯ

В СЛУЧАЕ ДВУХ НЕИЗВЕСТНЫХ

 

МЕР

 

При решении

непараметрических задач

статистической

классификации, т. е.

при проверке статистических гипотез, ког­

да информация о неизвестных альтернативных

распределениях

содержится в независимых выборках из этих распределений,

приходится оценивать

плотность одной

неизвестной

меры отно­

сительно

другой

неизвестной меры.

Точнее,

по

 

результатам

Х х,..., Хп и Уг, .

независимых в совокупности наблюдений

над 6-мерными

случайными

величинами X и Y с

неизвестными

распределениями

Р и

Q в 6-мерном

евклидовом

пространстве

 

 

 

 

 

 

dp

(2)

меры

Р относи-

Rh необходимо оценить плотность f (2) = —

 

 

 

 

 

 

dQ

 

 

 

 

 

тельно меры Q. Подобные оценки встречаются в работах Ф и к с а

и Х о д ж е с а [80],

Л.

Д. М е ш а л к и н а [45],

К ь ю с е н б е р -

ри и Г е с с и а н а

[92].

 

 

 

 

 

 

 

Настоящее изложение следует в основном

работам

К. В.

М а н д ж г а л а д з е

и Р. Я.

Ч и т а ш в и л и

[19—22].

 

При

построении оценок функции

/ ( 2)

используется

метод

так называемых „статистически эквивалентных бл ок ов оценки выбираются в классе простых функций на случайных разбие­ ниях. В § 1 доказывается состоятельность оценок, а § 2 посвя­ щен исследованию их асимптотического распределения.

§ 1. СОСТОЯТЕЛЬНЫЕ ОЦЕНКИ плотности

Пусть Р, Q—одномерные вероятностные меры,

 

У1, . ..Ym—упорядоченные по возрастанию

результаты

наблюде­

ний над случайными величинами X и F,

распределенными по

1GS


законам Р и Q соответственно. Пусть i f = /.,•—заданная после­ довательность натуральных чисел такая, что

i= l

(число членов нтследовательности г= г (га)^С га).

Образуем множества S,-, полагая

 

 

 

S1=

{ г : — оо <

z

 

YLl},

 

 

 

 

 

S2 = {.z ;F. < - z < F .

. ),

 

 

 

 

f5,= ,{z :Yii+ ... + /r _ i< ^

< oo).

 

 

 

В качестве

оценки

для

непрерывной функции плотности

/(z)

в [19] предложено выражение вида

 

 

 

 

 

 

7„m(z)

=

--(^

,

26.S,,

 

(3.1.1)

 

 

 

 

 

ч

 

 

 

 

 

 

тде

l(Sl)='ln(S,) —количество

Х-ов

из

выборки

X !,..., Х „, по­

павших в интервал S,-.

 

 

 

 

 

 

 

 

 

Исследуем .сначала состоятельность оценки (3.2.1) в смыс­

ле

метрики

 

 

 

 

 

 

 

 

 

 

 

 

 

:E ^{sup|

fnm( z ) - f m ,

 

(3.1.2)

 

 

 

I г 1<Л

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п

т

где ££$ 'означает усреднение

по

мере

Р-ПРХП Q, являю-

 

 

 

 

 

 

 

 

 

1

1

 

щейся прямым произведением мер Р и Q, в пространстве р п+т.

 

Т е о р е м а

3.1. Если Q

имеет

непрерывную

положитель-

мую плотность то лебеговой мере, то при выборе 1{

так, чтобы

 

 

Ч,

л

л

при

п,т-+<х>

 

шах —

0, шах —

О

 

i

га

 

т

/|

 

 

 

 

 

 

106


v.

max lt

i

0 < C i< . _ . < с 2,*>

тmin lt

оценка

(3.1.1)

равномерно

состоятельна

в смысле

критерия

(3.1.2).

 

 

 

 

 

Д о к а з а т е л ь с т в о

проведем в два этапа. Сначала най­

дем условия, при которых статистика (3..

1. 1) сходится к слу­

чайной

величине

P(St) а затем изучим

сходимость

P(St)

 

 

Q (Si)

"

 

Q(St)

плотности f(z). Мы будем пользоваться тем, что случайные ве­

личины Q(S;)

(по

построению

S{)

имеют бета-распределение с

параметрами

m—lL—\ (см. § 3).

 

 

 

 

На первом этапе доказательства требуются следующие не­

равенства:

 

 

 

 

 

 

 

FPQ

sup

I (S')

 

 

max

l (S')

nP(St) l2

*~пт

 

 

 

 

 

h \

 

z\<A

 

 

 

 

i

 

 

^ V

ppo \l (Si)

nP(S')

|2_ c0 'V P ( 5 f) ( l- P ( S ())n^

 

 

e ™ \— ,

— | - e " ^ j

Ц

*

 

 

 

<

m ax—

Eg V

P(St)-=max

(3.1.3)

 

 

 

 

i li

i

 

i

h

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

где

Eg

означает

усреднение

по

мере | |

Q в

пространст-

ве

Rm.

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

Первое

неравенство

следует

из того, что по

построению

оценка (3.1.1) постоянна на областях St.

 

 

 

Второе неравенство вытекает

из следующего

простого ут­

верждения: для любых.случайных

величин §(-

 

Е тах а < \ } ' Е ;? .

*)

с(-), ci

i > 0, />!1—положительные константы, зави­

сящие от переменных, заключенных в скобки.

107


В самом деле

 

2 '

Е т а х Й = У ]

Щ1 {£| = тах£?}

1 ] ее

i

i

 

где 1В—индикатор события В.

Используя тот 4 акт, что наблюдения над случайными вели­ чинами X и Y независимы, т. е. l(St) зависят от У1; Y2,..., Ym только посредством областей 5 г, получим, что

P(St)( l - P ( S t))

 

.рР I

l(St)

- P(St)

(Y*

 

Ym)

,

 

 

 

 

'

|

 

 

 

где Eg означает усреднение

по

мере II Р в пространстве Rn.

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

Как следствие того, что непрерывная плотность f(z) огра­

ничена сверху

при \г\<А постоянной

# < о о ,

а случайные -

величины Q(S,)

имеют

бета-распределение со

средним

^

 

/г( т - / , . + 1)

 

 

 

 

 

 

 

 

т - И

и дисперсией

 

имеем следующую

оценку:

 

(.т+ 1)2( т + 2 )'

 

 

Р (Si) т

P(St)

 

 

 

 

 

Eg, !

sup

 

 

 

 

 

 

 

 

 

I z\<A

 

h

 

Q (St)

 

 

 

 

=Е & (

 

sup

(IP (S,)\* Q (S f)m

 

 

 

 

 

 

li2i</i\Q (St)

 

l,

 

 

 

 

 

= E&

 

max

P(St) y

Q (S{) m

 

 

 

 

 

 

 

i

 

\Q (St)

 

h

 

 

 

 

2 j Eg

Q (S,) m

1

1

Я 2

 

m‘

 

 

 

 

 

 

<

> , ----------

--------------<

 

 

 

 

 

 

 

 

 

> Y .

 

 

 

 

i

 

 

 

h

 

 

 

 

 

^

lt(m-f l )

(m + 2)

 

< Я 2 _ m

 

m ax------------------------- Я 2 max

m

 

(3.1.4).

m i n /£

;

 

/г( т + 1 ) ( т + 2 )

 

;

/?

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для доказательства сходимости

 

 

 

 

 

 

 

 

 

EQ

sup

p (St)

-f(*)

 

 

 

 

 

 

•-ЧЛ

г\<A

Q(St)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

заметим, что

из условий

теоремы

вытекает,

равномерная по>

z (] z | < Л < оо)

сходимость

 

 

 

 

 

 

 

 

 

108