Файл: Мания, Г. М. Статистическое оценивание распределения вероятностей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 116

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

 

lim

s (log s f _ n

 

 

 

 

 

f t —* СО

n

 

 

 

 

 

 

b

 

что же

касается

условия

j* f(x)dx=l—а < 1,

которое исполь-

 

 

 

 

а

 

зуется

в [58],

оно здесь отсутствует.

 

Некоторые

примеры

ядра К(х) приводятся в следующей

таблице:

 

 

 

 

 

 

 

К(х)

 

J

K2(x)dx

 

 

 

 

 

- СО

 

 

1/2.

 

|х|<1

1

 

 

0.

 

1*1 >1

2

 

 

1 -1 *1 .

 

1х| <1

2.

 

 

о .

 

|х|>1

 

 

 

8х2+ 8|х|3,

\х\

 

 

 

- М ) 3.

 

1

0,96.

 

 

2 <

 

 

 

 

 

 

 

0

 

 

1

_ 1_

 

1

 

Г

*S1

 

у 2-я

ехр

(}

У2к

 

1

 

 

 

1

 

 

y e x p j - ■1*1}

~2

 

 

1

1

 

 

1

 

 

я

1+Х'2

 

я

 

 

 

 

 

 

1

 

 

 

 

 

 

Зя

 

0 ,5 4 + 0,46 cos тех,

|х|<1

3

 

 

о

 

.

и >1

1

 

т


Наконец, заметим, что приведенным методом можно найти

.доверительные области для многомерной плотности вероятности

испектральной плотности стационарного процесса*).

§4. НЕПАРАМЕТРИЧЕСКАЯ ОЦЕНКА ПЛОТНОСТИ ДВУМЕРНОГО РАСПРЕДЕЛЕНИЯ

В этом параграфе рассматривается двумерный аналог одной простой оценки одномерной плотности, изученной Р о з е н -

б л а т т о м [96].

Если g(x)—некоторая функция, то обозначим

Ад g(x)=g(x+h)-g{x~h).

В качестве оценки плотности /(х) случайной величины X по выборке из X в [96] принята статистика

7 п ( х ) = - 0р - ,

 

(2.4.1)

 

 

2п

 

 

где S„(x)—эмпирическая функция распределения

выборки. Оче

видно, что (2.4.1) соответствует

выбору

ядра

 

 

 

1

 

1.

 

* „ (* )=

2 ’

'

 

 

 

 

I

0 ,

| х | >

1.

 

Критерием локальной и глобальной

точности

оценки fn(x)

Розенблатт выбрал

 

 

 

 

 

и соответственно

Е [?»(*)- /(*) ]2

 

 

 

 

 

 

Е

[fa(x)-f(x)\*dx.

 

Имеет место

 

 

 

 

 

Т е о р е м а 2.8. Если f(x)

имеет непрерывную

вторую про­

изводную в окрестности х, то

 

 

 

Е

 

[ f ' W + 0

( 1 - +

(2.4.2)

*) Внедавно вышедшей работе Э. А. Надарая (Сообщ. АН ГССР, 71,1 (1973), 57—60) описанный метод применяется при построении доверительной области для функции регрессии.—Прим. ред.

96


При /"(х )ф О оптимальное h равно

к =

Г У у*

2

\Пх)]*

и при h=h0

Е [ Ш

- / ( * ) ] 2= - ^ - 2-4/59~4/3 /(л;)4/5|Г(х)|2/5 п -4/5

£сл« же /(х) имеет непрерывную и ограниченную на всей прямой производную второго порядка, интегрируемую с квадра­ том, то

Е J (Гп( х ) Ч ( х ) } Ч х = 2^Г + — J № ) ] 2^ + о

Оптимальное h равно

9

К =

/ 1 П *)]8йх

1 /5

Д - 1 /5

и при h=h0

Е[/„ (* )-/(* )]2d*=

= _ 2-4/® 9-1/5

j № ) ] 2<к 1/5д- 4/5+ 0 (л-*/5).

4

 

Пусть теперь Z=(X, К)—случайный вектор с плотностью f(x, у).

В качестве ее оценки по выборке

 

 

2 г = (Х „

Yt), i= lT n ,

(2.4.3)

рассмотрим статистику [32]

 

 

 

 

Тп(х, y) = ^ l M ^ l J l ,

(2.4.4)

 

ml

 

 

 

где S„(x, у)— эмпирическая

функция

распределения

выборки

(2.4.3), равная относительной частоте

тех значений Zt,

для

ко­

торых Х ,< х и Y,<Cy, a h= h{n) и 1 — 1(п)—положительные

чи­

сла, стремящиеся к нулю при п-*-оо,

причем

 

 

 

nhl-+ оо.

 

(2.4.5)

7. Г. М. Мания

S7


Пусть

 

 

 

 

X

 

У

 

 

 

 

 

 

 

 

 

 

F(x, у) = Р{Х<х,

Y<y)

 

 

 

f (и, v) du dv.

 

 

 

 

 

 

-00

---- 00

 

 

Поскольку nSv(x,

у)

имеет

биномиальное распределение с

параметрами п и F(x, у), то

 

 

 

 

 

 

 

Е S„{x, y) = F(x,

у)

 

 

(2.4.6)

D Sjx,

 

1

F(x, y)[l-F(x, у)},

 

(2.4.7)

у) =

 

 

 

п

 

 

 

 

 

 

 

Нетрудно подсчитать также, что

 

 

 

 

 

 

 

 

 

1

F (min (х, х'), min (у, if))—

Е Sjx, у) Sn(x\ y')*=—

 

 

 

п

 

 

 

 

 

 

-

OlZ.1 F(x, у) F(x',

у’),

 

 

откуда

 

 

 

 

 

 

 

 

 

соv(Sn(x,y),

Sn(x'

у')) =

 

 

= — [F(min (х, х'),

min (у, y'))—F(xt

у)

F(x',

у%

(2.4.8)

п

 

 

 

 

 

 

 

 

 

Из (2.4.6), (2.4.7),

(2.4.8)

получим

 

 

 

 

 

Е /„(*,

 

1

М / Л * ,

У),

 

(2.4.9)

y) = -ju -

 

1

 

 

ш

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.4.10)

D /„(*, у)= 16 nhH2 1

у) -

 

 

 

у)]2

 

 

 

 

Предположим, что f(x, у) имеет непрерывные

производные вто­

рого порядка в окрестности (х, у).

 

 

 

 

 

Поскольку

 

 

x+h

у+1

 

 

 

 

 

 

 

 

 

 

 

А /А Л *.

У)=

j*

[

/ К

v) dudv=

 

 

 

 

х—h у—l

 

 

 

 

 

 

1

1

 

 

 

 

 

 

 

— М j

J

f(x+hu,

y + lv)dudv,

 

 

—1 - 1

 

 

 

 

 

 

 

то, разлагая /(и, и) в ряд Тейлора в окрестности (х, у), получим

98


 

AiAhF(x, y) = 4hlf(x, y) +

 

 

+ ~3 hl lh*fe(x,

y) + Pf>(x,

y)]+o[h*l+Ph).

 

Отсюда, согласно (2.4.9)

и (2.4.10),

будем иметь

 

 

 

E /nC*>

y) = f(x,

у)

+

 

+

yg- ih2f>(x,

y)+Pfy(x,

y)] + o(h2+B),

(2.4.11)

Поскольку

 

-

i

A

+

° {

i i ) -

<2-4-12»

 

 

 

 

 

 

 

 

E [fn(x,

y)—f(x, y)]2= D f n(x,

y)+[YL fn(x,

y)—f(x, y)}2,

(2.4.13)

из (2.4.11) и (2.4.12) имеем

 

 

 

 

 

 

E lfn(x,

y)- f(x, y)\2= _

^

+

_ L

[h2fXx,y)+l2fXx,y)\2 +

 

+

о i y ~

+ (Л2+ / 2)2|

_

(2.4.14)

Соотношения^ (2.4.11), (2.4.12) и (2.4.14) характеризуют свойства оценки fn(x, у). Она оказывается асимптотически не­ смещенной с порядком смещения 0(Л2 + /2) и состоятельной, при­ чем из (2.4.12) следует

р {!/»(* - y)~f(x,

г/) |> s)

= О ( у =

+

(Л2+ /2)j .

Для поиска оптимальных Л0, 10 в (2.4.18)

минимизируем по

Л и / функцию

 

 

 

 

 

ф(Л,

l ) = ~

+(Bh2+Ct2)2,

 

где

 

 

 

 

>(x’ У)

А = f { x ’ у )

в =

У)

г -

f

4п

 

6

 

 

6----- '

Приравнивая нулю частные производные <р(Л, /),

Фл(Л, t)= - A - + 4Bh(Bh2-\-Cl2)=Q,

l)= -A ~ + 4 C l(B h 2+ С/2) = 0,

99