Файл: Дьяченко, А. Н. Интегральное исчисление функций нескольких переменных. Теория вероятностей и элементы математической статистики учебное пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 68

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

будет близок к нормальному при любом законе распределения ге­ неральной совокупности.

Если т*п мало, заключение центральной предельной теоремы еще не имеет силы, и закон распределения т*п в общем случае нельзя считать нормальным. Однако если распределение генераль­

ной совокупности нормальное, то

распределение т* при любом

п — 1 , 2 , . . . также нормальное,

как распределение суммы нор­

мальных случайных величин.

 

Выборочная дисперсия в зависимости от объема выборки опреде­ ляется по формулам (6.2) или (6.4).

Оценки по методу максимума правдоподобия. Распространенным методом вычисления оценок параметров закона распределения ге­ неральной совокупности является метод максимума правдоподобия. Пусть с точностью до параметра известна плотность вероятности закона распределения генеральной совокупности f (х, а). Тогда

вероятность того, что г-е выборочное значение

будет принадле­

жать области

 

+ Л,

(6.10)

равна

 

f(X it а )А + аг-Д

 

где Ншаг = 0.

 

Д ->0

 

Вероятность одновременного выполнения неравенств (6.10) для всех г, как вероятность произведения независимых событий, равна произведению их вероятностей:

П [/(X,.,

а) А +

aiA ]= f(X 1, a)f{X2, а) . . . f(X n, а)Ап+уАп,

i=1

 

 

где у ^ О

при А

0.

Коэффициент при Ап в первом слагаемом правой части послед­ него равенства называется функцией правдоподобия. Обозначим его g (Х х, Х 2, . . . , Хп, а). В качестве оценки параметра а выби­ рается значение а*, при котором функция правдоподобия дости­

гает наибольшего значения. Необходимое условие экстремума

dg(Xlt X t, ■ ■ ■ , Х п, а) 0

да

задает оценку ап как функцию выборочных значений Х ъ Х 2, . . . , Хп неявно.

Требования, предъявляемые в статистике к точечным оценкам. О качестве оценок в статистике судят по тому, насколько они удов­ летворяют следующим трем требованиям:

161


1. Состоятельность оценки. Оценка а* параметра а называется состоятельной, если при п оо она сходится по вероятности к па­ раметру а, т. е. при любом е>-0

lim P ( |а;— а | < е ) = 1.

(6.11)

п-юо '

'

 

Теорема. Для состоятельности оценки а* достаточно, чтобы при со

М[а*п] ^ а и D [а*] -> 0.

(6.12)

Д о к а з а т е л ь с т в о . По определению предела последова­

тельности, если ПтМГа*1 = а,

то по любому — > 0

найдется

п-*-оо

L J

 

 

2

, номера

такое число Nv что для членов последовательности УИ[а*]

которых п'Д>Ы1 будет выполняться неравенство

 

a - T L < M [a*n] < a + f .

(6.13)

При этом, каждый

раз, когда

будут

выполняться неравенства

м К

\

-

т

+ i

(6.14)

 

одновременно будут выполняться неравенства

 

 

а— е < а*

а + г

 

и равносильное им неравенство

 

 

 

 

 

\а*п—а | < е .

 

(6.15)

Это означает, что при n^>N1 вероятность выполнения неравен­ ства (6.15) не меньше вероятности выполнения неравенств (6.14)

или равносильного им неравенства

|а* — М Га*] |<—

:

 

1 > р ( I I < « ) > Р

IК - М [а;] |< -S-

.

(6.16)

Для оценки снизу правой части последнего неравенства, вос­ пользуемся неравенством Чебышева (5.123). Возьмем в этом нера-

венстве | = а* и

вместо е, в результате (5.123) приводится к

виду:

 

 

Р [ \ К - М К } \ >

<

События

< - Щ < ]

|>Н

[«;]!<■

 

162


противоположны. Поэтому

(6.17)

Из (6.16) и (6.17) следует, что

Так как£> [а*]

0,

то при

п ^

с о предел правой

части нера­

венств (6.18) равен

1,

левая

часть

неравенств равна

1, поэтому

при любом е > 0 существует предел центральной части

неравенств

и этот предел равен 1*. Таким образом, справедливо (6.11), следо­ вательно, теорема доказана.

Покажем, что выборочное среднее т* и выборочная дисперсия с>2 являются состоятельными оценками математического ожидания

т и дисперсии а генеральной совокупности. Из свойств 1 и 4 мате­ матического ожидания следует:

пт

т. (6.19)

п

По определению дисперсии

° [ т'п]=М [[т' п - т)*\=М

Вынесем — за скобку:

п

Вычтем из каждого слагаемого под знаком суммы по т и выне-

сем неслучайный множитель — за знак математического ожидация:

После возведения в квадрат получаем:

* См. [1], § 5.5, теорема 1, стр. 142.

163

Применяя свойство 4 математического ожидания и вспоминая определение дисперсии и корреляционного момента, находим:

D Гт*1=- 1

П

2 М [& -т)*] + 2 2 М [(^-mjdy-m)]

Я*

I 1=1

1 . В Ы + 2 ^ К щ

1=1

i+i

11

Ввиду независимости L и £. при

i Ф\

Къ . = 0, кроме того

D [£г] = а 2 при всех i, поэтому

 

 

D К ]

 

( 6. 20)

Далее

 

 

М Го-21 = М

-т_

± 2 < ь -

 

Представим каждое слагаемое

Возведем полученные выражения в квадрат и просуммируем по i поочередно первое, второе и третье слагаемые. После преобразова­ ний получим:

М Гсг21= М 4

- 3

f-tm-

-2 (т*т) X

- Х - г 2 & - т ) + {т*п- т у

Заметим, что

 

 

 

1

 

 

■тп—т,

2 ( | £-— т ) = — 21£г

i=l

 

г=1

 

поэтому

1

 

 

М [сг2] = м

m

—/л)

3

v

f t -

 

Пользуясь свойствами математического ожидания 2 и 4 и опреде­

лением дисперсии, находим:

 

М К ] =

[ K - m ) * ] =

= _L у

 

П

 

Принимая во внимание (6.20) и то,

что при всех i D[\t] = а2,

имеем:

п 1

М |a?J = а2

(6.21)

164


Аналогичные, правда более громоздкие, вычисления дают;

Ич ^2

2 (р4-~2и|)

Р4 — 3^2

п

Я2

(6. 22)

и3

где р&— центральный момент порядка k закона распределения

генеральной

совокупности.

что

при

п

 

М [m*] = m

_ и

Из (6.19)

и

(6.20) следует,

с о

£ > [я г ;]^ 0 , — а

из

(6.21) и

(6.22), М

[a2]

-

a2,

D [а2] -> 6 .

Таким образом,

условие (6.12)

выполнено

и,

следовательно,

яг*,

а2, являются состоятельными оценками т и а2.

 

 

 

 

2. Несмещенность оценки. Оценка ап параметра а называется

несмещенной,

если

математическое

ожидание

 

оценки

совпадает

с истинным значением параметра;

 

 

 

 

 

 

 

 

 

М[а*п]= а .

 

 

 

(6.23)

При многократном повторении оценок а* их значения группи­ руются около математического ожидания М [а*]. Разность между

математическим ожиданием оценки и истинным значением пара­ метра называется систематической ошибкой оценки. Если оценка несмещенная, то ее систематическая ошибка равна нулю.

Из (6.19) следует, что выборочное среднее т* является несме­

щенной оценкой математического ожидания. Выборочная диспер­ сия a2, как следует из (6.21), не является несмещенной оценкой

дисперсии генеральной совокупности.

Несмещенной оценкой дисперсии является величина

П

V х,- -т

(6.24)

При большом объеме п выборки величины о2 и а2 мало отли­ чаются друг от друга, однако при малом п следует пользоваться оценкой а2.

Пример 5. В примерах 1 и 3 были вычислены математические ожидания т * = |* и выборочные дисперсии а2 высоты колец и диаметров голо­

вок заклепок соответственно. Как отмечалось, величина т* = |* яв­ ляется несмещенной оценкой математического ожидания. По из­

вестному объему выборки п и выборочной дисперсии о 2 найти несме­ щенную оценку дисперсии, используя результаты решения примеров

Р е ш е н и е . В примере 1 п = 10, о2 =0,193. Воспользовав­

шись формулой (6.24) находим, что несмещенная дисперсия высоты колец равна:

о2 = —

о2 =

0,193 = 0,214.

п ~

1

*

9

 

В примере 3 о2 =

0,0120;

п =

200. Находим — - — = 1,005, поэ-

*

 

 

 

п — 1

165


тому

а2п = 1,005-0,0120 = 0,0121.

Несмещенная оценка дисперсии практически не отличается от выборочной дисперсии.

3.Эффективность оценки. Если две величины а°п и а* являютс

несмещенными оценками параметра а, то выгоднее применять ту из них, значения которой меньше разбросаны вокруг математиче­ ского ожидания, т. е. оценку с меньшей дисперсией. Несмещенная оценка называется эффективной оценкой параметра а, если ее дис­ персия достигает минимального возможного значения по сравнению с дисперсиями других несмещенных оценок того же параметра.

Заметим без доказательства, что если закон распределения ге­ неральной совокупности нормальный, то оценки, полученные по методу максимума правдоподобия обладают минимальной диспер­ сией, хотя не все из них являются несмещенными. Оценка матема­ тического ожидания, полученная в случае нормального распределе­ ния по методу максимума правдоподобия, совпадает с т*п и потому

удовлетворяет всем трем требованиям: она является состоятельной, несмещенной и эффективной. Действительно, функция правдоподо­ бия в этом случае имеет вид:

§ (-^li

•••> Хп, т) ' ( / 2л а)п

_1_

2 (X l-m)2

2а-

1=1

Точка максимума этой функции совпадает с точкой минимума функции

g i = 2 (X t— m f ,

{=1

которая находится из условия

= 2 i ( X , - m ) = 0.

от

Откуда

П

Оценки числовых характеристик векторных случайных величин. Аналогичная задача оценки параметров закона распределения воз­ никает при обработке ограниченного числа наблюдений над век­ торными случайными величинами (системами случайных величин). Рассмотрим, например, точечные оценки числовых характеристик в случае, когда наблюдаются значения двух случайных величин (компонент двумерного случайного вектора). Результаты обследова­ ния выборки объема п представляют собой п пар:

(Xlt Yx), (Xt, Y%), . . . , (Хп, Yn).

166