Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 212

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§2

основные требования, предъявляемые к оценкам параметров распределения

Очевидно, что наилучшей оценкой параметров следует считать такую, которая наиболее близка к истинному значению оценивае­ мого параметра. Уточним это общее определение. Допустим, рас­ сматривается функция плотности вероятностей Р (х, сн, Дг........Да)

известного вида, содержащая неизвестные параметры ai, Дг, ..., Да, и случайная выборка объемом п членов из генеральной совокупно­ сти xi, хг, ..., хп, соответствующей указанной функции распределе­ ния Р (х, аи аг, ..., Да). При этом k<^.n. По данным выборки требу­

ется оценить значения неизвестных параметров.

Оценки параметров генеральной совокупности, которые обозна­ чим а\, аг, ..., Да, как отмечалось "выше, зависят (являются функ­

циями) от

выборочных

данных Д1 (xi, Хг, ..., хп),

az(xi,Xz,...

..., хп), ....

Да(*1, хг, ...,

хп), и, следовательно, сами

являются ве­

личинами случайными, варьирующими от выборки к выборке. За­

кон распределения д,- зависит, во-первых, от закона распределения величины х (и, в частности, от самого неизвестного параметра д), во-вторых, — от числа опытов п.

Функций вида Дг (xi, хг, ..., хп), используемых для определения

выборочных значений параметров, вообще говоря^ может быть предложено весьма много. Так, для определения математического ожидания можно использовать среднее арифметическое или сред­ нее геометрическое, медиану, различные квантили, полусумму крайних членов выборки и т. д. Однако эти характеристики будут обладать различной степенью приближения к искомому «истин­ ному» значению рассматриваемого параметра. Число возможных функций, используемых для определения выборочных значений па­ раметров, существенно сократится, если к оценкам параметров предъявить некоторые определенные требования.

Первым условием, которому должна удовлетворять рацио-

онально построенная оценка1 a (xi, х%, .... х„) для параметра д,

является сходимость по вероятности оценки к оцениваемому пара­ метру при неограниченном возрастании объема наблюдений п, т. е.

в(*Ь *2 ..........(5-1)

1Для простоты изложения ограничиваемся случаем выборки из совокупно­ сти, описываемой функцией плотности вероятности Р(х, а), содержащей лишь один неизвестный параметр а.

17*

259



Отметим, что про случайную величину (в данном случае а) говорят, что она сходится по вероятности к величине а, если при увеличении п выполняется равенство

(5.2)

П

где е — сколь угодно малая величина.

Оценки, удовлетворяющие требованию (5.1) и (5.2), называются

состоятельными.

Состоятельность статистической оценки обеспечивает ее практи­ ческую близость (по крайней мере, при больших значениях п) к ис­

комому параметру. Примером состоятельных оценок являются вы­ борочные оценки среднего значения и дисперсии. Из состоятельно­ сти оценки еще нельзя сделать полного вывода о ее пригодности для приближенного определения соответствующего параметра при малых п, так как в этих условиях состоятельная оценка может ук­

лоняться в ту или иную сторону от искомого значения параметра. Поэтому вторым условием, предъявляемым к статистическим оценкам, является условие несмещенности, т. е. отсутствие в ней си­ стематической погрешности при любом п. Для несмещенной оценки

ее математическое ожидание должно совпадать с параметром гене­ ральной совокупности

(5.3)

Здесь имеется в виду, что математическое ожидание оценки а определяется из множества выборок случайной переменной х объ­ емом N при любом конечном (в том числе и при малом) числе п членов в выборке (n<^N). Оценка называется положительно сме­

щенной, если М (а )> а , и отрицательно смещенной, если М (а)< а.

Требование несмещенности оценок особенно важно при малых объемах выборок (рядов наблюдений), с которыми обычно прихо­ дится иметь дело гидрологам. Выборочное среднее арифметическое значение является не только состоятельной, но и несмещенной оценкой математического ожидания

М (х)= р..

Это вытекает из следующих очевидных соотношений:

M(Xi) = [x,

и значит

п

п

£ ( X i X )2

Выборочное же значение дисперсии S2=

п

(5.4)

при ма-

260


лых п является отрицательно смещенной оценкой дисперсии гене­

ральной совокупности

М (52) =

(5.5)

Величина S2, исправленная на величину смещения и, следова­

тельно, являющаяся уже состоятельной несмещенной оценкой, мо­ жет быть определена, согласно формуле (5.5), по соотношению

 

 

 

 

52=

—-------,----

(5.6)

 

 

 

 

 

 

 

П1

 

 

Выражение (5.6) получается

из следующих преобразований:

5 2= -^ - 2

и - * ) 2=

4 г 2

[(-«i—i*)—(^ —

 

 

 

/ = 1

 

 

i — 1

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

^

 

[(^« —!А)2 —2 U —р.)(хг —р)+

(л: —а)2] =

 

 

1= 1

 

 

 

 

П

 

 

 

 

П

 

 

 

 

 

 

 

п

2

 

— В-)2 — 2 (■*—р)

2

(-*г —I1) + /*(■*—р)2] =

 

I

=1

 

 

 

 

 

i =1

 

 

 

"

 

 

_

 

 

2 j

б** — !*)

 

 

2d {xt — \>)2—2n (х — р)

- = 1- - ----------\-п(х- р)2

 

1=1

 

 

 

 

 

 

 

 

 

_

П

 

-1 р)2 2 л — р)2+ п (х — р)2] :

 

~

 

 

/ =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

V

 

(Xt р)2п (х — р)2= — 2

(•** ~ Р?

 

п

ih=1

 

 

 

 

 

i =1

 

 

 

 

 

4 -

 

2

ix t - v )

 

 

 

 

 

 

i=i

 

 

 

 

В случае отсутствия зависимости между членами исходной по­ следовательности можно записать

М {(JCi — р)(Xi+k— р)} = М (xt — p)M(xi+k — р )= 0 .

Поэтому, переходя к математическому ожиданию выборочных дисперсий, получаем

П

 

 

 

П

М {S2) = 4 - 2 м

 

^

- 2 М ((*<- н-)2) =

1=1

 

 

 

1=1

п

1

о

71 — 1

п

2

---------п

о2=

------------п

о2.

261


Полученное соотношение является основой зависимости (5.6), которая обычно и используется в руководствах по гидрологии для оценки выборочного значения дисперсии при п < 20. При п > 20 по­

правку на смещение вследствие ее незначительности не учитывают.

Рассмотренный способ устранения

смещенности выборочных

значений параметров путем введения

поправки

на смещенность

во многих случаях является более рациональным,

чем построение

некоторых сложных функций, обеспечивающих получение выбороч­ ных значений, лишенных эффекта смещенности. Способ устранения смещенности введением соответствующих поправок используется в дальнейшем при изложении метода статистических испытаний

для оценки выборочных значений параметров.

 

По определению, коэффициент

вариации представляет собой

отношение среднего

квадратического отклонения к среднему C„ =

= L^rr-.

Учитывая,

что среднее значение является

несмещенной

х

математического ожидания,

а смещенность

оценки сред­

оценкой

него квадратического отклонения может быть устранена по равен­ ству (5.6), можно было бы ожидать, что коэффициент вариации определяется без систематического смещения. Однако Е. Г. Блохи-

нов

[18] теоретическим анализом получил, что для случая CS = 2C„

коэффициент вариации, не имеющий систематического

смещения,

может быть определен из приближенной формулы

 

 

Ж(Св)= С „ - - ^ - ( 1 + ЗС“),

(5.7)

где п — число членов ряда; С„ — несмещенная оценка

коэффици­

ента

вариации; M(CV) — математическое ожидание

смещенной

оценки коэффициента вариации.

Указанный вывод, по мнению Блохинова, следует из того обсто­

ятельства, что несмещенность аргументов и сгж) не определяет несмещенности функции (Cv). Поправка на смещенность выбороч­

ной оценки С„, вытекающая из формулы (5.7) при п>20, состав­ ляет 2—5%, и поэтому обычно не учитывается. Полученная Блохиновым аналогичным образом поправка для устранения отрицатель­ ной смещенности выборочной оценки коэффициента асимметрии имеет вид

(п — 1) (я — 2) •

Однако эта поправка не обладает необходимой точностью и под­ лежит уточнению на основании метода статистических испытаний, излагаемого ниже.

Состоятельные несмещенные оценки, полученные различными методами, могут иметь различное рассеяние. Например, при нор­ мальном законе распределения вероятностей для оценки центра распределения (математического ожидания) можно использовать как среднее арифметическое значение, так и эмпирическую меди­

262