Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 214

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ану. Обе эти оценки состоятельны и несмещены, однако величина их рассеяния неодинакова. Поэтому возникает необходимость в оценке выборочных оценок параметров по их дисперсии. При этом

в качестве критерия эффективности двух каких-либо оценок оч

и а2 одного и того же выборочного значения параметра а принима­

ется отношение

е =

(5.9)

Da2

Если е < 1, то оценка at более эффективна, чем а% (и наоборот),

так как ей соответствует меньшее рассеяние. Та оценка оч, у кото­ рой дисперсия не превосходит некоторого теоретического возмож­ ного минимума, называется эффективной оценкой с минимально возможной дисперсией.

В качестве примера оценим эффективность применения крите­ рия для оценки математического ожидания нормальной генераль­ ной совокупности средней арифметической и медианы. Дисперсия случайных колебаний среднего арифметического значения для ряда случайных величин, включающих п членов, определяется по выра­ жению

D ( x ) =

(5.10)

где D (х) — дисперсия генеральной совокупности.

Действительно,

после определения дисперсии и среднего арифметического имеем:

D (х) = М [(эс-Хо)2],

 

JC=

Хи

 

где М — символ

математического ожидания;

х0— математическое

ожидание генеральной совокупности.

 

 

Вследствие независимости лч можно написать

D (х )— М

1

= 4 - 2 м

co)2i =

П2 1 х г ■х0

 

пР (х)

1

 

 

Р(х)

 

 

п2

 

 

так как D(x)— M [(л;,— х0)2].

Таким образом, среднее квадратическое отклонение (случайная ошибка) выборочной средней арифметической равно среднему квадратическому отклонению генеральной совокупности, уменьшен­

ному в У п раз,

0_

°х

(5.11)

Vn ■

X

 

263


Подставим в (5.11) ox= Cvxx, получим обычно использующуюся

в гидрологии зависимость

Сг,х х

о_ (5.12)

X Vn

Пользуясь зависимостью (5.12), можно установить необходимое число лет наблюдений п для получения нормы рассматриваемой

величины '(например, стока) с заданной случайной ошибкой при различных значениях величины коэффициента вариации. Для гене­ ральной совокупности, подчиняющейся нормальному закону рас­ пределения, дисперсия медиан, полученных из выборок объема п членов, определяется по формуле

D ( Ме) =<£ед=

а2

 

 

 

-

|

-

(5.13)

Используя зависимости (5.11) и (5.13), определим эффектив­ ность медианы по сравнению со средней арифметической

 

с2-

ах 1

Я

. 4 =

2

_

 

е(Ме) =

X

0,64.

а2

п 1

2

п

1Z

 

 

мед

 

 

 

 

 

 

Приведенное соотношение показывает, что для определения оценки центра по среднему арифметическому нужно использовать лишь 64% того числа наблюдений, которое требуется для решения этой задачи через оценку медианы.

Приведенные в настоящем разделе краткие сведения о способах оценки точности выборочных значений параметров, в частности, о способах устранения смещения, полученные путем теоретического анализа, имеют преимущественно иллюстративное значение, по­ скольку они относятся к нормально распределенным совокупностям или к гамма-распределению, ограниченному условием Cs= 2Ct!. Более полное исследование точности выборочных оценок парамет­ ров, выполненное на основании метода статистических испытаний, изложено в § 4 настоящей главы.

§ 3

методы определения оценок параметров распределения

При решении гидрологических задач используются следующие методы определения оценок параметров распределения:

1 ) метод моментов;

2 ) метод квантилей;

3 ) метод наибольшего правдоподобия.

Метод моментов получил наибольшее распространение в прак­ тике гидрологических расчетов. Сущность его заключается в том, что искомые параметры распределения выражаются через мо­

264


менты, в качестве оценок которых принимают значения моментов эмпирического распределения обычно с поправками на ликвидацию смещения. Число эмпирических моментов, определенных по мате­ риалам наблюдений, равно числу параметров рассматриваемого за­ кона распределения. Как уже отмечалось, достоверность эмпириче­ ской оценки моментов с возрастанием их степени при данном объ­ еме совокупности резко снижается. Поэтому в гидрологии обычно не применяются распределения, зависящие более чем от трех пара­ метров.

Параметры законов распределения через статистические мо­ менты выражаются формулами (1.1), (1.22) и (1.27). Оценки пара­ метров, полученные способом моментов, применительно к законам распределения, используемым в гидрологии, являются состоятель­ ными для случая внутрирядно несвязанных величин. Смещение оце­ нок невелико и может быть устранено с помощью простых по­ правок.

Метод квантилей основан на использовании связи величин вы­ борочных параметров со значениями соответствующих квантилей. В гидрологических расчетах получил распространение графоанали­ тический вариант метода квантилей, разработанный Г. А. Алексее­ вым [3, 5]. Технические приемы применения этого метода рассмот­ рены в главе III.

Сущность

метода наибольшего правдоподобия заключается

в следующем.

При независимых испытаниях вероятность совмест­

ного появления в выборке значений хх, х2, ..., хп в границах: для первого члена от х\ до Xi+ Axi

для

второго члена от х2 до х2+Ах2

для

л-го члена

от хп до хп+ Ахп

равна (для распределения с одним параметром а)

Р = Р 1(х[; а)Р2(х2; а) ..

. Рп(хп, а)АххАх2 . . . Ахп.

Здесь Pi (Х{, a)Axi — вероятности того, что любое, взятое на вы­ борку значение х* попадет в некоторый интервал (х,-— Xj+i). Эти

вероятности при достаточно малых интервалах могут приближенно считаться пропорциональными ординатам кривой плотности веро­ ятностей (Р') функции распределения, используемой для описания

рассматриваемой совокупности.

Поскольку выборочные значения хь ..., хп случайной величины

фактически наблюдались в процессе опыта, то наиболее вероятно такое значение параметра а, или нескольких параметров, при кото­

ром эта вероятность максимальна, т. е. при которой достигает мак­ симума произведение вероятностей (или, что то же, сумма логариф­ мов вероятностей) наблюденных величин

L(XU х 2, . . ., х п\ а )= р [( х и а)Р2(х2, а) . . . Р'„(хп, а). (5.14)

Выражение (5.14) называется функцией правдоподобия.

265


Таким образом, в качестве оценки для неизвестного параметра а принимается его значение, получаемое из уравнения

 

 

-

Ж

-

0 -

(5-15)

Учитывая, что In L достигает

максимума при том же значении

а, что и L, вместо уравнения (5.15)

можно использовать более про­

стое уравнение правдоподобия

 

 

 

 

1

dL _

rf In L

V

d l n P (x i. a)

(5.16)

L

da

da

* *

da

 

 

 

 

l

 

 

Непосредственно из выражения

(5.16) следует, что метод наи­

большего правдоподобия придает

больший вес тем

выборочным

значениям случайной величины,

которым соответствуют большие

значения вероятностей. Это свойство метода наибольшего правдо­ подобия в большей мере проявляется в асимметричных распределе­ ниях. В методе же статистических моментов, наоборот, придается больший вес крайним членам выборки и меньший — средним. Поэтому метод наибольшего правдоподобия приводит к более устойчивым оценкам параметров, чем метод моментов. Метод наи­ большего правдоподобия приводит к состоятельным оценкам, рас­ пределенным асимптотически нормально, имеющим наименьшую возможную дисперсию по сравнению с другими, также асимптоти­ чески нормальными оценками, и наилучшим образом использующим всю информацию о неизвестном параметре, содержащуюся в вы­ борке. Оценки по методу наибольшего правдоподобия могут быть смещены. Это смещение, в общем незначительное, может быть уст­ ранено введением соответствующих поправок.

Применительно к закону нормального распределения оценки, получаемые методом наибольшего правдоподобия, совпадают с моментными оценками. Для других распределений эти методы дают, как правило, различные результаты.

Метод наибольшего правдоподобия в практику гидрологических

расчетов введен С. Н. Крицким и М. Ф. Менкелем

[6 8]. До практи­

ческого использования этот метод

доведен Е.

Г.

Блохиновым

[ 20, 22].

оценку методом

наибольшего

В качестве примера рассмотрим

правдоподобия параметров нормального распределения.

Как известно, нормальный закон распределения применительно

к выборке объема п может быть записан в виде

 

Р(хг, х 0;

о)=

-2? (■*!-*о)2

(5.17)

У 2т.

 

 

 

Образуем функцию правдоподобия (5.14), для чего предвари­ тельно найдем логарифмы величин Р (xit х0, о)

In P(Xj\ Хо, а )= —In а — ~2~!п --- 2^Г~ — -^о)2-

(5.18)

266


Суммируя величины 1пР для всех наблюденных значений хи по­ лучим функцию правдоподобия

11

 

п

 

п

 

 

п

Z . = 2 ln / 3(jc/;

а\ o)=

- 2 l n o — § " 2 1п21Г —

—-^о)2-

1

 

i

 

l

l

 

 

Далее, находим уравнение

правдоподобия

dL

=0 примени-

dxо

тельно к оценке параметра х0

 

 

 

 

 

 

(1L _____

1

П

 

 

 

 

 

V

(JC! — лг0)=

0 ,

 

 

 

dxо

 

 

 

 

 

 

откуда, учитывая,

что 2Цх0 = пх0, получаем

 

 

 

 

1

 

 

 

 

 

 

 

 

 

2

*i

 

 

 

 

 

х 0=- 1

 

 

 

 

Таким образом, статистической оценкой параметра xq (матема­

тического ожидания) в данном случае является величина среднего арифметического значения ряда величин Xi.

Для получения методом наибольшего правдоподобия выраже­ ния статистической оценки параметра о образуем уравнение прав­

доподобия —- - = 0

 

 

do

 

 

dL

2 ^ г + ^ г 2

(-*<-*о)2,

dv

или

i

 

 

 

dL

^ 2 (-*1 --*о)2 - - д г = о .

da

Откуда получим

 

 

 

П

 

 

2 (*1 -

хо)2

 

1

 

п

(5.19)

 

т. е. выражение среднего квадратического отклонения.

Из приведенного анализа следует, что применительно к нор­ мальному закону распределения оценки параметров, полученные методом наибольшего правдоподобия, совпадают с моментными оценками. Для других кривых распределения такое полное совпа­ дение не является обязательным.

В качестве второго примера рассмотрим, согласно анализу, вы­ полненному С. Н. Крицким и М. Ф. Менкелем [68], примене­

ние метода наибольшего правдоподобия для оценки параметров

267