Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 201

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 5

результаты оценок выборочных параметров распределения

Как было отмечено в § 3, определить статистические оценки па­ раметров законов распределения в полном объеме (т. е. в зависи­ мости от объема выборки, изменчивости и асимметрии ряда при различных значениях коэффициента внутрирядной корреляции) на основе аналитического анализа не удается. Такие оценки возможны на основе использования метода статистических испытаний. Приво­ димые ниже основные выводы, полученные в этом направлении, опираются на статистическое моделирование, выполненное по про­ грамме, изложенной в § 3. При реализации этой программы ряды представлялись в форме модульных коэффициентов. В этом слу­

чае, как известно, среднее значение ряда равно единице.

 

 

Общий объем

моделируемой

последовательности

(N) прини­

мался 50 000, а в отдельных случаях доводился

до 1

000

000.

Та­

ким образом, число выборок (L)

для п 10 составляло 5000;

для

п 25 L = 2000; для n = 50 L = 1000; для n=100

L = 500

и, нако­

нец, для n = 200

L = 250. Коэффициенты вариации при моделиро­

вании рядов принимались соответственно равными 0,1;

0,3;

0,5;

0,7;

1,0, коэффициенты асимметрии — Cs= 0; CS = CV; CS=2CT; CS = 3CV; CS = 4CV, коэффициенты корреляции между смежными членами

ряда — 0,0; 0,3; 0,5; 0,7; 0,9. Выборки включали следующее число членов: 10, 25, 50, 100 и 200. Общее число вариантов расчета со­ ставило 500 для каждого испытанного распределения (Крицкого— Менкеля и биномиального) и 125 вариантов, относящихся к нор­ мальному распределению (С5 = 0).1

Полученный материал, весьма полно освещающий рассматри­ ваемый вопрос, будет опубликован в специальных научных изда­ ниях. Здесь приведем лишь основные выводы.

оценка выборочных средних

В § 2 настоящей главы отмечалось, что средняя арифметическая представляет собой состоятельную, несмещенную, достаточную и эффективную оценку математического ожидания (х0), или нормы, по принятой в гидрологии терминологии. Средние арифметические

значения (х ), полученные по многочисленным выборкам, входя­

щим в состав генеральной совокупности независимых величин,

1 Расчеты осуществлялись В. М. Зверевой и М. В. Зориным на ЭВМ типа

М-220. В анализе и обобщении результатов расчетов принимала участие В. М. Зверева.

19 З ак . № 88

289

 


подчиняющейся нормальному закону распределения, образуют ряд, также распределенный нормально, с параметрами:

х = х 0 и a- — —yL- ,

(5.48)

х

г П

 

где <т~ — среднее квадратическое отклонение ряда, составленного из

величин х; ох — среднее квадратическое отклонение генеральной со­ вокупности; п — число членов в выборке.

Приблизительно нормальный закон распределения выборочных средних сохраняется и для выборок, уклоняющихся от нормального распределения, если объемы выборок достаточно велики.

Для статистических совокупностей, обладающих внутрирядной корреляцией между смежными членами (простая цепь Маркова), Крицкий и Менкель [78] получили зависимость

1 +

2‘г

п

1—Гл

4 ( 1 - г)

т )

Уп

2г

 

(5.49)

 

 

Л ( л - 1 ) (1 =75 (— £ f )

где г — коэффициент корреляции между смежными членами ряда.

Остальные обозначения указаны выше. При г= 0 формулы (5.48) и (5.49), очевидно, совпадают. При малых значениях г формула

(5.49) может быть представлена в виде приближенной зависимости

а_

1+г

(5.50)

V1 — г

X

 

рекомендуемой для практического применения.

Иллюстрация интегральных законов распределения выборочных средних представлена на рис. 5.6.

Кривые обеспеченности, изображенные на рис. 5.6, построены на основании рядов, смоделированных методом статистических испы­

таний при исходных параметрах1: х —1; Cv= 0,3; Cs=0,6; п=25; N=

= 15 000; Д= 600; ru i +1= 0,0; 0,3; 0,5; 0,9.

Результаты моделирования показывают, что выборочные сред­ ние арифметические при всех исходных параметрах практически не имеют смещения (все кривые обеспеченности пересекаются в точке

х=1 при Р = 50%). Дисперсия выборочных средних увеличивается

с увеличением коэффициента корреляции между смежными членами ряда. Распределение выборочных средних имеет положительную асимметрию, которая увеличивается с возрастанием г.

На рис. 5.6 одновременно с эмпирическими кривыми обеспечен­ ности представлены аналитические биномиальные функции распреде­ ления. Аналитические функции построены на основании параметров

1 По техническим причинам здесь и В дальнейшем при изображении кривых обеспеченностей нанесены не все точки.

.2 9 0



со

*

Рис. 5.6. Кривые обеспеченности выборочных средних, полученных по данным моделированных методом Монте-

Карло рядов (*==1; С„ = 0,3; С»=0,6) с различными коэффициентами корреляции между смежными членами ряда.

1 ~ Г = 0,0, 2 — г —0,3, 3 — г=*0,5, 4 - г - 0 , 7, 5 - г = 0 . 9 .

совокупностей выборочных средних (х-, Cv~, Cs-). Хорошее

согласование эмпирических и аналитических кривых обеспеченно­ стей дает основание весь дальнейший анализ смоделированных ста­ тистических совокупностей проводить на основании использования статистических параметров, соответствующих моделируемым вы­ боркам. Указанный путь использования информации, содержа­ щейся в моделируемых рядах, имеет и то преимущество, что пере­ ход к аналитическим функциям, описывающим смоделированные статистические совокупности параметров, обеспечивает некоторую генерализацию выборочных данных, сглаживая отдельные их слу­ чайные флуктуации. Кроме того, аналитические функции распреде­ ления выборочных оценок (в частности, средних) позволяют пред­ ставить информацию в компактной форме, что открывает техниче­ ские возможности обработки случайных рядов практически неогра­ ниченной длины.

Действительно, при использовании аналитической формы описа­ ния статистических совокупностей ЭВМ в своей памяти сохраняет сведения лишь о параметрах этих совокупностей. Для воспроизве­ дения же эмпирических функций распределения машина должна полностью сохранять сведения о всех членах, образующих ряды рассматриваемых величин. В данном случае статистические сово­ купности представляют собой ряды, состоящие из выборочных сред­ них. Помимо указанного, следует учесть, что размещение членов выборок в ранжированном порядке занимает много машинного вре­ мени. В итоге расчет на ЭВМ эмпирических функций распределения по 600 выборкам занимает около 40 мин машинного времени, а рас­ чет стандартных статистических параметров аналитических функ­ ций распределения по 2000 выборкам — около 5 мин. Следует также учесть, что ЭВМ может одновременно осуществить (по объему па­ мяти) обработку примерно 700 выборок применительно к задаче построения эмпирических функций распределения, а при использо­ вании ЭВМ для оценки лишь статистических параметров выборок число одновременно рассматриваемых выборок практически неог­ раниченно.

Таким образом, принятая форма выдачи из ЭВМ информации в виде стандартных статистических параметров открывает допол­ нительные возможности в использовании метода статистических йспытаний. Приведенные соображения в полной мере относятся и к исследованию законов распределения выборочных коэффициентов вариации, асимметрии, коэффициентов корреляции между смеж­ ными членами ряда, а также ординат кривых обеспеченностей.

Применение метода статистических испытаний для определения стандарта выборочных средних значений позволяет сделать следую­ щие выводы.

1. Применение для моделирования различных функций распре­ деления (Крицкого—Менкеля, биномиального) не сказывается на величинах случайных средних квадратических ошибок выборочных средних во всем диапазоне задаваемых параметров исходного рас­ пределения (С„, Cs/Cv) при различных г и п.

2 9 2


2. На величинах средних квадратических ошибок выборочных средних не сказывается и величина задаваемого исходного соотно­ шения Cs/Cv.

3. Средняя квадратическая ошибка выборочных средних возра­ стает с увеличением коэффициента вариации исходного распреде­ ления, с уменьшением объема выборки и с увеличением коэффици­ ента корреляции между смежными членами ряда. При величинах коэффициента корреляции 0,3—0,5 стандарт выборочных средних возрастает примерно на 30—40%.

4. Расхождения между величинами средних квадратических оши­ бок, полученных по формуле (5.49) и рассчитанных методом стати­ стических испытаний, обычно очень невелики. Они возрастают с уве­ личением коэффициента корреляции между смежными членами ряда и коэффициента вариации исходного распределения. При не­ больших объемах выборок (/г=10), высоких значениях коэффици­ ента вариации (Сг, = 1,0) и коэффициента корреляции (г = 0,5) эти различия составляют 0,05, а при С„ = 1,0 г = 0,7; п —10 достигают

даже 0,1—0,2. Более высокие значения стандарта ошибок выбороч­ ных средних получаются по формуле (5.49), по сравнению с мето­ дом статистических испытаний. Таким образом, при коэффициентах корреляции между смежными членами ряда, не превышающих г — = 0,5, и при числе членов ряда п > 10 рассматриваемые различия не­

существенны и, следовательно, формула (5.49) имеет практически вполне достаточную точность.

Попутно можно отметить, что сравнительно небольшие разли­ чия в оценке случайных средних квадратических ошибок выбороч­ ных средних, полученных независимо, т. е. методом статистических испытаний и на основе теоретической формулы (5.49), являются до­ полнительным подтверждением правильности выполнения статисти­ ческого моделирования.

оценка выборочных коэффициентов вариации

Выборочное среднее квадратическое отклонение и коэффициент вариации даже для рядов, не обладающих внутрирядной корреля­ цией, представляют собой отрицательно смещенные оценки пара­ метров генеральной совокупности. Эта смещенность частично уст-

п

раняется введением множителя---------,

где п — объем выборки.

п — 1

 

В- работах Е. Г. Блохинова [18] и А. Ш. Резниковского [37] от­ мечается, что величина отрицательного смещения выборочных ко­ эффициентов вариации (средних квадратических отклонений) обычно не превышает 3—4%. Однако это справедливо только, если исходное Cs/Cv^:2. С увеличением отношения C$/Cv смещенность

возрастает, и только при коэффициентах вариации меньше 0,5 сме­ щенность мало зависит от отношения Cs/Cv и остается незначитель­

ной. При других значениях параметров ряда это не так. Например, по данным статистического моделирования для рядов, не обладаю­ щих внутрирядной связью, при СsiСи = 4 и при С„ = 1,0 и объеме

2 9 3