Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 221

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§3

анализ согласия эмпирических и аналитических функций распределения

Существующая практика расчетов речного стока основывается на определении расходов воды заданной вероятности ежегодного превышения. Для решения этой задачи используются различные теоретические кривые распределения, рассмотренные в главе II. Большое разнообразие теоретических схем распределения, исполь­ зуемых при описании гидрологических характеристик, свидетельст­ вует о том, что эмпирические данные гидрологических наблюдений в общем неплохо соответствуют применяемым аналитическим кри­ вым распределения.

В главе III указывалось, что это соответствие может быть уста­ новлено на основании визуальной оценки эмпирических и аналити­ ческих кривых распределения, выполненных на соответствующих клетчатках вероятности. При этом отмечалось, что такой прием оценки согласия эмпирических данных и используемой аналитиче­ ской функции распределения, обладая рядом достоинств, имеет и существенный недостаток, заключающийся в элементе субъекти­ визма и, следовательно, в неоднозначности полученного решения. В данной главе рассматриваются критерии согласия эмпирических и аналитических кривых распределения, лишенные этого недо­ статка.

Необходимо особо подчеркнуть, что с помощью критерия соот­ ветствия эмпирических данных аналитическим функциям распреде­ ления устанавливается их согласие лишь в пределах наблюденных данных. Поэтому экстраполяция теоретических функций распреде­ ления за пределы наблюденных данных должна осуществляться с особой осторожностью даже при установлении согласия между эмпирическими и аналитическими функциями распределения. Вме­ сте с тем в гидрологических расчетах, широко применяющихся в на­ стоящее время, наиболее часто используются аналитические функ­ ции распределения за пределами наблюденных данных. В этом от­ ношении критерии согласия эмпирических и аналитических функций распределения оказываются недостаточными применительно к опи­ санию многолетних колебаний различных гидрометеорологических характеристик.

Обратим внимание, кроме того, и на тот факт, что степень со­ гласия эмпирических и аналитических функций распределения за­ висит от числа свободно назначаемых параметров. Иначе говоря, используя теоретические функции распределения с большим числом параметров, определенных по экспериментальным данным огра­ ниченного объема, как правило, получим лучшее соответствие аналитических кривых фактическим данным по сравнению с ана­ литическими функциями, учитывающими меньшее число свободно назначаемых параметров.

16*

243


Из рассматриваемых далее критериев согласия отмеченное свойство теоретических функций распределения, включающих боль­ шое число параметров, учитывает критерий согласия %2, так как его теоретическое распределение зависит от числа параметров, опреде­ ляемых по выборочным данным. Критерии согласия Колмогорова и /гео2 не зависят от числа параметров теоретической функции рас­ пределения. Поэтому их использование предполагает, что теорети­ ческая функция распределения полностью задана, включая числен­ ное значение параметров, в нее входящих.

В практике гидрологических приложений параметры распреде­ ления почти всегда определяются по выборочным данным. Ввиду этого использование критериев Колмогорова и /г©2 в гидрологиче­ ских исследованиях ограничено.

В случаях же когда эти критерии применяются при вычислении параметров по выборочным данным, они дают избыточное согласие с нулевой гипотезой даже тогда, когда верна альтернативная гипо­ теза — гипотеза несоответствия данных наблюдений принятой тео­ ретической функции распределения; это обстоятельство в гидроло­ гических исследованиях обычно не учитывается при использовании критериев Колмогорова и па2. Поэтому в подобных работах, как

правило, отмечается хорошее соответствие эмпирических распреде­ лений теоретическим даже тогда, когда теоретические функции рас­ пределения заведомо не согласуются с выборочными данными, что объясняется некорректным использованием данных критериев.

Критерии согласия разработаны применительно к случайным по­ следовательностям, в которых отсутствует зависимость между их членами, в то время как многие гидрологические ряды наблюдений корреляционно связаны. В таких случаях доверительные границы критериев расширяются и они становятся менее чувствительными по отношению к альтернативной гипотезе, что опять-таки приводит к признанию нулевой гипотезы даже тогда, когда она не соответст­ вует выборочным данным.

При соответствии эмпирических данных нескольким теоретиче­ ским функциям распределения следует использовать более простые

схемы с меньшим

числом свободно

назначаемых параметров.

С. Н. Крицкий и М.

Ф. Менкель [83, 84]

приводят два условия, кото­

рым должна удовлетворять теоретическая функция распределения при описании многолетних колебаний речного стока:

1) простирание функции распределения должно заключаться

впределах от 0 до оо;

2)функция распределения должна определяться тремя свободно

назначаемыми параметрами.

Этим условиям из законов распределения случайных величин, рассмотренных в главе II, удовлетворяет лишь трехпараметрическое гамма-распределение Крицкого и Менкеля, так как все остальные типы кривых распределения при простирании их от 0 до оо являются двухпараметрическими. Вместе с тем в настоящее время можно счи­ тать установленным, что рядам гидрологических характеристик свойственна различная асимметрия. Поэтому двухпараметрические

244


распределения должны хуже соответствовать эмпирическим данным по сравнению с трехпараметрическими распределениями. Кроме того, различия в коэффициентах асимметрии гидрологических ря­ дов в большей мере сказываются на виде аналитической функции, чем различия, связанные с выбором различных схем распределения.

Таким образом, если исходить из приведенных выше условий, то в качестве теоретической функции может быть использовано рас­ пределение Крицкого и Менкеля. В этом случае применение крите­ риев согласия ограничивается, очевидно, испытанием только этого распределения.

Если же иметь в виду возможность применения двухпараметри­ ческих распределений для описания определенных классов гидро­

логических явлений (Q Cp, QuiaKCi Q mhh и др.), то тогда целесообразно

использовать

критерии согласия

гидрологических характеристик

к различным

двухпараметрическим распределениям. И

если при

этом окажется,

что некоторые из

этих распределений

находятся

в соответствии

с эмпирическими данными, то тогда, им целесооб­

разно отдать предпочтение как наиболее простым по сравнению с трехпараметрическими распределениями. Исследования в таком плане нельзя считать завершенными, несмотря на проделанную ра­ боту в этом направлении.

Наиболее обстоятельное исследование соответствия многолетних данных речного стока и осадков теоретическим функциям распре­ деления проведено Крицким и Менкелем [83] с помощью критерия согласия %2. В работе [83] устанавливается, что данные годового и

максимального стока рек, а также максимальные суточные осадки могут считаться согласующимися с используемыми при их обобще­ нии теоретическими функциями распределения.

Р. Д. Марковик [156] изучал соответствие аналитических функ­ ций распределения (нормальной, логарифмически-нормальной с 2 и 3 параметрами, гамма-распределения с 2 и 3 параметрами) дан­ ным о годовом стоке и годовых осадках и пришел к следующему выводу: «Все пять изученных вероятностных функций пригодны, н ни одна из них не является более приемлемой, чем другие, при ана­ лизе распределения величин среднегодовых осадков и стока». Этот вывод не является достаточно убедительным, по крайней мере для нормального закона распределения, так как в настоящее время общепризнана асимметричность рядов годового стока.

Л. Ш. Резниковский и другие [37] исследовали соответствие рас­ пределения Пирсона III типа и логарифмически-нормального эмпи­ рическим функциям распределения годового стока. При этом ис­ пользовались критерий согласия %2 и критерий Колмогорова.

В результате был сделан вывод о возможности использования рас­ сматриваемых законов распределения при описании годовых объ­ емов стока.

Таким образом, по Резниковскому, отдать предпочтение какомулибо закону распределения при описании годового стока не пред­ ставляется возможным. В подобных случаях решающим факто­ ром при выборе функции распределения должна быть принята во

245


внимание простота расчетной схемы и по возможности физическое обоснование с установлением соответствия пределов колебаний случайной переменной и теоретической функции распределения.

При использовании критериев согласия (так же как и критериев однородности и случайности) выдвигается нуль-гипотеза и альтер­ нативная гипотеза, назначается уровень значимости и область до­ верия и, наконец, принимается решение. В качестве нуль-гипотезы принимается условие соответствия теоретической функции распре­ деления эмпирической, а альтернативная гипотеза заключается 6 несогласии этих функций.

Для установления соответствия эмпирических данных принятой аналитической кривой распределения используются различные ста­ тистики, законы распределения которых известны, если справедлива нуль-гипотеза. В качестве таких статистик, например, может быть принята сумма расхождений между эмпирическими и аналитиче­ скими вероятностями или наибольшее расхождение между эмпири­ ческими и аналитическими обеспеченностями и др.

Далее решается вопрос, чем может быть объяснено расхождение (численное значение критерия) между эмпирическими данными и принятой аналитической функцией распределения. Если это расхо­ ждение объясняется случайными флуктуациями выборочных дан­ ных, в этом случае принимается соответствие эмпирической функ­ ции распределения аналитической; если это расхождение настолько велико, что нуль-гипотеза не может быть принята, то принимается альтернативная гипотеза, т. е. гипотеза несоответствия эмпириче­ ского распределения принятому теоретическому.

Окончательное суждение по этому вопросу устанавливается на основании расчета вероятности появления данной статистики в пред­ положении, что нуль-гипотеза верна. Если эта вероятность доста­ точно велика или, что то же самое, значение критерия попадает в область доверия при принятом уровне значимости, то признается нуль-гипотеза, в противном случае она опровергается. Более же точ­ ная формулировка заключается в том, что нуль-гипотеза не опро­ вергается, если значение критерия попадает в доверительную об­ ласть, в то время как альтернативная гипотеза может быть приз­ нана, если значение критерия попадает в критическую область.

Из числа критериев согласия, которые уже применяются в ги­ дрологических исследованиях и которые могут быть рекомендованы для дальнейшего использования, рассмотрим критерии согласия ./2, Колмогорова и «со2.

критерий х2

В качестве меры расхождения в данном критерии согласия используется сопоставление сгруппированных эмпирических вероят­ ностей с вероятностями принятого теоретического закона распреде­ ления. Поэтому применение критерия при малом объеме стати­ стической совокупности может привести к неправильным заключе­ ниям, так как группирование эмпирических данных при небольших

2 4 6


выборках осуществляется недостаточно точно. Ряды наблюдений за различными характеристиками гидрологического режима (QMnн>

Q-макс. Qcp и др.), как правило, не превышают нескольких десятков лет. Это ограничивает возможность использования рассматривае­ мого критерия для оценки согласия таких рядов с принятой теоре­ тической функцией распределения.

В случае выборок небольшого объема критерий х2 является не­ чувствительным, если нулевая гипотеза неверна, т. е. использование рассматриваемого критерия при малом объеме выборок может при­ вести к тому, что нулевая гипотеза может быть признана даже для нескольких распределений, существенно различных между собой. Для выборок же достаточно большого объема, наоборот, данный критерий почти всегда опровергает нулевую гипотезу, не позволяет принять ни одно распределение в качестве приемлемой модели для эмпирических данных. В какой-то мере этот недостаток может быть компенсирован назначением различного уровня значимости в зави­ симости от объема исходных выборок, т. е. с увеличением объема эмпирического материала необходимо уменьшать уровень значимо­ сти. Сопоставимые результаты с использованием критерия %2 могут быть получены при рядах одинаковой длительности.

Особенно полезно использовать критерий х2> когда на одном и том же материале проверяется несколько теоретических функций распределения. Главное преимущество критерия х2 заключается

в том, что он может использоваться для оценки согласия эмпириче­ ских данных с любым законом распределения.

Вкачестве меры расхождения между эмпирическими данными

итеоретической функцией распределения используется выражение

*( р ' р . ) *

i=i

Р-1

(4 -3 1 >

где Р* — эмпирические вероятности

в i-той

 

градации; Pi — теоре­

тические вероятности попадания случайной переменной в г'-тую гра­ дацию; N — объем совокупности; k — число градаций.

К. Пирсон показал, что закон распределения х2 не зависит от вида исходного распределения при достаточно большом N, а зави­ сит лишь от числа степеней свободы l= k г — 1, где г — число сво­

бодно назначаемых параметров.

Таблица распределения х2 приведена, например, в работе [89]. Критерий х2 представляет собой односторонний критерий, по­ скольку большие значения х2 позволяют признать альтернативную гипотезу, утверждающую несоответствие эмпирических данных при­ нимаемой теоретической функции распределения. Слишком же ма­ лые значения %2 указывают на необходимость дополнительного кри­ тического анализа исходных данных, обратив при этом особое вни­

мание на их случайность.

Оценим соответствие эмпирического распределения годового стока р. Невы у г. Петрокрепости трехпараметрическому гамма-рас­ пределению с использованием критерия х2-

247