Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 227

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

независимой информации, которая должна учитываться при расче­ тах однородности.

Оценка степени случайности гидрологических рядов будет рас­ смотрена в следующем параграфе настоящей главы. Здесь же лишь подчеркиваются те ограничения, которые необходимо иметь в виду при применении статистических критериев однородности.

Второе ограничение при использовании статистических крите­ риев однородности применительно к гидрологическим данным заключается в наличии корреляционной связи между рядами гид­ рологических наблюдений, которая уменьшает доверительный ин­ тервал критериев однородности. Применение же статистических критериев однородности без учета корреляционных связей между рядами гидрологических наблюдений приводит к тому, что заведомо неоднородные данные могут быть признаны однородными. Ошибки подобного рода довольно часты при оценке однородности гидроло­ гических наблюдений, так как гидрологические данные по многим явлениям гидрологического режима (годовой, максимальный сток, сток по сезонам и мн. др.) на близко расположенных реках, как правило, корреляционно связаны. Неучет этих связей может при­ вести к признанию заведомо неоднородных данных однородными.

Таким образом, если неучет внутрирядных корреляционных свя­ зей в наблюденных данных приводит к страхующим решениям од­ нородности (заведомо однородные данные могут быть отнесены к разряду неоднородных), то неучет корреляционных связей между рядами гидрологических наблюдений приводит, наоборот, к рас­ ширению понятия однородности (заведомо неоднородные данные могут быть отнесены к разряду однородных).

Кроме отмеченных ограничений, часто упускаемых при исполь­ зовании статистических критериев однородности, имеются и другие, которые обычно излагаются при описании этих критериев и поэтому принимаются во внимание при их использовании. К числу таких учитываемых ограничений, например, относится условие подчине­ ния исследуемых статистических совокупностей тому или иному тео­ ретическому закону распределения, чаще всего нормальному. Кри­ терии подобного рода (например, критерий однородности средних значений Стьюдента или критерий однородности дисперсий Фише­ ра) называют параметрическими в отличие от непараметрических критериев, которые не зависят от вида распределения исходных данных (например, критерий Вилькоксона). Заметим, что парамет­ рические критерии обычно более эффективны по сравнению с непа­ раметрическими за счет более полного использования исходной ин­ формации. Указанное деление критериев статистической оценки ги­ потез на параметрические и непараметрические относится в равной мере и к следующим разделам настоящей главы. Непараметриче­ ские критерии обычно более просты и не требуют дополнительного обоснования правомерности их применения в отношении типа ис­ ходного распределения. При использовании параметрических кри­ териев на однородность оцениваются параметры распределения (среднее значение, коэффициенты вариации и асимметрии).

188


Рассматриваемые ниже классические критерии оценки однород­ ности, за исключением обобщенного на случай нескольких совокуп­ ностей критерия Стьюдента и критерия Бартлета, пригодны для анализа однородности лишь двух эмпирических совокупностей. При наличии большого числа рядов, подлежащих оценке на однород­ ность, попарное сравнение их средних значений или дисперсий при­ водит к появлению ряда значений соответствующего критерия. Наличие такого ряда позволяет оценивать однородность рассмат­ риваемых рядов по степени соответствия теоретического распреде­ ления рассматриваемого критерия однородности эмпирическому. В случае достаточного соответствия указанных распределений ги­ потеза однородности подтверждается, в случае несоответствия этих

распределений — отвергается. Степень

соответствия эмпирических

и теоретических распределений может

быть оценена критериями

согласия, рассматриваемыми в § 3 настоящей главы.

2. основные этапы анализа однородности рядов наблюдений

Статистический анализ однородности рядов наблюдений вклю­ чает следующие основные этапы: формулировку нулевой и альтер­ нативных гипотез, определение уровня значимости, выбор критиче­ ской области, браковку или признание нулевой гипотезы. Так как эти этапы являются, как правило, неотъемлемой частью любого ста­ тистического исследования однородности рядов наблюдений, оста­ новимся кратко на них. Прежде всего условимся, что результаты наблюдений будем считать однородными тогда, когда они принад­ лежат к одной и той же генеральной совокупности. При этом все наблюдения будем считать независимыми как внутри рядов наблю­ дений (иными словами соблюдено условие случайности отбора), так и между исследуемыми рядами наблюдений.

Формулировка нулевой и альтернативных гипотез. Любое ста­ тистическое суждение об однородности тех или иных рядов наблю­ дений всегда имеет вероятностный характер. Статистический ана­ лиз однородности рядов наблюдений начинается с предположения отсутствия существенного различия между параметрами сравни­ ваемых рядов (нулевая гипотеза). При этом обычно предпола­ гается, что закон распределения сопоставляемых рядов наблюде­ ний один и тот же, что следует из физических соображений или накопленного предыдущего опыта, но могут иметь место лишь раз­ личия в параметрах распределения, к числу которых могут быть отнесены: среднее значение, коэффициент вариации и коэффициент асимметрии. Во многих случаях подлежат проверке на нулевую ги­ потезу все параметры распределения. Гипотезы, противоположные нулевой, называются альтернативными.

Предположим, что требуется оценить однородность средних зна­ чений запаса воды в снежном покрове, полученных по данным двух

снегомерных маршрутов. При этом хи хг — средние значения запаса

воды в снежном покрове на двух маршрутах. Нулевой гипотезой

189



в данном случае будет Xi = X2 , а альтернативных гипотез может быть

три: Xi^xz, или Xi>x2, или Xi<x2.

Выбор уровня значимости. Уровнем значимости будем считать такое достаточно малое значение вероятности, которое в том или ином конкретном случае может считаться характеризующим прак­ тически невозможное событие. Появление такого редкого события указывает на неправильность принятой нулевой гипотезы с вероят­ ностью, не превышающей выбранный уровень значимости. В таком случае с вероятностью, равной выбранному уровню значимости, можно отвергнуть нулевую гипотезу, хотя она может оказаться пра­ вильной, или, как говорят, совершить ошибку первого рода. В дру­ гом случае, задаваясь некоторым достаточно малым уровнем зна­ чимости, можно принять неправильную альтернативную гипотезу или совершить ошибку второго рода. Очевидно, что полностью из­ бежать ошибок первого и второго рода нельзя. При этом всегда имеет место некоторый риск. Можно лишь уменьшить риск совер­ шения ошибки одного рода за счет увеличения ошибки другого рода. Обычно за уровень значимости принимают вероятность 5, 2 или 1%-ную. В отдельных случаях уровень значимости может быть выбран 0,1 % и менее или более 5%.

С уменьшением уровня значимости вероятность забраковать ну­ левую гипотезу уменьшается, когда она верна и, следовательно, уменьшается вероятность совершения ошибки первого рода. Но с уменьшением уровня значимости увеличивается область допу­ стимых значений и, следовательно, увеличивается вероятность при­ нятия нулевой гипотезы, когда она неверна, или увеличивается ве­

роятность совершения ошибки

второго рода. С

другой стороны,

увеличивая уровень значимости,

мы увеличиваем

вероятность со­

вершения ошибок первого рода

(т. е. отвергнуть исходную нулевую

гипотезу, хотя она верна) и соответственно уменьшаем вероятность совершения ошибок второго рода.

Выбор уровня значимости при проверке однородности гидроло­ гических рядов следует назначать, сообразуясь с теми последст­ виями, которые могут возникнуть в результате совершения ошибок первого или второго рода. Кроме того, при этом всегда следует иметь в виду погрешности исходных данных.

Выбор критической области осуществляется таким образом, чтобы вероятность попадания в нее, когда гипотеза верна, в точ­ ности была равна уровню значимости. Область, которая дополняет критическую, обычно называют областью допустимых значений, или областью принятия. Выбор критической области при заданном уровне значимости необходимо осуществлять, исходя из тех или иных физических соображений и предполагаемых различий в па­ раметрах их распределений. Иными словами, критическую область

следует выбирать таким образом,

чтобы вероятность

попадания

в нее критерия была наибольшей,

когда справедлива альтернатив­

ная гипотеза, т. е. гипотеза, конкурирующая с нулевой

гипотезой.

Чем больше эта вероятность, которая часто называется мощностью критерия, тем меньше вероятность совершения ошибки второго рода.

190


При заданном уровне значимости можно рассматривать сле­ дующие критические области (рис. 4.1): 1) область больших поло­ жительных отклонений (/); 2) область больших отрицательных отклонений (II); 3) область больших по абсолютному значению отклонений (III); 4) область малых по абсолютному значению от­

клонений

(IV).

 

 

 

 

Поясним

сказанное

на

О

примере.

Допустим,

нас ин­

сГ

тересует однородность сред­

 

них высот снежного

покро­

 

ва, полученных

по

данным

 

маршрутов,

расположенных

 

в поле и в лесу в пределах

 

однородного физико-геогра­

 

фического района. За уро­

 

вень значимости примем ве­

 

роятность

 

1%.

Исходя

из

 

чисто

логических

соображе­

 

ний,

можно

полагать,

что

 

средняя

высота

снежного

 

покрова в лесу (х{)

больше,

Рис. 4.1. Критические области критерия

чем в поле

( х 2 ) ,

так

как в

(х').

 

лесу ослаблена деятельность ветра, в связи с чем в лесу меньше плотность снега и отсутствует

его передувание. В качестве нулевой гипотезы примем xi = x2,

а в качестве альтернативной X i > x 2. За критическую область в,дан­

ном случае целесообразно принять область больших положитель­ ных отклонений, так как только при этом условии вероятность по­ падания критерия однородности в критическую область будет наи­ большей.

Если выборочное значение критерия попадает в критическую об­ ласть, то нулевая гипотеза неверна, и должна быть принята альтер­ нативная гипотеза. В случаях если величина критерия оказывается в области допустимых значений, то это значит, что при данном эм­ пирическом материале нет оснований опровергнуть нулевую гипо­ тезу и, следовательно, она признается, во всяком случае до тех пор, пока дополнительные данные, полученные в результате наблюде­ ний, не опровергнут ее.

3. критерии оценки однородности средних значений

Изложение критериев однородности средних величин начнем с довольно часто встречающегося случая, когда выборочные сред­ ние распределены по нормальному закону. Это имеет место, когда распределение исходных рядов подчинено нормальному закону или когда имеются довольно продолжительные ряды наблюдений, по­ скольку в этом случае вне зависимости от закона распределения

191