Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 187

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Эта оценка имеет особое значение при обработке гидрологиче­ ских величин, образующих обычно небольшие по объему совокуп­ ности. В таких ситуациях может оказаться, что статистические связи хорошо соответствуют выборочным данным, но значительно уклоняются от стохастических связей.

Наиболее полно стохастические связи между двумя перемен­ ными описываются двумерной плотностью распределения. Стати­ стическая же связь между двумя переменными описывается призмограммой частот. Такие описания статистических и стохастиче­ ских связей между двумя переменными обобщаются на случай связи между n-переменными. Эти связи описываются п-мерным законом распределения. Такое описание статистических и стохасти­ ческих связей является наиболее полным, но вместе с тем требую; щим весьма большого объема исходной информации. При исследо­ вании гидрологических процессов эти условия не удается выпол­ нять. Поэтому при изучении статистических связей вообще и между гидрологическими переменными в частности обычно применяются так называемые корреляционные связи, представляющие собой

связи между определенными фиксированными значениями одной величины (аргумента) и соответствующими им условными сред­ ними значениями другой (функции). Очевидно, что корреляцион­ ные связи представляют собой частную форму выражения статисти­ ческих связей.

Корреляционные связи выражаются в форме корреляционных уравнений или уравнений регрессии, которые бывают линейными и нелинейными. Далее рассматриваются линейные корреляционные связи между переменными. В случае нелинейности связи между рас­ сматриваемыми гидрологическими характеристиками можно осу­ ществить преобразование исходных данных, которое привело бы связь между преобразованными величинами к линейному виду. От­ метим, что указанное преобразование означает приведение исход­ ного закона распределения рассматриваемых величин к нормаль­

ному виду.

преобразования рассмотрены

Некоторые приемы такого

в главе II. Необходимо отметить,

что процедуру преобразования

имеет смысл применять лишь в том случае, когда достаточно уве­ ренно установлен факт существования именно нелинейной связи между исходными величинами.

При коротких рядах материалов наблюдений часто существует опасность признать линейную связь за нелинейную из-за случай­ ного рассеяния данных, образующих малую выборку.

§ 2

линейная корреляция между двумя переменными

Корреляционные линейные связи между двумя переменными ши­ роко используются в гидрологии. Они применяются для приводки характеристик рядов стока к многолетним значениям, для прогноза

318


стока или уровней воды в нижележащих створах по данным о стоке в верхних створах; аналогичным образом могут быть построены прогностические расчетные связи в отношении многих иных харак­ теристик гидрологического режима в зависимости от основных оп­ ределяющих их факторов. В связи с указанным рассмотрим связи между двумя переменными не как частный случай множественной линейной корреляции, изложенный в следующем параграфе, а как самостоятельную задачу.

Рассмотрим основные соотношения, описывающие корреляцион­ ные линейные зависимости двух переменных. Выявление связи ме­ жду рассматриваемыми гидрометеорологическими характеристи­ ками осуществляется на основании сопоставления их совокупностей. При нанесении на график соответственных значений х{ и y i они об­

разуют группу точек, более или менее закономерно располагаю­ щихся вдоль некоторой прямой. Требуется определить параметры линейной зависимости у = ах + Ь, наиболее соответствующей ука­

занной группе точек. Это достигается в том случае, когда сумма квадратов отклонений наблюденных данных от рассчитанных по уравнению регрессии будет минимальна

П

 

5 = 2 \У‘~ (ах;-}-6)]2 — min.

(6 .1 )

1

 

Значения параметров а, Ь, удовлетворяющие условию (6.1),

най­

дем, приравнивая нулю производные этой суммы по параметрам: производная по а

 

П

 

 

~ =

2 ^ i (yi -

ax i - b ) ( - x l)=0,

 

отсюда

1

 

 

 

 

 

п

п

п

 

2

1

~{~ь ^ —0;

(6.2)

1

1

 

производная по b

п

1

отсюда

пп

^ y i —a 2 х/" nb— 0.

(6.3)

1

1

 

Обозначим средние значения переменных

(6.4)

1 1

319


Решая уравнения (6.2) и (6.3) относительно параметров а и Ь,

получаем:

2

(х ‘У1 — пху)

а —

b = y —ax.

2-*/

Выражение параметра а, называемого коэффициентом регрес­

сии, можно привести к виду

а = г

(6.5)

Коэффициент корреляции г между переменными х и у можно полу-,

чить на основании используемых выборок по формуле

2 ( хг —•*) (у<- У )

г =

 

' -------

.

(6.6)

 

V2 U i - i ) 22 ( y/- y ) 2

 

 

f

1

1

 

Коэффициент корреляции нередко используется в одной из сле­

дующих форм:

СОУ (х, у)

 

г =

(6.7)

где cov(x, у ) — ковариация

(второй смешанный момент),

или мо­

мент связи величин х, у, представляющий собой математическое

ожидание произведения отклонений х и у от их центров, т. е.

П

cov(x, y)=-jr ' ^ ( x i—x ) ( y l - y )

1

или

 

г= у ау1хах/у,

(6.8)

где ау1х и ах/у — коэффициенты регрессии у по х и х по у.

Перечислим основные свойства коэффициента корреляции. Если переменные х и у независимы между собой, то сумма про­

изведений их отклонений от среднего, стоящая в числителе выра­ жения (6.6), равна нулю, и следовательно, равен нулю коэффициент корреляции. В том случае, когда связь между переменными функ­ циональная (и притом линейная), коэффициент корреляции равен плюс или минус единице. При наличии корреляционной связи, в за­ висимости от ее тесноты, величина коэффициента корреляции изме­ няется в пределах ± 1,0.

Положительные значения коэффициента корреляции соответст­ вуют случаю, когда функция возрастает с увеличением аргумента (связь прямая); уменьшение функции с возрастанием аргумента характеризуется отрицательными значениями коэффициента кор­ реляции (связь обратная).

3 2 0


Средние квадратические отклонения переменных от их арифме­ тических средних определяются по зависимостям:

2 ( * i - x ) 2

V i

п

’ У

(6.9)

 

 

 

 

Параметр b можно записать в виде

 

 

 

Ь = у — г ——х.

( 6. 10)

С учетом равенств (6.5) и (6.9) корреляционное уравнение мо­ жно представить в виде

у = ах b= а х + у ах,

или

у —у = а (х —х) = г — (х —х).

(6. 11)

Полученное равенство есть уравнение регрессии у по х. Уравнение линейной зависимости х по у получается аналогично

и имеет вид

х - х = г ^ - ( у - у ) .

(6.12)

■ У

 

Уравнения (6.11) и (6.12) являются различными самостоятель­ ными зависимостями, взаимно не получаемыми одно из другого. Заметим, что различный вид корреляционных регрессий у по х и х по у является следствием различий статистического характера свя­

зей и не связан с ограниченностью выборочных данных. Приведенные зависимости, вообще говоря, справедливы для вы­

борок из любого закона распределения случайных переменных х и у. Если переменные х и у распределены нормально, то каждая точка

уравнения регрессии есть центр условной кривой распределения за­ висимой переменной (у), вокруг которого группируются величины у, появляющиеся (при различных испытаниях) совместно с рас­

сматриваемым значением х. При этом в рассматриваемом частном случае условные кривые распределения также соответствуют нор­ мальному закону со средним значением, определяемым равенством (6.4), и с дисперсией, соответствующей равенству (6.9).

В общем виде рассеивание корреляционно связанных между со­ бой величин, подчиняющихся нормальному закону распределения, осуществляется в пределах так называемого эллипса рассеивания (эллипса равных вероятностей) (рис. 6.1). Для статистически не­ зависимых между собой нормальных совокупностей эллипс превра­ щается в окружность, а для функциональных связей — в однознач­ ную линейную связь.

Прямая ab есть линия регрессии у по х, она делит пополам вер­ тикальные хорды эллипса, выражающие рассеивание величины у

21 З ак . № 88

321