Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 183

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

при заданном х. Аналитически величина рассеивания описывается

зависимостью (6.9). Величина дисперсии, характеризующей функ­ ции у, является постоянной, не зависящей от Xi, поэтому выражение (6.9) дает оценку рассеивания величины у как для сечения, отно­

сящегося к фиксированному значению х,-, так и для всего уравне­ ния регрессии в целом. Линия cd делит пополам горизонтальные хорды, параллельные оси х.

Линии ab и cd, соответствующие уравнениям (6.11) и (6.12), как

указано выше, совпадают лишь для функционально связанных ве­

 

 

 

личин х н у .

 

 

 

 

Для суждения о том, насколь­

 

 

 

ко получаемые на основании ис­

 

 

 

пользования выборок корреляци­

 

 

 

онные

уравнения соответствуют

 

 

 

стохастическим связям, необхо­

 

 

 

димо оценить точность уравнения

 

 

 

регрессии и входящих в него па­

 

 

 

раметров. В качестве

критерия

 

 

 

точности уравнения регрессии ис­

 

 

 

пользуется условное среднее ква­

Рис. 6.1. Схема зависимости у = ах + Ь\

дратическое отклонение (стан­

х = а'у + Ь'

для нормально

распреде­

дартная ошибка) ву,

представ­

ленных переменных х

и у.

ляющее собой среднее

квадрати­

денными

величинами

 

ческое отклонение между наблю­

и рассчитанными

по уравнению

регрессии 1

 

ау

 

(Ус, н - Ур) 2

(6.13)

 

 

п

 

где у iu — наблюденная величина; с/р — величина, рассчитанная по

уравнению регрессии.

С использованием коэффициента корреляции выражение (6.13) приводится к виду

(6-14)

Здесь Оу0— среднее квадратическое отклонение исходного ряда

величин у (функция); г — коэффициент корреляции уравнения ре­

грессии.

Выражение (6.14) показывает, что, например, при г= 0,95 сред­ нее квадратическое отклонение величин, полученных по уравнению регрессии, составляет 0,32 а Уо, т. е. рассеяние этих величин умень­

шается примерно в 3 раза по сравнению с рассеянием

исходного

ряда зависимой переменной.

 

 

1 Иногда при использовании зависимости

(6.13) знаменатель

записывают

в виде п — 2, стремясь этим учесть утрату двух

степеней свободы в связи с вы­

числением двух параметров уравнения регрессии. Эта операция приводит к не­ которому различию в оценках по формулам (6.13) и (6.14), что не имеет доста­ точных оснований.

322


Рассматривая параметры b и а как варьирующие величины, из­

меняющиеся от выборки к выборке, точность выборочных оценок можно охарактеризовать значениями соответствующих стандарт­ ных ошибок

ш__ °у Ы

°у / 1 — Г2

*

У п

(6.15)

У п

Для коэффициента

регрессии а

будем иметь распределение,

близкое к нормальному с оа,

°У 1 - /-2

(6.16)

°х

У П

Используя для построения линии регрессии значения парамет­ ров а и Ь, обладающие указанными случайными ошибками, мы до­

пускаем погрешность в оценке ординаты линии регрессии. Эта по­ грешность может быть охарактеризована значением соответствую­ щей дисперсии (квадрата стандартной ошибки):

О

У w

1

(xi -

х)2

(6.17)

У

п - 2

 

 

<31

 

 

 

 

 

 

 

 

2

— *)2

 

 

 

i

= 1

 

 

2

Дисперсия ) характеризует рассеивание ординат выбороч­

ной линии регрессии относительно линии регрессии, соответствую­ щей генеральной совокупности.

Рассмотрим вопрос о точности выборочных оценок коэффици­ ента корреляции.

В работе В. И. Романовского [111, стр. 391] выводится формула средней квадратической ошибки коэффициента корреляции

1 - / - 2

П72

75r ‘i - 13

а'= y z z r r

У 1+ ~ 2 ^ " 1------ 27Д— '

которая при достаточно больших п ( п > 25) записывается в наибо-

лее часто встречающемся виде

1 ~Г*

(6.18)

Зг ~ у у = т ■

 

Когда п достаточно велико и г не слишком близко к единице,

распределение выборочных коэффициентов корреляции стремится к нормальному закону с центром распределения, равным г, и сред-

1 — г2

ним квадратическим отклонением ог= — —. При постоянном п in —7

и при |

г |-М распределение выборочных коэффициентов корреля­

ции все

более уклоняется от нормального. Коэффициент корреля­

ции, рассчитанный по выборке конечного объема п, в среднем

21*

323


всегда меньше коэффициента корреляции генеральной совокупно­ сти, т. е. выборочные коэффициенты корреляции имеют отрицатель­ ное смещение. Это смещение уменьшается с увеличением п.

Нормальное распределение выборочных коэффициентов корре­ ляции приблизительно сохраняется, когда п не слишком мало и г не слишком велико. Во всех остальных случаях (при малом п и больших г) распределение выборочных г асимметрично.

Для коэффициентов корреляции, полученных по выборкам из распределения, отличного от нормального, закон распределения вы­ борочных г, вообще говоря, неизвестен, и следовательно, оценка эм­

пирического коэффициента корреляции затруднена. При малых объ­ емах выборок (п<50) и особенно при больших г для оценки слу­

чайного рассеивания выборочных коэффициентов корреляции обычно используется преобразование Фишера, основанное на ис­ пользовании специальной переменной г, функционально связанной с г выражением

 

 

 

 

■у ■--- _1_

In

1 +Т

 

 

 

(6.19)

 

 

 

 

2

1 - с

 

 

 

 

 

Для

определения

величин z = f(r)

целесообразно использовать

 

данные табл. 6.1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

6.1

 

 

 

 

 

 

 

 

 

Значения z = } ( r )

 

 

 

 

 

Г

0,00

0,01

0,02

0,03

 

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,00

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

 

0,1

0,10

0,11

0,12

0,13

0,14

0,15

0,16

0,17

0,18

0,19

 

0,2

0,20

0,21

0,22

0,23

0,24

0,26

0,27

0,28

0,29

0,30

 

0,3

0,31

0,32

0,33

0,34

0,35

0,37

0,38

0,39

0,40

0,41

 

0,4

0,42

0,44

0,45

0,46

0,47

0,48

0,50

0,51

0,52

0,54

 

0,5

0,55

0,56

0,58

0,59

0,60

0,62

0,63

0,65

0,66

0,68

 

0,6

0,69

0,71

0,72

0,74

0,76

0,78

0,79

0,81

0,83

0,85

 

0,7

0,87

0,89

0,91

0,93

0,95

0,97

1,00

1,02

1,05

1,07

 

0,8

1,10

1,13

1,16

1,19

 

1,22

1,26

1,29

1,33

1,38

1,42

 

0,9

1,47

1,53

1,59

1,66

1.74

1,83

1,95

2,09

2,30

2,65

 

0,99

2,65

2,70

2,76

2,83

2,90

2,99

3,11

3,25

3,45

3,80

 

Распределение г даже и для небольших выборок весьма близко

 

к нормальному и практически не зависит от п и истинного значе­

 

ния г.

 

 

 

 

 

 

 

 

 

 

 

 

Стандартная ошибка 2 равна

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'

 

(6.20)

 

По значениям oz, используя данные табл. 6.1, можно найти ве­ личину ог и далее, опираясь на закон нормального распределения,

установить, в каких пределах заключены выборочные значения ко­

324


Рис. 6.2. Минимальная величина коэффи­ циента корреляции с 5%-ным уровнем значимости в генеральной совокупности при различных значениях этого коэффи­ циента в выборках разного объема.
г

эффициентов корреляции при разных уровнях доверительной веро­ ятности.

Частным случаем применения преобразования Фишера является график, приведенный на рис. 6.2.

Одной из важных задач гидрологических расчетов, решаемых с использованием аппарата линейной корреляции, является приве­ дение параметров рядов гидрологических величин, определенных по имеющейся короткой вы­ борке, к многолетнему пе­ риоду. Физической основой такого решения является синхронность, наблюдаемая в колебаниях исследуемой гидрологической величины и какой-либо гидрометеороло­ гической характеристики, корреляционно связанной с этой величиной. При этом имеется в виду, что характе­ ристика (аргумент) зафик­ сирована в течение более продолжительного периода, чем интересующая нас ги­ дрологическая величина (функция).

Статистические связи синхронных наблюдений мо­ гут быть использованы в следующих двух видах. Од­ на форма использования ста­ тистической связи заключа­

ется в восстановлении интересующей нас гидрологической величины за весь период, по которому имеются данные о величине аргумента. Второе направление основано на использовании корреляционных уравнений, устанавливающих связь между значениями статистиче­ ских параметров (среднего и стандарта) на объекте, в отношении которого выполняется операция приводки, и объекте-аналоге.

Используя первый путь, мы как бы удлиняем короткий ряд, включая в него значения, вычисленные по уравнению регрессии. Такой восстановленный ряд позволяет определить его параметры, соответствующие периоду наблюдений на объекте-аналоге (сред­ нее значение, изменчивость), но, кроме того, содержит дополни­ тельную информацию о чередовании в многолетнем разрезе лет различной водности.

Следует, однако, иметь в виду, что такой восстановленный ряд не точно воспроизводит наблюдавшиеся в прошлом значения рас­ сматриваемой характеристики. Дело заключается в том, что вели­ чины функции (в данном случае восстановленной величины у),

получаемые по уравнению регрессии, представляют собой среднее

325


значение из множества реализаций при фиксированном значении аргумента х,-. Действительные же индивидуальные значения функ­ ции у более или менее значительно отклоняются от линии регрес­

сии. Замена этих рассеивающихся вокруг линии регрессии величин их математическим ожиданием и приводит к тому, что восстанов­ ленный ряд отличается от действительного сглаженностью колеба­ ний. С. Н. Крицкий и М. Ф. Менкель [82] указывают, что действи­ тельное значение коэффициента вариации рассматриваемой гидро­ логической величины (С„) равно С'/г, где С' — коэффициент

вариации, полученный по ряду, восстановленному с использованием уравнения регрессии, а г — коэффициент корреляции уравнения ре­

грессии. Аналогичным образом, чтобы в удлиненном ряду сохра­ нить общий характер колебаний переменной у, выражаемый дей­

ствительным значением коэффициента вариации С„, следует уве­

личить

отклонения, у у,

вычисленные по уравнению регрессии,

в 1/г раз.

расчет по исходному уравнению ре­

Эта

операция приводит

грессии к случаю, когда r= 1, что равносильно использованию так

называемого «единого» решения, отвечающего уравнению

°дг при котором линии регрессии у по х и х по у совпадают. Подобный

результат получается также при применении так называемого спо­ соба Г. П. Иванова. Сущность его заключается в том, что на изу­

чаемый объект

с объекта-аналога

переносится не величина

°-^—{Хг х ),

а значение обеспеченностей Рх. , которые

характерн­

ая;

 

°У ,

1

 

зуют величины

 

 

—-(x j— х).

 

 

 

 

Ох

 

 

Для нормально распределенных совокупностей перенос с ана-

лога величин

— (х,-— х) или величин

Рх . означает

выполнение

 

а*

1

 

тождественной операции, различающейся лишь внешним оформ­ лением.

При асимметричных законах распределения вероятностей прием Иванова более правомерен, так как величины Рх ., полученные по

эмпирической кривой обеспеченности, отражают и свойственную ей асимметрию.

Следует иметь в виду, что при низких значениях коэффициента корреляции ряды, восстановленные с учетом поправки, равной 1/г, не отражают колебания рассматриваемой величины за конкретный отрезок времени, к которому относятся используемые при расчете наблюдения за колебаниями аргумента х.

Восстановленная часть ряда становится некоторым типовым примером, передающим лишь характер свойственных рассматри­ ваемому ряду колебаний, а не воспроизводящим их в конкретный календарный отрезок времени.

3 2 6