Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 304

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

А также:

 

2(Xj — х) (Уі — у)

Ь у / х

Е(х і-

(128)

 

х)2

— 2(*» — а) і ~~у)

(128а)

 

~Ъ ( У і - у ) г

По формулам 126, 127, и 128 определяется среднее (ожидаемое) значение У при изменении на единицу меры X, а по формулам 126а, 127а и 128а находят среднюю величину х ѵ при изменении на единицу меры признака У. Например, коэффициент корреля­

ции между весом

(У) и годовым удоем (X) коров горбатовской

породы /- = 0,527

(см. предыдущую главу); оѵ = 3,015 кг и

<тх=2,86 кг. Так как эти показатели вычислялись на интервальных вариационных рядах, то необходимо учесть и величины классо­ вых интервалов: % = 15 кг и г* =150 кг. Отсюда находим:

 

3,015 X

15

23,83

Ьу/х =

0,527 X 2,86 X

150

= 0,055 кг,

429,0

Ьх/У=

2,86 X 150

226,08

0,527 X

15

5,02 кг.

 

3,015 X

45,23"

Это значит, что увеличение годового удоя на 1 кг соответству­ ет увеличению живого веса коров в среднем на 0,055 кг. А увели­ чению веса коров на 1 кг соответствует возрастание годового удоя в среднем на 5,02 кг.

Если судить о прибавках живого веса и удоя коров по отно­ шениям между средними арифметическими этих признаков, ко­ торые равны по удою х = 2228,5 кг, по весу г/= 349,75 кг, то полу­ чается, что на 1 кг живого веса коров приходится в среднем 2228,5: 349,75 = 6,4 кг молока, а прибавка годового удоя на 1 кг связана с увеличением живого веса коров в среднем на 349,75:2282,5 = 0,16 кг. Сравнивая эти показатели с величинами коэффициента регрессии, видим, что они не совпадают: отноше­ ния средних арифметических дают более высокие результаты, чем значения коэффициента регрессии. Причина этого явления заключается в том, что отношения средних арифметических не учитывают корреляционную зависимость между признаками, по­ тому и не могут служить точным показателем регрессии У по X и X по У. Из этого примера видно значение коэффициента регрес­ сии в оценке относительных прибавок величины одного призна­ ка по изменяющимся значениям другого связанного с ним приз­ нака.

Коэффициент регрессии определяет углы наклона плоскости, образуемой линиями регрессии в системе координат, к осям абс­ циссы и ординаты. На коэффициенте регрессии хорошо выясняет-

238


ся связь между регрессией и корреляцией. Если средние квадра­ тические отклонения двух сопряженных рядов равны между со­ бой, т. е. Оу= ах, то отношение между ними равно единице. В таком случае, как это следует и из формул 126 и 126а, между коэффициентом корреляции и коэффициентом регрессии осуще­ ствляется равенство r = by/x=bx/y.

По значениям коэффициента регрессии Ьу/Х и Ьх/Ѵопределяет­ ся коэффициент корреляции, который есть не что иное, как сред­ няя геометрическая из коэффициента регрессии У по X и X по У,

т. е.

 

г == УЬу/х X Ьх/у.

(129)

Указанная зависимость между коэффициентами регрессии и корреляции расширяет и углубляет наши представления об этих показателях, характеризующих линейную зависимость между пе­ ременным Х и У. Эта зависимость позволяет, во-первых, контро­ лировать правильность расчета коэффициента корреляции по из­ вестным значениям коэффициента регрессии, а во-вторых, опре­ делять неизвестную величину коэффициента корреляции по известным значениям коэффициента регрессии.

Как и коэффициент корреляции, коэффициент регрессии ха­ рактеризует только линейную связь, когда приращения одной пе­ ременной У пропорциональны приращениям другой переменной величины X. И так же, как и коэффициент корреляции, коэффи­ циент регрессии может иметь положительный ( + ), либо отрица­ тельный (—) знак, что зависит от направления связи. Но в отли­ чие от коэффициента корреляции, выражающего зависимость между признаками У и У в нормированных отклонениях, коэф­ фициент регрессии выражает ее в принятых единицах измерения. Коэффициент корреляции — число не именованное, а значения коэффициента регрессии — числа именованные.

Одна из характерных особенностей регрессионного анализа заключается в том, что он позволяет исследовать корреляцион­ ную зависимость между признаками даже при очень малых чис­ лах парных значений признаков. Возьмем соответствующий при­ мер. По данным Т. А. Скворцовой (1956), в роде синиц наблюда­ ется зависимость между весом мозга, выраженном в процентах от веса тела, и двигательной активностью птиц, измеряемой ко­ личеством прыжков, которые птица совершает в течение одного часа. Эти данные вместе с расчетом вспомогательных значений 2у, 2х, 'Lxy, Ъу2и 2х2 приведены в табл. 80. Воспользуемся ими и найдем эмпирическое уравнение и коэффициент регрессии для этих данных.

Средние

арифметические

признаков

У и А и их

квадраты

равны:

 

 

 

 

26,8

6,7; у2 = 44,89;

14,1

= 3,5; я2 =

12,25.

У — - =

* = - ^ -

239


Т а б л и ц а 80

 

 

Средний

Среднее

 

 

 

 

Вес

число

 

 

 

 

нес мозга

 

 

 

Виды синиц

тела

прыжков

 

ь 2

ж3

в % к весу

X IJ

 

(г)

тела ( Y)

в 1 ч.

 

 

 

 

 

 

(тыс .) ( X)

 

 

 

Большая синица Q.-J .-J

15,8

5,5

2,5

13,75

30,25

6,25

Л а зо р е в к а .................

9,9

7,1

3,7

26,27

50,41

13,69

М о с к о в к а ..................

7,7

8,4

5,5

46,20

70,51

30,25

Длиннохвостая . . .

7,7

5,8

2,4

13,92

33,64

5,76

Сумма . . .

26,8

14,1

100,14

184,86

55,95

Определяем коэффициент регрессии У по X и X по У:

Ъху — пху

_ 100,14 — 4 X 6 ,7 X 3 ,5

_ 6,34

Их2 — пх2

~~

55,95 —

4 X 12,25

 

— 6^95

Ъху пху

 

6,34

 

6,34

= Ъу2 — пу2 ~

184,86 -

4 X 44,89

5,30

а — у by/x X =

6,7 — 0,91 X 3,5 = 6,7

— 3,185 = 3,52,

откуда уравнение регрессии У по X

Ух = 0,91л: + 3,52.

По этому уравнению можно определить ожидаемые значения веса (ух) по показателям двигательной активности птиц (X). Именно: эмпирические данные

вес мозга синиц

(у):

5,5

7,1

8,4

5,8

вычисленные по

уравне­

 

 

 

нию регрессии

(ух):

5,8

6,9

8,5

5,7

Зная величины Ьу/Х и Ьх/Ѵ,

можно

определить коэффициент

корреляции между этими признаками:

 

 

t

г = уо,91 X 1,07 = У097“= 0,98.

Показатели корреляции в данном случае оказались весьма высо­ кими. Следует, однако, иметь в виду, что при наличии малочис­ ленного1ряда регрессии показатели корреляционной зависимо­ сти— коэффициенты регрессии и корреляции — могут оказаться завышенными.

Также нужна большая осторожность при экстраполяции ли­ нии регрессии за пределы исследованного периода. Линия рег­ рессии, выходя за указанные пределы, может изменить свое на­ правление и линейная экстраполяция в таких случаях не даст обнадеживающих результатов.

240


ОЦЕНКА ДОСТОВЕРНОСТИ ПОКАЗАТЕЛЕЙ РЕГРЕССИИ

Показатели регрессии, как и всякие другие выборочные пока­ затели, являются величинами случайными: их значения могут не совпадать с соответствующими значениями в генеральной сово­ купности. Для измерения возможной погрешности, с какой опре­ деляются выборочные показатели относительно своих генераль­ ных параметров, служат ошибки репрезентативности, позволяю­ щие с той или иной вероятностью устанавливать доверительные границы для генеральных параметров по данным выборочных наблюдений, оценивать статистическую достоверность показате­ лей регрессии.

ОШИБКА РЕПРЕЗЕНТАТИВНОСТИ ЛИНЕЙНОЙ РЕГРЕССИИ

Когда известны средние квадратические отклонения и коэф­ фициент корреляции выборочных распределений, ошибка коэф­ фициента регрессии определяется по следующим аналогичным формулам:

СГу -| /

1 — г 2

(130)

тЪух = — I /-------— и

Ох 1

п — 2

 

0x1 /

1 — f2

 

т Ъху = — \

-------(130а)

 

Оу '

п — 2

 

Если средние квадратические отклонения вычислялись на ин­ тервальных рядах, то при вычислении ошибок по указанным фор­ мулам сигмы должны умножаться на величину классовых интер­ валов, т. е. в знаменателе и числителе должны быть оѵХ іѵ и ОхХіх■ Например, ошибка коэффициента регрессии веса (У) по годовому удою (X) коров горбатовской породы определяется следующим образом:

ІТІЬух

3,015 X 15-|/

1 -(0 ,5 2 7 )2 = 0,1054 X 0,0854 = 0,009 кг.

2,86 X 150 »

 

1 0 0 -2

Ошибка коэффициента регрессии удоя по весу коров

_

2,86 X

150

-|/

1 —(0,527)2

тЬѵх ~~ 3,015 X

15

'

= 9,48 X 0,0854 == 0,809 кг.

1 0 0 - 2

Достоверность коэффициента регрессии оценивается по кри­ терию Стьюдента с числом степеней свободы k — n — 2. В данном

0,055

^

5,02

„ й

случае tv/x = ^

= 6,1 п tx/y =

— — =

6,2. В обоих случаях

t~>3, что свидетельствует о достоверности этих показателей.

241


Ошибку коэффициента регрессии можно вычислить, минуя определение средних квадратических отклонений по следующим формулам:

 

2а,

(2ахау)2

 

 

2 а*2

 

ІТІЬух

 

(131)

(л - 2 ) Х 2 а *

 

ffl-bxy

 

Ъа\

(131а)

( п -

2) Х

2 а 2

 

где ау и ах — отклонения вариант

от

средних арифметических,

т. е. ау= (уі у) и а* = (х{ — х).

 

 

 

Ошибка разности между сравниваемыми коэффициентами ре­ грессии оценивается по следующей формуле:

mdb

ГПу

тп2

У2 ( * * - * ) 2

(132)

 

Ъ (у г - у )2’

где mx и my — ошибки коэффициентов регрессии.

Если сравниваемые коэффициенты регрессии вычислены на малочисленных выборках, то ошибка их разности должна опре­ деляться по формуле

mdb = 1/

I

X

1

1

 

{пх — 2) пгх А- (пу— 2) ml

 

( ^ - 2 ) + К - 2 )

—*)2 Ъ(у— уУ

(133)

Критерий достоверности различий между выборочными коэффи­

циентами регрессии — Ы =

— — — ^stst (k = пх

+

пѵ — 4) —

mdb

 

оценивается по таблице Стьюдента.

По идее и по существу линия регрессии, построенная на основании эмпирических данных по способу наименьших квад­ ратов, выполняет в регрессионном анализе такую же роль, какая принадлежит средней арифметической в любой выборочной со­ вокупности. И как величина случайная, линия регрессии, как и средняя арифметическая, сопровождается ошибкой репрезента­ тивности. Ошибка линейной регрессии У по X характеризует сопряженную вариацию значений У возле х у по заданным зна­ чениям X, и наоборот, ошибка регрессии X по У характеризует

242