Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 305

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

варьирование значений X возле ух по заданным значениям У. Варьирование значений случайной величины вокруг их средней арифметической измеряется, как известно, средним квадрати­ ческим отклонением. А так как линия регрессии уподобляется средней арифметической выборочной совокупности, то ее «ошиб­ ку» будем обозначать символами Оу/д-и Ох/у', она вычисляется по следующим аналогичным формулам:

Оу/х = ОуУ1— г2,

(134)

ах/у — ОхУ1 — г2,

(134а)

где Оу и ох — средние квадратические отклонения рядов У и X,

а величина У 1—г2, называемая коэффициентом

алиенации

(F. Kelley, 4919), служит поправкой на сопряженность между переменными X и Y.

Для рассмотренного выше примера ошибка регрессии окруж­ ности груди по длине тела у мужчин оказывается следующая:

0у/х = оу У 1 - г2 = 2,43 У 1 - 0,887 = 2,43 X 0,34 = 0,83.

Если известны теоретически вычисленные значения линейной регрессии, ее ошибку можно определить по разности между фак­ тически наблюдаемыми и вычисленными по способу наименьших квадратов значениями по следующим аналогичным формулам:

Оу/х

■ ' Ъ { У і - у х)г

(135)

Ох/у

 

(135а)

В числителе этих формул суммы квадратов разности между эм­ пирическими и вычисленными значениями членов ряда; п — чис­ ло членов, составляющих ряд регрессии.

Применим одну из этих формул к тому же примеру. По табл. 78

рассчитана 2 (г/т — ух)2 = 9,32. Отсюда

оу/х =

=У0,716 = 0,84. Получился тот же результат, что и выше. Не­

большая неточность расчета объясняется приближенными вычис­ лениями, связанными с округлением дробных чисел.

243


ДОВЕРИТЕЛЬНАЯ ЗОНА ЛИНЕЙНОЙ РЕЕРЕССИИ

Ошибка регрессии позволяет определить вероятную зону, или область, тех случайных отклонений выборочной линии, в пре­ делах которых находится истинная линия регрессии, т. е. ли­ нейная регрессия генеральной совокупности. Максимальная ошибка репрезентативности или погрешность (А) выборочной линии регрессии выражается следующими формулами:

 

AylX-- tOy/x

(136)

и

Ах/у — tOxty*

(136а)

Отсюда линейная регрессия, с учетом возможной максимальной погрешности, может быть выражена в виде следующих урав­ нений:

Ух — (п “У Ьу/х%') it töy/x'

(13/)

Ху = (а + Ьх/уу) ± tax/у.

(137а)

По этим уравнениям можно определить доверительные границы линии регрессии для любого порога вероятности (Р). Так, имея в виду, что в пределах от у — За до г/+ 3а заключены почти все 100% вариант нормально распределяемой совокупности, по ошибке регрессии а х,у =0,84 определяем величину максимальной

погрешности А у/Х=3-0,84 = 2,52 = 2,5

см. Откладывая

эту вели­

чину в обе стороны от теоретически

высчисленной

по способу

наименьших квадратов линии регрессии, получим границы дове­ рительного интервала для принятого порога доверительной ве­

роятности Р = 0,997. Именно, для

первой

точки //*= 80,7 (см.

табл. 78) находим:

 

 

 

н и ж н ю ю

гр а н и ц у = 8 0 ,7 —

2,5 = 7 8 ,2

 

верхню ю

границу = 80,7 + 2,5 = 83,2

и т. д.

Проводя через точки, обозначаемые границы доверительного ин­ тервала, прямые (вдоль линии регрессии), получаем так назы­ ваемую доверительную зону возможных (случайных) отклонений выборочной линии регрессии от ее положения в генеральной со­ вокупности. На рис. 23 пунктиром изображены границы дове­ рительной воны линии регрессии У по X.

Анализ эмпирических регрессий имеет большое практическое значение. По уравнению регрессии можно оценить, например, физическое развитие отдельно взятого индивида по отношению принятой нормы для популяции, дать групповую оценку состоя­ нию отдельных категорий населения при известных стандартах или показателях генеральной совокупности и т. д. При нормаль­ ном распределении признаков, между которыми установлена корреляционная связь, в интервале у х ± а х/ ѵ или х у — а у/х заклю­ чено около 68% всех вариант данной совокупности. А в интер­ вале ух± 2ІзОхіу или х у± 2/зОуіх находится половина всех вариант

244


нормально распределенной совокупности. Если варианты, за­ ключенные в этом интервале, считать «нормальными», то осталь­ ные, распределяющиеся за этими пределами, можно рассматри­ вать как отстоящие ниже или выше принятой «нормы». Таким образом получается объективная основа для сравнительной оцен­ ки отдельных вариант по отношению к принятой норме популя­ ции. Границы доверительного интервала в таких случаях уста­ навливаются следующим образом. Представим, что у самки павиана-гамадрила весом 12,6 кг родился детеныш с весом, рав­ ным 0,65 кг. Спрашивается, нормальный это вес или нет? Урав­ нение регрессии веса новорожденных гамадрилов по весу их матерей нам известно: ух = 0,03543 х + 0,283. Ошибка линии регрессии оказалась равной ау/х= 0,06 кг. Для вероятности Р = = 0,95, которой соответствует ^ = 1,96, имеем:

Рис. 23. Доверительная зона регрессии окружности груди по длине тела у мужчин:

на оси абсцисс — длина тела (рост) мужчин (см), на оси ординат — окружность груди (см)

ух= (0,03543X12,6 + 0,283) ±1,96-0,06, или ^ж=0,73±0,12. От­ куда границы доверительного интервала для принятого порога вероятности оказываются равными:

нижняя граница —0,73—0,12 = 0,61 кг верхняя граница = 0,73+0,12 = 0,85 кг

Видно, что вес новорожденного (0,65 кг) не выходит за пределы доверительных границ случайных отклонений. Следовательно, его можно считать нормальным.

Если количественной оценке подлежат не отдельные индиви­ ды, а выборочные группы с их средними характеристиками, то границы доверительного интервала для групповых средних ли­

245

нейной регрессии устанавливают по заданному порогу довери­ тельной вероятности по следующей формуле:

у = (а + Ьѵ/хх ) ± ^ — ,

(138)

І п — 1

 

где п — объем оцениваемой выборочной группы.

Например, антропологическое обследование учащихся млад­ ших классов в школах №-й области показало, что их средний вес равен х = 29,6 кг, а средний рост г/= 136,0 см. Корреляция меж­ ду весом и ростом учащихся выразилась показателем г=+0,69. Уравнение регрессии веса по возрасту оказалось следующим:

х ѵ — 0,811 у — 80,14

с ошибкой ах/у = 4,62 кг.

В одном из районов этой

области выборочно обследовано

50 учащихся младших классов восьмилетних школ. Их средний вес оказался равным 28,4 кг, а рост— 134,0 см. Можно ли на основании этих данных заключить, что учащиеся школ указан­ ного района несколько отстают по физическому развитию от из­ вестных средних показателей учащихся области по данным признакам?

Опираясь на полученные данные, устанавливаем доверитель­ ный интервал для первого порога вероятности /’= 0,95, которому

соответствует

1,96:

х =(0,811 X 134 + 80,14)+ 1,9 6 Х 4 - 2= 28,53+ 1,29 кг, Т/50 — 1

откуда доверительные границы интервала оказываются следу­ ющие:

нижняя=28,53—1,29=27,24 кг верхняя=28,53+1,29 = 29,82 кг

Так как

средний вес

обследованной

группы

учащихся

(х =

= 28,4 кг), соответствующий их среднему

росту

(у = 134,0

см),

находится

в

границах

доверительного

интервала

(от 27,2 до

29,8 кг),

то

с вероятностью Р = 0,95 его

можно

счйтать

нор­

мальным.

 

 

 

 

 

 

 

 

КРИВОЛИНЕЙНАЯ ЗАВИСИМОСТЬ

Корреляция между признаками может быть не только ли­ нейной, но и криволинейной. Последняя имеет место, когда рав­ новеликим изменениям одного признака X соответствуют нерав­ новеликие приращения величины другого признака У, корреля­ ционно связанного с первым. Криволинейная зависимость может иметь самые различные формы и описывается аналитически со­ ответствующими корреляционными уравнениями. Рассмотрим случаи наиболее типичных криволинейных связей, с которыми биологу приходится встречаться в своей работе.

246



Параболичекая зависимость

Нередко эмпирические ряды регрессии изображаются графи­ чески в виде параболической кривой. Применять к таким кривым уравнение линейной функции нельзя, так как оно не описывает такого вида зависимость между переменными величинами. Наи­ более подходящим в таких случаях оказывается уравнение па­ раболы общего вида:

у = о, -j- Ьх -j- сх2-j- dx3

(139)

Этот полином представляет развитие

линейной

функции у —

— а + Ьх путем увеличения степени при х.

Здесь у и х — перемен-

Рис. 24. Эмпирическая и вычисленная кривые лактации:

ча оси абсцисс — лактация, на оси ординат— удой коров в центнерах

ные величины, буквами а, b, с, d... обозначены параметры урав­ нения. В зависимости от того, на каком члене полинома оста­ новимся, будем иметь параболу первого, второго и больших порядков. Система нормальных уравнений для определения па­ раметров параболы второго порядка у= а + Ьх + сх2, которая обычно применяется в биологии, следующая:

2г/ = ап + ЬПх + сПх2— первое уравнение,

Пух = аНх + ЬПхг + сПх3— второе уравнение,

(140)

Пух2 = аПх2+ ЬПх3+ сПхі — третье уравнение.

Следовательно, для составления системы нормальных уравнений по эмпирическим данным необходимо определить значения Пу, Пх, Пух, Их2, Их3, Их4, Пух2.

247