Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 292

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Когда п<100, критерием для проверки'Нулевой гипотезы берется

г Ум — 2

У1 — г2 ’

Нулевая гипотеза отвергается, если t ^ t st для k — n—2 и взято­ го уровня вероятности (Р). Это значит, что в генеральной сово­ купности р^О и, следовательно, выборочный коэффициент корреляции достоверно отличается от нуля, между X и У сущест­ вует корреляционная связь. При t < tst нулевая гипотеза сохраня­ ется, отклонение выборочного коэффициента корреляции от нуля считается чисто случайным. Например, на выборке п = 36 получен г = 0,46. Нужно оценить эту величину. Критерий достоверности

t = 0,46 У36 — 2 =

2,682 _ а п

У 1 -

0,462

0,888

По таблице Стьюдента

(табл. V приложений) для &= 36—2 =

= 34 и Р = 0,01 находим tst = 2,58. Так как t

= 3,0> 4; = 2,58, нуле­

вая гипотеза отвергается.

 

Когда под руками имеется специальная таблица для оценки

достоверности выборочного коэффициента

корреляции, необхо­

димость расчета критерия t отпадает. Такая таблица приводится в приложениях под № XV. В ней указаны максимальные .('крити­ ческие) значения, которые может иметь выборочный коэффици­ ент корреляции при условии, что р= 0, т. е. принятии нулевой гипотезы. Если выборочный коэффициент корреляции превосхо­ дит указанную в таблице величину для k — n—2 и принятого уров­ ня вероятности Р, нулевая гипотеза отвергается. Так, относитель­ но взятого выше примера для Р = 0,01 и k = 34 в табл. XV находим 0,42. Выборочный г = 0,46 превосходит эту критическую величину, что позволяет отвергнуть нулевую гипотезу.

МЕТОД Z (ЗЕТ)

На малочисленных выборках оценка коэффициента корреля­ ции описанным выше способом* может оказаться недостаточно точной. Дело в том, что в силу присущих коэффициенту корреля­ ции свойств (принимать значения только в пределах от —1 до + 1) его распределение обнаруживает левостороннюю асиммет­ рию, отклоняясь от нормальной кривой тем сильнее, чем абсо­ лютное значение коэффициента корреляции ближе к единице.

Обойти затруднения в оценке выборочного коэффициента кор­ реляции, связанные с указанными особенностями его распреде­ ления, позволяет предложенный Р. Фишером метод «зет». Фишер предложил вместо коэффициента корреляции для его оценки ис­ пользовать связанную с ним вспомогательную величину Z (зет):

175


1 1 - 4 - г

Z =

1 -f- г

(95)

Z = — ln —— , или

1,15129 lg -—^— .

Распределение этой величины мало зависит от численности

вы­

борки и от значения коэффициента

корреляции в генеральной

совокупности. Преимущество Z

(зет)

перед г заключается в том,

что Z, меняя свое значение от —оо до + о о , быстро приближается к нормальному распределению при возрастании числа наблюде­ ний (п). Поэтому показатель «зет» дает особенно надежные результаты на малых выборках, так как именно в этих случаях эмпирический коэффициент корреляции может сильно отличать­ ся от своего значения в генеральной совокупности. Фишер пока­ зал, что даже при значениях, близких к единице, вычисляемый на малых выборках, показатель Z распределяется почти нормаль-

„ 2

1

но с дисперсией oz =

-----—.

 

п — і

Преобразование коэффициента корреляции в показатель «зет» производится по специальной таблице, составленной Фише­ ром (см. приложения табл. XVI). В этой таблице указаны значе­ ния Z, соответствующие разным величинам коэффициента кор­ реляции.

Критерием достоверности показателя «зет» служит следую­

щее выражение:

2

^ = _ = Z y n - 3. Oz

Этот критерий пригоден как для малых, так и для больших выбо­ рок; он используется во всех случаях, когда вместо коэффициен­ та корреляции берется соответствующее ему значение Z (зет).

Для оценки достоверности и установления доверительного интервала, по которому с достаточной вероятностью можно су­ дить о величине коэффициента корреляции в генеральной сово­ купности поступают следующим образом. По значению эмпири­ ческого коэффициента корреляции в табл. XVI приложений на­ ходят значение Z (зет). Затем определяют величину ошибки по­ казателя «зет» по формуле

0z = - = L = .

(96)

■j/n-3

 

По отношению Z к своей ошибке находят значение критерии tz, который сравнивается со стандартом по таблице Стьюдента для

принятого уровня

значимости (Р) и

числа

степеней свободы

k = n—2. По величине максимальной

погрешности — AZ = £ÖZ

находят границы

доверительного интервала

для генерального

параметра. Например, на выборе п 28 получен г = 0,52. Чтобы оценить эту величину, в табл. XVI приложений находим: Z = 0,576.

176


Затем

вычисляем ошибку oz = ■

= — = 0,20, откуда

 

У28 — 3

5

^2 = 0,576^ 25 = 2,88. По таблице Стьюдента

(табл. V приложе­

ний)

для k = 28—2= 26 и Р= 0,05 находим

tst = 2,06. Поскольку

іф= 2,88>tst = 2,06, нулевая гипотеза «е сохраняется.

По величине Az=taz = 1,96X0,20 = 0,392 находим границы до­ верительного интервала для показателя «зет»:

нижняя граница=0,576—0,392 =0,184 верхняя граница = 0,576+0,392=0,968

Пользуясь табл. XVI приложений, переводим значения «зет» в величины коэффициента корреляции и находим его доверитель­ ные границы:

нижняя граница = 0,18 верхняя граница = 0,74

Это значит, что величина коэффициента корреляции в генераль­ ной совокупности находится между пределами 0,18<г<0,74. Можно сказать, что эмпирический коэффициент корреляции г = 0,52 определен с достаточной точностью.

МИНИМАЛЬНОЕ ЧИСЛО НАБЛЮДЕНИИ ДЛЯ ПЛАНИРУЕМОЙ ТОЧНОСТИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ

Статистическая недостоверность эмпирического коэффициен­ та корреляции еще не доказывает, что связи между варьирующи­ ми признаками нет. При достаточном числе наблюдений эта связь может выявиться достоверно. Рассчитать необходимый объем выборки для планируемой точности коэффициента корре­ ляции можно по формуле

й

« = у 2+ 3 ,

(97)

где п -искомая численность парных наблюдений, т. е. объем выборки; tz — заданная по принятому порогу доверительной ве­ роятности величина критерия достоверности «зет». Например,

для г = 0,25 и л=і20 величина 2 = 0,2554, откуда ^ = 0,25541/17 = = 1,05. Для Р = 0,05 и £ —20—2 = 18 tst = 2,10. Видно, что при t$<tsu нулевую гипотезу отвергнуть нельзя. Какое же число на­ блюдений надо провести, чтобы с вероятностью Р = 0,95 сделать окончательный вывод о достоверности (или недостоверности) корреляции между интересующими нас признаками Х и У? Используя формулу 97 и памятуя о том, что вероятности Р = 0,95 соответствует t= 1,96, находим:

(1,96)8

3

3,842

(0,2554)2

3 = 59 + 3 = 62.

 

0,065 '

177


Итак, чтобы удовлетворить поставленной задаче, необходимо провести не менее 62 наблюдений.

ОЦЕНКА РАЗНОСТИ МЕЖДУ КОЭФФИЦИЕНТАМИ КОРРЕЛЯЦИИ

Метод «зет» позволяет оценить достоверность разности меж­ ду эмпирическими коэффициентами корреляции, вычисленными на независимых выборочных совокупностях. Ошибка разности Zi — Z2 определяется по формуле

 

1

m° z

(98)

«2— 3

 

Критерием достоверности оценки служит отношение разности Z1 — Z2 к своей ошибке. Например, измеряя зависимость между длиной колосьев (см) и количеством содержащихся в них зерен у озимой ржи в одном случае на выборке «і = 50 коэффициент корреляции оказался равным /т = +0,56, а в другом на выборке

«2 = 44—-г2 = +0,48.

Разница

г\—г2 = 0,56—0,48 = 0,08.

Нужно

выяснить, случайное это расхождение или нет. По табл. XVI при­

ложений находим сответственно Z\ = 0,633 и Z2 = 0,523.

Критерий

достоверности —

 

 

 

 

 

,

0,633 — 0,523

0,11

 

tD = ------’

--------■=

.......... - = 0,52.

 

л/

1

 

1

У0,0456

 

*

50 — 3 +

44 — 3

 

 

Так как для Р 0,95 tst = 1,96,

а /с = 0,52<4< = 1,96, необходимо

признать, что наблюдаемая разница мехсду коэффициентами кор­ реляции носит случайный характер.

ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ НА МАЛЫХ ВЫБОРКАХ

На выборках небольшого объема коэффициент корреляции вычисляется, не прибегая к распределению выборочного матери­ ала в вариационные ряды и группировке его в корреляционную таблицу. Для примера используем данные о весе 20 новорожден­ ных павианов-гамадрилов и весе их матерей, измеренном в нача­ ле беременности (табл. 56).

Предполагается, что между весом матерей и весом их приплода существует прямолинейная положительная связь. Вычислим для этих данных коэффициент корреляции. Можно воспользоваться приведенными выше формулами Пирсона или Браве. Но проще рассчитывать коэффициент корреляции по следующим рабочим

формулам:

n'Lxy — 2хХ2г /

 

 

г =

— ,

(99)

----------

У«2х2 -

(Ех)2 X У«2у2-

(2у )2

 

178


 

 

 

 

Т а б л и ц а 56

Вес матерей (кг) (X)

Вес их детенышей

Вес матерей (Л:)

Вес их детенышей

(кг) (Y)

 

10,0

0,70

 

14,5

0,70

10,8

0,73

 

11,0

0,65

11,3

0,75

'

12,0

0,72

10,0

0,70

11,8

0,69

10,1

0,65

 

13,4

0,78

11,1

0,65

 

11,4

0,70

11,3

0,70

 

12,0

0,60

10,2

0,61

 

15,6

0,85

13,5

0,70

 

13,0

0,80

12,3

0,63

 

12,1

0,75

Ъху Пху

( 100)

 

У ( 2 л:2 пх2) (2у2пу2)

 

 

 

__

2 ху — 1/га (2лг2г/)

 

 

( 101)

 

 

 

Dx

Dy

 

 

 

 

 

 

 

 

 

 

 

У

Dy

ZX

 

 

( 102)

 

 

 

X

 

 

 

 

 

 

2 у/)* X

 

 

 

где

 

( 2 * ) 2

 

 

 

Ѵ уѴ

 

Д* =

2л:2

Dy = 2 у2

 

п

1

п

 

 

 

 

 

 

 

 

и

Dd = 2d2 -

(2d)2 _

 

 

п

>

 

 

 

 

 

 

 

 

 

 

через X и у обозначены

парные

варианты признаков

X и Y;

X и у — средние

арифметические; d = x—у и п — число

парных

наблюдений или объем выборки.

 

 

 

 

 

Чтобы использовать ту или иную из'приведенных формул, не­ обходимо предварительно найти вспомогательные значения 2 ху, 2 л:2 2 у2и др. Расчет их показан в табл. 57. По итоговым данным

этой таблицы находим средние арифметические:

 

X

237,4

 

_

14,06

кг. Определяем суммы

= ------ - = 11,87

кг и у —

-------= 0,703

 

20

У

20

 

 

квадратов отклонении:

 

 

 

 

£>*=2861,60

(237,4)2

 

(14,06)2

 

20

= 43,662; Dy= 9,9598

20

 

 

 

 

 

=

0,0756; Dd = 2535,7218 -

(223,34)2

41,6840.

Подставляем

20

 

 

 

 

 

 

179