ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 292
Скачиваний: 1
Когда п<100, критерием для проверки'Нулевой гипотезы берется
г Ум — 2
У1 — г2 ’
Нулевая гипотеза отвергается, если t ^ t st для k — n—2 и взято го уровня вероятности (Р). Это значит, что в генеральной сово купности р^О и, следовательно, выборочный коэффициент корреляции достоверно отличается от нуля, между X и У сущест вует корреляционная связь. При t < tst нулевая гипотеза сохраня ется, отклонение выборочного коэффициента корреляции от нуля считается чисто случайным. Например, на выборке п = 36 получен г = 0,46. Нужно оценить эту величину. Критерий достоверности
t = 0,46 У36 — 2 = |
2,682 _ а п |
|
У 1 - |
0,462 |
0,888 |
По таблице Стьюдента |
(табл. V приложений) для &= 36—2 = |
= 34 и Р = 0,01 находим tst = 2,58. Так как t |
= 3,0> 4; = 2,58, нуле |
вая гипотеза отвергается. |
|
Когда под руками имеется специальная таблица для оценки |
|
достоверности выборочного коэффициента |
корреляции, необхо |
димость расчета критерия t отпадает. Такая таблица приводится в приложениях под № XV. В ней указаны максимальные .('крити ческие) значения, которые может иметь выборочный коэффици ент корреляции при условии, что р= 0, т. е. принятии нулевой гипотезы. Если выборочный коэффициент корреляции превосхо дит указанную в таблице величину для k — n—2 и принятого уров ня вероятности Р, нулевая гипотеза отвергается. Так, относитель но взятого выше примера для Р = 0,01 и k = 34 в табл. XV находим 0,42. Выборочный г = 0,46 превосходит эту критическую величину, что позволяет отвергнуть нулевую гипотезу.
МЕТОД Z (ЗЕТ)
На малочисленных выборках оценка коэффициента корреля ции описанным выше способом* может оказаться недостаточно точной. Дело в том, что в силу присущих коэффициенту корреля ции свойств (принимать значения только в пределах от —1 до + 1) его распределение обнаруживает левостороннюю асиммет рию, отклоняясь от нормальной кривой тем сильнее, чем абсо лютное значение коэффициента корреляции ближе к единице.
Обойти затруднения в оценке выборочного коэффициента кор реляции, связанные с указанными особенностями его распреде ления, позволяет предложенный Р. Фишером метод «зет». Фишер предложил вместо коэффициента корреляции для его оценки ис пользовать связанную с ним вспомогательную величину Z (зет):
175
1 1 - 4 - г |
Z = |
1 -f- г |
(95) |
Z = — ln —— , или |
1,15129 lg -—^— . |
||
Распределение этой величины мало зависит от численности |
вы |
||
борки и от значения коэффициента |
корреляции в генеральной |
||
совокупности. Преимущество Z |
(зет) |
перед г заключается в том, |
что Z, меняя свое значение от —оо до + о о , быстро приближается к нормальному распределению при возрастании числа наблюде ний (п). Поэтому показатель «зет» дает особенно надежные результаты на малых выборках, так как именно в этих случаях эмпирический коэффициент корреляции может сильно отличать ся от своего значения в генеральной совокупности. Фишер пока зал, что даже при значениях, близких к единице, вычисляемый на малых выборках, показатель Z распределяется почти нормаль-
„ 2 |
1 |
но с дисперсией oz = |
-----—. |
|
п — і |
Преобразование коэффициента корреляции в показатель «зет» производится по специальной таблице, составленной Фише ром (см. приложения табл. XVI). В этой таблице указаны значе ния Z, соответствующие разным величинам коэффициента кор реляции.
Критерием достоверности показателя «зет» служит следую
щее выражение:
2
^ = _ = Z y n - 3. Oz
Этот критерий пригоден как для малых, так и для больших выбо рок; он используется во всех случаях, когда вместо коэффициен та корреляции берется соответствующее ему значение Z (зет).
Для оценки достоверности и установления доверительного интервала, по которому с достаточной вероятностью можно су дить о величине коэффициента корреляции в генеральной сово купности поступают следующим образом. По значению эмпири ческого коэффициента корреляции в табл. XVI приложений на ходят значение Z (зет). Затем определяют величину ошибки по казателя «зет» по формуле
0z = - = L = . |
(96) |
■j/n-3 |
|
По отношению Z к своей ошибке находят значение критерии tz, который сравнивается со стандартом по таблице Стьюдента для
принятого уровня |
значимости (Р) и |
числа |
степеней свободы |
k = n—2. По величине максимальной |
погрешности — AZ = £ÖZ — |
||
находят границы |
доверительного интервала |
для генерального |
параметра. Например, на выборе п —28 получен г = 0,52. Чтобы оценить эту величину, в табл. XVI приложений находим: Z = 0,576.
176
Затем |
вычисляем ошибку oz = ■ |
= — = 0,20, откуда |
|
У28 — 3 |
5 |
^2 = 0,576^ 25 = 2,88. По таблице Стьюдента |
(табл. V приложе |
|
ний) |
для k = 28—2= 26 и Р= 0,05 находим |
tst = 2,06. Поскольку |
іф= 2,88>tst = 2,06, нулевая гипотеза «е сохраняется.
По величине Az=taz = 1,96X0,20 = 0,392 находим границы до верительного интервала для показателя «зет»:
нижняя граница=0,576—0,392 =0,184 верхняя граница = 0,576+0,392=0,968
Пользуясь табл. XVI приложений, переводим значения «зет» в величины коэффициента корреляции и находим его доверитель ные границы:
нижняя граница = 0,18 верхняя граница = 0,74
Это значит, что величина коэффициента корреляции в генераль ной совокупности находится между пределами 0,18<г<0,74. Можно сказать, что эмпирический коэффициент корреляции г = 0,52 определен с достаточной точностью.
МИНИМАЛЬНОЕ ЧИСЛО НАБЛЮДЕНИИ ДЛЯ ПЛАНИРУЕМОЙ ТОЧНОСТИ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ
Статистическая недостоверность эмпирического коэффициен та корреляции еще не доказывает, что связи между варьирующи ми признаками нет. При достаточном числе наблюдений эта связь может выявиться достоверно. Рассчитать необходимый объем выборки для планируемой точности коэффициента корре ляции можно по формуле
й
« = у 2+ 3 , |
(97) |
где п —-искомая численность парных наблюдений, т. е. объем выборки; tz — заданная по принятому порогу доверительной ве роятности величина критерия достоверности «зет». Например,
для г = 0,25 и л=і20 величина 2 = 0,2554, откуда ^ = 0,25541/17 = = 1,05. Для Р = 0,05 и £ —20—2 = 18 tst = 2,10. Видно, что при t$<tsu нулевую гипотезу отвергнуть нельзя. Какое же число на блюдений надо провести, чтобы с вероятностью Р = 0,95 сделать окончательный вывод о достоверности (или недостоверности) корреляции между интересующими нас признаками Х и У? Используя формулу 97 и памятуя о том, что вероятности Р = 0,95 соответствует t= 1,96, находим:
(1,96)8 |
3 |
3,842 |
(0,2554)2 |
3 = 59 + 3 = 62. |
|
|
0,065 ' |
177
Итак, чтобы удовлетворить поставленной задаче, необходимо провести не менее 62 наблюдений.
ОЦЕНКА РАЗНОСТИ МЕЖДУ КОЭФФИЦИЕНТАМИ КОРРЕЛЯЦИИ
Метод «зет» позволяет оценить достоверность разности меж ду эмпирическими коэффициентами корреляции, вычисленными на независимых выборочных совокупностях. Ошибка разности Zi — Z2 определяется по формуле
|
1 |
|
m° z |
(98) |
|
«2— 3 |
||
|
Критерием достоверности оценки служит отношение разности Z1 — Z2 к своей ошибке. Например, измеряя зависимость между длиной колосьев (см) и количеством содержащихся в них зерен у озимой ржи в одном случае на выборке «і = 50 коэффициент корреляции оказался равным /т = +0,56, а в другом на выборке
«2 = 44—-г2 = +0,48. |
Разница |
г\—г2 = 0,56—0,48 = 0,08. |
Нужно |
||
выяснить, случайное это расхождение или нет. По табл. XVI при |
|||||
ложений находим сответственно Z\ = 0,633 и Z2 = 0,523. |
Критерий |
||||
достоверности — |
|
|
|
|
|
, |
0,633 — 0,523 |
0,11 |
|
||
tD = ------’ |
--------■= |
.......... - = 0,52. |
|
||
л/ |
1 |
|
1 |
У0,0456 |
|
* |
50 — 3 + |
44 — 3 |
|
|
|
Так как для Р —0,95 tst = 1,96, |
а /с = 0,52<4< = 1,96, необходимо |
признать, что наблюдаемая разница мехсду коэффициентами кор реляции носит случайный характер.
ВЫЧИСЛЕНИЕ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ НА МАЛЫХ ВЫБОРКАХ
На выборках небольшого объема коэффициент корреляции вычисляется, не прибегая к распределению выборочного матери ала в вариационные ряды и группировке его в корреляционную таблицу. Для примера используем данные о весе 20 новорожден ных павианов-гамадрилов и весе их матерей, измеренном в нача ле беременности (табл. 56).
Предполагается, что между весом матерей и весом их приплода существует прямолинейная положительная связь. Вычислим для этих данных коэффициент корреляции. Можно воспользоваться приведенными выше формулами Пирсона или Браве. Но проще рассчитывать коэффициент корреляции по следующим рабочим
формулам: |
n'Lxy — 2хХ2г / |
|
|
|
г = |
— , |
(99) |
||
---------- |
||||
У«2х2 - |
(Ех)2 X У«2у2- |
(2у )2 |
|
178
|
|
|
|
Т а б л и ц а 56 |
Вес матерей (кг) (X) |
Вес их детенышей |
Вес матерей (Л:) |
Вес их детенышей |
|
(кг) (Y) |
|
(П |
||
10,0 |
0,70 |
|
14,5 |
0,70 |
10,8 |
0,73 |
|
11,0 |
0,65 |
11,3 |
0,75 |
' |
12,0 |
0,72 |
10,0 |
0,70 |
11,8 |
0,69 |
|
10,1 |
0,65 |
|
13,4 |
0,78 |
11,1 |
0,65 |
|
11,4 |
0,70 |
11,3 |
0,70 |
|
12,0 |
0,60 |
10,2 |
0,61 |
|
15,6 |
0,85 |
13,5 |
0,70 |
|
13,0 |
0,80 |
12,3 |
0,63 |
|
12,1 |
0,75 |
Ъху — Пху
( 100)
|
У ( 2 л:2 — пх2) (2у2— пу2) |
|
|
|||||
|
__ |
2 ху — 1/га (2лг2г/) |
|
|
( 101) |
|||
|
|
|
Dx |
Dy |
|
|
||
|
|
|
|
|
|
|||
|
|
|
У"У |
Dy |
ZX |
|
|
( 102) |
|
|
|
X |
|
|
|
||
|
|
|
2 у/)* X |
|
|
|
||
где |
|
( 2 * ) 2 |
|
|
|
Ѵ уѴ |
|
|
Д* = |
2л:2 |
Dy = 2 у2 |
|
|||||
п |
1 |
п |
|
|||||
|
|
|
|
|
|
|
||
и |
Dd = 2d2 - |
(2d)2 _ |
|
|
||||
п |
> |
|
|
|||||
|
|
|
|
|
|
|
|
|
через X и у обозначены |
парные |
варианты признаков |
X и Y; |
|||||
X и у — средние |
арифметические; d = x—у и п — число |
парных |
||||||
наблюдений или объем выборки. |
|
|
|
|
|
Чтобы использовать ту или иную из'приведенных формул, не обходимо предварительно найти вспомогательные значения 2 ху, 2 л:2 2 у2и др. Расчет их показан в табл. 57. По итоговым данным
этой таблицы находим средние арифметические: |
|
||||||
X |
237,4 |
|
_ |
14,06 |
кг. Определяем суммы |
||
= ------ - = 11,87 |
кг и у — |
-------= 0,703 |
|||||
|
20 |
’ |
У |
20 |
|
|
|
квадратов отклонении: |
|
|
|
||||
|
£>*=2861,60 |
(237,4)2 |
|
(14,06)2 |
|||
|
20 |
= 43,662; Dy= 9,9598 |
20 |
||||
|
|
|
|
|
|||
= |
0,0756; Dd = 2535,7218 - |
(223,34)2 |
41,6840. |
Подставляем |
|||
20 |
|||||||
|
|
|
|
|
|
179