ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 284
Скачиваний: 1
Для нахождения величины критерия хи-квадрат необходимо: 1) по каждому классу вариационного ряда найти разницу между фактическими и вычисленными частотами, т. е. р — p' = d; 2 ) возвести разницу в квадрат (d2) и отнести к вычисленным час тотам (р') для каждого класса и 3) суммировать полученные от-
/ d 2 \
ношения^__j для всех классов вариационного ряда — это и
будет величина хи-квадрат. Так как отклонения эмпирических частот от частот вычисленных возводятся в квадрат, то величина критерия хи-квадрат всегда положительная. Поэтому при уста новлении разности р — p' = d знаки можно не учитывать.
Если 2 (р —р') =0, то %2=0, что указывает на полное соот ветствие фактических частот вычисленным частотам вариацион ного ряда. Если же критерий хи-квадрат не равен нулю, это может указывать на несоответствие фактических частот вычис ленным частотам данного вариационного ряда. В таких случаях нужно оценить величину критерия хи-квадрат, которая теорети чески может изменяться от 0 до оо. Оценка значимости критерия хи-квадрат производится с помощью специальной таблицы, при веденной в приложениях под № VIII. В этой таблице содержат ся критические (стандартные) значения критерия хи-квадрат для трех уровней доверительной вероятности и разных чисел степе ней свободы, которые берутся по правилам, указанным ниже.
Если % нулевая гипотеза сохраняется, т. е. оправдывается предположение, что расхождение между фактическими и теорети ческими или ожидаемыми частотами носит исключительно слу чайный, а не систематический характер. В противном случае, т. е. ПРИ Уф2^ :Г) н у л е в а я гипотеза отвергается. Таким образом с помощью критерия хи-квадрат выясняется, соответствует ли эм пирическое распределение тому закону, по которому вычислены теоретические частоты ряда.
Распределение вероятных значений случайной величины %2 является непрерывным и ассимметричным (рис. 18); оно зави сит от числа степеней свободы (k) и приближается к нормаль ному распределению по мере увеличения числа наблюдений
(п). Поэтому применение это го критерия для оценки дис кретных распределений сопря жено с некоторыми погрешно стями, которые особенно сильно сказываются на малочислен ных выборках В силу отмечен ных особенностей показателя ми правильного применения
137
критерия хи-квадрат считается наличие в выборке достаточного числа вариант и чтобы в крайних классах сравниваемых распре делений имелось минимально допустимое количество теоретиче ских частот. Обыкновенно не рекомендуется, чтобы число вари ант в крайних классах теоретически рассчитанного ряда было меньше 5. Однако по данным Ван дер Вардена, исследовавшего этот вопрос, количество вариант в крайних классах вариационно го ряда следует связывать с числом ступеней свободы следую щим образом:
числа степеней свободы (£=я<—3): |
1 |
2 |
3—6 |
> 6 |
минимально допустимые теоретиче |
|
|
|
|
ские частоты (р) крайних классов |
4 |
2 |
1 |
0,5. |
ряда: |
При наличии в крайних классах теоретически вычисленных час тот меньше указанного количества следует объединить теоретиче ские частоты смежных классов так, чтобы выполнялись требова ния Ван дер Вардена. Соответственно объединяются и частоты крайних классов эмпирического вариационного ряда. Число сте
пеней свободы |
равно вторичному числу классов без трех, т. е. |
k = tii—3, где |
Пі не объем выборки,число классов вариацион |
ного ряда. Чтобы получились достаточно надежные результаты, общее число наблюдений (п), распределяемых в вариационный ряд, должно быть не менее 30.
Так как точность вычисления величины критерия хи-квадрат в значительной мере зависит от точности самих значений р', при установлении разности р —p' = d следует пользоваться неокруг ленными теоретическими частотами (р' ). Следует также иметь в виду, что критерий хи-квадрат не применим к частотам, выра женным в процентах, долях единицы, т. е. в относительных еди ницах измерения.
|
|
|
|
Т а б л и ц а 38 |
||
|
Частоты |
|
|
|
||
Варианты |
|
|
Разница |
Кваират раз |
|
|
(*) |
эмпир. (/?) |
вычисл. ( p ’) |
(P—P'—d) |
ницы (d 2) |
P' |
|
п і |
3 |
1,7 |
1,3 |
1,69 |
0,99 |
|
112 |
9 |
10,0 |
1,0 |
1,00 |
0,10 |
|
113 |
31 |
34,3 |
3,3 |
10,89 |
0,32 |
|
114 |
71 |
67,9 |
3,1 |
9,61 |
0,01 |
|
115 |
82 |
77,Q |
4,4 |
19,36 |
0,25 |
|
116 |
46 |
51,1 |
5,1 |
26,01 |
0,51 |
|
117 |
19 |
19,5 |
0,5 |
0,25 |
0,01 |
|
118 |
5 } е |
4,3 И 8 |
|
1,44 |
0,30 |
|
119 |
0,5 Г ’0 |
1,2 |
||||
|
||||||
Сумма . . . |
267 |
267,2 |
— |
— |
2,49 |
138
Продемонстрируем применение критерия хи-квадрат на при мерах. Воспользуемся данными табл. 35 и вычислим критерий хи-квадрат для распределения датских угрей по числу позвонков, имея в виду гипотезу о нормальности этого распределения. Ход
вычисления критерия |
хи-квадрат показан в табл. 38. Для |
k = 8—3 = 5 степеней |
свободы и вероятности Р = 0,95 по табл. |
VIII находим Xst2=11,1. Так как фактическая величина критерия
хи-квадрат (2,49) |
не превосходит его критического |
значения |
( 11,1) при данном |
пороге доверительной вероятности |
и числе |
степеней свободы, нулевая гипотеза сохраняется; небольшие рас хождения между частотами эмпирическими и вычисленными по нормальному закону следует признать случайными.
Применим тот же критерий к оценке эмпирического ряда рас пределения числа клеток, пораженных альфа-частицами. Теоре тические значения частот этого ряда приведены в табл. 37. Расчет критерия хи-квадрат показан в следующей табл. 39.
Т а б л и ц а 39
Число клеток |
Число слу |
Теоретич. |
Разность |
d ‘ |
JLL |
||
(т) |
чаев (р ) |
частоты (p' ) |
(.P—P' =d) |
K P l |
|||
p' |
|||||||
0 |
112 |
|
115,34 |
3,34 |
11,16 |
0,09 |
|
1 |
168 |
|
173,04 |
5,04 |
25,40 |
0,15 |
|
2 |
130 |
|
129,77 |
0,23 |
0,05 |
0,00 |
|
3 |
68 |
|
64,88 |
3,12 |
9,73 |
0,15 |
|
4 |
32 |
|
24,35 |
7,65 |
58,52 |
2,40 |
|
5 |
5 |
|
7,29 |
2,29 |
5,24 |
0,71 |
|
6 |
1 |
I |
1.81 ) |
0,22 |
0,05 |
0,02 |
|
|
|
2 |
2,22 |
||||
7 |
1 |
0,41 J |
|
|
|
||
J |
|
|
|
||||
Сумма . . . |
517 |
|
516,90 |
— |
— |
3,52 |
2
В данном случае %ф=8,Ъ2. Для Р = 0,95 и числа степеней свобо ды k = tii — 2 = 7—2 = 5 по табл. VIII находим %si2= 11,1. Посколь
ку X(f)<%st >нулевую гипотезу отвергнуть нельзя. На этом осно вании следует заключить, что данное распределение следует за кону Пуассона.
Критерий хи-квадрат можно использовать и для сравнения друг с другом двух однородных эмпирических распределений, т. е. таких, у которых одни и те же границы классов. Критерий хи-квадрат в таких случаях определяется по формуле
= |
- |
(73, |
ni-nz |
Рі + р2 |
|
139
где п\ и п2— объемы сравниваемых распределений; рі и р2— час тоты соответствующих классов или классовых вариант.
Рассмотрим следующий пример. Урожай фасоли от посева крупных и мелких семян распределился следующим образом:
125 |
175 |
225 |
275 |
325 |
375 |
4 2 5 |
4 7 5 |
5 2 5 |
1 |
5 |
17 |
45 |
70 |
51 |
10 |
1 |
> 0 |
1 |
3 |
7 |
22 |
88 |
69 |
7 |
2 |
1 |
|
|
|
|
|
|
|
|
|
Т а б л и ц а 40 |
Классовые |
Частоты |
|
|
|
|
|
|
(п,рг—пгр,у- |
|
|
|
|
|
Рі+Ра |
п,ХРг |
«I ХРі |
ПіРі—ПгРі |
||
варианты |
рі |
Рг |
|
|
Pi+Ps |
||||
м |
|
|
|
|
|
|
|||
125 |
1 |
1 |
|
|
2 |
200 |
200 |
0 |
0 |
175 |
5 |
3 |
|
|
8 |
600 |
1 000 |
- 4 0 0 |
2 0 000 |
225 |
17 |
7 |
|
|
24 |
1 4 0 0 |
3 400 |
- 2 000 |
166 667 |
275 |
45 |
22 |
|
|
67 |
4 4 0 0 |
9 000 |
— 4 600 |
315 821 |
325 |
70 |
88 |
|
|
158 |
17 600 |
14 000 |
3 600 |
82 025 |
375 |
51 |
69 |
|
|
120 |
13 800 |
10 200 |
3 600 |
108 000 |
425 |
10 |
7 |
|
|
17 |
1 4 0 0 |
2 000 |
- 6 0 0 |
21 176 |
475 |
1 1 |
2 |
1 |
|
4 |
600 |
20 0 |
40 0 |
4 0 0 00 |
|
1 |
3 |
|||||||
525 |
|
|
|||||||
0 ] |
1 І |
|
|
|
|
|
|||
|
|
|
|
|
|
||||
Сумма |
200 |
200 |
|
— |
— |
— |
— |
75 3 689 |
В данном случае через х обозначены классовые варианты по весу отдельных семян фасоли, выраженному в мг, а через р\ и р2— распределение урожая, полученного в одних и тех же усло виях выращивания растений от посева крупных (рі) и мелких (р2) семян. Сопоставим полученные данные, как того требует формула 73 (табл. 40). Подставляя известные значения в фор
мулу 73, находим значение критерия хи-квадрат: %2= |
,1 |
||||
X |
|||||
|
|
|
|
2 |
0 0 X 200 |
X 753 689 |
= 18,84. Для р = |
0,95 и &= |
8 — 3 = |
5 / st = |
11,1, а для |
р = 0,999 |
2 |
2 |
2 |
опровергает нуле |
|
%st = 15,1. Видно, |
что хф > |
х«<> что |
вую гипотезу; расхождение между этими распределениями нель зя признать случайным.
Критерий хи-квадрат применим не только к оценке вариаци онных рядов, но и к выборкам, группируемым в четырехпольные и многопольные таблицы. Поэтому он находит широкое примене ние в генетике, селекции и семеноводстве, а также в фармаколо гии при оценке действия лекарственных веществ и во многих дру гих областях знания. Соответствующие примеры приводятся ниже.
140