Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 284

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Рис. 18. График плотности вероятно­ сти ^-распределения при числе степе­ ней свободы К= 1, 2 и 6 (по Смирно­ ву и Дунину-Барковскому, 1965)

Для нахождения величины критерия хи-квадрат необходимо: 1) по каждому классу вариационного ряда найти разницу между фактическими и вычисленными частотами, т. е. р p' = d; 2 ) возвести разницу в квадрат (d2) и отнести к вычисленным час­ тотам (р') для каждого класса и 3) суммировать полученные от-

/ d 2 \

ношения^__j для всех классов вариационного ряда — это и

будет величина хи-квадрат. Так как отклонения эмпирических частот от частот вычисленных возводятся в квадрат, то величина критерия хи-квадрат всегда положительная. Поэтому при уста­ новлении разности р p' = d знаки можно не учитывать.

Если 2 (р —р') =0, то %2=0, что указывает на полное соот­ ветствие фактических частот вычисленным частотам вариацион­ ного ряда. Если же критерий хи-квадрат не равен нулю, это может указывать на несоответствие фактических частот вычис­ ленным частотам данного вариационного ряда. В таких случаях нужно оценить величину критерия хи-квадрат, которая теорети­ чески может изменяться от 0 до оо. Оценка значимости критерия хи-квадрат производится с помощью специальной таблицы, при­ веденной в приложениях под № VIII. В этой таблице содержат­ ся критические (стандартные) значения критерия хи-квадрат для трех уровней доверительной вероятности и разных чисел степе­ ней свободы, которые берутся по правилам, указанным ниже.

Если % нулевая гипотеза сохраняется, т. е. оправдывается предположение, что расхождение между фактическими и теорети­ ческими или ожидаемыми частотами носит исключительно слу­ чайный, а не систематический характер. В противном случае, т. е. ПРИ Уф2^ :Г) н у л е в а я гипотеза отвергается. Таким образом с помощью критерия хи-квадрат выясняется, соответствует ли эм­ пирическое распределение тому закону, по которому вычислены теоретические частоты ряда.

Распределение вероятных значений случайной величины %2 является непрерывным и ассимметричным (рис. 18); оно зави­ сит от числа степеней свободы (k) и приближается к нормаль­ ному распределению по мере увеличения числа наблюдений

(п). Поэтому применение это­ го критерия для оценки дис­ кретных распределений сопря­ жено с некоторыми погрешно­ стями, которые особенно сильно сказываются на малочислен­ ных выборках В силу отмечен­ ных особенностей показателя­ ми правильного применения

137


критерия хи-квадрат считается наличие в выборке достаточного числа вариант и чтобы в крайних классах сравниваемых распре­ делений имелось минимально допустимое количество теоретиче­ ских частот. Обыкновенно не рекомендуется, чтобы число вари­ ант в крайних классах теоретически рассчитанного ряда было меньше 5. Однако по данным Ван дер Вардена, исследовавшего этот вопрос, количество вариант в крайних классах вариационно­ го ряда следует связывать с числом ступеней свободы следую­ щим образом:

числа степеней свободы (£=я<—3):

1

2

3—6

> 6

минимально допустимые теоретиче­

 

 

 

 

ские частоты (р) крайних классов

4

2

1

0,5.

ряда:

При наличии в крайних классах теоретически вычисленных час­ тот меньше указанного количества следует объединить теоретиче­ ские частоты смежных классов так, чтобы выполнялись требова­ ния Ван дер Вардена. Соответственно объединяются и частоты крайних классов эмпирического вариационного ряда. Число сте­

пеней свободы

равно вторичному числу классов без трех, т. е.

k = tii—3, где

Пі не объем выборки,число классов вариацион­

ного ряда. Чтобы получились достаточно надежные результаты, общее число наблюдений (п), распределяемых в вариационный ряд, должно быть не менее 30.

Так как точность вычисления величины критерия хи-квадрат в значительной мере зависит от точности самих значений р', при установлении разности р p' = d следует пользоваться неокруг­ ленными теоретическими частотами (р' ). Следует также иметь в виду, что критерий хи-квадрат не применим к частотам, выра­ женным в процентах, долях единицы, т. е. в относительных еди­ ницах измерения.

 

 

 

 

Т а б л и ц а 38

 

Частоты

 

 

 

Варианты

 

 

Разница

Кваират раз­

 

(*)

эмпир. (/?)

вычисл. ( p ’)

(P—P'—d)

ницы (d 2)

P'

п і

3

1,7

1,3

1,69

0,99

112

9

10,0

1,0

1,00

0,10

113

31

34,3

3,3

10,89

0,32

114

71

67,9

3,1

9,61

0,01

115

82

77,Q

4,4

19,36

0,25

116

46

51,1

5,1

26,01

0,51

117

19

19,5

0,5

0,25

0,01

118

5 } е

4,3 И 8

 

1,44

0,30

119

0,5 Г ’0

1,2

 

Сумма . . .

267

267,2

2,49

138


Продемонстрируем применение критерия хи-квадрат на при­ мерах. Воспользуемся данными табл. 35 и вычислим критерий хи-квадрат для распределения датских угрей по числу позвонков, имея в виду гипотезу о нормальности этого распределения. Ход

вычисления критерия

хи-квадрат показан в табл. 38. Для

k = 8—3 = 5 степеней

свободы и вероятности Р = 0,95 по табл.

VIII находим Xst2=11,1. Так как фактическая величина критерия

хи-квадрат (2,49)

не превосходит его критического

значения

( 11,1) при данном

пороге доверительной вероятности

и числе

степеней свободы, нулевая гипотеза сохраняется; небольшие рас­ хождения между частотами эмпирическими и вычисленными по нормальному закону следует признать случайными.

Применим тот же критерий к оценке эмпирического ряда рас­ пределения числа клеток, пораженных альфа-частицами. Теоре­ тические значения частот этого ряда приведены в табл. 37. Расчет критерия хи-квадрат показан в следующей табл. 39.

Т а б л и ц а 39

Число клеток

Число слу­

Теоретич.

Разность

d ‘

JLL

(т)

чаев (р )

частоты (p' )

(.P—P' =d)

K P l

p'

0

112

 

115,34

3,34

11,16

0,09

1

168

 

173,04

5,04

25,40

0,15

2

130

 

129,77

0,23

0,05

0,00

3

68

 

64,88

3,12

9,73

0,15

4

32

 

24,35

7,65

58,52

2,40

5

5

 

7,29

2,29

5,24

0,71

6

1

I

1.81 )

0,22

0,05

0,02

 

 

2

2,22

7

1

0,41 J

 

 

 

J

 

 

 

Сумма . . .

517

 

516,90

3,52

2

В данном случае %ф=8,Ъ2. Для Р = 0,95 и числа степеней свобо­ ды k = tii — 2 = 7—2 = 5 по табл. VIII находим %si2= 11,1. Посколь­

ку X(f)<%st >нулевую гипотезу отвергнуть нельзя. На этом осно­ вании следует заключить, что данное распределение следует за­ кону Пуассона.

Критерий хи-квадрат можно использовать и для сравнения друг с другом двух однородных эмпирических распределений, т. е. таких, у которых одни и те же границы классов. Критерий хи-квадрат в таких случаях определяется по формуле

=

-

(73,

ni-nz

Рі + р2

 

139



где п\ и п2— объемы сравниваемых распределений; рі и р2— час­ тоты соответствующих классов или классовых вариант.

Рассмотрим следующий пример. Урожай фасоли от посева крупных и мелких семян распределился следующим образом:

125

175

225

275

325

375

4 2 5

4 7 5

5 2 5

1

5

17

45

70

51

10

1

> 0

1

3

7

22

88

69

7

2

1

 

 

 

 

 

 

 

 

 

Т а б л и ц а 40

Классовые

Частоты

 

 

 

 

 

 

(п,рг—пгр,у-

 

 

 

 

Рі+Ра

п,ХРг

«I ХРі

ПіРі—ПгРі

варианты

рі

Рг

 

 

Pi+Ps

м

 

 

 

 

 

 

125

1

1

 

 

2

200

200

0

0

175

5

3

 

 

8

600

1 000

- 4 0 0

2 0 000

225

17

7

 

 

24

1 4 0 0

3 400

- 2 000

166 667

275

45

22

 

 

67

4 4 0 0

9 000

— 4 600

315 821

325

70

88

 

 

158

17 600

14 000

3 600

82 025

375

51

69

 

 

120

13 800

10 200

3 600

108 000

425

10

7

 

 

17

1 4 0 0

2 000

- 6 0 0

21 176

475

1 1

2

1

 

4

600

20 0

40 0

4 0 0 00

 

1

3

525

 

 

0 ]

1 І

 

 

 

 

 

 

 

 

 

 

 

Сумма

200

200

 

75 3 689

В данном случае через х обозначены классовые варианты по весу отдельных семян фасоли, выраженному в мг, а через р\ и р2— распределение урожая, полученного в одних и тех же усло­ виях выращивания растений от посева крупных (рі) и мелких (р2) семян. Сопоставим полученные данные, как того требует формула 73 (табл. 40). Подставляя известные значения в фор­

мулу 73, находим значение критерия хи-квадрат: %2=

,1

X

 

 

 

 

2

0 0 X 200

X 753 689

= 18,84. Для р =

0,95 и &=

8 — 3 =

5 / st =

11,1, а для

р = 0,999

2

2

2

опровергает нуле­

%st = 15,1. Видно,

что хф >

х«<> что

вую гипотезу; расхождение между этими распределениями нель­ зя признать случайным.

Критерий хи-квадрат применим не только к оценке вариаци­ онных рядов, но и к выборкам, группируемым в четырехпольные и многопольные таблицы. Поэтому он находит широкое примене­ ние в генетике, селекции и семеноводстве, а также в фармаколо­ гии при оценке действия лекарственных веществ и во многих дру­ гих областях знания. Соответствующие примеры приводятся ниже.

140