Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 278

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Ошибка средней разности, определяемая по формуле 61, рав­ няется:

 

md =

1 / 1 / 2,03

0,52

\

-------

 

 

 

|/ — [ —— -

J = 1/0,018 = 0,13 а.

Критерий

іф =

0 5

Для

Я = 0,05

и

k = 6 —1=5 по

'—-— = 3,85.

 

 

0,13

 

 

 

 

 

табл. V находим tst= 2,57. Видно, что

 

Также и довери­

тельная

граница tmd = 2,57x0,13= 0,33

заметно

ниже средней

разницы

(0,5), наблюдаемой в посевах

ржи

по

апрельскому и

черному пару. Следовательно, имеются

достаточные основания

отвергнуть нулевую гипотезу и признать эту разницу статисти­ чески достоверной.

Итак, применив два разных способа обработки одного и того же материала, мы пришли к прямо противоположным выводам. Очевидно, вторая оценка результатов опыта является более эф­ фективной, потому что она опирается на правильно выбранный способ анализа опытных данных. Несомненно, что на протяже­ нии шестилетнего испытания посевов ржи по черному и апрель­ скому пару условия выращивания растений не были одинако­ выми: они колебались по годам опыта. А это значит, что перед нами величины сопряженные и сравнивать их нужно попарно, т. е. по средней разности сопряженных вариант.

. Приведенный пример служит наглядным подтверждением, того, о чем говорилось выше: статистические методы нельзя при­ менять огульно, не сообразуясь с содержанием материала, к которому они применяются. Если выбранные методы обработки не соответствуют содержанию описываемых с их помощью фак­ тических данных, они могут оказать исследователю плохую услугу.

В качестве следующего примера подвергнем полной обработ­ ке результаты испытания на урожайность ячменя и овса в усло­ виях нечерноземной полосы Российской Федерации, приведен­ ные в табл. 2. Расчет необходимых значений показан в табл. 31.

Разница между средним урожаем ячменя и овса на протя­

жении

семилетних испытаний составила: 8,54—7,57 = 0,97

ц/га.

Находим ошибку этой разности:

 

 

 

 

 

md

 

 

0,53

ц/га.

 

Критерий іф =

0,97 = 1,83. Для

уровня

значимости Я = 0,05 и

 

 

сУкГ

 

 

 

 

числа

степеней

свободы &= 7—1 = 6 критерий

tst= 2,45

(см.

табл.

V приложений). Поскольку

t$<C.tsu

нулевая гипотеза со­

110


храняется; преимущество по урожайности ячменя перед овсом

остается недоказанным.

Сравнение результатов опыта с контролем или одного вари­ анта опыта с другим можно провести также и по средней раз­ ности между парными значениями сравниваемых величин, отно­

ся ее к выборочной ошибке.

Т а б л и ц а 31

Урожай ціга

Годы

 

 

Разница

d 2

d —d

{ d - d ?

ячмень

овес

(d)

 

 

 

 

 

1928

7 , 7

8 , 2 6

— 0 ,5 6

0 ,3 1

- 1 , 5 4

2 ,3 7

1929

9 , 0

7 , 2 2

1 ,7 8

3 ,1 7

0 ,8 0

0 , 6 4

1930

9 , 4

8 , 4 3

0 ,9 7

0 , 9 4

0 ,0 1

0 ,0 0

1931

7 , 4

5 , 5 7

1 ,8 3

3 ,3 5

0 ,8 5

0 ,7 2

1932

7 , 4

6 , 3 5

1 ,0 5

1 ,1 0

0 , 0 7

0 ,0 0

1933

1 0 ,9

8 , 0 0

2 , 9 0

8 ,4 1

1 ,9 2

3 ,6 9

1934

8 , 0

9 , 1 3

- 1 , 1 3

1 ,2 8

- 2 , 1 1

4 , 4 5

Сумма

+ 6 , 8 4

1 8 ,5 6

1 1 ,8 7

Среднее

8 , 5 4

7 ,5 7

0 , 9 8

Так, в рассматриваемом примере средняя арифметическая, вы­ численная по общей сумме парных различий (с учетом знаков!), равняется:

d — fy— = 0,977 = 0,98 (см. табл. 31).

п7

Выборочная ошибка этой разницы определяется по формуле

md —

і /

S j i - i y

= у

1Г87 =

= 0 ,5 3 Ч/га.

к Р”теР

 

1

п ( п — 1)

'

7 X 6

 

 

 

Іф

0,98 =

1,83.

Получился тот же результат, что и выше.

 

0,53

 

 

 

 

 

 

В качестве критерия достоверности средней разности может

служить также и отношение t — ~\/п,

где <7 = — 2<7і,

 

а Оа =

 

 

 

 

 

Od

п

 

 

 

 

2

(di — J ) 2, которые оцениваются по таблице

Стью-

дента.

Способ парных сравнений позволяет оценивать достоверность наблюдаемых различий также и по доверительному интервалу.

111


Если доверительный интервал, построенный по средней разности между парными вариантами и ошибкой этой разности, имеет нижнюю границу с положительным знаком, это указывает на достоверность разницы между генеральными параметрами срав­ ниваемых выборочных показателей. Если же нижняя граница доверительного интервала оказывается с отрицательным знаком, это свидетельство недостоверности наблюдаемых различий. В отношении рассматриваемого примера доверительный интер­ вал для Р = 0,05 и k = 6 оказывается следующим: d±tm.a = 0,98± ±2,45x0,53 = 0,98± 1,30 или от —0,32 до +2,28. Нижняя граница доверительного интервала имеет отрицательный знак (—0,32). что указывает на недостоверность разницы, наблюдаемой между урожайностью ячменя и овса.

СРАВНЕНИЕ ДИСПЕРСИЙ. ^-РАСПРЕДЕЛЕНИЕ ФИШЕРА

Описанные способы оценки генеральных параметров по вы­ борочным средним в принципе применимы и для установления доверительных границ показателей вариации. Среднеквадрати­ ческие ошибки выборочных — о и Сѵ — определяются по сле­ дующим формулам:

Шп

а2

=

а

(63)

----

----- \

 

2п

 

ф2п

ГПсѵ

СѴ2

СѴ

(64)

2п

 

]/2п

 

 

 

Критерием достоверности различий между средними квадратическими отклонениями служит отношение

оі — 02

Уо^/Пі + 0 2/ « 2

Например, выборка из урожая фасоли на делянке п = 200 семян

59,3 характеризуется а = 59,3 мг с ошибкой та = :==— = 2,96 мг.

Доверительные границы генерального параметра для Р=0,05 и соответственно /=1,96:

нижняя=59,3— 1,96 X 2,96 = 53,8

мг

верхняя = 5 9 ,3 + 1,96 X 2,96= 65,1

мг

Однако этот способ оценки генеральных параметров приме­ ним лишь к выборкам достаточно большого объема, распреде­ ляемых по нормальному закону. На малых выборках он оказы­ вается неточным. В поисках лучшего способа оценки Р. А. Фи-

112


шер установил, что если вместо разности оі — о2 взять разность натуральных логарифмов In оі—ln 0 2, где 0 і > 02, то эта величи­ на, обозначенная им через Z, распределяется нормально не только при больших, но и на среднего объема выборках. При вычислении Z вместо натуральных можно пользоваться десятич­ ными логарифмами по формулам: Z = 2,3O26(lg0t — lg Ст2), или

о

02

Z = 2,3026 lg — , а также

Z == 1,1513 lg ^ -. В дальнейшем вмес-

02

0|

то логарифма отношений были взяты самые отношения и не средних квадратических отклонений, а дисперсий; в честь Фише­ ра их принято обозначать заглавной буквой F:

2

 

F = Оі

(65)

Этот показатель получил название критерия Фишера. Соответ­ ственно были переработаны и таблицы Фишера применительно к функции это критерия, что значительно упрощает расчеты.

Критерий F функционально связан с вероятностью, он имеет непрерывную функцию распределения и зависит только от чисел степеней свободы: ki = rii — 1 и k2 = n2— 1 сравниваемых Диспер­ сий. Характерным для F оказывается то, что он полностью опре­ деляется выборочными дисперсиями и не зависит от генеральных параметров, так как предполагается, что обе дисперсии из одной и той же генеральной совокупности. Поэтому при k— >-оо отно-

шение 0 і/о2 -> 1. График плотности вероятности F распределения для ki и k2 и критических границ F\ и F2 приводится на рис. 12. Видно, что распределение F асимметрично.

Ф)

Рис. 12. График плотности вероятности F-pacnpe- деления для типичных значений k\ и k2 числа сте­ пеней свободы и критические границы F, и F2 (по Смирнову и Дунину-Барковскому, 1965)

113

Закономерность

функции

F =

— для двух уровней значи-

 

2

 

 

 

а2

 

 

 

2

мости Рі = 0,05 и ^ 2 = 0,01 и соответствующих степеней свободы ■ki и &2 табулирована в виде критических (стандартных) значе­ ний критерия F (см. приложения табл. VII). В этой таблице сте­

пени свободы для большей дисперсии берутся

по горизонтали

(верхняя

строка), а по вертикали

(первая

граф а)— степени

свободы

для меньшей

дисперсии.

При определении величины

критерия F числителем

берется обычно большая дисперсия. По­

этому критерий F может быть равен единице или больше ее. Чем значительней разница между дисперсиями, тем больше будет и величина критерия F, и, наоборот, чем меньше окажется рас­ хождение между дисперсиями, тем меньше будет и величина F. Нулевая гипотеза исходит из признания равенства дисперсий. Если эмпирические значения критерия Фишера (/>) меньше теоретических, указанных в таблице (Fst) для соответствующего уровня значимости и степеней свободы k\ и k2, они рассматри­ ваются как.случайные. Если же F $ ^ F si, нулевая гипотеза от­ вергается, разница между сравниваемыми величинами признает­ ся статистически достоверной.

Например, сравниваются две выборки по весу семян фасоли: одна из посевного материала — «1 = 100 и оі = 58,3 мг и другая из

урожая—«2 = 200 и 02 = 59,3 мг. Критерий Fst =

(59,3)2

3516

 

=

= 1,03. По таблице Фишера для Р = 0,05

и &i=200—1= 199'

и k2 = 100 — 1=99 находим Fst = 1,31 (см. табл. VII приложений). Так как /><CPsi, нулевая гипотеза сохраняется; расхождения между выборками по данному признаку оказываются статисти­ чески недостоверными.

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ОЦЕНОК

Критерии Стьюдента (t) и Фишера (F) связаны с опреде­ ленными формами нормального распределения; их применение имеет в виду оценку расхождений-между генеральными пара­ метрами на основании выборочных показателей сравниваемых совокупностей. Поэтому они называются параметрическими кри­ териями. Их разрешающая мощность велика лишь при условии,, что сравниваемые совокупности распределяются по нормальному закону или не сильно отклоняются от него.

В практике же встречаются не только нормальные, но и иного вида распределения, о которых исследователю мало что извест­ но. В таких случаях применение параметрических критериев не гарантирует от возможных ошибок. Поэтому для оценки рас­ хождений между выборками, наряду с указанными критериями,, используются и другие, вспомогательные критерии, основанные

114


на сравнении не самих вариант, а их порядковых чисел в ран­ жированном ряду. Критерии, основанные на этом принципе, на­ зываются порядковыми. Применение порядковых критериев не связано с определенной формой распределения; они не нуждают­ ся в вычислении средней арифметической и среднего квадрати­ ческого отклонения и других параметров, поэтому и получили название непараметрических критериев.

Непараметрические, или порядковые, критерии просты по своей конструкции; они не требуют большой вычислительной ра­ боты, что выгодно отличает их от критериев параметрических. При всем этом преимущество остается на стороне критериев па­ раметрических, обладающих большей статистической мощно­ стью, лучшей разрешающей возможностью, чем у критериев непараметрических. Поэтому во всех случаях, когда распределе­ ния практически не отклоняются от нормального закона, реко­ мендуется использовать критерии параметрические. Там же, где возникает сомнение в точности выводов, которые делаются па основании использования параметрических критериев, когда форма распределения остается недостаточно ясной, уместно ис­ пользовать и непараметрические критерии различия. Всесторон­ ний контроль над правильностью выводов никогда не мешает. Если же обработка выборочного материала разными способами дает один и тот же результат, это гарантия того, что выводы по­ лучаются правильные.

Существует несколько непараметрических критериев разли­ чий, неодинаковых по своей конструкции и мощности. Мы рас­ смотрим лишь два из них, наиболее простых и удобных в работе, особенно при сравнительной оценке малочисленных выборок.

Критерий Т Уайта

Одним из критериев, применяемых для установления досто­ верности различий, наблюдаемых при сравнении двух независи­ мых распределений, является непараметрический критерий Т •Уайта, который в равной мере применим к выборкам равновели­ кого и неодинакового объема. Сущность методики, лежащей в основе применения этого критерия, следующая. Все варианты сравниваемых совокупностей ранжируют в один общий ряд и находят их ранги. Затем ранги суммируют — отдельно по каж­ дой выборке. Если сравниваемые выборки совершенно не отли­ чаются одна от другой, то и суммы их рангов должны быть равны между собой. В противном случае такого равенства на­ блюдаться не будет. И чем значительнее расхождение между выборками, тем больше разница между суммами их рангов. А так как указанные различия могут быть случайными, они оце­ ниваются с помощью критерия Уайта по специальной таблице, рассчитанной для выборочных наблюдений разного объема и

115