ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 278
Скачиваний: 1
Ошибка средней разности, определяемая по формуле 61, рав няется:
|
md = |
1 / 1 / 2,03 |
0,52 |
\ |
------- |
|
|
|
|/ — [ —— - |
J = 1/0,018 = 0,13 а. |
|||||
Критерий |
іф = |
0 5 |
Для |
Я = 0,05 |
и |
k = 6 —1=5 по |
|
'—-— = 3,85. |
|||||||
|
|
0,13 |
|
|
|
|
|
табл. V находим tst= 2,57. Видно, что |
|
Также и довери |
|||||
тельная |
граница tmd = 2,57x0,13= 0,33 |
заметно |
ниже средней |
||||
разницы |
(0,5), наблюдаемой в посевах |
ржи |
по |
апрельскому и |
|||
черному пару. Следовательно, имеются |
достаточные основания |
отвергнуть нулевую гипотезу и признать эту разницу статисти чески достоверной.
Итак, применив два разных способа обработки одного и того же материала, мы пришли к прямо противоположным выводам. Очевидно, вторая оценка результатов опыта является более эф фективной, потому что она опирается на правильно выбранный способ анализа опытных данных. Несомненно, что на протяже нии шестилетнего испытания посевов ржи по черному и апрель скому пару условия выращивания растений не были одинако выми: они колебались по годам опыта. А это значит, что перед нами величины сопряженные и сравнивать их нужно попарно, т. е. по средней разности сопряженных вариант.
. Приведенный пример служит наглядным подтверждением, того, о чем говорилось выше: статистические методы нельзя при менять огульно, не сообразуясь с содержанием материала, к которому они применяются. Если выбранные методы обработки не соответствуют содержанию описываемых с их помощью фак тических данных, они могут оказать исследователю плохую услугу.
В качестве следующего примера подвергнем полной обработ ке результаты испытания на урожайность ячменя и овса в усло виях нечерноземной полосы Российской Федерации, приведен ные в табл. 2. Расчет необходимых значений показан в табл. 31.
Разница между средним урожаем ячменя и овса на протя
жении |
семилетних испытаний составила: 8,54—7,57 = 0,97 |
ц/га. |
||||
Находим ошибку этой разности: |
|
|
|
|
||
|
md |
|
|
0,53 |
ц/га. |
|
Критерий іф = |
0,97 = 1,83. Для |
уровня |
значимости Я = 0,05 и |
|||
|
|
сУкГ |
|
|
|
|
числа |
степеней |
свободы &= 7—1 = 6 критерий |
tst= 2,45 |
(см. |
||
табл. |
V приложений). Поскольку |
t$<C.tsu |
нулевая гипотеза со |
110
храняется; преимущество по урожайности ячменя перед овсом
остается недоказанным.
Сравнение результатов опыта с контролем или одного вари анта опыта с другим можно провести также и по средней раз ности между парными значениями сравниваемых величин, отно
ся ее к выборочной ошибке.
Т а б л и ц а 31
Урожай ціга
Годы |
|
|
Разница |
d 2 |
d —d |
{ d - d ? |
ячмень |
овес |
(d) |
||||
|
|
|
|
|
||
1928 |
7 , 7 |
8 , 2 6 |
— 0 ,5 6 |
0 ,3 1 |
- 1 , 5 4 |
2 ,3 7 |
1929 |
9 , 0 |
7 , 2 2 |
1 ,7 8 |
3 ,1 7 |
0 ,8 0 |
0 , 6 4 |
1930 |
9 , 4 |
8 , 4 3 |
0 ,9 7 |
0 , 9 4 |
0 ,0 1 |
0 ,0 0 |
1931 |
7 , 4 |
5 , 5 7 |
1 ,8 3 |
3 ,3 5 |
0 ,8 5 |
0 ,7 2 |
1932 |
7 , 4 |
6 , 3 5 |
1 ,0 5 |
1 ,1 0 |
0 , 0 7 |
0 ,0 0 |
1933 |
1 0 ,9 |
8 , 0 0 |
2 , 9 0 |
8 ,4 1 |
1 ,9 2 |
3 ,6 9 |
1934 |
8 , 0 |
9 , 1 3 |
- 1 , 1 3 |
1 ,2 8 |
- 2 , 1 1 |
4 , 4 5 |
Сумма |
— |
— |
+ 6 , 8 4 |
1 8 ,5 6 |
— |
1 1 ,8 7 |
Среднее |
8 , 5 4 |
7 ,5 7 |
0 , 9 8 |
— |
— |
— |
Так, в рассматриваемом примере средняя арифметическая, вы численная по общей сумме парных различий (с учетом знаков!), равняется:
d — fy— = 0,977 = 0,98 (см. табл. 31).
п7
Выборочная ошибка этой разницы определяется по формуле
md — |
і / |
S j i - i y |
= у |
1Г87 = |
= 0 ,5 3 Ч/га. |
к Р”теР |
||
|
1 |
п ( п — 1) |
' |
7 X 6 |
|
|
|
|
Іф |
0,98 = |
1,83. |
Получился тот же результат, что и выше. |
|||||
|
0,53 |
|
|
|
|
|
|
|
В качестве критерия достоверности средней разности может |
||||||||
служить также и отношение t — — ~\/п, |
где <7 = — 2<7і, |
|
а Оа = |
|||||
|
|
|
|
|
Od |
п |
|
|
|
|
2 |
(di — J ) 2, которые оцениваются по таблице |
Стью- |
дента.
Способ парных сравнений позволяет оценивать достоверность наблюдаемых различий также и по доверительному интервалу.
111
Если доверительный интервал, построенный по средней разности между парными вариантами и ошибкой этой разности, имеет нижнюю границу с положительным знаком, это указывает на достоверность разницы между генеральными параметрами срав ниваемых выборочных показателей. Если же нижняя граница доверительного интервала оказывается с отрицательным знаком, это свидетельство недостоверности наблюдаемых различий. В отношении рассматриваемого примера доверительный интер вал для Р = 0,05 и k = 6 оказывается следующим: d±tm.a = 0,98± ±2,45x0,53 = 0,98± 1,30 или от —0,32 до +2,28. Нижняя граница доверительного интервала имеет отрицательный знак (—0,32). что указывает на недостоверность разницы, наблюдаемой между урожайностью ячменя и овса.
СРАВНЕНИЕ ДИСПЕРСИЙ. ^-РАСПРЕДЕЛЕНИЕ ФИШЕРА
Описанные способы оценки генеральных параметров по вы борочным средним в принципе применимы и для установления доверительных границ показателей вариации. Среднеквадрати ческие ошибки выборочных — о и Сѵ — определяются по сле дующим формулам:
Шп |
а2 |
= |
а |
(63) |
---- |
----- \ |
|||
|
2п |
|
ф2п |
■ |
ГПсѵ |
СѴ2 |
СѴ |
(64) |
|
2п |
|
]/2п |
||
|
|
|
Критерием достоверности различий между средними квадратическими отклонениями служит отношение
оі — 02
Уо^/Пі + 0 2/ « 2
Например, выборка из урожая фасоли на делянке п = 200 семян
59,3 характеризуется а = 59,3 мг с ошибкой та = :==— = 2,96 мг.
Доверительные границы генерального параметра для Р=0,05 и соответственно /=1,96:
нижняя=59,3— 1,96 X 2,96 = 53,8 |
мг |
верхняя = 5 9 ,3 + 1,96 X 2,96= 65,1 |
мг |
Однако этот способ оценки генеральных параметров приме ним лишь к выборкам достаточно большого объема, распреде ляемых по нормальному закону. На малых выборках он оказы вается неточным. В поисках лучшего способа оценки Р. А. Фи-
112
шер установил, что если вместо разности оі — о2 взять разность натуральных логарифмов In оі—ln 0 2, где 0 і > 02, то эта величи на, обозначенная им через Z, распределяется нормально не только при больших, но и на среднего объема выборках. При вычислении Z вместо натуральных можно пользоваться десятич ными логарифмами по формулам: Z = 2,3O26(lg0t — lg Ст2), или
о |
02 |
Z = 2,3026 lg — , а также |
Z == 1,1513 lg ^ -. В дальнейшем вмес- |
02 |
0| |
то логарифма отношений были взяты самые отношения и не средних квадратических отклонений, а дисперсий; в честь Фише ра их принято обозначать заглавной буквой F:
2 |
|
F = Оі |
(65) |
Этот показатель получил название критерия Фишера. Соответ ственно были переработаны и таблицы Фишера применительно к функции это критерия, что значительно упрощает расчеты.
Критерий F функционально связан с вероятностью, он имеет непрерывную функцию распределения и зависит только от чисел степеней свободы: ki = rii — 1 и k2 = n2— 1 сравниваемых Диспер сий. Характерным для F оказывается то, что он полностью опре деляется выборочными дисперсиями и не зависит от генеральных параметров, так как предполагается, что обе дисперсии из одной и той же генеральной совокупности. Поэтому при k— >-оо отно-
шение 0 і/о2 -> 1. График плотности вероятности F распределения для ki и k2 и критических границ F\ и F2 приводится на рис. 12. Видно, что распределение F асимметрично.
Ф)
Рис. 12. График плотности вероятности F-pacnpe- деления для типичных значений k\ и k2 числа сте пеней свободы и критические границы F, и F2 (по Смирнову и Дунину-Барковскому, 1965)
113
Закономерность |
функции |
F = |
— для двух уровней значи- |
|
2 |
||
|
|
|
а2 |
|
|
|
2 |
мости Рі = 0,05 и ^ 2 = 0,01 и соответствующих степеней свободы ■ki и &2 табулирована в виде критических (стандартных) значе ний критерия F (см. приложения табл. VII). В этой таблице сте
пени свободы для большей дисперсии берутся |
по горизонтали |
|||
(верхняя |
строка), а по вертикали |
(первая |
граф а)— степени |
|
свободы |
для меньшей |
дисперсии. |
При определении величины |
|
критерия F числителем |
берется обычно большая дисперсия. По |
этому критерий F может быть равен единице или больше ее. Чем значительней разница между дисперсиями, тем больше будет и величина критерия F, и, наоборот, чем меньше окажется рас хождение между дисперсиями, тем меньше будет и величина F. Нулевая гипотеза исходит из признания равенства дисперсий. Если эмпирические значения критерия Фишера (/>) меньше теоретических, указанных в таблице (Fst) для соответствующего уровня значимости и степеней свободы k\ и k2, они рассматри ваются как.случайные. Если же F $ ^ F si, нулевая гипотеза от вергается, разница между сравниваемыми величинами признает ся статистически достоверной.
Например, сравниваются две выборки по весу семян фасоли: одна из посевного материала — «1 = 100 и оі = 58,3 мг и другая из
урожая—«2 = 200 и 02 = 59,3 мг. Критерий Fst = |
(59,3)2 |
3516 |
|
= |
|
= 1,03. По таблице Фишера для Р = 0,05 |
и &i=200—1= 199' |
и k2 = 100 — 1=99 находим Fst = 1,31 (см. табл. VII приложений). Так как /><CPsi, нулевая гипотеза сохраняется; расхождения между выборками по данному признаку оказываются статисти чески недостоверными.
НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ОЦЕНОК
Критерии Стьюдента (t) и Фишера (F) связаны с опреде ленными формами нормального распределения; их применение имеет в виду оценку расхождений-между генеральными пара метрами на основании выборочных показателей сравниваемых совокупностей. Поэтому они называются параметрическими кри териями. Их разрешающая мощность велика лишь при условии,, что сравниваемые совокупности распределяются по нормальному закону или не сильно отклоняются от него.
В практике же встречаются не только нормальные, но и иного вида распределения, о которых исследователю мало что извест но. В таких случаях применение параметрических критериев не гарантирует от возможных ошибок. Поэтому для оценки рас хождений между выборками, наряду с указанными критериями,, используются и другие, вспомогательные критерии, основанные
114
на сравнении не самих вариант, а их порядковых чисел в ран жированном ряду. Критерии, основанные на этом принципе, на зываются порядковыми. Применение порядковых критериев не связано с определенной формой распределения; они не нуждают ся в вычислении средней арифметической и среднего квадрати ческого отклонения и других параметров, поэтому и получили название непараметрических критериев.
Непараметрические, или порядковые, критерии просты по своей конструкции; они не требуют большой вычислительной ра боты, что выгодно отличает их от критериев параметрических. При всем этом преимущество остается на стороне критериев па раметрических, обладающих большей статистической мощно стью, лучшей разрешающей возможностью, чем у критериев непараметрических. Поэтому во всех случаях, когда распределе ния практически не отклоняются от нормального закона, реко мендуется использовать критерии параметрические. Там же, где возникает сомнение в точности выводов, которые делаются па основании использования параметрических критериев, когда форма распределения остается недостаточно ясной, уместно ис пользовать и непараметрические критерии различия. Всесторон ний контроль над правильностью выводов никогда не мешает. Если же обработка выборочного материала разными способами дает один и тот же результат, это гарантия того, что выводы по лучаются правильные.
Существует несколько непараметрических критериев разли чий, неодинаковых по своей конструкции и мощности. Мы рас смотрим лишь два из них, наиболее простых и удобных в работе, особенно при сравнительной оценке малочисленных выборок.
Критерий Т Уайта
Одним из критериев, применяемых для установления досто верности различий, наблюдаемых при сравнении двух независи мых распределений, является непараметрический критерий Т •Уайта, который в равной мере применим к выборкам равновели кого и неодинакового объема. Сущность методики, лежащей в основе применения этого критерия, следующая. Все варианты сравниваемых совокупностей ранжируют в один общий ряд и находят их ранги. Затем ранги суммируют — отдельно по каж дой выборке. Если сравниваемые выборки совершенно не отли чаются одна от другой, то и суммы их рангов должны быть равны между собой. В противном случае такого равенства на блюдаться не будет. И чем значительнее расхождение между выборками, тем больше разница между суммами их рангов. А так как указанные различия могут быть случайными, они оце ниваются с помощью критерия Уайта по специальной таблице, рассчитанной для выборочных наблюдений разного объема и
115