Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 364

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

эмпирической совокупности приближается к ее математическому ожиданию по мере увеличения числа наблюдений. Чтобы опреде­ лить математическое ожидание случайной величины, нужно выяс­ нить значения, которые она может принимать, и вероятности этих значений. Например, из 50 животных, поступающих на про­ дажу, десять оценены по 100 рублей каждое, 25 особей получили оценку по 80 рублей, а остальные 15 животных оценены по 50 рублей. Определим среднюю стоимость, т. е. математическое ожидание животных этой партии. Таблица значений этой івеличины с их вероятностями следующая:

значения величины:

100

80

50

вероятности значений:

10/50

25/50

15/50,

отсюда М = 100X0,2 + 80X0,5 + 50X0,3 = 75 рублей.

Дисперсия служит мерой отклонения возможных значений случайной величины X от ее математического ожидания М. Она равна математическому ожиданию квадрата отклонения значе­

ний этой величины от ее математического ожидания:

 

D (X) = Е ( хі — М )2.

(14)

Дисперсию случайной величины можно представить и как раз­ ность между математическим ожиданием квадрата этой величи­ ны и квадратом ее математического ожидания:

D(X) = Е(Х2) — [Е{Х)]2.

(14а)

Например, имеются следующие значения случайной величины X и их вероятности:

х:

0

1

2

3

р:

0,2

0,3

0,4

0,1

Найдем математическое ожидание и дисперсию этой величины:

М =

0 X 0,2 +

1 X 0,3

+

2 X 0,4 + 3 X 0,1 = 1,4.

Определяем

величину

Е(Х2)

=

0 X 0 ,2 + 1 X0,3 + 4Х0,4 + 9Х0,1 =

=2,8.

Атакже [E(X)f = (1,4)2= 1,96. Откуда D(X) =2,8—1,96 = 0,84.

РАСПРЕДЕЛЕНИЕ ПУАССОНА

Когда вероятности альтернатив неравны, т. е. рф ц, биноми­ альное распределение становится ассиметричным и тем сильнее, чем больше разница между вероятностями р и q. Когда вероят­ ность р ожидаемого события очень мала, т. е. исчисляется соты­ ми и тысячными долями единицы по сравнению с противополож­ ной вероятностью q этого события, распределение его частоты в п независимых испытаний становится крайне ассимметричным. Распределение частоты таких редких событий описывается сле­ дующей формулой Пуассона (1837):

38


где т — частота ожидаемого события в п независимых испыта­ ний; а ^ п р — наивероятнейшая частота или математическое ожи­ дание редкого события; е = 2,7183...— основание натуральных ло­

гарифмов; ml — факториал частоты, т. е. произведение

нату­

ральных чисел 0ХІ Х2 ХЗ Х4 Х ... X т.

 

Формула 15 может быть выражена и в таком виде:

 

Рп{т) — —-— .

(15а)

т\еа

 

По этой формуле проще определить вероятность частоты т ред­ кого события в серии независимых испытаний. Например, для а = 2 вероятность того, что событие А в данных условиях не осу­ ществится, будет равна:

1

1

ÖI72 ~~

(2,7183)2

0,1353.

7,389

Вероятность единичного осуществления события А равняется:

21

2

2

Не2

(2,7183)2

0,2707.

~7Д89

Для трех случаев вероятность Рз = 0,1805 и т. д. Так определяют­ ся значения вероятности Рп(т) для любых значений а от 0 до п. Таблица этих значений помещена в приложениях под № III. По этой таблице можно определить ожидаемые частоты т редкого события А для любого числа испытаний п. Для этого формула 15 преобразуется так, чтобы она выражала не вероятности, а ожи­ даемые абсолютные частоты случайного события А:

х т

(16)

р' = — Хе-*.

ml

 

Здесь р' — теоретические ординаты кривой распределения Пуас­ сона, т. е. ожидаемое число случаев редкого события в каждом отдельно взятом классе испытания — 0, 1, 2, 3 и т. д.; х — сред­ нее число фактически наблюдаемых случаев. Остальные символы объяснены выше.

Распределение Пуассона — частный случай биномиального распределения; оно обладает свойством с возрастанием средней а = пр приближаться к кривой биномиального распределения, что видно на рис. 9, который иллюстрирует график функции Рп (т), построенный для разных значений а.

Формула Пуассона описывает многие явления, с которыми биологи встречаются в своей работе. Наиболее часто такие ред­



кие случайные события наблюдаются в области микробиологии, радиобиологии, биофизики и в других отраслях биологической науки. Сэджер и Райн (1964) показали, что спонтанный мутаци­ онный процесс у кишечной палочки (Escherichia coli) описыва­ ется формулой Пуассона

рп(т)

ат

Рие. 9. График функции Рп(т) = е-“ для раз­

ных значений а

ПАРАМЕТРЫ РАСПРЕДЕЛЕНИЯ ПУАССОНА

Закон распределения редких событий, описываемый форму­ лой Пуассона, является частным случаем биномиального распре­ деления и характеризуется теми же параметрами, что и биномиальное распределение. Но в отличие от последнего для распределения Пуассона характерно совпадение по абсолютной величине математического ожидания и дисперсии случайной ве­ личины. Иначе говоря, дисперсия случайной величины, распре­ деляемой по закону Пуассона, равна наивероятнейшей частоте этой величины или ее математическому ожиданию: D(m)=a.

* *

Рассмотренные законы распределения выведены путем мате­ матической индукции на основании известных фактов. Они про­ диктованы конкретными задачами и служат математическими моделями эмпирических распределений. Значение описанных те­ оретических законов распределения в исследовательской работе исключительно велико: они составляют логическую основу био­ метрии, на них опирается статистический анализ массовых явлений.

' С э д ж е р

Р. и Р а й н Ф. Цитологические и химические основы на­

следственности.

«Мир», М., 1964, стр. 62—68.

40

ГЛАВА ЧЕТВЕРТАЯ

СРЕДНИЕ ВЕЛИЧИНЫ

ВИДЫ СРЕДНИХ И ИХ ЗНАЧЕНИЕ

Одной из важнейших обобщающих характеристик варьирую­

щих признаков является

с р е д н я я в ел и ч и н а. Характеризуя

ту или иную популяцию,

говорят, например, о средней продук­

тивности животных или растительных организмов, средней успе­ ваемости учащихся, о средней скорости биохимических реакций и о многих других средних величинах. Значение средних заклю­ чается в их свойстве нивелировать индивидуальные различия, в результате чего выступает более или менее устойчивая числовая характеристика признака — не отдельных представителей, а це­ лой группы статистических единиц.

Средняя величина характеризует групповые свойства. В ней, как в фокусе лучи, сходятся все силовые линии тех многочислен­ ных влияний, под воздействием которых происходит развитие признака и определяется размах его вариации. В средней нахо­ дит свое выражение внутренняя связь, существующая между от­ дельными вариантами и всей их совокупностью в целом. Средняя величина — это центр распределения: она занимает центральное положение в общей массе варьирующих значений признака.

Существует несколько видов средних. Применяемые в биоло­ гии средние делятся на степенные, или параметрические, и сред­ ние порядковые, или непараметрические. Параметрические сред­ ние функционально связаны с распределением варьирующих признаков, тогда как порядковые средние функциональной связи с распределением признаков не имеют, характеризуя лишь струк­ турные особенности вариации, поэтому и относятся к группе структурных средних. К ним принадлежат медиана, мода и неко­ торые другие средние показатели.

Параметрические, или степенные, средние получаются из

общей формулы:

h

 

 

(17)

где X — средняя величина; х — варианта;

2 — знак суммирова­

ния; п — объем совокупности, на котором

вычисляется

средняя;

k— величина, определяющая вид средней. Так, при &=1

получа­

ется средняя арифметическая (х), при k —1 — средняя гармо­ ническая (хи), при k = 2 — средняя квадратическая и т. д.

Наряду с общими средними, характеризующими всю совокуп­ ность наблюдений, различают частные, или групповые, средние (хі ), вычисляемые на отдельных (частных) группах вариант,

41


входящих в состав общей совокупности или данного комплекса (в дисперсионном анализе).

Критерием правильного выбора средней служат ее свойства, которые должны соответствовать содержанию описываемого яв­ ления и согласоваться с задачами и характером исследования. Если эти условия не выполняются, средняя не может служить точной обобщающей характеристикой массовых явлений.

СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ

Простая средняя арифметическая

Из всех параметрических средних наиболее часто применяет­ ся средняя арифметическая (х ), представляющая частное от де­ ления суммы всех вариант совокупности на их общее число:

Хі -{- Х2 -f- Х3 -f- . . . -f- Хп 2Xt

(17)

п

п

Например, в помете каждой из шести свиноматок было получено следующее количество поросят:

№ животных по порядку:

4

5

6

число поросят в помете:

5

8

10

В данном случае численность отдельных вариант повторяется всего один раз. В этом легко убедиться, распределив эти данные в вариационный ряд:

число поросят в помете

(* ):

4

 

5

6

8

9

10

количество пометов

(ча­

1

1

1

 

1

1

стота, р) :

1

 

Средняя арифметическая, вычисленная для такого рода сово­ купности-, называется п р о с т о й , или невзвешенной средней. В данном случае:

1

( 4 +

42

X =

5 + 6 + 8 + Э _|_ 10) = —■= 7 поросят.

6

 

R

Средняя арифметическая — величина именованная, она выра­ жается теми же единицами измерения, что и характеризуемый ею признак.

Взвешенная средняя

Если же в совокупности наблюдений отдельные варианты пов­ торяются р раз, то средняя вычисляется с учетом повторяемости вариант по следующей формуле:

ХіРі + Х2р2 “Ь • • • + Хпр п

2 Хірі

p i + Pz + . • • + Рп

( 18)

2 Pi

42