Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 264

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Видно, что с увеличением числа т вероятность Р\о{т) сначала

Г5 _ 252 быстро возрастает, достигая максимума при и ю — Ю24’ а затем

в такой же последовательности убывает. Эти данные показыва­ ют, что слишком мала вероятность ожидать, чтобы все десять новорожденных оказались мужского пола. Наиболее вероятный исход—равное отношение полов среди новорожденных.

При больших числах испытаний использование формулы Бер­ нулли становится затруднительным. В таких случаях для уста­ новления вероятности частоты ожидаемого события использует­ ся следующая приближенная формула Лапласа:

 

( т - а р У

 

Р Л т)= -----:

2ПРЧ "

(6)

У'Ілпрд

 

 

Здесь т — частота осуществления ожидаемого события; р — вероятность его осуществления при однократном испытании; пр —■средняя при альтернативном варьировании, или наиболь­ шая частота; npq — показатель вариации, называемый диспер­ сией частоты; я — отношение длины окружности к ее диаметру, равное 3,1416...

ПАРАМЕТРЫ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Из предыдущей формулы видно, что биномиальное распреде­ ление характеризуется двумя параметрами: средней величиной, представляющей собой наиболее вероятную частоту ожидаемого события в п повторных независимых испытаний и называемую математическим ожиданием, и дисперсией (D) частоты этого со­ бытия. Математическое ожидание или М) частоты случайно­ го события приблизительно равно произведению числа испыта­ ний п на вероятность р, которую имеет данное событие в каждом отдельном испытании, т. е.

Е(т) = М = пр.

(7)

Например, нужно определить наиболее вероятное число девочек из общего количества 450 рождающихся детей. Исходя из соот­ ношения полов 1 : 1, вероятность появления женского пола р = 1І2 - Математическое ожидание рождения девочек выразится следую­ щей величиной:

М = — X 450 £= 225.

2

Дисперсия частоты т случайного события А в п независимых испытаний равна произведению общего числа испытаний на пря­ мую и противоположную вероятности этого события:

D(m) = npq.

(8)

2 -2802

33


Так, дисперсия частоты появления девочек в 450 случаях рожде­ ния потомства для принятой вероятности 0,5 равняется: D{m) = = 450X0,5X0,5=11,25.

Корень квадратный из дисперсии распределения частоты т случайного события А носит название стандартного отклонения биномиального распределения:

a{m) = ^D(m) = ^npq.

(9)

Характер биномиального распределения зависит от двух ве­ личин: числа испытаний п и вероятности р ожидаемого результа­ та. При p = q 0,5 распределение строго симметрично. Когда число испытаний неограниченно возрастает, т. е. при «->■оо, кри­ вая биномиального распределения стремится к своему пределу — кривой нормального распределения (см. ниже).

ПОНЯТИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ

Все, что можно подсчитать или измерить, называется величи­ ной. Не составляют исключение и биологические признаки — альтернативные и рядовые, когда их рассматривают с количест­ венной стороны. Поэтому в области биометрии допустимо не раз­ граничивать биологическое понятие «признак» с математическим понятием «величина»; в дальнейшем различий между этими по­ нятиями не делается.

Величины делятся на постоянные и переменные. Постоянной называется величина, которая в заданных условиях не меняет своего значения. Переменная — это такая величина, которая в данных условиях способна принимать различные числовые зна­ чения. Постоянные и переменные величины принято обозначать заглавными буквами, а их значения— строчными; причем посто­ янные величины обозначаются начальными буквами латинского алфавита (Л, В , С,...), а переменные — последними буквами то­ го же алфавита (X, У, Z, ...), соответственно прописными буква­ ми обозначаются значения постоянных (а, Ь, с, ...), и переменных івеличин Х[, х2, Хз, ... или у\, у2, уз, ■■■ и т. д. Биологу приходится иметь дело и с переменными и с постоянными величинами. С.пос­ ледними он встречается, используя те или иные уравнения, в ко­

торые входят постоянные

величины,

называемые параметрами.

Переменная величина

называется

с л у ч а й н о й , если в за­

данных условиях она может принимать то одни, то другие значе­ ния. Случайная величина, принимающая только целые числовые значения 0, 1, 2, 3, 4 ..., называется прерывистой или дискретной. Если же значения случайной величины можно указать лишь в ка­ ком-то промежутке от — до, она называется непрерывной случай­ ной величиной. Очевидно, счетные признаки — это дискретные случайные величины, а все мерные признаки относятся к случай­ ным величинам непрерывного варьирования.

34


Случайная величина в N повторных испытаниях может при­ нимать самые различные значения, но в каждом отдельном испы­ тании она принимает всегда только одно из возможных значе­ ний. Какое значение примет случайная величина в результате каждого испытания, заранее сказать невозможно. Поэтому ха­ рактеризовать случайную величину можно лишь с определенной вероятностью, т. е. указывая вероятность ее возможных значений.

НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Для точного выражения зависимости между переменными ве­ личинами в математике существует понятие ф у н к ц и и . Если определенному значению, которое может принять переменная величина X, называемая аргументом, соответствует одно значе­ ние другой переменной величины У, называемой функцией, то говорят «игрек есть функция от икс» и записывают эту функцио­

нальную зависимость

в виде уравнения общего вида Y = f ( X ) .

Здесь выражение f ( X )

подразумевает действие, которое необхо­

димо произвести над аргументом, чтобы получить значение У. На­ пример, если У увеличивается в 2 раза быстрее, чем связанная с ней величина X, то зависимость между этими переменными мож­

но выразить уравнением

У = 2 Х , по которому легко

построить

график этой функции.

распределения переменной

случайной

Чтобы открыть закон

величины, необходимо найти функциональную зависимость меж­ ду числовыми значениями, которые она может принимать, и веро­ ятностями этих значений. Для случаев альтернативного (дис­ кретного) варьирования эта зависимость выражается приведен­ ной выше формулой 6. В отношении же непрерывной случайной величины указать вероятности ее значений принципиально невоз­ можно, так как в пределах заданного интервала она может при­ нимать любые значения. Поэтому речь может идти лишь о тех значениях, которые случайная непрерывная величина может при­ нять с той или иной вероятностью в интервале от — до, причем этот интервал может быть каким угодно— и большим и малым. Математики Муавр (1733), а затем Лаплас (1780) и Гаусс (1809), независимо друг от друга, доказали теорему о том, что вероятность Р любого значения х непрерывно распределяющей­ ся случайной величины X находиться в интервале от х до x + dx, где dx — величина, определяющая ширину указанного ин­ тервала, выражается следующей формулой:

1

- ( х - м г

 

Р{х) = -----—1

Х е 2оа dx,

(10)

о У

 

 

где я и е — математические константы: я = 3,1416..., а е = 2,7183...; греческая буква а (сигма малая) обозначает стандартное или среднее квадратическое отклонение, характеризующее размер

2 *

35


вариации случайной величины; М — средняя величина или мате­

матическое ожидание.

Формула Гаусса — Лапласа описывает закон нормального распределения случайных величин, называемый также нормаль­

ным законом. Выражение^__ , входящее в состав форму­

лы 10, называется нормированным отклонением и обозначается буквой t; эта величина играет большую роль в исследовании свойств нормального распределения. Можно сказать, что форму­ ла Гаусса — Лапласа выражает зависимость между вероятно­ стью Р и нормированным отклонением t. Иными словами, вероят­ ность отклонения любого значения х случайной величины X от математического ожидания, которое служит центром распреде­ ления, где х—М = 0, определяется функцией нормированного от­ клонения. В простейшем виде эта функция выражается уравнением следующего вида:

V

 

 

 

 

 

(И)

Здесь t — случайная

величина,

 

 

для

которой

математическое

 

ожидаңие равно нулю, а сред­

 

нее

квадратическое

отклоне­

 

ние— единице. Кривая, описы­

 

ваемая этим уравнением и на­

 

зываемая

кривой

нормального

Рис. 8. Кривая нормального распреде-

распределения, или

нормаль-

ной

кривой,

имеет

площадь,

ления

равную

единице.

Графически

 

она

изображается

в

виде ко­

локолообразной кривой, изображенной на рис. 8. Максимальная ордината этой кривой, или ее вершина, соответствует началу ко­ ординат, перенесенному в центр распределения, где х — М = 0. Вправо и влево от этого центра случайная величина может при­ нимать любые значения. Как уже сказано, величина отклонения значения х случайной величины X от центра распределения М определяется функцией его нормированного отклонения — f(t). Вероятности таких отклонений Р, соответствующие разным зна­ чениям t, приводятся в табл. I приложений. Из этой таблицы видно, что на равные интервалы, измеренные нормированным отклонением от центра распределения, приходится равное число вариант, и вероятность любой варианты х отклониться на t, 2t

и 3t в обе стороны от М равняется:

 

 

Р{— t < x — М <

+

0 =

0,683

Р{— 2t.< X — М <

+

20 =

0,954

Р{— 3t < X — М <

+

30 =

0,997.

36


Другими словами, в пределах от — t до + t расположено 68,3% всей площади, а следовательно, 68,3% от числа всех членов со­ вокупности и т. д. Это значит, что при общей численности 10 000 испытаний в пределах M ± t должно быть 6827 или 68,3% всех членов ряда.

Чтобы ордината (У) выражала не вероятности, а абсолютные численности, т. е. теоретически ожидаемые частоты вариант эм­ пирического вариационного ряда, нужно в правую часть уравне­ ния 11 ввести дополнительные множители: в числитель — общее число наблюдений (п) и величину классового интервала (і), если совокупность разбита на классы, а в знаменатель — величину среднего квадратического отклонения. Тогда уравнение 11 при­ нимает следующее выражение:

 

Р' = о X f ( t ) ,

(12)

1

-

 

гдef ( t ) = —— Х<? — значение функции t. Эти значения приво-

V 2Л

дятся в табл. II приложений, р' — теоретические или ожидаемые частоты вариационного ряда. Пользуясь табл. I и II приложений, можно по двум эмпирическим показателям — средней величине и среднему квадратическому отклонению (см. ниже)— опреде­ лить ожидаемые частоты вариационного ряда, рассчитать орди­ наты и построить нормальную кривую. Таким образом из соотно­ шения, существующего между средней величиной (М ) и мерой варьирования (а), априори выводятся числовые характеристики закона распределения без опасения впасть в разногласие с фак­ тами. Как будет показано в дальнейшем, этот вывод имеет прин­ ципиальное значение в области статистического анализа эмпири­ ческих распределений.

ПАРАМЕТРЫ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Нормальное распределение характеризуется математическим ожиданием и дисперсией случайной величины. Математическое ожидание случайной величины X равняется сумме произведений отдельных значений этой величины на их вероятности:

Е (X) = М Xipi -f- Х2 Р2 Ч- ... -f- XNPN = "EXjpi.

(13)

Математическое ожидание — величина именованная, она выра­ жается в тех же единицах меры, что и случайная величина. Фор­ мально математическое ожидание соответствует понятию средней арифметической (см. ниже). Однако ставить знак равенства меж­ ду этими средними величинами нельзя. Средняя арифметическая

37