ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 264
Скачиваний: 1
Видно, что с увеличением числа т вероятность Р\о{т) сначала
Г5 _ 252 быстро возрастает, достигая максимума при и ю — Ю24’ а затем
в такой же последовательности убывает. Эти данные показыва ют, что слишком мала вероятность ожидать, чтобы все десять новорожденных оказались мужского пола. Наиболее вероятный исход—равное отношение полов среди новорожденных.
При больших числах испытаний использование формулы Бер нулли становится затруднительным. В таких случаях для уста новления вероятности частоты ожидаемого события использует ся следующая приближенная формула Лапласа:
|
( т - а р У |
|
Р Л т)= -----: — |
2ПРЧ " |
(6) |
У'Ілпрд |
|
|
Здесь т — частота осуществления ожидаемого события; р — вероятность его осуществления при однократном испытании; пр —■средняя при альтернативном варьировании, или наиболь шая частота; npq — показатель вариации, называемый диспер сией частоты; я — отношение длины окружности к ее диаметру, равное 3,1416...
ПАРАМЕТРЫ БИНОМИАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Из предыдущей формулы видно, что биномиальное распреде ление характеризуется двумя параметрами: средней величиной, представляющей собой наиболее вероятную частоту ожидаемого события в п повторных независимых испытаний и называемую математическим ожиданием, и дисперсией (D) частоты этого со бытия. Математическое ожидание (Е или М) частоты случайно го события приблизительно равно произведению числа испыта ний п на вероятность р, которую имеет данное событие в каждом отдельном испытании, т. е.
Е(т) = М = пр. |
(7) |
Например, нужно определить наиболее вероятное число девочек из общего количества 450 рождающихся детей. Исходя из соот ношения полов 1 : 1, вероятность появления женского пола р = 1І2 - Математическое ожидание рождения девочек выразится следую щей величиной:
М = — X 450 £= 225.
2
Дисперсия частоты т случайного события А в п независимых испытаний равна произведению общего числа испытаний на пря мую и противоположную вероятности этого события:
D(m) = npq. |
(8) |
2 -2802 |
33 |
Так, дисперсия частоты появления девочек в 450 случаях рожде ния потомства для принятой вероятности 0,5 равняется: D{m) = = 450X0,5X0,5=11,25.
Корень квадратный из дисперсии распределения частоты т случайного события А носит название стандартного отклонения биномиального распределения:
a{m) = ^D(m) = ^npq. |
(9) |
Характер биномиального распределения зависит от двух ве личин: числа испытаний п и вероятности р ожидаемого результа та. При p = q —0,5 распределение строго симметрично. Когда число испытаний неограниченно возрастает, т. е. при «->■оо, кри вая биномиального распределения стремится к своему пределу — кривой нормального распределения (см. ниже).
ПОНЯТИЕ СЛУЧАЙНОЙ ВЕЛИЧИНЫ
Все, что можно подсчитать или измерить, называется величи ной. Не составляют исключение и биологические признаки — альтернативные и рядовые, когда их рассматривают с количест венной стороны. Поэтому в области биометрии допустимо не раз граничивать биологическое понятие «признак» с математическим понятием «величина»; в дальнейшем различий между этими по нятиями не делается.
Величины делятся на постоянные и переменные. Постоянной называется величина, которая в заданных условиях не меняет своего значения. Переменная — это такая величина, которая в данных условиях способна принимать различные числовые зна чения. Постоянные и переменные величины принято обозначать заглавными буквами, а их значения— строчными; причем посто янные величины обозначаются начальными буквами латинского алфавита (Л, В , С,...), а переменные — последними буквами то го же алфавита (X, У, Z, ...), соответственно прописными буква ми обозначаются значения постоянных (а, Ь, с, ...), и переменных івеличин Х[, х2, Хз, ... или у\, у2, уз, ■■■ и т. д. Биологу приходится иметь дело и с переменными и с постоянными величинами. С.пос ледними он встречается, используя те или иные уравнения, в ко
торые входят постоянные |
величины, |
называемые параметрами. |
Переменная величина |
называется |
с л у ч а й н о й , если в за |
данных условиях она может принимать то одни, то другие значе ния. Случайная величина, принимающая только целые числовые значения 0, 1, 2, 3, 4 ..., называется прерывистой или дискретной. Если же значения случайной величины можно указать лишь в ка ком-то промежутке от — до, она называется непрерывной случай ной величиной. Очевидно, счетные признаки — это дискретные случайные величины, а все мерные признаки относятся к случай ным величинам непрерывного варьирования.
34
Случайная величина в N повторных испытаниях может при нимать самые различные значения, но в каждом отдельном испы тании она принимает всегда только одно из возможных значе ний. Какое значение примет случайная величина в результате каждого испытания, заранее сказать невозможно. Поэтому ха рактеризовать случайную величину можно лишь с определенной вероятностью, т. е. указывая вероятность ее возможных значений.
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ
Для точного выражения зависимости между переменными ве личинами в математике существует понятие ф у н к ц и и . Если определенному значению, которое может принять переменная величина X, называемая аргументом, соответствует одно значе ние другой переменной величины У, называемой функцией, то говорят «игрек есть функция от икс» и записывают эту функцио
нальную зависимость |
в виде уравнения общего вида Y = f ( X ) . |
Здесь выражение f ( X ) |
подразумевает действие, которое необхо |
димо произвести над аргументом, чтобы получить значение У. На пример, если У увеличивается в 2 раза быстрее, чем связанная с ней величина X, то зависимость между этими переменными мож
но выразить уравнением |
У = 2 Х , по которому легко |
построить |
график этой функции. |
распределения переменной |
случайной |
Чтобы открыть закон |
величины, необходимо найти функциональную зависимость меж ду числовыми значениями, которые она может принимать, и веро ятностями этих значений. Для случаев альтернативного (дис кретного) варьирования эта зависимость выражается приведен ной выше формулой 6. В отношении же непрерывной случайной величины указать вероятности ее значений принципиально невоз можно, так как в пределах заданного интервала она может при нимать любые значения. Поэтому речь может идти лишь о тех значениях, которые случайная непрерывная величина может при нять с той или иной вероятностью в интервале от — до, причем этот интервал может быть каким угодно— и большим и малым. Математики Муавр (1733), а затем Лаплас (1780) и Гаусс (1809), независимо друг от друга, доказали теорему о том, что вероятность Р любого значения х непрерывно распределяющей ся случайной величины X находиться в интервале от х до x + dx, где dx — величина, определяющая ширину указанного ин тервала, выражается следующей формулой:
1 |
- ( х - м г |
|
Р{х) = -----—1 |
Х е 2оа dx, |
(10) |
о У 2я |
|
|
где я и е — математические константы: я = 3,1416..., а е = 2,7183...; греческая буква а (сигма малая) обозначает стандартное или среднее квадратическое отклонение, характеризующее размер
2 * |
35 |
вариации случайной величины; М — средняя величина или мате
матическое ожидание.
Формула Гаусса — Лапласа описывает закон нормального распределения случайных величин, называемый также нормаль
ным законом. Выражение^__ , входящее в состав форму
лы 10, называется нормированным отклонением и обозначается буквой t; эта величина играет большую роль в исследовании свойств нормального распределения. Можно сказать, что форму ла Гаусса — Лапласа выражает зависимость между вероятно стью Р и нормированным отклонением t. Иными словами, вероят ность отклонения любого значения х случайной величины X от математического ожидания, которое служит центром распреде ления, где х—М = 0, определяется функцией нормированного от клонения. В простейшем виде эта функция выражается уравнением следующего вида:
V 2я |
|
|
|
|
|
(И) |
|
Здесь t — случайная |
величина, |
||||||
|
|||||||
|
для |
которой |
математическое |
||||
|
ожидаңие равно нулю, а сред |
||||||
|
нее |
квадратическое |
отклоне |
||||
|
ние— единице. Кривая, описы |
||||||
|
ваемая этим уравнением и на |
||||||
|
зываемая |
кривой |
нормального |
||||
Рис. 8. Кривая нормального распреде- |
распределения, или |
нормаль- |
|||||
ной |
кривой, |
имеет |
площадь, |
||||
ления |
равную |
единице. |
Графически |
||||
|
она |
изображается |
в |
виде ко |
локолообразной кривой, изображенной на рис. 8. Максимальная ордината этой кривой, или ее вершина, соответствует началу ко ординат, перенесенному в центр распределения, где х — М = 0. Вправо и влево от этого центра случайная величина может при нимать любые значения. Как уже сказано, величина отклонения значения х случайной величины X от центра распределения М определяется функцией его нормированного отклонения — f(t). Вероятности таких отклонений Р, соответствующие разным зна чениям t, приводятся в табл. I приложений. Из этой таблицы видно, что на равные интервалы, измеренные нормированным отклонением от центра распределения, приходится равное число вариант, и вероятность любой варианты х отклониться на t, 2t
и 3t в обе стороны от М равняется: |
|
|
|
Р{— t < x — М < |
+ |
0 = |
0,683 |
Р{— 2t.< X — М < |
+ |
20 = |
0,954 |
Р{— 3t < X — М < |
+ |
30 = |
0,997. |
36
Другими словами, в пределах от — t до + t расположено 68,3% всей площади, а следовательно, 68,3% от числа всех членов со вокупности и т. д. Это значит, что при общей численности 10 000 испытаний в пределах M ± t должно быть 6827 или 68,3% всех членов ряда.
Чтобы ордината (У) выражала не вероятности, а абсолютные численности, т. е. теоретически ожидаемые частоты вариант эм пирического вариационного ряда, нужно в правую часть уравне ния 11 ввести дополнительные множители: в числитель — общее число наблюдений (п) и величину классового интервала (і), если совокупность разбита на классы, а в знаменатель — величину среднего квадратического отклонения. Тогда уравнение 11 при нимает следующее выражение:
|
Р' = —о X f ( t ) , |
(12) |
1 |
- |
|
гдef ( t ) = —— Х<? — значение функции t. Эти значения приво-
V 2Л
дятся в табл. II приложений, р' — теоретические или ожидаемые частоты вариационного ряда. Пользуясь табл. I и II приложений, можно по двум эмпирическим показателям — средней величине и среднему квадратическому отклонению (см. ниже)— опреде лить ожидаемые частоты вариационного ряда, рассчитать орди наты и построить нормальную кривую. Таким образом из соотно шения, существующего между средней величиной (М ) и мерой варьирования (а), априори выводятся числовые характеристики закона распределения без опасения впасть в разногласие с фак тами. Как будет показано в дальнейшем, этот вывод имеет прин ципиальное значение в области статистического анализа эмпири ческих распределений.
ПАРАМЕТРЫ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ
Нормальное распределение характеризуется математическим ожиданием и дисперсией случайной величины. Математическое ожидание случайной величины X равняется сумме произведений отдельных значений этой величины на их вероятности:
Е (X) = М — Xipi -f- Х2 Р2 Ч- ... -f- XNPN = "EXjpi. |
(13) |
Математическое ожидание — величина именованная, она выра жается в тех же единицах меры, что и случайная величина. Фор мально математическое ожидание соответствует понятию средней арифметической (см. ниже). Однако ставить знак равенства меж ду этими средними величинами нельзя. Средняя арифметическая
37