Файл: Лакин Г.Ф. Биометрия учеб. пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 269

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Медиана служит вспомогательной характеристикой вариацион­ ного ряда; ее значение выясняется при оценке эмпирических рас­ пределений по нормальному закону (см. ниже).

Мода

Модой называется наиболее часто встречающаяся величина. В непрерывных вариационных рядах мода находится обыкновен­ но в том классе, который имеет наибольшее число вариант. Этот класс с наибольшей частотой называется модальным классом. Например, в распределении количества кальция в сыворотке кро­ ви павианов-гамадрилов модальным является пятый класс с час­ тотой 25; срединное значение этого класса равно 11,7 мг%.

Вариационные ряды могут содержать два и большее число модальных классов. Обычно мода, как и медиана, является вели­ чиной, довольно близкой к средней арифметической и совпадает с ней при полной симметрии распределения. Поэтому для прак­ тически симметричных или слабо скошенных распределений мо­ да определяется приблизительно по следующим формулам К. Пирсона:

Мо = Зх — 2Me, или Мо = х — 3(х — Me) .

Так, для распределения количества кальция в сыворотке крови павианов-гамадрилов мода определяется по этим формулам сле­ дующим образом:

Мо =

3 X 11,90 — 2 X 11,88 = 3570 — 23,76 — 11,94 мг %,или

Мо =

11,90 + 3(11,90 - 11,88) =

11,90 + 0,06 = 11,96 мг%.

Мода может быть вычислена и по следующей приближенной

формуле:

 

 

 

Mo = X Ля X о

(33)

 

 

2

 

где X — средняя арифметическая;

Л з— показатель асимметрии

или скошенности распределения;

о — среднее

квадратическое

отклонение

 

 

Более точные результаты при определении моды получаются

на основании следующей формулы: .

 

 

Л1о = а + і ( — ^ --- ^ — ),

(34)

 

' 2р2— рі Рг'

 

где xk—■нижняя граница модального класса, т. е. класса с наи­ большей частотой; р\ — частота класса, предшествующего мо-

1 Описание указанных показателей см. ниже.

62


дальному; р2— частота модального класса; р3— частота класса, следующего за модальным.

Применение этой формулы к распределению количества каль­ ция в сыворотке крови павианов-гамадрилов дает следующий ре­

зультат:

 

 

 

Мо =

11,35 + 04

2 5 - 17

=

2 X 2 5 — 17 — 23

= 11,35 +

0

11,35 + 0 ,5 6 = 11,91)

мг%.

Мода и медиана, являясь вспомогательными характеристика­ ми вариационного ряда, применяются в биологических исследо­ ваниях сравнительно редко.

ГЛАВА ПЯТАЯ

ПОКАЗАТЕЛИ ВАРИАЦИИ

ЛИМИТЫ И РАЗМАХ ВАРИАЦИИ

Средняя арифметическая — важнейшая статистическая ха­ рактеристика. Но она ничего не говорит о величине варьирования характеризуемого признака. Не содержат такой информации и другие средние показатели, о которых сообщалось в предыдущей главе. Между тем без учета степени варьирования нельзя соста­

вить полную характеристику варьирующего признака.

Отсюда

следует, что наряду с использованием средних величин

нужны

еще и показатели вариации изучаемых признаков.

л и м и-

Одним из таких показателей служат так называемые

ты (от лат. limes — предел, граница), т. е. минимальная

и мак­

симальная варианты совокупности. Лимиты показывают факти­ ческие границы варьирования признака, что имеет определенное значение, например, в метеорологии, где лимиты показывают ми­ нимальную и максимальную температуру, а также в микробио­ логии для характеристики размеров микроорганизмов, в селекции и во многих других областях знания. Значение лимитов в их кон­ кретности. Поэтому в сводных биометрических таблицах, наряду с другими статистическими показателями, приводятся обыкновен­ но и лимиты, обозначаемые символом Пт.

Размеры варьирования признаков оцениваются также по раз­ ности лимитов, т. е. разности между максимальной и минималь­ ной вариантами совокупности. Этот показатель называется р а з ­ м а х о м вариации. Например, если лимиты одной выборки рав­ ны: min =4 и тах= 16, а другой, т іп = 3 и тах= 19, то размах вариации в первом случае равен: 16—4=12, а во втором— 19— —3=16, откуда следует, что вариабильность первого признака меньше, чем второго.

Описываемые показатели вариации конкретны и просты — в этом их положительное значение. Но, в силу присущих им недо­ статков, они не применяются в качестве основного мерила вари­ ации, во-первых, потому что способны сильно менять свое значе­ ние, а во-вторых, в силу их неспособности характеризовать существенные черты варьирования. Иллюстрацией к сказанному могут служить следующие ряды ранжированных значений двух переменных величин х и у.

х:

10

15

20

25

30

35

40

45

50;

1 = 30

у:

10

28

28

30

30

30

32

32

50;

у = 30

Средние арифметические этих рядов одинаковы, одинаковыми являются и лимиты, а следовательно, и размах вариации. А ха­

64


рактер варьирования у них разный, что не отражается на величи­ не этих показателей..

ДИСПЕРСИЯ И СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ

Наиболее подходящей мерой варьирования служит централь­ ный момент второго порядка. Этот показатель, обозначаемый символом >о2, называется средним квадратом отклонений, или д и с п е р с и е й , и выражается формулой

E j X j - x ) 2 *

(35)

Al — 1

Учитывая повторяемость отклонений и обозначая ихчерез а, мо­ жем выразить эту формулу в таком виде:

'Ера2

(35а)

о2

1

п

 

Извлекая корень квадратный из дисперсии, получим другой по­

казатель— с р е д н е е

к в а д р а т и ч е с к о е

о т к л о н е н и е :

- | /

Е р ( Х і - х ) 2

Ера2

(36)

 

п 1

Уп

1

'

 

Величина п—1 носит название ч и с л а

с т е п е н е й с в о б о ­

ды, под которым подразумевается число свободно варьирующих членов совокупности. Чтобы уяснить это понятие, с которым при­ дется встречаться в дальнейшем, представим некоторую совокуп­ ность варьирующих значений признака, из которой случайным способом, т. е. наугад, отбираются три варианты с тем условием, чтобы в сумме они дали число 30. Очевидно, первые две вариан­ ты могут принимать различные значения, свобода их вариации ничем не ограничена, тогда как третья варианта может принять только одно значение, определяемое разностью между числом 30 и суммой первых двух вариант. В таких случаях говорят, что в ограниченных условиях одна варианта не имеет степени свободы.

В математической статистике доказывается, что при опреде­ лении средней арифметической никаких ■ограничений свободы варьирования не имеется. При вычислении же показателей вари­ ации один член эмпирической совокупности всегда не имеет сте­ пени свободы. А в некоторых случаях для п членов может быть и большее число ограничений свободы вариации (ѵ). Обозначив число степеней свободы через k, можем выразить этот показатель в виде формулы k = n—ѵ. Так как обычно ѵ = 1, то формула при­ нимает вид k = n—1.

* Некоторые авторы средний квадрат отклонений называют вариансой, а под дисперсией понимают сумму квадратов отклонений вариант от средней

арифметической

(Плохинский, 1970; Рокицкий, 1967 и др.).

3—2802

65


Среднее квадратическое отклонение, называемое также основ­ ным, или стандартным, отклонением (от англ, standard deviati­ on),— величина именованная и выражается в тех же единицах измерения, что и признак. Чем сильнее варьирует признак, тем больше и величина среднего квадратического отклонения, и на­ оборот, при слабом варьировании признака среднее квадратиче­ ское отклонение будет меньше. Так, для приведенного выше ряда ранжированных значений переменной величины X среднее квад­ ратическое отклонение оказывается равным 13,7; это видно из следующего расчета:

X:

а:

10

15

20

25

30

35

40

45

50;

20

15

10

5

0

5

10

15

20;

400

225

100

25

0

25

100

225

400;

1500, откуда

і / 1500

,-------

= 13,7,

Ох = у,

= У 187,5

Тогда как для второго ряда {у) этот показатель (сигма) выража­ ется следующей величиной:

У-

10

28

28

30

30

30

3 2

3 2

50:

у = 30

а:

20

2

2

0

0

0

2

2

20

 

а 2:

400

4

4

0

0

0

4

4

400:

2 а 2 = 816

 

 

 

 

-і/"816

 

 

 

 

 

 

 

 

Оу =

У I T " " 1

УШ2

". 10,1.

 

 

Из этого примера видно, что среднее квадратическое отклонение характеризует не только размах, но и специфику варьирования признаков.

При большом числе наблюдений разница между п и п—1 су­ щественно не сказывается на величине показателей вариации. Поэтому в приведенных формулах 35 и 36 вместо п—1 можно брать п. Если же объем совокупности невелик (д<30), этого де­ лать не надо, так как замена п—1 на п становится ощутимой и заметно сказывается на величине показателей вариации, которые окажутся несколько смещенными относительно их значения в генеральной совокупности (см. ниже).

Средняя арифметическая и среднее квадратическое отклоне­ ние дают полную количественную характеристику любой эмпи­ рической совокупности, распределяемой по нормальному закону. Средняя арифметическая отображает действие на признак основ­ ных причин, определяющих типичный для популяции уровень его развития, тогда как среднее квадратическое отклонение характе­ ризует варьирование значений этого признака вокруг центра рас­ пределения, т. е. средней арифметической, является мерой степе­ ни влияния на признак различных второстепенных причин, вызы­

66


вающих его варьирование. Таким образом, эти показатели хотя и отображают разные стороны варьирующих признаков, тесно связаны между собой.

ОСНОВНЫЕ СВОЙСТВА ПОКАЗАТЕЛЕЙ ВАРИАЦИИ

Показатели вариации — дисперсия и среднее квадратическое отклонение — играют большую роль в статистическом анализе биометрических данных. Поэтому важно указать на их основные свойства, которые могут быть использованы при решении ряда вопросов чисто прикладного значения.

1.Если каждую варианту совокупности увеличить на одну и

ту

же

величину,

то средняя арифметическая (х ) увеличится на

ту

же

величину,

тогда как дисперсия и среднее квадратическое

отклонение от этого не изменятся. Это свойство можно иллюст­ рировать на простом примере. Возьмем следующие семь вариант:

2 4 3 5 4 6 4, для которых х = 4,0 и

о2=1,43. Увеличим каждую

варианту на две единицы и вычислим среднюю

(х)

и дисперсию:

х :

4

6

5

7

6

8

_

Их

42

6;

п

7

а:

- 2 0 1

+ 1

0

+ 2 0

 

10

а2:

4

0

1

1

0

4

ІД2

0;

п

7

 

 

 

 

 

 

 

 

и о =

іЛ ,4 3 =

1,195.

 

 

 

 

 

 

Из этого следует, что средний квадрат отклонений можно вы­ числять не только по значениям признака, но и на их отклонени­ ях от какой-нибудь постоянной величины.

2. При умножении каждой варианты на одно и то же число К средняя (ж) увеличится в то же число раз, тогда как квадраты отклонений увеличатся в К2 раз, а следовательно, и дисперсия увеличится в К2 раз, среднее квадратическое отклонение, как и средняя (х), увеличится только в К раз. Иллюстрируем это пра­ вило на том же примере, увеличив каждую варианту в два раза:

х:

4

8

6

10

8

12

8;

-

56

8 , 0

 

=

а :

— 4

0

- 2

+ 2

0

+ 4

0

 

у

 

 

 

 

ß2;

16

0

4

4

0

16

0;

„ 2 _

j 0 _ =

5 ,7 1

 

 

 

 

 

 

 

 

 

7

 

И 0 = У 5 /7 1 = 2 , 3 9

Из этого правила следует, что при наличии многозначных ва­ риант их можно сократить на общий множитель К и по резуль­ татам вычислить дисперсию, а затем уменьшить ее на квадрат общего множителя (К2) для того, чтобы получилась искомая ве­ личина дисперсии.

3 *

67