ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 269
Скачиваний: 1
Медиана служит вспомогательной характеристикой вариацион ного ряда; ее значение выясняется при оценке эмпирических рас пределений по нормальному закону (см. ниже).
Мода
Модой называется наиболее часто встречающаяся величина. В непрерывных вариационных рядах мода находится обыкновен но в том классе, который имеет наибольшее число вариант. Этот класс с наибольшей частотой называется модальным классом. Например, в распределении количества кальция в сыворотке кро ви павианов-гамадрилов модальным является пятый класс с час тотой 25; срединное значение этого класса равно 11,7 мг%.
Вариационные ряды могут содержать два и большее число модальных классов. Обычно мода, как и медиана, является вели чиной, довольно близкой к средней арифметической и совпадает с ней при полной симметрии распределения. Поэтому для прак тически симметричных или слабо скошенных распределений мо да определяется приблизительно по следующим формулам К. Пирсона:
Мо = Зх — 2Me, или Мо = х — 3(х — Me) .
Так, для распределения количества кальция в сыворотке крови павианов-гамадрилов мода определяется по этим формулам сле дующим образом:
Мо = |
3 X 11,90 — 2 X 11,88 = 3570 — 23,76 — 11,94 мг %,или |
||
Мо = |
11,90 + 3(11,90 - 11,88) = |
11,90 + 0,06 = 11,96 мг%. |
|
Мода может быть вычислена и по следующей приближенной |
|||
формуле: |
|
|
|
|
Mo = X — Ля X о |
(33) |
|
|
|
2 |
|
где X — средняя арифметическая; |
Л з— показатель асимметрии |
||
или скошенности распределения; |
о — среднее |
квадратическое |
|
отклонение |
|
|
|
Более точные результаты при определении моды получаются |
|||
на основании следующей формулы: . |
|
||
|
Л1о = а + і ( — ^ --- ^ — ), |
(34) |
|
|
' 2р2— рі — Рг' |
|
где xk—■нижняя граница модального класса, т. е. класса с наи большей частотой; р\ — частота класса, предшествующего мо-
1 Описание указанных показателей см. ниже.
62
дальному; р2— частота модального класса; р3— частота класса, следующего за модальным.
Применение этой формулы к распределению количества каль ция в сыворотке крови павианов-гамадрилов дает следующий ре
зультат: |
|
|
|
Мо = |
11,35 + 04 |
2 5 - 17 |
= |
2 X 2 5 — 17 — 23 |
|||
= 11,35 + |
0 |
11,35 + 0 ,5 6 = 11,91) |
мг%. |
Мода и медиана, являясь вспомогательными характеристика ми вариационного ряда, применяются в биологических исследо ваниях сравнительно редко.
ГЛАВА ПЯТАЯ
ПОКАЗАТЕЛИ ВАРИАЦИИ
ЛИМИТЫ И РАЗМАХ ВАРИАЦИИ
Средняя арифметическая — важнейшая статистическая ха рактеристика. Но она ничего не говорит о величине варьирования характеризуемого признака. Не содержат такой информации и другие средние показатели, о которых сообщалось в предыдущей главе. Между тем без учета степени варьирования нельзя соста
вить полную характеристику варьирующего признака. |
Отсюда |
следует, что наряду с использованием средних величин |
нужны |
еще и показатели вариации изучаемых признаков. |
л и м и- |
Одним из таких показателей служат так называемые |
|
ты (от лат. limes — предел, граница), т. е. минимальная |
и мак |
симальная варианты совокупности. Лимиты показывают факти ческие границы варьирования признака, что имеет определенное значение, например, в метеорологии, где лимиты показывают ми нимальную и максимальную температуру, а также в микробио логии для характеристики размеров микроорганизмов, в селекции и во многих других областях знания. Значение лимитов в их кон кретности. Поэтому в сводных биометрических таблицах, наряду с другими статистическими показателями, приводятся обыкновен но и лимиты, обозначаемые символом Пт.
Размеры варьирования признаков оцениваются также по раз ности лимитов, т. е. разности между максимальной и минималь ной вариантами совокупности. Этот показатель называется р а з м а х о м вариации. Например, если лимиты одной выборки рав ны: min =4 и тах= 16, а другой, т іп = 3 и тах= 19, то размах вариации в первом случае равен: 16—4=12, а во втором— 19— —3=16, откуда следует, что вариабильность первого признака меньше, чем второго.
Описываемые показатели вариации конкретны и просты — в этом их положительное значение. Но, в силу присущих им недо статков, они не применяются в качестве основного мерила вари ации, во-первых, потому что способны сильно менять свое значе ние, а во-вторых, в силу их неспособности характеризовать существенные черты варьирования. Иллюстрацией к сказанному могут служить следующие ряды ранжированных значений двух переменных величин х и у.
х: |
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
50; |
1 = 30 |
у: |
10 |
28 |
28 |
30 |
30 |
30 |
32 |
32 |
50; |
у = 30 |
Средние арифметические этих рядов одинаковы, одинаковыми являются и лимиты, а следовательно, и размах вариации. А ха
64
рактер варьирования у них разный, что не отражается на величи не этих показателей..
ДИСПЕРСИЯ И СРЕДНЕЕ КВАДРАТИЧЕСКОЕ ОТКЛОНЕНИЕ
Наиболее подходящей мерой варьирования служит централь ный момент второго порядка. Этот показатель, обозначаемый символом >о2, называется средним квадратом отклонений, или д и с п е р с и е й , и выражается формулой
E j X j - x ) 2 *
(35)
Al — 1
Учитывая повторяемость отклонений и обозначая ихчерез а, мо жем выразить эту формулу в таком виде:
'Ера2 |
(35а) |
|
о2 |
1 |
|
п — |
|
Извлекая корень квадратный из дисперсии, получим другой по
казатель— с р е д н е е |
к в а д р а т и ч е с к о е |
о т к л о н е н и е : |
||
- | / |
Е р ( Х і - х ) 2 |
Ера2 |
(36) |
|
|
п — 1 |
Уп — |
1 |
|
' |
|
|||
Величина п—1 носит название ч и с л а |
с т е п е н е й с в о б о |
ды, под которым подразумевается число свободно варьирующих членов совокупности. Чтобы уяснить это понятие, с которым при дется встречаться в дальнейшем, представим некоторую совокуп ность варьирующих значений признака, из которой случайным способом, т. е. наугад, отбираются три варианты с тем условием, чтобы в сумме они дали число 30. Очевидно, первые две вариан ты могут принимать различные значения, свобода их вариации ничем не ограничена, тогда как третья варианта может принять только одно значение, определяемое разностью между числом 30 и суммой первых двух вариант. В таких случаях говорят, что в ограниченных условиях одна варианта не имеет степени свободы.
В математической статистике доказывается, что при опреде лении средней арифметической никаких ■ограничений свободы варьирования не имеется. При вычислении же показателей вари ации один член эмпирической совокупности всегда не имеет сте пени свободы. А в некоторых случаях для п членов может быть и большее число ограничений свободы вариации (ѵ). Обозначив число степеней свободы через k, можем выразить этот показатель в виде формулы k = n—ѵ. Так как обычно ѵ = 1, то формула при нимает вид k = n—1.
* Некоторые авторы средний квадрат отклонений называют вариансой, а под дисперсией понимают сумму квадратов отклонений вариант от средней
арифметической |
(Плохинский, 1970; Рокицкий, 1967 и др.). |
3—2802 |
65 |
Среднее квадратическое отклонение, называемое также основ ным, или стандартным, отклонением (от англ, standard deviati on),— величина именованная и выражается в тех же единицах измерения, что и признак. Чем сильнее варьирует признак, тем больше и величина среднего квадратического отклонения, и на оборот, при слабом варьировании признака среднее квадратиче ское отклонение будет меньше. Так, для приведенного выше ряда ранжированных значений переменной величины X среднее квад ратическое отклонение оказывается равным 13,7; это видно из следующего расчета:
X:
а:
10 |
15 |
20 |
25 |
30 |
35 |
40 |
45 |
50; |
20 |
15 |
10 |
5 |
0 |
5 |
10 |
15 |
20; |
400 |
225 |
100 |
25 |
0 |
25 |
100 |
225 |
400; |
1500, откуда
і / 1500 |
,------- |
= 13,7, |
Ох = у, |
= У 187,5 |
Тогда как для второго ряда {у) этот показатель (сигма) выража ется следующей величиной:
У- |
10 |
28 |
28 |
30 |
30 |
30 |
3 2 |
3 2 |
50: |
у = 30 |
а: |
20 |
2 |
2 |
0 |
0 |
0 |
2 |
2 |
20 |
|
а 2: |
400 |
4 |
4 |
0 |
0 |
0 |
4 |
4 |
400: |
2 а 2 = 816 |
|
|
|
|
-і/"816 |
|
|
|
|
|
|
|
|
|
Оу = |
У I T " " 1 |
УШ2 |
". 10,1. |
|
|
Из этого примера видно, что среднее квадратическое отклонение характеризует не только размах, но и специфику варьирования признаков.
При большом числе наблюдений разница между п и п—1 су щественно не сказывается на величине показателей вариации. Поэтому в приведенных формулах 35 и 36 вместо п—1 можно брать п. Если же объем совокупности невелик (д<30), этого де лать не надо, так как замена п—1 на п становится ощутимой и заметно сказывается на величине показателей вариации, которые окажутся несколько смещенными относительно их значения в генеральной совокупности (см. ниже).
Средняя арифметическая и среднее квадратическое отклоне ние дают полную количественную характеристику любой эмпи рической совокупности, распределяемой по нормальному закону. Средняя арифметическая отображает действие на признак основ ных причин, определяющих типичный для популяции уровень его развития, тогда как среднее квадратическое отклонение характе ризует варьирование значений этого признака вокруг центра рас пределения, т. е. средней арифметической, является мерой степе ни влияния на признак различных второстепенных причин, вызы
66
вающих его варьирование. Таким образом, эти показатели хотя и отображают разные стороны варьирующих признаков, тесно связаны между собой.
ОСНОВНЫЕ СВОЙСТВА ПОКАЗАТЕЛЕЙ ВАРИАЦИИ
Показатели вариации — дисперсия и среднее квадратическое отклонение — играют большую роль в статистическом анализе биометрических данных. Поэтому важно указать на их основные свойства, которые могут быть использованы при решении ряда вопросов чисто прикладного значения.
1.Если каждую варианту совокупности увеличить на одну и
ту |
же |
величину, |
то средняя арифметическая (х ) увеличится на |
ту |
же |
величину, |
тогда как дисперсия и среднее квадратическое |
отклонение от этого не изменятся. Это свойство можно иллюст рировать на простом примере. Возьмем следующие семь вариант:
2 4 3 5 4 6 4, для которых х = 4,0 и |
о2=1,43. Увеличим каждую |
|||||||||
варианту на две единицы и вычислим среднюю |
(х) |
и дисперсию: |
||||||||
х : |
4 |
6 |
5 |
7 |
6 |
8 |
_ |
Их |
42 |
|
6; |
п |
7 |
||||||||
а: |
- 2 0 —1 |
+ 1 |
0 |
+ 2 0 |
||||||
|
10 |
|||||||||
а2: |
4 |
0 |
1 |
1 |
0 |
4 |
ІД2 |
|||
0; |
п |
7 |
||||||||
|
|
|
|
|
|
|
|
|||
и о = |
іЛ ,4 3 = |
1,195. |
|
|
|
|
|
|
Из этого следует, что средний квадрат отклонений можно вы числять не только по значениям признака, но и на их отклонени ях от какой-нибудь постоянной величины.
2. При умножении каждой варианты на одно и то же число К средняя (ж) увеличится в то же число раз, тогда как квадраты отклонений увеличатся в К2 раз, а следовательно, и дисперсия увеличится в К2 раз, среднее квадратическое отклонение, как и средняя (х), увеличится только в К раз. Иллюстрируем это пра вило на том же примере, увеличив каждую варианту в два раза:
х: |
4 |
8 |
6 |
10 |
8 |
12 |
8; |
- |
56 |
8 , 0 |
|
= |
|||||||||
а : |
— 4 |
0 |
- 2 |
+ 2 |
0 |
+ 4 |
0 |
|
у |
|
|
|
|
||||||||
ß2; |
16 |
0 |
4 |
4 |
0 |
16 |
0; |
„ 2 _ |
j 0 _ = |
5 ,7 1 |
|
|
|
|
|
|
|
|
|
7 |
|
И 0 = У 5 /7 1 = 2 , 3 9
Из этого правила следует, что при наличии многозначных ва риант их можно сократить на общий множитель К и по резуль татам вычислить дисперсию, а затем уменьшить ее на квадрат общего множителя (К2) для того, чтобы получилась искомая ве личина дисперсии.
3 * |
67 |