Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 25.06.2024
Просмотров: 96
Скачиваний: 0
факторе возникновения асимметрии в социалистическом хозяйстве звучит подкупающе. Однако есть ведь и такие производственные показатели, как себестоимость, трудо емкость, удельный расход материалов и т. п., сознатель ное, планомерное воздействие на которые направлено не
всторону их увеличения, а в сторону их сокращения. Со гласно гипотезе, изложенной выше, это должно было бы приводить к формированию распределений с левосторон ней асимметрией. Но все распределения по таким показа телям, как себестоимость, изученные нами на практике (часть их приводится ниже), неизменно обнаруживают не левостороннюю, а правостороннюю асимметрию. Очевид но, действие других причин, порождающих асимметрию, и
вчастности наличие одностороннего «левого» предела, является более сильным.
Опоказателе эксцесса распределения обычно пишут,
как о мере крутости, крутизны, островершинности [см. 8, с. 188; 13, с. 68]. К такому определению нужно относиться
скрайней осторожностью Ч Крутизна кривой, характе ризующей плотность распределения, зависит прежде все го и главным образом от величины среднего квадратиче ского отклонения, т. е. от силы вариации.'При слабой ва риации ряд получается крутовершинным, даже если ника кого эксцесса нет. При сильной вариации вершина кри вой уплощается также независимо от наличия или отсут-
1 Название показателей эксцесса распределения |
дано К. Пир |
|
соном, |
предложившим этот показатель , в 1905 г. |
Распределения |
с отрицательным эксцессом он предложил называть |
плосковершин- |
|
ными |
(в дословном переводе с греческого термина |
яХати/потод — |
«плоскогорбый»), а с положительным показателем эксцесса — остро вершинными (7&kto%vqxos“ «узкогорбый»). Трактовка К. Пирсона некритически перенята другими статистиками позднейшего времени. В частности, ее придерживаются Юл и Кендэл, которые, анализируя распределение браков в Австралии по возрасту жениха [44, с. 118], приходят к выводу на основании показателя эксцесса, равного +5,333, что «...кривая в сильной степени островершинна». Между тем, как видно и по самому ряду распределения, частота в модаль ном интервале весьма незначительно превосходит частоты в сосед них интервалах, т. е. «острая вершина» отсутствует. Большая вели чина показателя эксцесса объясняется иным, а именно наличием сильной правосторонней асимметрии ряда, при которой около 6 тыс.
единиц совокупности ( « 2 % ) |
вышли за |
пределы |
х + |
Зс>, что состав |
||
ляет в данном |
случае возраст в 29 + |
3-8 = 53 |
года. |
Фактическое |
||
распределение |
продолжается |
до возраста в 90 лет, |
т. |
е. существу |
||
ет избыток, эксцесс поздних |
браков мужчин, который и характери |
|||||
зуется показателем, исчисленным Юлом и Кендэлом. |
|
|
31
ствия эксцесса. Более полное и правильное толкование показателя эксцесса дано А. К. Митропольским [22, с. 54]. Он указывает, что важнейшим признаком наличия
эксцесса является выход за пределы х ± За значительно большего числа единиц совокупности, чем при нормаль ном распределении, т. е. повышенная вероятность значи тельных отклонений от среднего значения признака. При этом распределение является более крутым, чем было бы нормальное распределение при той же силе вариации. Однако нормальное распределение при меньшей силе ва риации может быть и часто бывает гораздо более кру тым, чем распределение, имеющее эксцесс. Подтвердим сказанное фактическими данными.
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 3 |
||
Сравнение распределения совхозов Ленинградской области |
|
|||||||||||||
по урожайности овощей в открытом грунте за два года |
|
|||||||||||||
|
|
|
|
|
Группы совхозов |
по урожайности |
|
|
|
|||||
Число |
|
о |
|
О |
о |
о |
|
|
о . |
|
о |
|
|
о |
совхозов |
О |
о |
8 |
О |
ю |
о |
8 |
8 |
ю |
8 |
18 |
8 |
8 |
8 |
сч |
сч |
|||||||||||||
|
ю |
|
|
I |
1 |
сэ |
гэ |
гг |
т |
Ю |
со |
• СО |
||
|
о |
ю |
О |
о |
о |
8 |
о |
О |
О |
О |
8 |
О |
8 |
|
|
П |
о |
ю |
о |
8 |
ш |
S |
ю |
S |
3 |
||||
|
|
|
|
сч |
сч |
ГО |
|
|
Ю |
СО |
||||
1959 г. |
1 |
19 |
35 |
21 |
10 |
3 |
|
|
|
|
— |
— |
|
|
1965 г. |
3 |
6 |
15 |
32 |
27 |
23 |
7 |
2 |
3 |
1 |
1 |
1 |
Изобразим эти ряды графически (см. рис. 2).
Рис. 2. Сравнение распределений с разной величиной эксцесса
32
Кривая распределения совхозов за 1959 г. выглядит на графике значительно более «крутой», «островершин ной», чем за 1965 г. Однако показатель эксцесса распре деления за 1959 г. равен—0,25, т. е. величина отрица тельная, что должно было бы указывать, согласно рас пространенному толкованию этого показателя, на плосковершинность кривой распределения. В то же время пока затель эксцесса распределения за 1965 г. равен +4,73, что должно было бы указывать на крайнюю островер шинность кривой распределения. Как видим, этого не на блюдается на самом деле. Зато очевидно, что в 1965 г. несколько передовых совхозов, достигших высокого уров ня урожайности, резко оторвались от основной их массы, т. е. имел место выход части единиц совокупности далеко
за пределы х ± За.
Рассмотренный нами пример заставляет уточнить и другое положение об эксцессе, встречающееся в статис тической литературе, а именно о том, какие значения экс цесса могут указывать на неоднородность совокупности. В учебнике Н. М. Виноградовой и других читаем: «Так, например, появление значительного отрицательного (под
черкнуто авторами учебника) эксцесса может указывать на качественную неоднородность исследуемой совокуп ности» [8, с. 189]. Не отрицая такой возможности, следует добавить, во-первых, что она далеко не всегда реализует ся, т. е. не обязательно наличие отрицательного эксцесса говорит о неоднородности совокупности. Во-вторых, что еще важнее, следует добавить, что и наличие положи тельного эксцесса иногда (тоже не обязательно!) может свидетельствовать о неоднородности совокупности. И уж во всяком случае наличие положительного эксцесса не может быть аргументом в пользу ее повышенной одно родности.
Практика показывает также, что наличие значитель ного положительного эксцесса часто сопровождается на личием значительной правосторонней асимметрии рас пределения.
После того как проведен анализ ряда распределения и получены его обобщающие характеристики, становится возможным дать общую картину этого распределения, т. е. выявить статистическую закономерность распределе ния. Вряд ли правильно считать понятие статистической закономерности распределения тождественным понятию
2-372 |
33 |
функции, описывающей плотность распределения. Эта функция при всем ее значении не исчерпывает собой ос новных свойств распределения. При одной и той же функ
ции плотности распределения |
(например, при функции |
Гаусса — Лапласа) свойства |
распределений могут силь |
но различаться. Например, |
распределение лиц опреде |
ленного пола и возраста по их росту подчиняется функ ции Гаусса — Лапласа, при этом вариация роста слабая, коэффициент вариации не достигает и 10%. Распределе ние совхозов по урожайности сельскохозяйственных куль тур в ряде случаев также очень близко к нормальному, однако оно обладает качественно иной характеристикой силы вариации, коэффициент которой достигает даже по столь сравнительно однородным и небольшим территори ям, как Ленинградская область, Эстонская ССР, 30—40%. Разве допустимо игнорировать это различие, отражающее принципиальную разницу в условиях, по рождающих вариацию в разных совокупностях, и объеди нять одно и другое распределение под слишком бесцвет ным флагом «нормального закона распределения»?
Итак, категория «.статистическая закономерность рас пределения», по нашему мнению, есть синтетическое описание всех основных характеристик распределения оп ределенной ^однокачественной совокупности (или целого класса однотипных совокупностей) по данному признаку, устойчиво присущих ему на протяжении определенного периода, этапа или фазы развития совокупности. Из дан ного определения видно, что установление статистической закономерности распределения требует изучения распре деления в динамике, позволяющего отделить закономер ные черты распределения от случайных особенностей, связанных со специфическими условиями определенного года, сезона, момента наблюдения и т. п. Поэтому попыт ку сформулировать какую-либо конкретную статистиче скую закономерность распределения на основе изучения нами фактических вариационных рядов следует-отложить до того момента, как будет рассмотрена динамика рас пределения, определены пути ее изучения и выводы, к ко торым приводит их применение.
Возвращаясь к понятию функции плотности распреде ления, надо сказать, что эта важная характеристика за кономерности распределения заслуживает внимательного изучения. При этом, большую роль играют «критерии со
34
гласия» (критерий «хи-квадрат» Пирсона; критерий «лямбда» А. М. Колмогорова и другие), позволяющие установить, является ли существенным отличие изучаемо го фактического ряда от того или иного теоретического распределения, полученного в предположении, что ряд подчиняется определенной функции плотности распреде ления. Не следует только считать, что применение крите риев согласия позволяет всегда получить однозначный ответ на вопрос о функции плотности распределения, ап проксимирующей изучаемый ряд. Нередко критерии со гласия свидетельствуют, что изучаемый ряд может быть описан как одной функцией плотности распределения, так и другой, и нет основания отбросить какую-то из них. Как видно из данных табл. 13, плотность распределения сов хозов Ленинградской области по урожайности картофеля за 6 лет из 14 примерно одинаково хорошо описывается как нормальным законом, так и логарифмичееки-нор- мальным законом распределения.
Суммируя сказанное, можно заключить, что одномер ное распределение — это категория статистики, выражаю щая собой различия между единицами однородной сово купности по одному из ее признаков. Она отражает ха рактер влияния различий во внешних и во внутренних условиях существования и развития отдельных единиц совокупности. Внутренней сущностью одномерного рас пределения являются статистические закономерности рас пределения, а формой ее внешнего проявления служит ряд распределения единиц совокупности по значениям варьирующего признака.
§ 2. Построение и анализ вариационно-динамических таблиц
Подобно тому, как изучение вариации какого-либо признака совокупности в статистике начинается с по строения вариационного ряда, изучение динамики рас пределения начинается с построения вариационно-дина мической таблицы. Вариационно-динамическая таблица представляет собой метод отражения динамики одномер ного распределения совокупности в систематизирован ном, обобщенном и удобном для последующего анализа виде.
2* |
35 |
Рассмотрим пример вариационншдинамической таблицы.
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц.а 4 |
||
Динамика распределения совхозов Ленинградской области |
|
||||||||||||||
|
|
|
|
по урожайности картофеля |
|
|
|
|
|||||||
Урожай |
1 |
эо |
q> |
О |
|
С и с-’ U |
С-‘ |
С |
С с! |
U С |
|||||
|
3 |
сч |
3 |
3 |
3 |
СО |
t— |
СО |
05 |
О |
|
||||
ность. |
|
о |
irt |
|
о |
со |
о |
О |
СО |
05 |
о> |
||||
ц/га |
|
|
Сз |
|
05 |
05 |
О) |
05 |
О: |
05 |
05 |
05 |
05 |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
До 20 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
20—40 |
|
18 |
4 |
— |
2 48 |
4 |
|
|
|
|
|
|
|
2 |
|
40—60 |
40 |
27 |
1 |
6 |
40 |
21 |
3 |
4 |
5 |
4 |
1 |
4 |
1 |
— |
|
60—80 |
22 |
28 |
14 |
35 |
22 |
43 |
7 |
6 |
26 |
12 |
2 |
14 |
3 |
1 |
|
80—100 |
|
11 |
21 |
41 |
36 |
10 |
31 |
29 |
10 |
40 |
37 |
15 |
48 |
9 |
11 |
100—120 |
|
1 |
15 |
33 |
24 |
3 |
20 |
36 |
24 |
34 |
27 |
34 |
34 |
8 |
19 |
120—140 |
— |
3 |
9 |
9 |
— |
4 |
33 |
27 |
13 |
35 |
45 |
20 |
20 |
23 |
|
140—160 |
|
2 |
1 |
11 |
3 |
— |
1 |
7 |
26 |
6 |
12 |
28 |
11 |
38 |
33 |
160—180 |
— |
_ |
3 |
1 — |
2 |
8 |
17 |
3 |
3 |
12 |
7 |
24 |
24 |
||
180—200 |
— — — |
— — — |
2 |
9 |
1 |
1 |
2 |
4 |
16 |
14 |
|||||
200—220 |
— — |
— |
— |
— — |
— |
3 — |
2 |
1 |
2 |
9 |
6 |
||||
220—240 |
— |
— |
— |
— |
— |
— |
— |
3 |
— |
2 |
— |
— |
5 |
2 |
|
240—260 |
|
|
|
|
|
|
|
|
1 |
|
|
1 |
— |
3 |
1 |
Всего совхо- |
99 |
99 112 116 131 126 |
125 130 128 |
135 141 |
144 |
136 |
136 |
||||||||
ЗОБ |
При первом же взгляде на вариационно-динамическую таблицу раскрывается картина изменений в распределе нии совхозов области по величине урожайности картофе ля за 13 лет. Наглядно видно, как подобно разведчикам наступающей армии, все дальше и дальше вперед, в сто рону более высокой урожайности «выскакивают» снача ла отдельные единицы совокупности — совхозы-«маяки». За ними выдвигается уже более солидный «авангард» — до десятка, полутора десятков передовых хозяйств. За ни ми значительно медленнее наступают «главные силы» — смещается в сторону более высокой урожайности модаль ный интервал. И замыкают «наступающие колонны» сов сем медленно двигающиеся «тылы» — небольшое число отстающих хозяйств. Итак, первый вывод, который мож но сделать на основе данных вариационно-динамической таблицы: она отражает совокупность, развивающуюся в прогрессивном направлении в результате мероприятий Коммунистической партии и Советского правительства,
36
направленных на подъем сельского хозяйства, а также усилий работников совхозов Ленинградской области, уче ных, агрономов, экономистов, инженеров в борьбе за по вышение урожайности картофеля. При этом картина, да ваемая табл. 4, значительно богаче и ярче, чем простой динамический ряд среднеобластных величин урожайнос ти картофеля, так как она раскрывает то, что скрыто в общей средней, уравнивающей достижения передовиков и отставание худших хозяйств.
Существенный вывод, к которому приводит рассмотре ние вариационно-динамической таблицы, состоит в том,
что в ходе прогрессивного развития совокупности распре деление постепенно растягивается, что говорит об увели чении вариации признака в абсолютном выражении. Это растягивание рядов распределения объясняется неодина ковой скоростью роста урожайности в передовых и в от стающих хозяйствах. Если за изучаемые 13 лет передовые совхозы сдвинулись на 5 интервалов (рост урожайности на 100 ц/га), то замыкающие ряды отстающие хозяйства сдвинулись только на 2 интервала (рост урожайности на 40 ц/ra). Растягивание распределения при возрастании средних величин признака в динамике не является осо бенностью только лишь рассмотренной совокупности в табл. 4. Напротив, как можно судить по приводимым да лее совокупностям, это растягивание представляет собой общую особенность, присущую различным совокупно стям.
Анализируя далее табл. 4, необходимо отметить, что она раскрывает такую черту динамики распределения, как колеблемость. Эта колеблемость проявляется в том, что отмеченные выше закономерные изменения в распре делении, его прогрессивное движение в сторону более вы сокой урожайности проявляются не в каждом отдельном году, а как общая долговременная тенденция, действую щая на протяжении изучаемого периода времени. При этом в отдельные годы, как, например, в 1960, 1963, 1965, 1967, 1970 гг., происходит резкий сдвиг распределения в сторону больших значений урожайности, а в другие, как, например, в 1961, 1962, 1966, 1969 гг., — некоторый сдвиг в обратную сторону, к более низким значениям урожай ности. Эти колебания, как и соответственные колебания средних по совокупности величин урожайности, объяс няются случайным чередованием более благоприятных
37
по метеорологическим условиям лет с менее благоприят ными. Резко выделяется крайне неблагоприятный (холод ное и сырое лето) 1962 г., приведший к экстремальному распределению — второй интервал от начала является уже модальным! Все распределение сжато до шести групп, характер его, как увидим далее, крайне необычен.
Колеблемость условий производства, приводящая к колебаниям в характере распределения совхозов по уро жайности, необходимо всегда принимать во внимание. Из факта ее существования вытекает, что анализ распре
деления совокупности только за один период |
(год) или |
на один момент времени может не отразить |
типичных |
черт, присущих данному распределению. Только при изу чении динамики распределения становится возможным отделить случайные черты, связанные с особенностями отдельных лет, от типичных, закономерных свойств изу чаемого распределения, преобладающих на протяжении всего изучаемого периода развития совокупности. О ме тодах выявления типичных черт распределения будет ска-
•зано в следующем параграфе. Итак, мы ознакомились в общих чертах с тем, что представляет собой вариацион но-динамическая таблица и о чем она может рассказать.
Перейдем к более подробному рассмотрению строения вариационно-динамической таблицы. Эта таблица пред ставляет собой систему вариационных и динамических рядов. Каждая ее графа является вариационным рядом, отражающим распределение совокупности по изучаемому признаку за отдельный период времени или на отдельный момент. Каждая строка таблицы представляет собой ди намический ряд числа единиц совокупности с заданным значением (интервалом) признака за последовательные периоды или на последовательные моменты времени. Ито говая строка таблицы является динамическим рядом об щей численности совокупности, представляющей одну из основных характеристик процесса ее развития. В прин ципе вполне возможно поменять местами строки и графы вариационно-динамической таблицы, так, чтобы в строках
были даны вариационные ряды, за отдельные периоды времени, а в графах — интервалы значений изучаемого признака. Но принятая ранее форма таблицы соответст вует традиции построения статистических таблиц, по ко торой данные за последовательные периоды времени, как
38