Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.06.2024

Просмотров: 96

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

факторе возникновения асимметрии в социалистическом хозяйстве звучит подкупающе. Однако есть ведь и такие производственные показатели, как себестоимость, трудо­ емкость, удельный расход материалов и т. п., сознатель­ ное, планомерное воздействие на которые направлено не

всторону их увеличения, а в сторону их сокращения. Со­ гласно гипотезе, изложенной выше, это должно было бы приводить к формированию распределений с левосторон­ ней асимметрией. Но все распределения по таким показа­ телям, как себестоимость, изученные нами на практике (часть их приводится ниже), неизменно обнаруживают не левостороннюю, а правостороннюю асимметрию. Очевид­ но, действие других причин, порождающих асимметрию, и

вчастности наличие одностороннего «левого» предела, является более сильным.

Опоказателе эксцесса распределения обычно пишут,

как о мере крутости, крутизны, островершинности [см. 8, с. 188; 13, с. 68]. К такому определению нужно относиться

скрайней осторожностью Ч Крутизна кривой, характе­ ризующей плотность распределения, зависит прежде все­ го и главным образом от величины среднего квадратиче­ ского отклонения, т. е. от силы вариации.'При слабой ва­ риации ряд получается крутовершинным, даже если ника­ кого эксцесса нет. При сильной вариации вершина кри­ вой уплощается также независимо от наличия или отсут-

1 Название показателей эксцесса распределения

дано К. Пир­

соном,

предложившим этот показатель , в 1905 г.

Распределения

с отрицательным эксцессом он предложил называть

плосковершин-

ными

(в дословном переводе с греческого термина

яХати/потод —

«плоскогорбый»), а с положительным показателем эксцесса — остро­ вершинными (7&kto%vqxos“ «узкогорбый»). Трактовка К. Пирсона некритически перенята другими статистиками позднейшего времени. В частности, ее придерживаются Юл и Кендэл, которые, анализируя распределение браков в Австралии по возрасту жениха [44, с. 118], приходят к выводу на основании показателя эксцесса, равного +5,333, что «...кривая в сильной степени островершинна». Между тем, как видно и по самому ряду распределения, частота в модаль­ ном интервале весьма незначительно превосходит частоты в сосед­ них интервалах, т. е. «острая вершина» отсутствует. Большая вели­ чина показателя эксцесса объясняется иным, а именно наличием сильной правосторонней асимметрии ряда, при которой около 6 тыс.

единиц совокупности ( « 2 % )

вышли за

пределы

х +

Зс>, что состав­

ляет в данном

случае возраст в 29 +

3-8 = 53

года.

Фактическое

распределение

продолжается

до возраста в 90 лет,

т.

е. существу­

ет избыток, эксцесс поздних

браков мужчин, который и характери­

зуется показателем, исчисленным Юлом и Кендэлом.

 

 

31


ствия эксцесса. Более полное и правильное толкование показателя эксцесса дано А. К. Митропольским [22, с. 54]. Он указывает, что важнейшим признаком наличия

эксцесса является выход за пределы х ± За значительно большего числа единиц совокупности, чем при нормаль­ ном распределении, т. е. повышенная вероятность значи­ тельных отклонений от среднего значения признака. При этом распределение является более крутым, чем было бы нормальное распределение при той же силе вариации. Однако нормальное распределение при меньшей силе ва­ риации может быть и часто бывает гораздо более кру­ тым, чем распределение, имеющее эксцесс. Подтвердим сказанное фактическими данными.

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 3

Сравнение распределения совхозов Ленинградской области

 

по урожайности овощей в открытом грунте за два года

 

 

 

 

 

 

Группы совхозов

по урожайности

 

 

 

Число

 

о

 

О

о

о

 

 

о .

 

о

 

 

о

совхозов

О

о

8

О

ю

о

8

8

ю

8

18

8

8

8

сч

сч

 

ю

 

 

I

1

сэ

гэ

гг

т

Ю

со

• СО

 

о

ю

О

о

о

8

о

О

О

О

8

О

8

 

П

о

ю

о

8

ш

S

ю

S

3

 

 

 

 

сч

сч

ГО

 

 

Ю

СО

1959 г.

1

19

35

21

10

3

 

 

 

 

 

 

1965 г.

3

6

15

32

27

23

7

2

3

1

1

1

Изобразим эти ряды графически (см. рис. 2).

Рис. 2. Сравнение распределений с разной величиной эксцесса

32


Кривая распределения совхозов за 1959 г. выглядит на графике значительно более «крутой», «островершин­ ной», чем за 1965 г. Однако показатель эксцесса распре­ деления за 1959 г. равен—0,25, т. е. величина отрица­ тельная, что должно было бы указывать, согласно рас­ пространенному толкованию этого показателя, на плосковершинность кривой распределения. В то же время пока­ затель эксцесса распределения за 1965 г. равен +4,73, что должно было бы указывать на крайнюю островер­ шинность кривой распределения. Как видим, этого не на­ блюдается на самом деле. Зато очевидно, что в 1965 г. несколько передовых совхозов, достигших высокого уров­ ня урожайности, резко оторвались от основной их массы, т. е. имел место выход части единиц совокупности далеко

за пределы х ± За.

Рассмотренный нами пример заставляет уточнить и другое положение об эксцессе, встречающееся в статис­ тической литературе, а именно о том, какие значения экс­ цесса могут указывать на неоднородность совокупности. В учебнике Н. М. Виноградовой и других читаем: «Так, например, появление значительного отрицательного (под­

черкнуто авторами учебника) эксцесса может указывать на качественную неоднородность исследуемой совокуп­ ности» [8, с. 189]. Не отрицая такой возможности, следует добавить, во-первых, что она далеко не всегда реализует­ ся, т. е. не обязательно наличие отрицательного эксцесса говорит о неоднородности совокупности. Во-вторых, что еще важнее, следует добавить, что и наличие положи­ тельного эксцесса иногда (тоже не обязательно!) может свидетельствовать о неоднородности совокупности. И уж во всяком случае наличие положительного эксцесса не может быть аргументом в пользу ее повышенной одно­ родности.

Практика показывает также, что наличие значитель­ ного положительного эксцесса часто сопровождается на­ личием значительной правосторонней асимметрии рас­ пределения.

После того как проведен анализ ряда распределения и получены его обобщающие характеристики, становится возможным дать общую картину этого распределения, т. е. выявить статистическую закономерность распределе­ ния. Вряд ли правильно считать понятие статистической закономерности распределения тождественным понятию

2-372

33

функции, описывающей плотность распределения. Эта функция при всем ее значении не исчерпывает собой ос­ новных свойств распределения. При одной и той же функ­

ции плотности распределения

(например, при функции

Гаусса — Лапласа) свойства

распределений могут силь­

но различаться. Например,

распределение лиц опреде­

ленного пола и возраста по их росту подчиняется функ­ ции Гаусса — Лапласа, при этом вариация роста слабая, коэффициент вариации не достигает и 10%. Распределе­ ние совхозов по урожайности сельскохозяйственных куль­ тур в ряде случаев также очень близко к нормальному, однако оно обладает качественно иной характеристикой силы вариации, коэффициент которой достигает даже по столь сравнительно однородным и небольшим территори­ ям, как Ленинградская область, Эстонская ССР, 30—40%. Разве допустимо игнорировать это различие, отражающее принципиальную разницу в условиях, по­ рождающих вариацию в разных совокупностях, и объеди­ нять одно и другое распределение под слишком бесцвет­ ным флагом «нормального закона распределения»?

Итак, категория «.статистическая закономерность рас­ пределения», по нашему мнению, есть синтетическое описание всех основных характеристик распределения оп­ ределенной ^однокачественной совокупности (или целого класса однотипных совокупностей) по данному признаку, устойчиво присущих ему на протяжении определенного периода, этапа или фазы развития совокупности. Из дан­ ного определения видно, что установление статистической закономерности распределения требует изучения распре­ деления в динамике, позволяющего отделить закономер­ ные черты распределения от случайных особенностей, связанных со специфическими условиями определенного года, сезона, момента наблюдения и т. п. Поэтому попыт­ ку сформулировать какую-либо конкретную статистиче­ скую закономерность распределения на основе изучения нами фактических вариационных рядов следует-отложить до того момента, как будет рассмотрена динамика рас­ пределения, определены пути ее изучения и выводы, к ко­ торым приводит их применение.

Возвращаясь к понятию функции плотности распреде­ ления, надо сказать, что эта важная характеристика за ­ кономерности распределения заслуживает внимательного изучения. При этом, большую роль играют «критерии со­

34


гласия» (критерий «хи-квадрат» Пирсона; критерий «лямбда» А. М. Колмогорова и другие), позволяющие установить, является ли существенным отличие изучаемо­ го фактического ряда от того или иного теоретического распределения, полученного в предположении, что ряд подчиняется определенной функции плотности распреде­ ления. Не следует только считать, что применение крите­ риев согласия позволяет всегда получить однозначный ответ на вопрос о функции плотности распределения, ап­ проксимирующей изучаемый ряд. Нередко критерии со­ гласия свидетельствуют, что изучаемый ряд может быть описан как одной функцией плотности распределения, так и другой, и нет основания отбросить какую-то из них. Как видно из данных табл. 13, плотность распределения сов­ хозов Ленинградской области по урожайности картофеля за 6 лет из 14 примерно одинаково хорошо описывается как нормальным законом, так и логарифмичееки-нор- мальным законом распределения.

Суммируя сказанное, можно заключить, что одномер­ ное распределение это категория статистики, выражаю­ щая собой различия между единицами однородной сово­ купности по одному из ее признаков. Она отражает ха­ рактер влияния различий во внешних и во внутренних условиях существования и развития отдельных единиц совокупности. Внутренней сущностью одномерного рас­ пределения являются статистические закономерности рас­ пределения, а формой ее внешнего проявления служит ряд распределения единиц совокупности по значениям варьирующего признака.

§ 2. Построение и анализ вариационно-динамических таблиц

Подобно тому, как изучение вариации какого-либо признака совокупности в статистике начинается с по­ строения вариационного ряда, изучение динамики рас­ пределения начинается с построения вариационно-дина­ мической таблицы. Вариационно-динамическая таблица представляет собой метод отражения динамики одномер­ ного распределения совокупности в систематизирован­ ном, обобщенном и удобном для последующего анализа виде.

2*

35

Рассмотрим пример вариационншдинамической таблицы.

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц.а 4

Динамика распределения совхозов Ленинградской области

 

 

 

 

 

по урожайности картофеля

 

 

 

 

Урожай­

1

эо

q>

О

 

С и с-’ U

С-‘

С

С с!

U С

 

3

сч

3

3

3

СО

t—

СО

05

О

 

ность.

 

о

irt

 

о

со

о

О

СО

05

о>

ц/га

 

 

Сз

 

05

05

О)

05

О:

05

05

05

05

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

До 20

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

20—40

 

18

4

2 48

4

 

 

 

 

 

 

 

2

40—60

40

27

1

6

40

21

3

4

5

4

1

4

1

60—80

22

28

14

35

22

43

7

6

26

12

2

14

3

1

80—100

 

11

21

41

36

10

31

29

10

40

37

15

48

9

11

100—120

 

1

15

33

24

3

20

36

24

34

27

34

34

8

19

120—140

3

9

9

4

33

27

13

35

45

20

20

23

140—160

 

2

1

11

3

1

7

26

6

12

28

11

38

33

160—180

_

3

1

2

8

17

3

3

12

7

24

24

180—200

— —

— — —

2

9

1

1

2

4

16

14

200—220

3

2

1

2

9

6

220—240

3

2

5

2

240—260

 

 

 

 

 

 

 

 

1

 

 

1

3

1

Всего совхо-

99

99 112 116 131 126

125 130 128

135 141

144

136

136

ЗОБ

При первом же взгляде на вариационно-динамическую таблицу раскрывается картина изменений в распределе­ нии совхозов области по величине урожайности картофе­ ля за 13 лет. Наглядно видно, как подобно разведчикам наступающей армии, все дальше и дальше вперед, в сто­ рону более высокой урожайности «выскакивают» снача­ ла отдельные единицы совокупности — совхозы-«маяки». За ними выдвигается уже более солидный «авангард» — до десятка, полутора десятков передовых хозяйств. За ни­ ми значительно медленнее наступают «главные силы» — смещается в сторону более высокой урожайности модаль­ ный интервал. И замыкают «наступающие колонны» сов­ сем медленно двигающиеся «тылы» — небольшое число отстающих хозяйств. Итак, первый вывод, который мож­ но сделать на основе данных вариационно-динамической таблицы: она отражает совокупность, развивающуюся в прогрессивном направлении в результате мероприятий Коммунистической партии и Советского правительства,

36


направленных на подъем сельского хозяйства, а также усилий работников совхозов Ленинградской области, уче­ ных, агрономов, экономистов, инженеров в борьбе за по­ вышение урожайности картофеля. При этом картина, да­ ваемая табл. 4, значительно богаче и ярче, чем простой динамический ряд среднеобластных величин урожайнос­ ти картофеля, так как она раскрывает то, что скрыто в общей средней, уравнивающей достижения передовиков и отставание худших хозяйств.

Существенный вывод, к которому приводит рассмотре­ ние вариационно-динамической таблицы, состоит в том,

что в ходе прогрессивного развития совокупности распре­ деление постепенно растягивается, что говорит об увели­ чении вариации признака в абсолютном выражении. Это растягивание рядов распределения объясняется неодина­ ковой скоростью роста урожайности в передовых и в от­ стающих хозяйствах. Если за изучаемые 13 лет передовые совхозы сдвинулись на 5 интервалов (рост урожайности на 100 ц/га), то замыкающие ряды отстающие хозяйства сдвинулись только на 2 интервала (рост урожайности на 40 ц/ra). Растягивание распределения при возрастании средних величин признака в динамике не является осо­ бенностью только лишь рассмотренной совокупности в табл. 4. Напротив, как можно судить по приводимым да­ лее совокупностям, это растягивание представляет собой общую особенность, присущую различным совокупно­ стям.

Анализируя далее табл. 4, необходимо отметить, что она раскрывает такую черту динамики распределения, как колеблемость. Эта колеблемость проявляется в том, что отмеченные выше закономерные изменения в распре­ делении, его прогрессивное движение в сторону более вы­ сокой урожайности проявляются не в каждом отдельном году, а как общая долговременная тенденция, действую­ щая на протяжении изучаемого периода времени. При этом в отдельные годы, как, например, в 1960, 1963, 1965, 1967, 1970 гг., происходит резкий сдвиг распределения в сторону больших значений урожайности, а в другие, как, например, в 1961, 1962, 1966, 1969 гг., — некоторый сдвиг в обратную сторону, к более низким значениям урожай­ ности. Эти колебания, как и соответственные колебания средних по совокупности величин урожайности, объяс­ няются случайным чередованием более благоприятных

37

по метеорологическим условиям лет с менее благоприят­ ными. Резко выделяется крайне неблагоприятный (холод­ ное и сырое лето) 1962 г., приведший к экстремальному распределению — второй интервал от начала является уже модальным! Все распределение сжато до шести групп, характер его, как увидим далее, крайне необычен.

Колеблемость условий производства, приводящая к колебаниям в характере распределения совхозов по уро­ жайности, необходимо всегда принимать во внимание. Из факта ее существования вытекает, что анализ распре­

деления совокупности только за один период

(год) или

на один момент времени может не отразить

типичных

черт, присущих данному распределению. Только при изу­ чении динамики распределения становится возможным отделить случайные черты, связанные с особенностями отдельных лет, от типичных, закономерных свойств изу­ чаемого распределения, преобладающих на протяжении всего изучаемого периода развития совокупности. О ме­ тодах выявления типичных черт распределения будет ска-

зано в следующем параграфе. Итак, мы ознакомились в общих чертах с тем, что представляет собой вариацион­ но-динамическая таблица и о чем она может рассказать.

Перейдем к более подробному рассмотрению строения вариационно-динамической таблицы. Эта таблица пред­ ставляет собой систему вариационных и динамических рядов. Каждая ее графа является вариационным рядом, отражающим распределение совокупности по изучаемому признаку за отдельный период времени или на отдельный момент. Каждая строка таблицы представляет собой ди­ намический ряд числа единиц совокупности с заданным значением (интервалом) признака за последовательные периоды или на последовательные моменты времени. Ито­ говая строка таблицы является динамическим рядом об­ щей численности совокупности, представляющей одну из основных характеристик процесса ее развития. В прин­ ципе вполне возможно поменять местами строки и графы вариационно-динамической таблицы, так, чтобы в строках

были даны вариационные ряды, за отдельные периоды времени, а в графах — интервалы значений изучаемого признака. Но принятая ранее форма таблицы соответст­ вует традиции построения статистических таблиц, по ко­ торой данные за последовательные периоды времени, как

38