Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.06.2024

Просмотров: 93

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

интегральным функциям распределения. Отклонения от теоретических законов возникают при рассмотрении час­ тот в отдельных узких интервалах ряда, т. е. они являют­ ся отклонениями «местного значения».

Третий вывод состоит в констатации колебания эмпи­ рического распределения в динамике: оно то приближает­ ся в отдельные годы к тому или иному теоретическому распределению, то отдаляется от него, причем эти коле­ бания имеют случайный характер. Из данного факта вы­ текают важные следствия: во-первых, изучение закона распределения по данным одного случайно выхваченно­ го года может привести к совершенно неправильным выводам. Например, если рассматривать изолированно распределение за 1960 или 1967 гг., пришлось бы сделать заключение о том, что оно не является ни нормальным, ни логарифмическн-нормальным. По данным 1969 г. был бы сделан вывод о логарифмически-нормальном законе, но по данным 1970 г. он был бы отвергнут, распределение оказалось бы нормальным! На самом деле нелепо счи­ тать. что столь обобщающая характеристика распреде­ ления значительной совокупности крупных предприятий чуть ли не ежегодно может меняться. Значит, метод анализа закономерности распределения по данным от­ дельного периода или момента, по крайней мере для всех признаков, имеющих существенную колеблемость в дина­ мике, не является научным.

Следующее заключение из данных табл. 13 состоит в отсутствии надежной тенденции в динамике к переходу от одного закона распределения к другому. Этот вывод является важным не только сам по себе — как свиде­ тельство возможности развития совокупности при сохра­ нении одного типа закономерности распределения, но и в том отношении, что отсутствие тенденции изменения закона распределения позволяет считать весь изучаемый период однородным в данном отношении. Следовательно, можно построить сводное, усредненное распределение за период, в котором случайные колебания не приводят к изменению типа закономерности. Анализ такого усред­ ненного распределения, в котором случайные колебания в большей мере погашаются, позволит значительно точ­ нее и надежнее установить соответствие эмпирического распределения той или иной теоретической модели. Ме­ тодика построения усредненного распределения для изу­

9 2

чения его интегральной и дифференциальной функции достаточно сложна. О ней будет сказано далее.

Интересно исследовать зависимость между степенью приближения эмпирического распределения к тому или иному закону и другими его характеристиками: средним

уровнем и показателем асимметрии (см. табл.

14).

Имея в виду, что ранее-уже были вычислены

2 и2и =

= 4785 и 2u'2as = 1,41, находим:

а) коэффициент корреляции между вероятностью

близости распределения

к нормальному и колебаниями

средней урожайности:

 

 

Ир,

+ 4 3 ,9 0

-7-0,62;

ruMUpl

 

У ±ил2j.. 2и|,

У 4 785 - 0,957!

 

б) коэффициент корреляции между вероятностью близости распределения к логарифмически-нормальному и колебаниями средней урожайности:

S/I■ М ' “ Р,

 

-3 3 ,9 8

:— 0.575.

ШмИр, =

1 4

785 • 0,7312

*Л1 НиPi

 

и 2 . .

 

 

 

Как видим, зависимости

имеют

противоположное друг

другу направление: в годы урожайные эмпирическое рас­ пределение приближается к нормальному, а в неурожай­ ныек логарифмически-нормальному!! Этот весьма интересный вывод является, по нашему убеждению, оп­ ровержением гипотезы о том, что прогрессивно развиваю­ щаяся совокупность должна иметь логарифмически-нор-

мальное распределение.

Напротив,

как видим,

именно

в наиболее урожайные

1965 и 1970 гг. распределение

совхозов по урожайности

картофеля

наиболее

близко

к нормальному и далеко от логарифмическинормально­ го. Оба коэффициента корреляции статистически значи­ мы при вероятности «нулевой гипотезы» не более 0,05.

Анализ связи вероятностей Р\ w Р% с показателем асимметрии распределения раскрывает в какой-то мере причины полученной закономерности. Вспомним, что за ­ висимость между колебаниями средней урожайности и показателями асимметрии распределения обратная. Правосторонняя асимметрия усиливается в неурожайные годы вследствие сдвига распределения в сторону низшего предела урожайности. Не является-ли это причиной, вы-

9 3


Т а б л и ц а 14

Показатели для анализа факторов, влияющих на близость эмпирического распределения к теоретическому

Годы

1958

1959

1960

1961

1962

1963

1964

1965

1966

1967

1968

1969

1970

1971

иМ

" a s

— 6

+ 0 ,4 2

+ 5

—0,39

-|-27

—0,07

+ 7

—0,29

—41

+ 0 ,1 4

— 14

+ 0 ,0 8

+ 1 3

- 0 ,2 5

+ 2 9

—0,35

— 14

+ 0 ,2 5

— 6

+ 0 ,4 0

+ 4

+ 0 ,2 1

—21

+ 0 ,5 0

+ 1 9

—0,31

+ 3

—0,41

“я,

"я.

" м " р ,

" м -“ р ,

ua s ' up t

ua s 'up а

 

■ * ,

—0,11

—0,20

+ 0 , 6 6

+ 1 ,2 0

—0,0462

—0,0840

0,0121

0,0400

+ 0 ,1 8

—0,02

+ 0 ,9 0

—0,10

—0,0702

+0,0078

0,0324

0,0004

+ 0

,0 1

—0,06

Ц-0,27

- 1 ,6 2

—0,0007

+0,0042

0,0001

0,0036

+ 0

,2 1

+ 0 ,0 6

+ 1 ,4 7

+ 0 ,4 2

—0,0609

—0,0174

0,0441

0,0036

- 0

,4 8

+ 0 ,0 9

+ 19,68

—3,69

—0,0672

+0,0126

0,2304

0,0081

+ 0 ,0 4

+ 0 ,1 3

—0,56

— 1,82

+0,0032

+0,0104

0,0016

0,0169

+ 0 ,2 1

+ 0 ,1 7

+ 2 ,7 3

+ 2 ,2 1

—0,0525

—0,0425

0,0441

0,0289

+ 0

,2 2

—0,38

+ 6 ,3 8

— 11,02

—0,0770

+0,1330

0,0484

0,1444

+ 0 ,2 0

+ 0 ,2 6

—2,80

—3,64

+0,0500

+0,0650

0,0400

0,0676

—0,45

+ 0 ,1 6

+ 2 ,7 0

—0,96

—0,1800

+0,0640

0,2025

0,0256

+0,21

+ 0 ,2 1

+ 0 ,8 4

+ 0 ,8 4

+0,0441

+0,0441

0,0441

0,0441

—0,45

+ 0 ,2 8

+ 9 ,4 5

—5,88

—0,2250

+0,1400

0,2025

0,0784

+ 0 ,0 8

—0,50

+ 1 ,5 2

—9,50

—0,0248

+0,1550

0,0064

0,2500

+ 0 ,2 2

—0,14

-|-0,00

—0,42

—0,0902

+0,0574

0,0484

0,0196

2

_

_

_

_

-И З , 90 —33,98 —0,7974 +0,5496

0,9571

0,7312


зывающен отклонение эмпирического распределения от нормального закона и его внешнее приближение к лога- рифмически-нормалы-юму закону? Если это предположе­ ние верно, связь вероятности А с показателем асиммет­ рии должна быть обратной, а вероятности Рг с показа­ телем асимметрии будет прямой. Табл. 14 подтвержда­ ет данное предположение:

коэффициент корреляции между вероятностью близо­ сти распределения к нормальному и показателем асим­ метрии

ruasuPt =

1р.

—0,7974

0,68;

 

— —

 

1Л +2

У 1,41 -0,9571

 

 

as ~ иР1

 

 

коэффициент корреляции между вероятностью близо­ сти распределения к логарифмически-нормальному и по­ каз ателем асимметрии

Г11а^Иpi

+0,5496

I

0,55.

У 1,41 • 0,7312

T

/ K s ' * 4 ,

 

 

Если приближение эмпирического ряда

распределе­

ния к логарифмически-нормальному происходит в резуль­ тате нарушения симметричности распределения при при­ ближении средней величины признака к его низшему пре­ делу, молено ли считать распределение по существу, а не формально соответствующим логарифмически-нор­ мальному закону распределения? Ведь он обычно связы­ вается с такими причинами, как мультипликативность действия факторов, влияющих на величину признака. Вряд ли правильно всякое распределение с умеренной правосторонней асимметрией, независимо от причин и характера ее динамики, ее колебаний, считать отвечаю­ щим логарифмически-нормальному закону, если даже критерии согласия не опровергают данную гипотезу.

Итак, в результате исследования динамики распреде­ ления совхоза Ленинградской области, по урожайности картофеля можно сделать вывод о том, что типические черты, устойчиво присущие данному распределению в тенденции на протяжении изучаемого периода, харак­ теризуют его, как близкое к нормальному закону распре­ деления. В отдельные годы функцияплотности вероятно­ сти испытывает существенные колебания, причем в иеуро-

95


жайные годы она отходит от нормального закона, фор­ мально приближаясь к логарифмически-нормальному. Соответствие распределения совхозов по урожайности нормальному закону отвечает положениям агрономиче­ ской науки: действие факторов, влияющих на урожай­ ность (как, например, удобрения различных видов, ме­ лиорация полей, сортовой состав посевного материала, уровень прочих агротехнических мероприятий), скорее аддитивно, чем мультипликативно. Оно даже, если мож­ но так выразиться, «ниже аддитивности», т. е. прибавки урожая за счет отдельных факторов не суммируются пол­ ностью: каждый из факторов дает эффект в полной мере только при осуществлении всего комплекса оптимальной агротехники и при оптимальных метеорологических ус­ ловиях.

Дальнейшим развитием методики статистического анализа динамики распределения могут служить методы анализа функции распределения по данным среднего многолетнего распределения. Поскольку ее форма в от­ дельные годы подвергается искажению от случайных ко­ лебаний, связанных в конечном счете с колебаниями метеорологических условий, а также со случайностями попадания большего или меньшего числа единиц совокуп­ ности в заданные интервалы значений признака при группировке, постольку для выравнивания колебаний и выявления устойчивого типа распределения полезно при­ менить усреднение распределения за ряд лет.

Если характеристики распределения: средняя величи­ на признака и среднее квадратическое отклонение не имеют тенденции изменения в динамике и существенной колеблемости, усреднение распределения за ряд лет про­ сто. Нужно суммировать частоты в натуральных интер­ валах варьирующего признака за все годы и анализиро­ вать полученный суммированный ряд распределения. Суммированные частоты можно, разумеется, разделить на число периодов или моментов Бремени, получив «сред­

негодовой ряд» распределения, но, но нашему мнению, в этом нет необходимости. Форма распределения усред­ ненного и суммированного рядов в точности одинакова, но в усредненном ряду частоты будут, как правило, выра­ жаться дробными числами, что снизит точность расчетов и увеличит их трудоемкость.

96

Однако распределения, не имеющие тенденции изме­ нения, встречаются редко и представляют меньше инте­ реса для статистики. В основном она имеет дело с из­ меняющимися в динамике характеристиками распределе­ ния. В этом случае механическое суммирование частот в интервалах за ряд лет недопустимо, так как приведет к искажению формы распределения. Так, например, при суммировании за ряд лет частот распределения, обладаю­ щего острой вершиной и при этом заметной тенденцией роста среднего уровня, получится искаженное, якобы плосковершинное распределение.

Методика усреднения или суммирования распреде­ ления, имеющего существенную тенденцию динамики среднего значения признака и его среднего квадратиче­ ского отклонения, насколько удалось установить, не из­ лагалась в статистической литературе. Ниже приведен один из возможных ее вариантов.

Для того чтобы иметь право суммировать и усред­ нять распределения, относящиеся к нескольким последо­ вательным периодам или моментам, не искажая функцию плотности распределения, необходимо прежде всего, что­ бы эмпирическое распределение за эти периоды или мо­ менты в тенденции было однотипным, чтобы колебания формы рядов распределения являлись случайными. Что­ бы абстрагироваться от наличия тенденции изменения среднего уровня, необходимо совместить центры распре­ делений, следовательно, суммированное распределение может быть построено не в абсолютных величинах при­ знака, а в виде отклонений от средней его величины. На­ конец, чтобы абстрагироваться от изменений величины среднего квадратического отклонения, нужно отклонения от средней величины признака нормировать, т. е. выра­ зить в единицах среднего квадратического отклонения за данный период. Только построив подобные сопоставимые ряды распределения за все усредняемые моменты или периоды времени, где варианты признака выражены в форме нормированных отклонений от среднего значения за каждый период, можно перейти к суммированию со­ ответствующих частот и построить обобщающее распре­ деление за несколько лет.

Указанную методику целесообразно применить к ана­ лизу динамики распределения областей, краев и АССР РСФСР по урожайности зерновых культур (см. табл. 5).

4 —372

97


Это распределение сравнительно небольшой совокупно­ сти, ввиду чего отдельные случайные отклонения особен­ но заметно искажают типичную его форму. Следователь­ но, метод усреднения распределения за ряд лет является весьма полезным при исследовании этого распределения. Кроме того, в динамике указанного распределения были выделены три различных этапа (см. § 2, гл. И). Интерес­ но проследить за тем, влияют ли различия между этими этапами на характер закономерности распределения.

 

 

 

 

-

Т а б л и ц а 15

 

Исследование характера суммарного распределения

 

 

 

за

1947—1954 гг.

 

 

 

 

Гипотеза о нормальном распределении

 

Нормированное

Суммарная

Р

(/с- / т)3:/ т

D

отклонение t

частота / с

 

 

 

- 3 , 5 ----- 3,0

1

0,0011

1]

9,3

1

—3,0----- 2,5

0,0049

3

—3

- 2 ,5 ------ 2,0

1

0,0166

9J

1,5

— 10

—2,0------ 1,5

18

0,0440

24

—16

1,5------ 1,0

47

0,0918

50

0,2

— 19

- 1 , 0 ------ 0,5

99 •

0,1499

81

4,0

_2

- 0 , 5 ------ 0,0

135

0,1916

104

9,2

+ 2 9

0,0 —

0,5

102

0,1916

104

0,0

4-27

0,5—

1,0

75

0,1499

81

0,4

+ 2 0

1,0—

1,5

33

0,0918

50

5,8

+ 3

1,5—

2,0

15

0,0440

24

3,4

—6

2,0 —

2,5

9

0,0166

9

 

5

2,5 —

3,0

7

0,0049

3

1 ,У

_ 1

3,0 —

3,5 '

1

0,0011

1

—1

 

3,5 —

4,0

1

0,0002

0]

 

0

Итого

 

544

1

544

35,7

__

О б о з н а ч е н и я : Р — вероятность нахождения

признака в

данном

 

 

интервале при нормальном законе распреде­

 

 

ления: Р = ^ F ( t i ) —— F(t2)\

 

 

 

fт — теоретическая

частота при нормальном-рас­

 

 

пределении;

 

 

 

 

 

D — разность накопленных

частот: суммарных

 

 

эмпирического распределения и теоретиче­

 

 

ских.

 

 

 

 

При 10 — 3 = 7 степенях свободы значение %2, равное 35,7, свидетельствует о том, что вероятность случайного отклонения эмпирического распределения от нормального

98