Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 25.06.2024
Просмотров: 93
Скачиваний: 0
интегральным функциям распределения. Отклонения от теоретических законов возникают при рассмотрении час тот в отдельных узких интервалах ряда, т. е. они являют ся отклонениями «местного значения».
Третий вывод состоит в констатации колебания эмпи рического распределения в динамике: оно то приближает ся в отдельные годы к тому или иному теоретическому распределению, то отдаляется от него, причем эти коле бания имеют случайный характер. Из данного факта вы текают важные следствия: во-первых, изучение закона распределения по данным одного случайно выхваченно го года может привести к совершенно неправильным выводам. Например, если рассматривать изолированно распределение за 1960 или 1967 гг., пришлось бы сделать заключение о том, что оно не является ни нормальным, ни логарифмическн-нормальным. По данным 1969 г. был бы сделан вывод о логарифмически-нормальном законе, но по данным 1970 г. он был бы отвергнут, распределение оказалось бы нормальным! На самом деле нелепо счи тать. что столь обобщающая характеристика распреде ления значительной совокупности крупных предприятий чуть ли не ежегодно может меняться. Значит, метод анализа закономерности распределения по данным от дельного периода или момента, по крайней мере для всех признаков, имеющих существенную колеблемость в дина мике, не является научным.
Следующее заключение из данных табл. 13 состоит в отсутствии надежной тенденции в динамике к переходу от одного закона распределения к другому. Этот вывод является важным не только сам по себе — как свиде тельство возможности развития совокупности при сохра нении одного типа закономерности распределения, но и в том отношении, что отсутствие тенденции изменения закона распределения позволяет считать весь изучаемый период однородным в данном отношении. Следовательно, можно построить сводное, усредненное распределение за период, в котором случайные колебания не приводят к изменению типа закономерности. Анализ такого усред ненного распределения, в котором случайные колебания в большей мере погашаются, позволит значительно точ нее и надежнее установить соответствие эмпирического распределения той или иной теоретической модели. Ме тодика построения усредненного распределения для изу
9 2
чения его интегральной и дифференциальной функции достаточно сложна. О ней будет сказано далее.
Интересно исследовать зависимость между степенью приближения эмпирического распределения к тому или иному закону и другими его характеристиками: средним
уровнем и показателем асимметрии (см. табл. |
14). |
Имея в виду, что ранее-уже были вычислены |
2 и2и = |
= 4785 и 2u'2as = 1,41, находим:
а) коэффициент корреляции между вероятностью
близости распределения |
к нормальному и колебаниями |
|
средней урожайности: |
|
|
Ир, |
+ 4 3 ,9 0 |
-7-0,62; |
ruMUpl |
|
|
У ±ил2j.. 2и|, |
У 4 785 - 0,957! |
|
б) коэффициент корреляции между вероятностью близости распределения к логарифмически-нормальному и колебаниями средней урожайности:
S/I■ М ' “ Р, |
|
-3 3 ,9 8 |
:— 0.575. |
ШмИр, = |
1 4 |
785 • 0,7312 |
|
*Л1 НиPi |
|
||
и 2 . . |
|
|
|
Как видим, зависимости |
имеют |
противоположное друг |
другу направление: в годы урожайные эмпирическое рас пределение приближается к нормальному, а в неурожай ные— к логарифмически-нормальному!! Этот весьма интересный вывод является, по нашему убеждению, оп ровержением гипотезы о том, что прогрессивно развиваю щаяся совокупность должна иметь логарифмически-нор-
мальное распределение. |
Напротив, |
как видим, |
именно |
в наиболее урожайные |
1965 и 1970 гг. распределение |
||
совхозов по урожайности |
картофеля |
наиболее |
близко |
к нормальному и далеко от логарифмическинормально го. Оба коэффициента корреляции статистически значи мы при вероятности «нулевой гипотезы» не более 0,05.
Анализ связи вероятностей Р\ w Р% с показателем асимметрии распределения раскрывает в какой-то мере причины полученной закономерности. Вспомним, что за висимость между колебаниями средней урожайности и показателями асимметрии распределения обратная. Правосторонняя асимметрия усиливается в неурожайные годы вследствие сдвига распределения в сторону низшего предела урожайности. Не является-ли это причиной, вы-
9 3
<© |
Т а б л и ц а 14 |
Показатели для анализа факторов, влияющих на близость эмпирического распределения к теоретическому
Годы
1958
1959
1960
1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
иМ |
" a s |
— 6 |
+ 0 ,4 2 |
+ 5 |
—0,39 |
-|-27 |
—0,07 |
+ 7 |
—0,29 |
—41 |
+ 0 ,1 4 |
— 14 |
+ 0 ,0 8 |
+ 1 3 |
- 0 ,2 5 |
+ 2 9 |
—0,35 |
— 14 |
+ 0 ,2 5 |
— 6 |
+ 0 ,4 0 |
+ 4 |
+ 0 ,2 1 |
—21 |
+ 0 ,5 0 |
+ 1 9 |
—0,31 |
+ 3 |
—0,41 |
“я, |
"я. |
" м " р , |
" м -“ р , |
ua s ' up t |
ua s 'up а |
|
■ * , |
|
—0,11 |
—0,20 |
+ 0 , 6 6 |
+ 1 ,2 0 |
—0,0462 |
—0,0840 |
0,0121 |
0,0400 |
|
+ 0 ,1 8 |
—0,02 |
+ 0 ,9 0 |
—0,10 |
—0,0702 |
+0,0078 |
0,0324 |
0,0004 |
|
+ 0 |
,0 1 |
—0,06 |
Ц-0,27 |
- 1 ,6 2 |
—0,0007 |
+0,0042 |
0,0001 |
0,0036 |
+ 0 |
,2 1 |
+ 0 ,0 6 |
+ 1 ,4 7 |
+ 0 ,4 2 |
—0,0609 |
—0,0174 |
0,0441 |
0,0036 |
- 0 |
,4 8 |
+ 0 ,0 9 |
+ 19,68 |
—3,69 |
—0,0672 |
+0,0126 |
0,2304 |
0,0081 |
+ 0 ,0 4 |
+ 0 ,1 3 |
—0,56 |
— 1,82 |
+0,0032 |
+0,0104 |
0,0016 |
0,0169 |
|
+ 0 ,2 1 |
+ 0 ,1 7 |
+ 2 ,7 3 |
+ 2 ,2 1 |
—0,0525 |
—0,0425 |
0,0441 |
0,0289 |
|
+ 0 |
,2 2 |
—0,38 |
+ 6 ,3 8 |
— 11,02 |
—0,0770 |
+0,1330 |
0,0484 |
0,1444 |
+ 0 ,2 0 |
+ 0 ,2 6 |
—2,80 |
—3,64 |
+0,0500 |
+0,0650 |
0,0400 |
0,0676 |
|
—0,45 |
+ 0 ,1 6 |
+ 2 ,7 0 |
—0,96 |
—0,1800 |
+0,0640 |
0,2025 |
0,0256 |
|
+0,21 |
+ 0 ,2 1 |
+ 0 ,8 4 |
+ 0 ,8 4 |
+0,0441 |
+0,0441 |
0,0441 |
0,0441 |
|
—0,45 |
+ 0 ,2 8 |
+ 9 ,4 5 |
—5,88 |
—0,2250 |
+0,1400 |
0,2025 |
0,0784 |
|
+ 0 ,0 8 |
—0,50 |
+ 1 ,5 2 |
—9,50 |
—0,0248 |
+0,1550 |
0,0064 |
0,2500 |
|
+ 0 ,2 2 |
—0,14 |
-|-0,00 |
—0,42 |
—0,0902 |
+0,0574 |
0,0484 |
0,0196 |
2 |
_ |
_ |
_ |
_ |
-И З , 90 —33,98 —0,7974 +0,5496 |
0,9571 |
0,7312 |
зывающен отклонение эмпирического распределения от нормального закона и его внешнее приближение к лога- рифмически-нормалы-юму закону? Если это предположе ние верно, связь вероятности А с показателем асиммет рии должна быть обратной, а вероятности Рг с показа телем асимметрии будет прямой. Табл. 14 подтвержда ет данное предположение:
коэффициент корреляции между вероятностью близо сти распределения к нормальному и показателем асим метрии
ruasuPt = |
1р. |
—0,7974 |
0,68; |
|
— — |
||
|
1Л +2 |
У 1,41 -0,9571 |
|
|
as ~ иР1 |
|
|
коэффициент корреляции между вероятностью близо сти распределения к логарифмически-нормальному и по каз ателем асимметрии
Г11а^Иpi |
+0,5496 |
I |
0,55. |
У 1,41 • 0,7312 |
T |
||
/ K s ' * 4 , |
|
|
|
Если приближение эмпирического ряда |
распределе |
ния к логарифмически-нормальному происходит в резуль тате нарушения симметричности распределения при при ближении средней величины признака к его низшему пре делу, молено ли считать распределение по существу, а не формально соответствующим логарифмически-нор мальному закону распределения? Ведь он обычно связы вается с такими причинами, как мультипликативность действия факторов, влияющих на величину признака. Вряд ли правильно всякое распределение с умеренной правосторонней асимметрией, независимо от причин и характера ее динамики, ее колебаний, считать отвечаю щим логарифмически-нормальному закону, если даже критерии согласия не опровергают данную гипотезу.
Итак, в результате исследования динамики распреде ления совхоза Ленинградской области, по урожайности картофеля можно сделать вывод о том, что типические черты, устойчиво присущие данному распределению в тенденции на протяжении изучаемого периода, харак теризуют его, как близкое к нормальному закону распре деления. В отдельные годы функцияплотности вероятно сти испытывает существенные колебания, причем в иеуро-
95
жайные годы она отходит от нормального закона, фор мально приближаясь к логарифмически-нормальному. Соответствие распределения совхозов по урожайности нормальному закону отвечает положениям агрономиче ской науки: действие факторов, влияющих на урожай ность (как, например, удобрения различных видов, ме лиорация полей, сортовой состав посевного материала, уровень прочих агротехнических мероприятий), скорее аддитивно, чем мультипликативно. Оно даже, если мож но так выразиться, «ниже аддитивности», т. е. прибавки урожая за счет отдельных факторов не суммируются пол ностью: каждый из факторов дает эффект в полной мере только при осуществлении всего комплекса оптимальной агротехники и при оптимальных метеорологических ус ловиях.
Дальнейшим развитием методики статистического анализа динамики распределения могут служить методы анализа функции распределения по данным среднего многолетнего распределения. Поскольку ее форма в от дельные годы подвергается искажению от случайных ко лебаний, связанных в конечном счете с колебаниями метеорологических условий, а также со случайностями попадания большего или меньшего числа единиц совокуп ности в заданные интервалы значений признака при группировке, постольку для выравнивания колебаний и выявления устойчивого типа распределения полезно при менить усреднение распределения за ряд лет.
Если характеристики распределения: средняя величи на признака и среднее квадратическое отклонение не имеют тенденции изменения в динамике и существенной колеблемости, усреднение распределения за ряд лет про сто. Нужно суммировать частоты в натуральных интер валах варьирующего признака за все годы и анализиро вать полученный суммированный ряд распределения. Суммированные частоты можно, разумеется, разделить на число периодов или моментов Бремени, получив «сред
негодовой ряд» распределения, но, но нашему мнению, в этом нет необходимости. Форма распределения усред ненного и суммированного рядов в точности одинакова, но в усредненном ряду частоты будут, как правило, выра жаться дробными числами, что снизит точность расчетов и увеличит их трудоемкость.
96
Однако распределения, не имеющие тенденции изме нения, встречаются редко и представляют меньше инте реса для статистики. В основном она имеет дело с из меняющимися в динамике характеристиками распределе ния. В этом случае механическое суммирование частот в интервалах за ряд лет недопустимо, так как приведет к искажению формы распределения. Так, например, при суммировании за ряд лет частот распределения, обладаю щего острой вершиной и при этом заметной тенденцией роста среднего уровня, получится искаженное, якобы плосковершинное распределение.
Методика усреднения или суммирования распреде ления, имеющего существенную тенденцию динамики среднего значения признака и его среднего квадратиче ского отклонения, насколько удалось установить, не из лагалась в статистической литературе. Ниже приведен один из возможных ее вариантов.
Для того чтобы иметь право суммировать и усред нять распределения, относящиеся к нескольким последо вательным периодам или моментам, не искажая функцию плотности распределения, необходимо прежде всего, что бы эмпирическое распределение за эти периоды или мо менты в тенденции было однотипным, чтобы колебания формы рядов распределения являлись случайными. Что бы абстрагироваться от наличия тенденции изменения среднего уровня, необходимо совместить центры распре делений, следовательно, суммированное распределение может быть построено не в абсолютных величинах при знака, а в виде отклонений от средней его величины. На конец, чтобы абстрагироваться от изменений величины среднего квадратического отклонения, нужно отклонения от средней величины признака нормировать, т. е. выра зить в единицах среднего квадратического отклонения за данный период. Только построив подобные сопоставимые ряды распределения за все усредняемые моменты или периоды времени, где варианты признака выражены в форме нормированных отклонений от среднего значения за каждый период, можно перейти к суммированию со ответствующих частот и построить обобщающее распре деление за несколько лет.
Указанную методику целесообразно применить к ана лизу динамики распределения областей, краев и АССР РСФСР по урожайности зерновых культур (см. табл. 5).
4 —372 |
97 |
Это распределение сравнительно небольшой совокупно сти, ввиду чего отдельные случайные отклонения особен но заметно искажают типичную его форму. Следователь но, метод усреднения распределения за ряд лет является весьма полезным при исследовании этого распределения. Кроме того, в динамике указанного распределения были выделены три различных этапа (см. § 2, гл. И). Интерес но проследить за тем, влияют ли различия между этими этапами на характер закономерности распределения.
|
|
|
|
- |
Т а б л и ц а 15 |
||
|
Исследование характера суммарного распределения |
|
|||||
|
|
за |
1947—1954 гг. |
|
|
||
|
|
Гипотеза о нормальном распределении |
|
||||
Нормированное |
Суммарная |
Р |
/т |
(/с- / т)3:/ т |
D |
||
отклонение t |
частота / с |
|
|
|
|||
- 3 , 5 ----- 3,0 |
1 |
0,0011 |
1] |
9,3 |
— 1 |
||
—3,0----- 2,5 |
0,0049 |
3 |
—3 |
||||
- 2 ,5 ------ 2,0 |
1 |
0,0166 |
9J |
1,5 |
— 10 |
||
—2,0------ 1,5 |
18 |
0,0440 |
24 |
—16 |
|||
— 1,5------ 1,0 |
47 |
0,0918 |
50 |
0,2 |
— 19 |
||
- 1 , 0 ------ 0,5 |
99 • |
0,1499 |
81 |
4,0 |
_2 |
||
- 0 , 5 ------ 0,0 |
135 |
0,1916 |
104 |
9,2 |
+ 2 9 |
||
0,0 — |
0,5 |
102 |
0,1916 |
104 |
0,0 |
4-27 |
|
0,5— |
1,0 |
75 |
0,1499 |
81 |
0,4 |
+ 2 0 |
|
1,0— |
1,5 |
33 |
0,0918 |
50 |
5,8 |
+ 3 |
|
1,5— |
2,0 |
15 |
0,0440 |
24 |
3,4 |
—6 |
|
2,0 — |
2,5 |
9 |
0,0166 |
9 |
|
— 5 |
|
2,5 — |
3,0 |
7 |
0,0049 |
3 |
1 ,У |
_ 1 |
|
3,0 — |
3,5 ' |
1 |
0,0011 |
1 |
—1 |
||
|
|||||||
3,5 — |
4,0 |
1 |
0,0002 |
0] |
|
0 |
|
Итого |
|
544 |
1 |
544 |
35,7 |
__ |
|
О б о з н а ч е н и я : Р — вероятность нахождения |
признака в |
данном |
|||||
|
|
интервале при нормальном законе распреде |
|||||
|
|
ления: Р = ^ F ( t i ) —— F(t2)\ |
|
||||
|
|
fт — теоретическая |
частота при нормальном-рас |
||||
|
|
пределении; |
|
|
|
||
|
|
D — разность накопленных |
частот: суммарных |
||||
|
|
эмпирического распределения и теоретиче |
|||||
|
|
ских. |
|
|
|
|
При 10 — 3 = 7 степенях свободы значение %2, равное 35,7, свидетельствует о том, что вероятность случайного отклонения эмпирического распределения от нормального
98