Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.06.2024

Просмотров: 76

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

хозяйств и т. п. Думаю, что преимущества прогноза це­ лостного распределения перед прогнозом только одной средней величины или объемного показателя не нуждают­ ся в длинном объяснении. Но путь к такому прогнозиро­ ванию распределений лежит через анализ существующей их динамики.

Введение предлагаемой методики в практику работы автоматизированной системы государственной статистики (АСГС) позволит более полно использовать проходящий через эту систему богатейший поток информации, заклю­ ченный в отчетности социалистических предприятий. Ведь ряд распределения совокупности, скажем, совхозов на 8 групп по урожайности обладает семью степенями свободы, не считая внутригрупповой вариации. Он позво­ ляет получить семь независимых сводных характеристик (независимых в том смысле, что каждая содержит новую информацию, ие повторяемую другими). Замена же этого распределения одной лишь средней величиной, что неред­ ко делают при изучении динамики, означает потерю шес­ ти седьмых информации.

Наличие в распоряжении органов государственной статистики плановых и хозяйственных руководящих ор­ ганов и крупных предприятий мощной современной вы­ числительной техники устраняет препятствия на пути внедрения любой, в том числе и гораздо более сложной, чем предлагаемая, методики статистического анализа и прогнозирования. Дело прежде всего в понимании необ­ ходимости изучения динамики распределений и корреля­ ционных зависимостей.

В течение довольно длительного времени развитие статистической методологии шло по пути все большего' разветвления и углубления методов анализа отдельных черт, сторон изучаемых совокупностей. Меньше внимания обращалось на синтетическое изучение совокупностей. В настоящее время положение меняется, так как задачи прогнозирования, комплексной оценки развития произ­ водства, происходящий процесс синтеза и «стыковки» разных наук увеличивают роль синтетического подхода, в том числе и в статистике. Такая синтетическая методика исследования сделает «статистическую картину» (выра­ жение В. И. Ленина) экономики производства, природ­ ных и технических процессов более глубокой и полной, что является главной задачей научного познания.

I

Г

Г л а в а II

СТАТИСТИЧЕСКИЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИКИ ОДНОМЕРНЫХ РАСПРЕДЕЛЕНИЙ

§ 1. Одномерные распределения, методы их изучения и их значение в статистике

Одномерным называют распределение статистической совокупности по значениям одного признака. Таковы, на­ пример, распределения жителей страны по возрасту; сов­ хозов области — по урожайности картофеля; промышлен­ ных предприятий данной отрасли — по числу рабочих и т. д.

Основным условием, которое должно быть соблюдено при построении и исследовании подобного распределения,

является однородность изучаемой совокупности. Но само понятие однородности статистической совокупности тре­ бует уточнения и конкретизации. Ни одна совокупность не является и не может быть однородной во всех отноше­ ниях, по всем своим существенным признакам. Совхозы Ленинградской области, образующие однородную сово­ купность по социально-экономическому типу предприя­ тий, весьма неоднородны по таким признакам, как струк­ тура производимой продукции, уровень рентабельности, размеры отдельных отраслей.

Вопрос об однородности совокупности подлежит рас­ смотрению в каждом отдельном случае, при конкретном исследовании определенного свойства совокупности. Гак, например, все совхозы Ленинградской области, несмотря на различие их специализации, можно считать однород­ ной совокупностью при исследовании такого признака, как урожайность сельскохозяйственных культур, напри­ мер картофеля, зерновых культур. В Ленинградской об­ ласти нет специализированных зерновых или картофеле­ водческих совхозов, эти отрасли при любой иной специа­ лизации являются дополнительными. Технология выра­

18


щивания картофеля и зерновых во всех совхозах одно­ типна', в ее основе лежат единые типовые технологиче­ ские карты, степень благоприятности природных условий области для выращивания картофеля и зерновых куль­ тур, хотя и варьирует, но не выходит за пределы качест­ венно единого типа. Независимо от той роли, которую играет производство картофеля или зерна в совхозе, каж­ дое хозяйство заинтересовано в получении максимально высоких урожаев. В результате этого распределение сов­ хозов области по урожайности картофеля или зерновых культур обладает, как видно из приводимых далее дан­ ных, всеми чертами распределения однородной совокуп­ ности.

Критерием правильности предварительного теоретиче­ ского исследования однородности совокупности в какомлибо отношении является практика, т. е. рассмотрение свойств фактического распределения. Ведь однородность совокупности — ее объективное свойство, существующее независимо от его отражения в статистических таблицах и показателях. Если исследователь объединит в резуль­ тате отсутствия предварительного теоретического анали­ за или ошибочности последнего разнородные совокупно­ сти в одном ряду распределения, их объективно сущест­ вующая разнородность проявится в характере полученно­ го ряда. Например, очень существенным свидетельством разнородности явлений, смешанных в одном ряду, слу­ жит бимодальность или мультимодальность распределе­ ния, несогласие распределения ни с одним из законов, обычно описывающих плотность распределения изучаемо­ го признака. Таким образом, если предварительный ана­ лиз природы изучаемой совокупности служит предпосыл­ кой построения ряда распределения, то исследование это­ го ряда либо подтверждает правильность предположения об однородности изучаемой совокупности в данном кон­ кретном отношении, либо свидетельствует об ошибочно­ сти предварительной качественной оценки совокупности.

Г. Громыко совершенно справедливо отмечает. «... прежде, чем строить тот или иной вариационный ряд, надо отчетливо представить, что же именно распреде­ ляется, т. е. единицы какой совокупности подразделяются на группы по определенному количественному признаку» [45, с. 53]. В этой статье убедительно показано на несколь­ ких примерах, какая путаница возникает из-за наруше-

19


,ния указанного правила. Обычно принято вариационным

'рядом называть ряд распределения по количественному, т. е. измеряемому и выражаемому численно признаку. Понятие «вариационный ряд», таким образом, уже, чем «ряд распределения». Следует добавить к этому, что и понятие «ряд распределения» гораздо более узкое, чем понятие «одномерное распределение». Собственно, по­ строение ряда — это уже один из методов, приемов изу­ чения одномерного распределения совокупности. В содер­ жание этого понятия или категории статистики входят и все характеристики распределения, показатели, система которых раскрывает статистическую закономерность рас­ пределения.

Одномерное распределение отражает различие усло­ вий, в которых существуют и развиваются отдельные еди­ ницы статистической совокупности. Эти условия могут быть как внешними, так и внутренними. Внешними яв­ ляются влияние и воздействия других совокупностей, дру­ гих признаков: например, если изучается распределение совхозов области по урожайности картофеля, то разли­ чия почв, метеорологических условий будут для отдель­ ных совхозов внешними условиями (под различием почв будем понимать их естественные различия). Внутрен­ ние— это влияние признаков, присущих неотъемлемо данным единицам совокупности, например различия в уровне организации производства, влияние различий в сортовом составе высеваемого семенного материала, раз­ личия в обработке почвы и т. п. Ввиду того, что количест­ во таких «условий», т. е. признаков, прямо или опосредст­ вованно связанных с изучаемым признаком, всегда вели­ ко, а количество их возможных комбинаций, если даже исключить заведомо нереальные и маловероятные соче­ тания, при увеличении числа факторов возрастает по за­ кону факториалов, поэтому вероятность полного сходства всех условий у двух разных единиц совокупности ничтож­ но мала..Практически каждая единица социально-эконо­ мической совокупности находится в своеобразном комп­ лексе условий ее существования и развития, а следова­ тельно, каждая единица совокупности обладает и особен-

I ным значением признака.

Но если отдельные значения признака у той или иной единицы совокупности зависят от случайного сочетания различных условий, то в совокупности в целом, в боль­

20


шом числе ее единиц, проявляется статистическая законо­ мерность распределения.

Поясним на весьма упрощенном примере возникнове­ ние этой закономерности. Предположим, что на изучае­ мый признак влияют всего восемь разных факторов (ус­ ловий) и по каждому из них могут существовать всего две градации: благоприятное значение для данного при­

знака или неблагоприятное (иначе говоря,

+ или —).

Общее число всех возможных сочетаний

будет

равно

28 = 256 (п).

Из них с нулем значений,

благоприятных

данному признаку, окажется одно сочетание С&° =

1 и од­

но с нулем неблагоприятных значений.

С одним благо­

приятным или одним неблагоприятным

значением ока­

жется С&1 =

8 или Се7 = 8 и т. д. В результате образует­

ся следующее распределение всех 256 возможных сочета­

ний различных

условий по количеству

благоприятных

или неблагоприятных:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 1

 

 

 

Распределение 256 различных условий

 

 

 

 

 

 

по числу благоприятных значений

 

 

 

Число благопри-

0

1

о

3

4

5

6

7

8

Всего

ятных значений

X

 

 

 

 

 

 

 

 

 

 

 

 

Число случаев

 

 

 

 

 

 

 

 

 

 

С этим

чис­

 

 

 

 

 

 

 

 

 

 

лом

благо­

 

 

 

 

 

 

 

 

 

 

приятных зна­

 

 

 

 

 

 

 

 

 

 

чений

 

(час­

1

8

28

 

40

 

28

8

1

256=я

тота)

т

 

56

56

Вероятность

 

 

 

 

 

 

 

 

 

 

данного

чис­

1

 

7

7

35

7

7

 

 

 

ла благопри­

1

1

1

1

ятных

значе­

256

32

64

32

128

32

64

32

256

ний р

=

т : п

 

Это распределение называется распределением Бернул­ ли, или биномиальным распределением [12, 5, 6]. Если предположить, что изучаемый признак примерно в рав­ ной степени зависит от всех восьми влияющих на него ус­ ловий, то и распределение совокупности по значениям этого признака будет близким к биномиальному. По ме­ ре увеличения числа влияющих на изучаемый признак факторов такое распределение стремится к пределу, ши-

21


роко известному под названием «нормального распреде­ ления», или распределения Гаусса—Лапласа.

Рмс. 1. Биномиальное распределение

При нормальном распределении плотность распреде­ ления описывается функцией

Я 0 = —

 

V 2г.

 

где i — нормированное отклонение заданной точки

на

оси абсцисс от точки, соответствующей положе­

нию средней величины признака.

от

Частость в заданном интервале значений признака

czi до а2 определяется интегральной функцией нормально­ го распределения как ^ -F (a2) ----^-F(ai), причем а2 > ай

 

i - t

- t *

F [а] =

1 >

- г

1 2п

е 2 dt.

 

 

где t-

Как показал А. М. Ляпунов, нормальное распределение образуется тогда, когда на изучаемую величину (при­ знак) влияет большое число независимых или слабо за ­ висимых друг от друга факторов, причем дисперсии каж­ дого из них ограничены и ни один фактор в отдельности не имеет преобладающего влияния. Многие производст­ венные, экономические и природные совокупности и их признаки удовлетворяют этому условию, например рост

22

человека, урожайность в совхозе, ошибки наблюдения и измерения, отклонения выборочных характеристик от ха­ рактеристик генеральной совокупности. Весьма сущест­ венно то, что нормальное распределение является пре­ дельным законом распределения, к которому стремятся некоторые другие типы распределений при увеличении объема совокупности.

В данной книге не ставится цель подробного изложе­ ния методики построения и анализа вариационных рядов, поскольку об этом можно прочесть как в учебниках об­ щей теории статистики или математической статистики, так и в специальных монографиях [6, 22]. Остановимся лишь на некоторых недостаточно освещенных или спор­ ных вопросах.

Построение вариационного ряда требует опыта и «ста­ тистического чутья»; это в известной мере искусство, и до сих пор нет надежного алгоритма, который бы позволил проводить эту операцию механически. Если не считать редко встречающиеся вариационные ряды, построенные по дискретному признаку с небольшим числом отдельных (целых) значений, то для всех остальных рядов весьма важным является правильный выбор числа групп, числа интервалов признака. Слишком малое число групп не раскрывает картины распределения, его закономерности, а излишне большое число групп вуалирует эту картину случайными колебаниями частот. Часто рекомендуется определять оптимальное число групп (или интервалов) по эмпирической формуле Стерджесса. При этом сама формула может выглядеть так [8, с. 152; 30, с. 134]:

k = 1 -1-3,322 Ig гг,

где k — число групп;

п — число единиц совокупности,

или так [5, с. 55; 6, с. 22]:

k = 1 -j- 3,2 lg п.

Дж. Эдни Юл и М. Дж. Кендэл предлагают брать от 15 до 25 групп [44, с. 104]. А. К. Митропольский предлагает брать всегда по 12 групп, причем считает допустимыми от­ клонения от 12 групп на 2—3 в ту или другую сторону [22, с. 20]. У Н. М. Виноградовой встречается и такое ука­ зание: «Количество групп (интервалов) в ряду при до­ статочно большом числе наблюдений (п > 200 — 300) ре­

23