Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 25.06.2024
Просмотров: 76
Скачиваний: 0
хозяйств и т. п. Думаю, что преимущества прогноза це лостного распределения перед прогнозом только одной средней величины или объемного показателя не нуждают ся в длинном объяснении. Но путь к такому прогнозиро ванию распределений лежит через анализ существующей их динамики.
Введение предлагаемой методики в практику работы автоматизированной системы государственной статистики (АСГС) позволит более полно использовать проходящий через эту систему богатейший поток информации, заклю ченный в отчетности социалистических предприятий. Ведь ряд распределения совокупности, скажем, совхозов на 8 групп по урожайности обладает семью степенями свободы, не считая внутригрупповой вариации. Он позво ляет получить семь независимых сводных характеристик (независимых в том смысле, что каждая содержит новую информацию, ие повторяемую другими). Замена же этого распределения одной лишь средней величиной, что неред ко делают при изучении динамики, означает потерю шес ти седьмых информации.
Наличие в распоряжении органов государственной статистики плановых и хозяйственных руководящих ор ганов и крупных предприятий мощной современной вы числительной техники устраняет препятствия на пути внедрения любой, в том числе и гораздо более сложной, чем предлагаемая, методики статистического анализа и прогнозирования. Дело прежде всего в понимании необ ходимости изучения динамики распределений и корреля ционных зависимостей.
В течение довольно длительного времени развитие статистической методологии шло по пути все большего' разветвления и углубления методов анализа отдельных черт, сторон изучаемых совокупностей. Меньше внимания обращалось на синтетическое изучение совокупностей. В настоящее время положение меняется, так как задачи прогнозирования, комплексной оценки развития произ водства, происходящий процесс синтеза и «стыковки» разных наук увеличивают роль синтетического подхода, в том числе и в статистике. Такая синтетическая методика исследования сделает «статистическую картину» (выра жение В. И. Ленина) экономики производства, природ ных и технических процессов более глубокой и полной, что является главной задачей научного познания.
I
Г
Г л а в а II
СТАТИСТИЧЕСКИЕ МЕТОДЫ ИССЛЕДОВАНИЯ ДИНАМИКИ ОДНОМЕРНЫХ РАСПРЕДЕЛЕНИЙ
§ 1. Одномерные распределения, методы их изучения и их значение в статистике
Одномерным называют распределение статистической совокупности по значениям одного признака. Таковы, на пример, распределения жителей страны по возрасту; сов хозов области — по урожайности картофеля; промышлен ных предприятий данной отрасли — по числу рабочих и т. д.
Основным условием, которое должно быть соблюдено при построении и исследовании подобного распределения,
является однородность изучаемой совокупности. Но само понятие однородности статистической совокупности тре бует уточнения и конкретизации. Ни одна совокупность не является и не может быть однородной во всех отноше ниях, по всем своим существенным признакам. Совхозы Ленинградской области, образующие однородную сово купность по социально-экономическому типу предприя тий, весьма неоднородны по таким признакам, как струк тура производимой продукции, уровень рентабельности, размеры отдельных отраслей.
Вопрос об однородности совокупности подлежит рас смотрению в каждом отдельном случае, при конкретном исследовании определенного свойства совокупности. Гак, например, все совхозы Ленинградской области, несмотря на различие их специализации, можно считать однород ной совокупностью при исследовании такого признака, как урожайность сельскохозяйственных культур, напри мер картофеля, зерновых культур. В Ленинградской об ласти нет специализированных зерновых или картофеле водческих совхозов, эти отрасли при любой иной специа лизации являются дополнительными. Технология выра
18
щивания картофеля и зерновых во всех совхозах одно типна', в ее основе лежат единые типовые технологиче ские карты, степень благоприятности природных условий области для выращивания картофеля и зерновых куль тур, хотя и варьирует, но не выходит за пределы качест венно единого типа. Независимо от той роли, которую играет производство картофеля или зерна в совхозе, каж дое хозяйство заинтересовано в получении максимально высоких урожаев. В результате этого распределение сов хозов области по урожайности картофеля или зерновых культур обладает, как видно из приводимых далее дан ных, всеми чертами распределения однородной совокуп ности.
Критерием правильности предварительного теоретиче ского исследования однородности совокупности в какомлибо отношении является практика, т. е. рассмотрение свойств фактического распределения. Ведь однородность совокупности — ее объективное свойство, существующее независимо от его отражения в статистических таблицах и показателях. Если исследователь объединит в резуль тате отсутствия предварительного теоретического анали за или ошибочности последнего разнородные совокупно сти в одном ряду распределения, их объективно сущест вующая разнородность проявится в характере полученно го ряда. Например, очень существенным свидетельством разнородности явлений, смешанных в одном ряду, слу жит бимодальность или мультимодальность распределе ния, несогласие распределения ни с одним из законов, обычно описывающих плотность распределения изучаемо го признака. Таким образом, если предварительный ана лиз природы изучаемой совокупности служит предпосыл кой построения ряда распределения, то исследование это го ряда либо подтверждает правильность предположения об однородности изучаемой совокупности в данном кон кретном отношении, либо свидетельствует об ошибочно сти предварительной качественной оценки совокупности.
Г. Громыко совершенно справедливо отмечает. «... прежде, чем строить тот или иной вариационный ряд, надо отчетливо представить, что же именно распреде ляется, т. е. единицы какой совокупности подразделяются на группы по определенному количественному признаку» [45, с. 53]. В этой статье убедительно показано на несколь ких примерах, какая путаница возникает из-за наруше-
19
,ния указанного правила. Обычно принято вариационным
'рядом называть ряд распределения по количественному, т. е. измеряемому и выражаемому численно признаку. Понятие «вариационный ряд», таким образом, уже, чем «ряд распределения». Следует добавить к этому, что и понятие «ряд распределения» гораздо более узкое, чем понятие «одномерное распределение». Собственно, по строение ряда — это уже один из методов, приемов изу чения одномерного распределения совокупности. В содер жание этого понятия или категории статистики входят и все характеристики распределения, показатели, система которых раскрывает статистическую закономерность рас пределения.
Одномерное распределение отражает различие усло вий, в которых существуют и развиваются отдельные еди ницы статистической совокупности. Эти условия могут быть как внешними, так и внутренними. Внешними яв ляются влияние и воздействия других совокупностей, дру гих признаков: например, если изучается распределение совхозов области по урожайности картофеля, то разли чия почв, метеорологических условий будут для отдель ных совхозов внешними условиями (под различием почв будем понимать их естественные различия). Внутрен ние— это влияние признаков, присущих неотъемлемо данным единицам совокупности, например различия в уровне организации производства, влияние различий в сортовом составе высеваемого семенного материала, раз личия в обработке почвы и т. п. Ввиду того, что количест во таких «условий», т. е. признаков, прямо или опосредст вованно связанных с изучаемым признаком, всегда вели ко, а количество их возможных комбинаций, если даже исключить заведомо нереальные и маловероятные соче тания, при увеличении числа факторов возрастает по за кону факториалов, поэтому вероятность полного сходства всех условий у двух разных единиц совокупности ничтож но мала..Практически каждая единица социально-эконо мической совокупности находится в своеобразном комп лексе условий ее существования и развития, а следова тельно, каждая единица совокупности обладает и особен-
I ным значением признака.
Но если отдельные значения признака у той или иной единицы совокупности зависят от случайного сочетания различных условий, то в совокупности в целом, в боль
20
шом числе ее единиц, проявляется статистическая законо мерность распределения.
Поясним на весьма упрощенном примере возникнове ние этой закономерности. Предположим, что на изучае мый признак влияют всего восемь разных факторов (ус ловий) и по каждому из них могут существовать всего две градации: благоприятное значение для данного при
знака или неблагоприятное (иначе говоря, |
+ или —). |
|||
Общее число всех возможных сочетаний |
будет |
равно |
||
28 = 256 (п). |
Из них с нулем значений, |
благоприятных |
||
данному признаку, окажется одно сочетание С&° = |
1 и од |
|||
но с нулем неблагоприятных значений. |
С одним благо |
|||
приятным или одним неблагоприятным |
значением ока |
|||
жется С&1 = |
8 или Се7 = 8 и т. д. В результате образует |
ся следующее распределение всех 256 возможных сочета
ний различных |
условий по количеству |
благоприятных |
||||||||||
или неблагоприятных: |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 1 |
||
|
|
|
Распределение 256 различных условий |
|
|
|
||||||
|
|
|
по числу благоприятных значений |
|
|
|
||||||
Число благопри- |
0 |
1 |
о |
3 |
4 |
5 |
6 |
7 |
8 |
Всего |
||
ятных значений |
||||||||||||
X |
|
|
|
|
|
|
|
|
|
|
|
|
Число случаев |
|
|
|
|
|
|
|
|
|
|
||
С этим |
чис |
|
|
|
|
|
|
|
|
|
|
|
лом |
благо |
|
|
|
|
|
|
|
|
|
|
|
приятных зна |
|
|
|
|
|
|
|
|
|
|
||
чений |
|
(час |
1 |
8 |
28 |
|
40 |
|
28 |
8 |
1 |
256=я |
тота) |
т |
|
56 |
56 |
||||||||
Вероятность |
|
|
|
|
|
|
|
|
|
|
||
данного |
чис |
1 |
|
7 |
7 |
35 |
7 |
7 |
|
|
|
|
ла благопри |
1 |
1 |
1 |
1 |
||||||||
ятных |
значе |
256 |
32 |
64 |
32 |
128 |
32 |
64 |
32 |
256 |
||
ний р |
= |
т : п |
|
Это распределение называется распределением Бернул ли, или биномиальным распределением [12, 5, 6]. Если предположить, что изучаемый признак примерно в рав ной степени зависит от всех восьми влияющих на него ус ловий, то и распределение совокупности по значениям этого признака будет близким к биномиальному. По ме ре увеличения числа влияющих на изучаемый признак факторов такое распределение стремится к пределу, ши-
21
роко известному под названием «нормального распреде ления», или распределения Гаусса—Лапласа.
Рмс. 1. Биномиальное распределение
При нормальном распределении плотность распреде ления описывается функцией
Я 0 = — |
|
V 2г. |
|
где i — нормированное отклонение заданной точки |
на |
оси абсцисс от точки, соответствующей положе |
|
нию средней величины признака. |
от |
Частость в заданном интервале значений признака |
czi до а2 определяется интегральной функцией нормально го распределения как ^ -F (a2) ----^-F(ai), причем а2 > ай
|
i - t |
- t * |
F [а] = |
1 > |
- г |
1 2п |
е 2 dt. |
|
|
|
где t-
Как показал А. М. Ляпунов, нормальное распределение образуется тогда, когда на изучаемую величину (при знак) влияет большое число независимых или слабо за висимых друг от друга факторов, причем дисперсии каж дого из них ограничены и ни один фактор в отдельности не имеет преобладающего влияния. Многие производст венные, экономические и природные совокупности и их признаки удовлетворяют этому условию, например рост
22
человека, урожайность в совхозе, ошибки наблюдения и измерения, отклонения выборочных характеристик от ха рактеристик генеральной совокупности. Весьма сущест венно то, что нормальное распределение является пре дельным законом распределения, к которому стремятся некоторые другие типы распределений при увеличении объема совокупности.
В данной книге не ставится цель подробного изложе ния методики построения и анализа вариационных рядов, поскольку об этом можно прочесть как в учебниках об щей теории статистики или математической статистики, так и в специальных монографиях [6, 22]. Остановимся лишь на некоторых недостаточно освещенных или спор ных вопросах.
Построение вариационного ряда требует опыта и «ста тистического чутья»; это в известной мере искусство, и до сих пор нет надежного алгоритма, который бы позволил проводить эту операцию механически. Если не считать редко встречающиеся вариационные ряды, построенные по дискретному признаку с небольшим числом отдельных (целых) значений, то для всех остальных рядов весьма важным является правильный выбор числа групп, числа интервалов признака. Слишком малое число групп не раскрывает картины распределения, его закономерности, а излишне большое число групп вуалирует эту картину случайными колебаниями частот. Часто рекомендуется определять оптимальное число групп (или интервалов) по эмпирической формуле Стерджесса. При этом сама формула может выглядеть так [8, с. 152; 30, с. 134]:
k = 1 -1-3,322 Ig гг,
где k — число групп;
п — число единиц совокупности,
или так [5, с. 55; 6, с. 22]:
k = 1 -j- 3,2 lg п.
Дж. Эдни Юл и М. Дж. Кендэл предлагают брать от 15 до 25 групп [44, с. 104]. А. К. Митропольский предлагает брать всегда по 12 групп, причем считает допустимыми от клонения от 12 групп на 2—3 в ту или другую сторону [22, с. 20]. У Н. М. Виноградовой встречается и такое ука зание: «Количество групп (интервалов) в ряду при до статочно большом числе наблюдений (п > 200 — 300) ре
23