Файл: Юзбашев М.М. Методы изучения динамики распределений и зависимостей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.06.2024

Просмотров: 77

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

комендуется брать от 10 до 20, при предполагаемом нор­ мальном распределении часто берут количество групп равным 12» [8, с. 152].-Наконец, Н. К. Дружинин пишет: «Выбор размеров интервалов, а следовательно, и их чис­ ла не может производиться механически» [13, с. 30].

Итак, есть самые разные точки зрения, начиная от полного отказа от какого бы то ни было математического приема определения оптимального числа групп до реко­ мендации строго фиксированного их числа. Бесспорно, что никакая формула не может в этом деле служить не­ коей универсальной отмычкой. Значение подобных фор­ мул лишь в том, чтобы дать исследователю возможность сразу приблизиться к оптимальному числу групп, изба­ вить его от излишних проб и вариантов. Следует возра­ зить против попыток рекомендовать какое-либо фиксиро­ ванное число групп (хотя бы и с допуском в обе стороны) на все случаи построения вариационных рядов. Правы те статистики, которые связывают число групп вариацион­ ного ряда с численностью единиц совокупности: чем по­ следняя больше, тем больше можно образовать групп, не рискуя затемнить закономерность распределения случай­ ными флуктуациями. Излишняя точность коэффициента при lgn в формуле Стерджесса не имеет практического значения. Было бы вполне достаточно дать этот коэффи­ циент с одним десятичным знаком. Необходимо указы­ вать. что равенство не точное, а приближенное, ибо чис­ ло групп «&» обязательно является целым, а в правой ча­ сти может получиться и дробная величина.

О роли и форме средней величины признака, моды и медианы, как . статистической характеристики «центра распределения», в литературе тоже имеется немало раз­ личных мнений. Подавляющее число статистиков отдает предпочтение средней арифметической величине. Это по­ нятно, если учесть ее связь с суммарным значением соот­ ветствующего объемного признака совокупности. Медиа­ ну и моду в таком случае рассматривают как вспомога­ тельные характеристики вариационного ряда. Однако есть и прямо противоположная точка зрения. Так, Н. Е. Рабкина пишет: «Медиана по самой своей природе яв­ ляется наиболее представительной средней и к ней имеет смысл обращаться даже тогда, когда закон распределе­ ния неизвестен» [9, с. 128]. Согласно этой точке зрения выбор вида средней, наилучшим образом характеризую­

24

щей «центр распределения», определяется законом по­ следнего. Средняя арифметическая величина пригодна в этой роли только при симметричном (в частности, нор­ мальном) распределении. Если распределение является логарифмически-нормальным, то эта роль переходит к геометрической средней. В целом та средняя является правильной характеристикой центра распределения, ко­ торая при данном законе распределения совпадает с ме­ дианой или наиболее близка к ней. Отсюда и следует вы­ вод о предпочтительном использовании медианы при лю-. бом законе распределения или при неизвестности таково­ го. Не в том ли корень данного и других подобных спо­ ров, что систему статистических показателей, в частности систему показателей распределения, пытаются заменить каким-либо одним главным показателем, будь то средняя арифметическая величина или медиана? Ни один показа­ тель в отдельности попросту не в силах нести всю ту на­ грузку, все функции, которые пытаются на него возло­ жить сторонники необходимости главного показателя. Только исходя из той конкретной задачи исследования, для решения которой должна быть применена средняя величина, можно правильно выбрать вид и форму сред­ ней. Применительно к проблеме, поставленной в данной книге, — исследованию динамики вариации, главную роль должна играть все же средняя арифметическая величина вариационного ряда (т. е. взвешенная на частоты этого ряда). Заменить среднюю арифметическую медианой нельзя хотя бы уже потому, что все основные показатели вариации строятся исходя из средней арифметической ве­ личины. Медиана и мода при изучении динамики распре­ деления будут играть вспомогательную роль.

Большое-значение при характеристике распределения, а следовательно, и его динамики имеют показатели, изме­ ряющие степень (силу) вариации. В качестве таковых ча:

ще всего применяются: показатель размаха вариации, среднее квадратическое отклонение и коэффициент ва­ риации. Методика вычисления среднего квадратического отклонения и коэффициента вариации известна, бесспор­ на и нет нужды на ней останавливаться. Другое дело — значение этих показателей, использование их в статисти­ ко-экономическом или производственном анализе, в ана­ лизе экспериментальных данных. Обычно в учебной ли­ тературе указывается, что коэффициент вариации необ­

25


ходим для сравнения вариации различных признаков или двух вариационных рядов, хотя бы и образованных по од­ ному и тому же признаку, но имеющих различные сред­ ние величины этого признака [см. напр. 6, 8, 30]. При этом упускается из виду очень существенное обстоятель­ ство, а именно: даже при наличии только одного вариа­ ционного ряда, ни с каким другим не сопоставляемого, по величине среднего квадратического отклонения нельзя сделать вывода о том, сильна или слаба вариация данно­ го признака. В самом деле, что можно сказать о силе ва­ риации урожайности картофеля в совокупности совхозов Ленинградской области, зная лишь величину среднего квадратического отклонения, равную, например, за 1969 г. 32,5 ц/га? Только при сравнении среднего квадратическо­ го отклонения со средней величиной урожайности стано­ вится возможным сделать вывод о силе вариации. Одна­ ко для такой качественной оценки коэффициента вариа­ ции нужно знать его обычную, нормальную для изучае­ мой совокупности величину. Наилучшим путем установ­ ления обычного для изучаемой совокупности и признака значения коэффициента вариации является наблюдение за ними в динамике за несколько лет. Продолжая преды­ дущий пример и зная, что средняя урожайность картофе­ ля в совхозах Ленинградской области в 1969 г. составила 110,1 ц/га, а средняя величина коэффициента вариации за предыдущие 5 лет составила 26,8%, можно сделать вы­ вод о том, что вариация урожайности в 1969 г. (v = = 29,5%) является сильной, превышающей обычный уро­ вень.

v Особым показателем, имеющим большое значение при анализе распределений социально-экономических сово­ купностей по размерам их объемного признака, является показатель концентрации, иногда называемый также по­ казателем дифференциации. Для его построения необхо­ димо сопоставить доли каждой из групп ряда по числу единиц совокупности с долями этих же групп по величи­ не объемного признака. Если те же доли выразить в виде нарастающих итогов и изобразить графически, получится график Лоренца, наглядно изображающий отступление в распределении признака от равномерного, т. е. пропор­ ционального числу единиц совокупности. Во многих учеб­ никах и монографиях этим графиком и ограничиваются [6, с. 45—47; 25, с. 72—74]. Однако одна и та же степень

26

концентрации может быть выражена различными линия­ ми графика Лоренца. Поэтому обобщающий показатель степени концентрации необходим. Построение такого по­ казателя покажем на примере концентрации фермерской земельной собственности в США в 1959 г. [см. 25. с. 68

и 74].

 

 

 

 

 

 

Таблица 2

 

 

 

Измерение степени концентрации

 

 

 

 

Д о л я в

проц е н тах

к и тогу

 

Груп пы

ф ер м

по п л о ­

 

 

Р а зн о с т ь

щ ад и

зем л и

(га )

ЧИСЛО

п л о щ ад ь

д ол ей в п р о ­

 

 

 

ф ерм

зем л и

ц ен тах

До 4

 

6,5

.

0 , 1

+ 6 ,4

4—20

 

21,9

 

1,9

-20,0

20—40

 

17,8

 

4,3

|-13,5

40—72

 

2 0 , 8

 

9,4

[ - И Д

72—104

 

1 1 , 2

 

8 , 0

+ 3 ,2

104—200

 

12,7

 

14,8

- 2 ,1

200—400

 

5,4

 

12,3

—6,9

Более

400

 

3,7

 

49,2

—45,5

Всего

 

 

1 0 0

 

1 0 0

_

В качестве показателя степени концентрации можно ззять сумму положительных или сумму отрицательных разностей долей, которые всегда равны между собой. Та­ ким образом, показатель степени концентрации опреде­ ляется по формуле

k

А

fr

 

Со = >]

:2,

i=i

2/

Vi *i

 

где — — доля данной группы по числу единиц совокуп­

2/

ности (по частоте); Хг — середина интервала группировочного призна­

ка;

^ - Xl — доля группы по объёму признака. 2/i " xi

В данном примере степень концентрации земельной соб­ ственности равна 54,5%, или 0,545. Теоретически этот по­ казатель может изменяться от нуля до единицы, но прак­ тически уже показатель около 0,5 говорит о весьма силь-

27


ной степени концентрации. Помимо показателя-общей концентрации по совокупности в целом, существенный ин­ терес представляет и показатель максимальной группо­ вой концентрации, измеряемый по наибольшей разности долей. Этот показатель характеризует степень концентра­ ции признака в «высшей» группе. В приведенном приме­ ре степень концентрации земельной фермерской собст­ венности в высшей группе ферм США составляет 45,5%,

т. е. более — общей концентрации. Не следует считать,

4

что показатели концентрации, построенные указанным, способом, будут сильно зависимы от числа групп. При разном числе групп действительно получаются неодина­ ковые показатели, причем необязательно, чтобы с увели­ чением числа групп они возрастали. Есть всегда какое-то одно число групп, при котором степень концентрации вы­ является с наибольшей полнотой, показатель при этом достигает максимума. При меньшем или большем числе групп, при другом построении интервалов концентрация выявляется менее полно. Следует отметить, что задача измерения степени концентрации лежит на стыке пробле­ мы измерения вариации и проблемы типологической группировки'.

Обычно в литературе упускают из виду, что измере­ ние степени концентрации относится только к объемным признакам совокупности. К признакам качественным, вы­ ражаемым относительными величинами, это понятие не­ применимо. Нельзя, например, ставить, вопрос о «кон­ центрации» в распределении совхозов по величине уро­ жайности. Произведение урожайности на число совхозов в группе не является реальным производственным пока­ зателем и нахождение долей групп по нему бессмыслен­ но. Интересно рассмотреть также обойденный теорией статистики вопрос о соотношении и взаимосвязи показа­ теля концентрации и показателей вариации признака. Используя абсолютные данные о распределении фермер­ ской земли в США [25, с. 68], можно вычислить среднее квадратическое отклонение размеров земли, приходящих­ ся на 1 ферму. Оно составило 302 гектара, а коэффици­ ент вариации — 250%! При этом более 90% дисперсии приходится на долю высшей группы ферм. Такие огром­ ные показатели вариации с полной определенностью сви­ детельствуют о качественной неоднородности изучаемой

28

совокупности, что и имеет место на самом деле. Для срав­ нения приведем следующие Данные, характеризующие распределение колхозов ЭССР по поголовью коров на 1 января 1970 г. [46, с. 406]. Показатель концентрации по­ головья равен 21,7%, коэффициент вариации размеров поголовья коров, приходящихся на 1 колхоз, равен 54%. Вариация, бесспорно, сильная, но в этом случае мы име­ ем дело с однородной, однокачественной совокупностью. Из приведенных примеров видно, что коэффициент ва­ риации является более чувствительным измерителем по сравнению с коэффициентом концентрации. Однако по­ следний необходим для правильного отражения степени развития определенного процесса — концентрации объе­ ма признака преимущественно у части единиц совокупно­ сти, и поэтому не может быть просто заменен коэффици­ ентом вариации. Более глубокое освещение проблемы по­ казателя концентрации дано в статьях В. Задорожного, И. Рабинштейна [45, с. 12— 18], Н. Апарина и Ж. Линков-

ского [45а, с. 76].

Менее употребительны в практической работе такие характеристики распределения, как показатели асим­ метрии и эксцесса. Основная в статистической литерату­ ре точка зрения на их роль в анализе распределения та­ кова, что они характеризуют степень отклонения изучае­ мого распределения от нормального распределения. Вме­ сте с тем отдельные авторы отмечают то или иное анали­ тическое значение указанных показателей, выдвигают на этот счет разнообразные гипотезы. Так, в учебнике Н. М. Виноградовой и других указываются три возможные при­ чины появления асимметрии: «... а) случайные влияния, которые действуют в одном направлении сильнее, чем в другом; б) ограниченность вариации в одном направле­ нии; в) внутренний процесс развития явления, когда по­ является «доминирующая» причина развития, влекущая за собой постепенное смещение центра распределения» [8, с. 185]. Что касается первой указанной причины — то это недоразумение. Если перевес отклонений от средней обусловлен только неполным взаимопогашением случай­ ных факторов, то он сам является случайным, ненадеж­ ным. В этом случае нельзя говорить и о наличии асим­ метрии распределения, под которой следует подразуме­ вать только статистически надежное, неслучайное пре­ вышение отклонений от средней величины в определен­

29



ном направлении. Чтобы не повторяться, отметим, что данное положение относится и к показателям эксцесса, крутизны распределения.

Вторая и третья из указанных Н. М. Виноградовой и соавторами причин действительно способны порождать асимметрию. Так, например, распределение работающих по возрасту асимметрично, так как имеется твердое огра­ ничение наименьшего возраста работника, в то время как подобного же ограничения для наибольшего возрас­ та не существует. Распределение работников по величи­ не заработной платы асимметрично по той же причине. Если изучаемый признак — величина', существенно поло­ жительная, а ее среднее значение невелико (по сравне­

нию с вариацией, скажем х < За), то следует ожидать об­ разования правосторонней (положительной) асимметрии распределения. По этой причине наблюдается, например, правосторонняя асимметрия распределения хозяйств по величине урожайности, если уровень последней низок. В 1958— 1959 гг. средняя урожайность зерновых культур в совхозах Ленинградской области составляла около 9 ц/га. В то же время и тогда отдельные передовые хо­ зяйства получали по 20 ц/га и более. Однако отклонение от средней в другую сторону, равное по абсолютной вели­ чине отклонению для передовых хозяйств, не могло су­ ществовать, так как урожайность даже при наихудших условиях не может быть отрицательной величиной. Сле­ довательно, распределение являлось асимметричным. И действительно, в 1959 г. показатель асимметрии (отно­ шение третьего центрального момента к кубу среднего квадратического отклонения) составил +0,81.

Появление асимметрии вследствие процесса развития совокупности, на что указывают также И. П. Суслов- [30, с. 220], Н. К. Дружинин [13, с. 67], будет подробнее рассмотрено в § 4 данной главы. Пока же заметим, что если указанные авторы видят в процессе развития при­

чину

возрастания

асимметрии,

то И. Г. Венецкпй

[6, с.

152], напротив,

видит в нем причину ее уменьшения.

Н. К. Дружинин указывает также, что «в условиях совет­ ского хозяйства правосторонняя асимметрия может быть вызвана таким, например, обстоятельством, как борьба за лучшее выполнение плана, соревнование, направлен­ ное на получение более высоких производственных пока­ зателей» [13, с. 67]. Гипотеза о сознательном, плановом

30