Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 165

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

условий его формирования и при увеличении числа членов выборки стремится к средней генеральной совокупности, или к математиче­ скому ожиданию.

Таким образом, среднее арифметическое значение статистиче­ ского ряда наблюдений представляет собой параметр, около кото­ рого осуществляются колебания данного статистического ряда, или, как часто говорят, параметр центра группирования статистических данных.

Вообще говоря, понятие математического ожидания при­ менительно к гидрологическим приложениям является математиче­ ской абстракцией, так как гидрологических рядов наблюдений бес­ конечной длины не существует. Кроме того, исходя из физических или генетических соображений формирования речного стока, также нельзя установить математическое ожидание. Условность термина математического ожидания усугубляется еще и тем, что в природе, вообще, и в колебаниях речного стока, в частности, известны на­ правленные изменения. Поэтому, говоря о математическом ожида­ нии, например годового стока, в инженерных расчетах обычно под­ разумевается средняя арифметическая не на бесконечном отрезке времени, а на несколько десятков или сотен лет. В таком случае, строго говоря, вообще нельзя употреблять термин «математиче­ ское ожидание».

§ 5

медиана

Следующей по важности характеристикой центра группирова­ ния после средней арифметической является медиана, которая

равна значению члена варьирующего ряда, занимающего среднее положение в том случае, когда величины, образующие ряд, распо­ ложены в убывающем или возрастающем порядке.

Если число членов ряда Xi нечетное и равно 2 т + 1 , то медианой этого ряда будет xm+i член ранжированных (расположенных в убы­

вающем или возрастающем порядке) данных наблюдений, т. е.

М е = л т+1.

(1.7)

Если же число членов ряда хгчетное,

т. е. 2т, то за ме­

диану условно принимается среднее значение между центральными значениями величин ранжированного ряда

M e= -g- (■хт-\-хт + т).

(1-8)

Определение медианы по эмпирическим данным обычно не вы­ зывает затруднений, особенно при небольшой длине ряда наблюде­ ний. Действительно, для этой цели необходимо лишь расположить ряд в убывающем (или возрастающем) порядке и выбрать средин­ ный член, в случае нечетного числа членов ряда, или два срединных члена (вычислив из них среднее значение) в случае четного числа

39



членов ряда. Так, медиана ряда среднегодовых расходов воды р. Днепра в створе у пгт Лоцманской Каменки после расположения этого ряда в убывающем порядке равна 1620 м3/с.

В случае сгруппированных данных наблюдений медиана может

быть рассчитана по следующей приближенной формуле:

 

Me=vV1

(1.9)

где N1 — конец медианного интервала; h — размер интервала; п

число членов ряда; S — накопленная частота до значения АД, т — число случаев в медианном интервале.

Расчеты медианы по данной формуле будут тем точнее, чем рав­ номернее распределение данных наблюдений внутри медианного интервала. Медиана для ряда годового стока р. Днепра, рассчитан­ ная по формуле (1.9), равна

200 (—4^-----

63'j

Me = 1699 -------- ---------------

=1623 м3/с.

Произведем расчет медианы сгруппированных приведенных выше данных о рельефе болота: jVt =16, h = 2; п = 903; S = 422; m = 144. Подставляя эти значения в формулу (1.9), получаем

М е=16

144

15,6 см.

 

 

Из произведенных расчетов видно, что значение медианы опре­ деляется только величиной срединного или двух срединных значе­ ний ряда, расположенного в убывающем порядке, и не зависит, в отличие от средней арифметической, от остальных членов ряда.

Иначе говоря, медиана не изменяется, если любые значения ар­ гумента, меньшие медианы, изменяются как угодно, оставаясь лишь при этих изменениях меньше Me, а любые значения рассмат­ риваемого ряда, большие Me, изменяются как угодно, оставаясь больше Me. Подобные изменения, очевидно, очень сказываются на значении средней арифметической. Это свойство медианы делает использование ее более целесообразным, чем использование сред­ ней, в тех случаях, когда конечные члены ряда неточны и нена­ дежны. Но медиана по сравнению со средней арифметической имеет тот недостаток, что не поддается так же легко, как средняя арифметическая, аналитическим операциям; например, для нее не применима теорема сложения.

Таким образом, соединив два ряда с известными медианами, ни­ чего нельзя сказать о медиане полученной совокупности, не вычис­ лив ее независимо от известных медиан составляющих рядов.

Перпендикуляр, восстановленный в точке, соответствующей зна­ чению медианы, к оси варьирующего признака, делит площадь ги­ стограммы на две равные части.

40


Отметим без доказательства основное свойство медианы, кото­ рое заключается в том, что сумма абсолютных отклонений значений членов статистического ряда от медианы минимальна по сравне­ нию с аналогичной суммой, образованной из отклонений от любой другой величины, отличной от Me.

§ 6

мода

Модой называется наиболее вероятная (наиболее часто встре­ чающаяся) в данном статистическом ряду величина. Или иначе, мода представляет собой наибольшую ординату кривой распреде­ ления в случае одновершинного распределения. В общем случае кривая распределения может иметь несколько вершин и соответст­ венно она будет иметь несколько мод.

Определение моды через наибольшие значения кривой распре­ деления— задача довольно сложная, а при небольших рядах на­ блюдений вообще практически невыполнимая. В качестве прибли­ женного значения моды можно взять середину интервала с наи­ большей частотой в сгруппированных данных наблюдений. Так, для ряда среднегодовых расходов воды р. Днепра у пгт Лоцманской Каменки Мо=1600 м3/с, а для поверхности микроландшафта Мо = = 19,5 см.

Для не очень асимметричных и одновершинных распределений мода может быть рассчитана по приближенному равенству, уста­ новленному К. Пирсоном,

М о = л :+ 3 (М е -л ).

(1.10)

Значение моды, рассчитанное по этой формуле для среднегодо­ вых расходов воды, равно 1576 м3/с, а для поверхности болотного микроландшафта — 26,3 см.

Использование моды, так же как и медианы, целесообразно при анализе резко асимметричных распределений, когда среднее ариф­ метическое уже не является достаточно представительным парамет­ ром распределения и его целесообразно дополнить модой и ме­ дианой.

§ 7

средняя геометрическая и средняя гармоническая

Иногда в целях получения лучшего соответствия закона распре­ деления эмпирического ряда некоторым статистическим (теорети­ ческим) схемам осуществляют преобразование величин эмпириче­ ской совокупности. В качестве такого преобразования часто приме­ няют логарифмирование величин исходного ряда. В этом случае вместо исходных величин xi, Xz, Хз, ..., хп. образуется ряд,

41

состоящий из lg'A'i,

lgX2, lg лгз, . . lg Xn-

Среднее арифметическое

значение этого нового ряда, очевидно, равно

 

lg G = 4

- (lg ^ 1+ lg x 2+ lg x 3+

. . . + lg д:л).

(M l)

Соотношение (2.11) получается путем логарифмирования исход­

ного выражения следующего вида:

 

п-------------------

(1.12)

G = у х 1х 2х 3. . . х п,

которое представляет собой среднее геометрическое значение аргу­ мента х, принимающего положительные значения хи х2, Хз, ..., хп.

Из соотношений (1.11) и (1.12) следует, что логарифм средней геометрической (G) равен средней арифметической из логарифмов значений величин рассматриваемого статистического ряда.

Как доказывается в математической статистике [111], среднее геометрическое всегда меньше среднего арифметического.

В качестве одной из форм трансформации величин исходного ряда статистической совокупности используют преобразование со-

1

вокупности положительных величин х±, хг, Хз, ..., хп в ряд вида — ,

,у . .

Хо Хз Хп

Среднее арифметическое значение трансформированного ука­

занным образом ряда равно

 

 

отсюда

 

 

 

H = j _

j _ J _

----------•

(1ЛЗ)

х х + х 2 + х 3 +

+ х п

 

Величина Я, обратное значение которой равно средней арифме­ тической из обратных значений переменной х, называется средней гармонической величины х.

Некоторые примеры логарифмического преобразования исход­ ного ряда и использования средней гармонической в гидрологиче­ ских расчетах рассмотрены в главе II.

Таким образом, средние значения (среднее арифметическое зна­ чение, медиана, мода и др.) являются характеристиками, вокруг которых осуществляется группирование вариационных рядов, или, как говорят, центрами группирования. Средние значения описы­

вают некоторые важные свойства статистических совокупностей, но не являются исчерпывающими их характеристиками. Действи­ тельно, можно себе представить два ряда величин, средние значе­ ния которых равны между собой, а характер рассеивания относи­ тельно средних будет различный. Например, среднее арифметиче­ ское значение уровня воды в замкнутом водоеме при слабом

42


и сильном волнении будет одно и то же. Однако характер колеба­ ний уровня воды при многократном измерении, очевидно, будет различным. Следовательно, для описания подобных совокупностей необходимо учитывать характеристики мер рассеивания, к рассмот­ рению которых перейдем в следующих параграфах.

§8

простейшие меры рассеивания

Наиболее простой мерой рассеивания, или изменчивости, стати­ стического ряда является амплитуда, или размах варьирования, ра­ нее введенный при группировании данных наблюдений

Л=л:„

(1.14)

Как следует из этой формулы, для вычисления амплитуды необ­

ходимо знать лишь наибольшее и наименьшее значения ряда

на­

блюдений. Так, амплитуда колебаний годового стока

р. Днепра

у пгт Лоцманской Каменки равна А =3040 — 717 = 2323

м3/с, а ам­

плитуда колебаний поверхности рассматриваемого болота

А =

=32— 1=31 см.

Сувеличением продолжительности ряда наблюдений амплитуда колебаний может лишь увеличиваться, что вносит некоторую неоп­

ределенность в использование амплитуды как характеристики рас­ сеивания. Введение поправок на число членов ряда при расчете амплитуды во многих случаях полностью не устраняет этого недо­ статка. Кроме того, амплитуда имеет большие случайные колебания от выборки к выборке, что также затрудняет ее использование. Не­ смотря на эти недостатки, амплитуда применяется в некоторых слу­ чаях в гидрологических расчетах. Например, при оценке оправды­ ваемое™ гидрологических прогнозов наряду с другими более совер­ шенными методами иногда используется 20% амплитуды. Если разность между прогнозируемой и фактической величиной меньше Vs А, то прогноз считается удовлетворительным, а в противном слу­

чае — неудовлетворительным.

В качестве другой характеристики меры рассеивания исполь­ зуется среднее абсолютное отклонение, которое рассчитывается по формуле

S l( * £ - * ) l

d = ^ — n--------

,

(1.15)

где п — число членов ряда xt, от t'=l до i = n\ х — среднее арифме­

тическое значение.

Наиболее существенный недостаток среднего абсолютного от­ клонения заключается в том, что при его расчете не учитывается

знак разности (х{ х), что затрудняет усовершенствование схемы

43