Файл: Рождественский, А. В. Статистические методы в гидрологии.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 15.10.2024
Просмотров: 165
Скачиваний: 0
условий его формирования и при увеличении числа членов выборки стремится к средней генеральной совокупности, или к математиче скому ожиданию.
Таким образом, среднее арифметическое значение статистиче ского ряда наблюдений представляет собой параметр, около кото рого осуществляются колебания данного статистического ряда, или, как часто говорят, параметр центра группирования статистических данных.
Вообще говоря, понятие математического ожидания при менительно к гидрологическим приложениям является математиче ской абстракцией, так как гидрологических рядов наблюдений бес конечной длины не существует. Кроме того, исходя из физических или генетических соображений формирования речного стока, также нельзя установить математическое ожидание. Условность термина математического ожидания усугубляется еще и тем, что в природе, вообще, и в колебаниях речного стока, в частности, известны на правленные изменения. Поэтому, говоря о математическом ожида нии, например годового стока, в инженерных расчетах обычно под разумевается средняя арифметическая не на бесконечном отрезке времени, а на несколько десятков или сотен лет. В таком случае, строго говоря, вообще нельзя употреблять термин «математиче ское ожидание».
§ 5
медиана
Следующей по важности характеристикой центра группирова ния после средней арифметической является медиана, которая
равна значению члена варьирующего ряда, занимающего среднее положение в том случае, когда величины, образующие ряд, распо ложены в убывающем или возрастающем порядке.
Если число членов ряда Xi нечетное и равно 2 т + 1 , то медианой этого ряда будет xm+i член ранжированных (расположенных в убы
вающем или возрастающем порядке) данных наблюдений, т. е.
М е = л т+1. |
(1.7) |
Если же число членов ряда хгчетное, |
т. е. 2т, то за ме |
диану условно принимается среднее значение между центральными значениями величин ранжированного ряда
M e= -g- (■хт-\-хт + т). |
(1-8) |
Определение медианы по эмпирическим данным обычно не вы зывает затруднений, особенно при небольшой длине ряда наблюде ний. Действительно, для этой цели необходимо лишь расположить ряд в убывающем (или возрастающем) порядке и выбрать средин ный член, в случае нечетного числа членов ряда, или два срединных члена (вычислив из них среднее значение) в случае четного числа
39
членов ряда. Так, медиана ряда среднегодовых расходов воды р. Днепра в створе у пгт Лоцманской Каменки после расположения этого ряда в убывающем порядке равна 1620 м3/с.
В случае сгруппированных данных наблюдений медиана может
быть рассчитана по следующей приближенной формуле: |
|
Me=vV1 |
(1.9) |
где N1 — конец медианного интервала; h — размер интервала; п —
число членов ряда; S — накопленная частота до значения АД, т — число случаев в медианном интервале.
Расчеты медианы по данной формуле будут тем точнее, чем рав номернее распределение данных наблюдений внутри медианного интервала. Медиана для ряда годового стока р. Днепра, рассчитан ная по формуле (1.9), равна
200 (—4^----- |
63'j |
Me = 1699 -------- --------------- |
=1623 м3/с. |
Произведем расчет медианы сгруппированных приведенных выше данных о рельефе болота: jVt =16, h = 2; п = 903; S = 422; m = 144. Подставляя эти значения в формулу (1.9), получаем
М е=16 |
144 |
15,6 см. |
|
|
Из произведенных расчетов видно, что значение медианы опре деляется только величиной срединного или двух срединных значе ний ряда, расположенного в убывающем порядке, и не зависит, в отличие от средней арифметической, от остальных членов ряда.
Иначе говоря, медиана не изменяется, если любые значения ар гумента, меньшие медианы, изменяются как угодно, оставаясь лишь при этих изменениях меньше Me, а любые значения рассмат риваемого ряда, большие Me, изменяются как угодно, оставаясь больше Me. Подобные изменения, очевидно, очень сказываются на значении средней арифметической. Это свойство медианы делает использование ее более целесообразным, чем использование сред ней, в тех случаях, когда конечные члены ряда неточны и нена дежны. Но медиана по сравнению со средней арифметической имеет тот недостаток, что не поддается так же легко, как средняя арифметическая, аналитическим операциям; например, для нее не применима теорема сложения.
Таким образом, соединив два ряда с известными медианами, ни чего нельзя сказать о медиане полученной совокупности, не вычис лив ее независимо от известных медиан составляющих рядов.
Перпендикуляр, восстановленный в точке, соответствующей зна чению медианы, к оси варьирующего признака, делит площадь ги стограммы на две равные части.
40
Отметим без доказательства основное свойство медианы, кото рое заключается в том, что сумма абсолютных отклонений значений членов статистического ряда от медианы минимальна по сравне нию с аналогичной суммой, образованной из отклонений от любой другой величины, отличной от Me.
§ 6
мода
Модой называется наиболее вероятная (наиболее часто встре чающаяся) в данном статистическом ряду величина. Или иначе, мода представляет собой наибольшую ординату кривой распреде ления в случае одновершинного распределения. В общем случае кривая распределения может иметь несколько вершин и соответст венно она будет иметь несколько мод.
Определение моды через наибольшие значения кривой распре деления— задача довольно сложная, а при небольших рядах на блюдений вообще практически невыполнимая. В качестве прибли женного значения моды можно взять середину интервала с наи большей частотой в сгруппированных данных наблюдений. Так, для ряда среднегодовых расходов воды р. Днепра у пгт Лоцманской Каменки Мо=1600 м3/с, а для поверхности микроландшафта Мо = = 19,5 см.
Для не очень асимметричных и одновершинных распределений мода может быть рассчитана по приближенному равенству, уста новленному К. Пирсоном,
М о = л :+ 3 (М е -л ). |
(1.10) |
Значение моды, рассчитанное по этой формуле для среднегодо вых расходов воды, равно 1576 м3/с, а для поверхности болотного микроландшафта — 26,3 см.
Использование моды, так же как и медианы, целесообразно при анализе резко асимметричных распределений, когда среднее ариф метическое уже не является достаточно представительным парамет ром распределения и его целесообразно дополнить модой и ме дианой.
§ 7
средняя геометрическая и средняя гармоническая
Иногда в целях получения лучшего соответствия закона распре деления эмпирического ряда некоторым статистическим (теорети ческим) схемам осуществляют преобразование величин эмпириче ской совокупности. В качестве такого преобразования часто приме няют логарифмирование величин исходного ряда. В этом случае вместо исходных величин xi, Xz, Хз, ..., хп. образуется ряд,
41
состоящий из lg'A'i, |
lgX2, lg лгз, . . lg Xn- |
Среднее арифметическое |
|
значение этого нового ряда, очевидно, равно |
|
||
lg G = 4 |
- (lg ^ 1+ lg x 2+ lg x 3+ |
. . . + lg д:л). |
(M l) |
Соотношение (2.11) получается путем логарифмирования исход
ного выражения следующего вида: |
|
п------------------- |
(1.12) |
G = у х 1х 2х 3. . . х п, |
которое представляет собой среднее геометрическое значение аргу мента х, принимающего положительные значения хи х2, Хз, ..., хп.
Из соотношений (1.11) и (1.12) следует, что логарифм средней геометрической (G) равен средней арифметической из логарифмов значений величин рассматриваемого статистического ряда.
Как доказывается в математической статистике [111], среднее геометрическое всегда меньше среднего арифметического.
В качестве одной из форм трансформации величин исходного ряда статистической совокупности используют преобразование со-
1
вокупности положительных величин х±, хг, Хз, ..., хп в ряд вида — ,
,у . .
Хо Хз Хп
Среднее арифметическое значение трансформированного ука
занным образом ряда равно |
|
|
|
отсюда |
|
|
|
H = j _ |
j _ J _ |
----------• |
(1ЛЗ) |
х х + х 2 + х 3 + |
+ х п |
|
Величина Я, обратное значение которой равно средней арифме тической из обратных значений переменной х, называется средней гармонической величины х.
Некоторые примеры логарифмического преобразования исход ного ряда и использования средней гармонической в гидрологиче ских расчетах рассмотрены в главе II.
Таким образом, средние значения (среднее арифметическое зна чение, медиана, мода и др.) являются характеристиками, вокруг которых осуществляется группирование вариационных рядов, или, как говорят, центрами группирования. Средние значения описы
вают некоторые важные свойства статистических совокупностей, но не являются исчерпывающими их характеристиками. Действи тельно, можно себе представить два ряда величин, средние значе ния которых равны между собой, а характер рассеивания относи тельно средних будет различный. Например, среднее арифметиче ское значение уровня воды в замкнутом водоеме при слабом
42
и сильном волнении будет одно и то же. Однако характер колеба ний уровня воды при многократном измерении, очевидно, будет различным. Следовательно, для описания подобных совокупностей необходимо учитывать характеристики мер рассеивания, к рассмот рению которых перейдем в следующих параграфах.
§8
простейшие меры рассеивания
Наиболее простой мерой рассеивания, или изменчивости, стати стического ряда является амплитуда, или размах варьирования, ра нее введенный при группировании данных наблюдений
Л=л:„ |
(1.14) |
|
Как следует из этой формулы, для вычисления амплитуды необ |
||
ходимо знать лишь наибольшее и наименьшее значения ряда |
на |
|
блюдений. Так, амплитуда колебаний годового стока |
р. Днепра |
|
у пгт Лоцманской Каменки равна А =3040 — 717 = 2323 |
м3/с, а ам |
|
плитуда колебаний поверхности рассматриваемого болота |
А = |
=32— 1=31 см.
Сувеличением продолжительности ряда наблюдений амплитуда колебаний может лишь увеличиваться, что вносит некоторую неоп
ределенность в использование амплитуды как характеристики рас сеивания. Введение поправок на число членов ряда при расчете амплитуды во многих случаях полностью не устраняет этого недо статка. Кроме того, амплитуда имеет большие случайные колебания от выборки к выборке, что также затрудняет ее использование. Не смотря на эти недостатки, амплитуда применяется в некоторых слу чаях в гидрологических расчетах. Например, при оценке оправды ваемое™ гидрологических прогнозов наряду с другими более совер шенными методами иногда используется 20% амплитуды. Если разность между прогнозируемой и фактической величиной меньше Vs А, то прогноз считается удовлетворительным, а в противном слу
чае — неудовлетворительным.
В качестве другой характеристики меры рассеивания исполь зуется среднее абсолютное отклонение, которое рассчитывается по формуле
S l( * £ - * ) l
d = ^ — n-------- |
, |
(1.15) |
где п — число членов ряда xt, от t'=l до i = n\ х — среднее арифме
тическое значение.
Наиболее существенный недостаток среднего абсолютного от клонения заключается в том, что при его расчете не учитывается
знак разности (х{ — х), что затрудняет усовершенствование схемы
43