438 ОБРАБОТКА РЕЗУЛЬТАТОВ ИСПЫТАНИЙ ГУ [ГЛ. 8
В том случае, когда равенство (3) выполняется только в пре
деле при тг->со, т. е. когда справедливо соотношение |
|
limM |ä] = a, |
(8.4) |
«->00 |
|
оценка называется асимптотически несмещенной.
Наконец, из двух оценок та называется более эффективной, дисперсия которой меньше.
Состоятельность оценки является необходимым условием для того, чтобы этой оценкой можно было пользоваться, так как в противном случае при увеличении объема выборки не повыша ется точность определения интересующего нас параметра. Не смещенность является также положительным качеством оценки, так как ее наличие гарантирует от появления систематической ошибки. Однако в некоторых случаях, в основном из соображе ний простоты расчетов, довольствуются требованием асимпто тической несмещенности. Также иногда предпочтительней яв ляется использовать менее эффективную, но более простую оценку, чем более эффективную, но сложную в вычислительном отношении.
После этих общих замечаний перейдем к рассмотрению оценок математического ожидания X и дисперсии ох2 по выборке (1).
В математической статистике доказывается, что несмещенная, состоятельная и наиболее эффективная оценка х математического ожидания X определяется формулой
П
(8-5)
з= 1
т. е. в качестве оценки х целесообразно выбрать среднее ариф метическое элементов выборки.
Находя дисперсию суммы по общей формуле (1. 39), получим, что дисперсия оценки х определяется формулой
где о| — дисперсия случайной величины X.
В целях упрощения вычислений формулу (5) можно пере
писать в следующем эквивалентном виде: |
|
П |
|
(а7 ~ С) + С) |
(8-7) |
3=1 |
|
где с — произвольное число, называемое ложным нулем.
§ 8.1] |
ОБЩИЕ ПРИНЦ ИПЫ П О ЛУ ЧЕНИЯ ОЦЕНОК |
439 |
Если выбрать с так, чтобы его значение приближенно рав нялось X, то разности (Xj ~c) будут малыми и их суммирование
проще осуществляется, чем суммирование х г Например, если элементы выборки х - отличаются друг от друга только дробными частями, то, выбрав в качестве с неизменную целую часть ж.,
мы тем самым избавимся от необходимости складывать одинако вые целые части элементов выборки.
В качестве второго упрощения при вычислении х по фор муле (5) иногда применяется разбиение элементов выборки на группы. Для этого определяют минимальный элемент выборки жшіп, максимальный элемент выборки жшах и вычисляют «размах» (жтах—жшіп). Затем задаются числом групп (иногда говорят — «разрядов») и определяют интервал каждого разряда по формуле
|
|
А — " |
(^ m a x |
^ 'm in )' |
|
|
( ^ - 8 ) |
Обозначив границы |
Z-ro разряда |
Л, _ 15 Д,, |
а среднее |
значе |
ние разряда ж„ для их определения получим |
|
|
д, = |
Зты + JA, £t= ( l — у )А + жтіп (1 = |
1, |
2, . . т). |
(8.9) |
Далее |
подсчитывается |
численность /г, |
каждого разряда, |
т. е. число элементов |
выборки, попадающих |
в данный |
разряд |
(если элемент попадает на границу двух разрядов, то в сосед ние разряды прибавляется по 1/2). После этого оценка х может быть подсчитана по приближенной формуле
тт
|
і=і |
і=і |
с^ + с ’ |
(8 л °) |
|
|
|
где с — по-прежнему |
обозначает «ложный |
нуль». |
Преимущество |
формулы (10) перед1! |
(5) |
сказывается при |
большом объеме вы |
борки п.
Результат разбиения элементов выборки на разряды целе сообразно представить в виде таблицы 8 .1 .
При вычислении по формуле (10) делается добавочная ошибка, связанная с тем, что значения каждого элемента в группе при нимаются равными среднему значению для этой группы. Если
считать каждый |
элемент, |
попавший в |
группу, |
распределенным |
по равномерному |
закону с |
1 |
7 |
указанное округ |
параметром -j/i, то |
ление приводит к тому, что дисперсия оценки х вместо выраже ния (6 ) будет определяться формулой
4 4 0 |
|
ОБРАБОТКА РЕЗУЛЬТАТОВ ИСПЫТАНИЙ ГУ |
[ГЛ. 8 |
|
|
|
|
|
Т а б л и ц а |
8.1 |
Номер разряда і |
1 |
|
2 |
|
т |
|
Границы |
раз |
%min 1 хmin |
^min |
^min |
%min “j“ ірі |
1) Ä, |
аг m;ix |
ряда Дг_г, Д, |
|
|
|
|
|
|
Численность |
«1 |
|
п 2 |
|
п т |
|
разряда п г |
|
|
х2 |
|
|
|
Среднее |
зна |
Ху |
|
|
|
|
чение Хі |
|
|
|
|
|
|
|
Частость по падания эле мента в разряд
пі |
|
Р‘ = 1 Г |
|
1 |
1 |
т. е. дисперсия увеличится н а ~ |
j ^ 2- Так как дисперсия (И) |
стремится к нулю при и-> оо, то оценка х по-прежнему остается состоятельной, однако ее эффективность понижается. Если ин
тервал h достаточно мал, то на |
это понижение эффективности |
оценки часто идут в целях упрощения вычислений. |
Несмещенную состоятельную |
оценку дисперсии по выборке |
(1 ) дает формула |
|
И |
= |
(8-12)* |
j= |
1 |
где оценка х определяется выражением (5).
Если и в этом случае ввести ложный нуль, то формулу (12) можно заменить эквивалентным выражением *)
П
(8.13)
У=і
При определении оценки дисперсии также можно пользо ваться группировкой элементов выборки по разрядам. В этом
*) В том случае, когда математическое ожидание х известно, формулы
(12) и (13) должны быть заменены формулами
— с)2 — (х — с )2
§ 8 . 1 ] ОБЩИЕ ПРИНЦИПЫ ПО ЛУ ЧЕНИЯ ОЦЕНОК 441
случае оценка |
может быть вычислена но приближенной |
формуле |
т |
|
|
tel |
Формула (14) дает несколько большее значение для оценки дисперсии, чем формула (1 2 ), так как, округляя величину каж дого элемента выборки до среднего значения данной группы, мы делаем добавочную ошибку округления, приближенно под чиняющуюся равномерному закону распределения с парамет-
ром -Tfh. В отличие от формулы (10), в которой эта ошибка неус
транима, при оценке дисперсии} эту ошибку в первом приближе нии можно учесть, введя так называемую поправку Шеппарда [5], [50], согласно которой вместо (14) оценку следует вычислять по формуле
т
^ пЛ£і — я)2 —t j ä 2. |
(8.15) |
tel
Если в качестве оценки среднего квадратического отклоне ния взять корень квадратный из оценки дисперсии, даваемой одной из приведенных выше формул, то мы получим только асим птотически несмещенную оценку. Для выборки из нормаль ной генеральной совокупности (т. е. для того случая, когда слу чайная величина X является нормальной) для получения не
смещенной оценки Зх достаточно умножить V а| на некоторый коэффициент кп, зависящий от объема выборки п, значение кото рого можно найти в таблицах [п ], [65]. В этом случае в соответст вии с (1 2 ) для несмещенной состоятельной оценки среднего квад ратического отклонения получим
Коэффициент кп с ростом п быстро стремится к единице (на пример, к1й—1,028). Поэтому при достаточно большом объеме выборки этот коэффициент можно не учитывать.
Для определения точности оценок х и 5 удается получить простые формулы, справедливые для любого объема выборки, только для выборки из нормальной генеральной совокупности. Как доказывается в математической статистике, в этом случае
442 |
ОБРАБОТКА РЕЗУЛЬТАТОВ ИСПЫТАНИЙ ГУ |
[ГЛ. S |
для |
любого положительного |
е справедливы формулы |
|
|
|
|
|
t« |
|
|
а е= Р {| X — X j |
|
е} = |
2 I Sk (t) dt, |
|
|
|
|
£ 'J п |
О |
|
|
, |
|
|
(8 .1 7 ) |
|
|
|
|
|
|
|
|
|
Ук |
|
|
|
|
|
1-ч |
|
|
а = Р { |9* — aJ |
< |
e} = |
J p k(x)dx, |
( 8 .1 8 ) |
|
|
|
|
V'fc |
|
|
|
|
|
i+« |
|
|
|
|
|
|
|
|
|
|
|
|
|
k — n — 1 , |
q = ej\j^ 2 |
|
|
|
где |
Sk (t) |
и Pk (y) — универсальные |
функции, |
не |
зависящие |
от |
неизвестных параметров |
х и |
оя, |
а ох определяется форму |
лой |
(1 2 ) |
(Sk (t) — плотность |
распределения |
закона |
Стьюдента, |
а Рк (у) — плотность |
распределения «закона |
^»). |
|
|
|
Формулы (17) и (18) позволяют судить о точности полу |
ченных оценок, так как, задавшись величиной а, |
мы тем самым |
получим |
величину |
отклонения |
е, |
определяющего |
интервал, |
за который ошибка не выйдет с заданной вероятностью. Опре деляемые таким образом вероятности называются доверитель ными вероятностями, а соответствующие им интервалы — до верительными интервалами.
Втом случае, когда объем выборки достаточно велик, оценки
(5)и (12), выражаемые суммами независимых слагаемых, в соот ветствии с предельной теоремой теории вероятностей можно при ближенно считать нормальными величинами, параметры кото рых равны их оценкам, и вместо формул (17) и (18) пользоваться формулами
а ~ |
о і = |
|
(8 .1 9 ) |
|
< е } = Ф |
£ '/п \ |
(8.20) |
|
|
где Ф (z) — интегральная |
функция |
Лапласа, |
определяемая фор- |
мулой |
|
|
|
|
|
£1 |
|
Ф ( 2 ) = |
е 2 dt. |
( 8 . 2 1 ) |