Файл: Бошняк, Л. Л. Измерения при теплотехнических исследованиях.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 145

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

признано целесообразным начать раздел с тех понятий теории вероят­ ностей и математической статистики, которые допускают неоднознач­ ное толкование, имеют различную символику или, наконец, могут оказаться забытыми, но являются важными для понимания рассма­ триваемых ниже методов.

Статистическое описание (вероятностная модель); статистика; статистическая устойчивость; генеральная совокупность. Понятие статистическое описание или вероятностная модель применяется

к физическим процессам,

обладающим тем свойством, что хотя

результат отдельного измерения х не может быть предсказан

с до­

статочной точностью, значение некоторой подходящей функции

у =

= ср (хъ . . ., х„), где х ъ

. . .', хп — реализации случайной вели­

чины х, может быть предсказано с существенно большей точностью. Такая функция называется статистикой, а указанное свойство физи­ ческого процесса — его статистической устойчивостью. Наиболее известные статистики — относительная частота и выборочная сред­ няя. Так как у — ф (х1; . . ., хп) есть функция выборочных зна­ чений, то она представляет собой случайную величину, распределе­ ние которой определяется распределением случайной величины X и числом наблюдений п.

Когда п возрастает, многие статистики сходятся по вероятности к соответствующим параметрам теоретического распределения X. В частности, относительные частоты сходятся в среднем к соответ­ ствующим вероятностям. Поэтому каждую выборку рассматривают как выборку из теоретически бесконечной генеральной совокупно­ сти, в которой распределение признака совпадает с теоретическим распределением вероятностей величины X. Последнее называется распределением генеральной совокупности, а его параметры — па­ раметрами генеральной совокупности. Во многих приложениях теоретическая генеральная совокупность есть только полезная идеа­ лизация действительной совокупности, из которой получена выборка.

Выборка объема п — результат п независимых повторных изме­ рений (или реализаций X) х ъ . . ., хп, которые представляют собой независимые случайные величины с одинаковой плотностью вероятности / (х). Такая выборка представляет собой п-мерную

случайную величину (хь

. . ., хп).

Функция

правдоподобия — плотность распределения случайной

величины х х,

. . ., хп

 

 

L (хх,

(хх)f (х2). . ./ (х„).

Закон распределения случайной величины; функция распределе­ ния; плотность распределения; тип (семейство) распределения.

Самой универсальной и полной характеристикой случайной вели­ чины является закон ее распределения. Он выраж'ается функцией распределения F (х) или ее производной f (х) — плотностью распре­ деления

*

F (х) = Р (X < х) = j f (х) dx.

389


Считается, что плотность и соответствующая ей функция сосредото­ чены на интервале / = с, d, если / (х) = О для всех х, не принадле­ жащих /. Тогда F (х) = 0 для х < с и F (х) — 1 для х > d. Все особенности закона распределения X зависят от его типа (семейства) и параметров. Тип (семейство) распределения определяется аналити­ ческим выражением функции или плотности распределения, а пара­ метры — его аргументами. Два распределения F (х) и Ф" (х), а также их плотности / (х) и ф (х) принадлежат одному и тому же типу (или отличаются только параметрами), если они связаны соотношениями:

¥ (х) = F {ах + Ь)\ ф (х) = а/ (ах + Ь),

где а > 0 . Параметр b часто называют центрирующим или параме­ тром сдвига (положения), а — масштабным.

Наиболее широко распространенными в практике статистических исследований являются такие типы распределения, как нормаль­ ное, равномерное, Пуассона, биномиальное, гамма, Вейбула, хиквадрат, а также распределения, связанные с нормальным — Стьюдента, бета, логарифмически нормальное.

Непрерывные распределения имеют три вида параметров, ко­ торые определяют его центр, масштаб и форму. Параметры центра распределения представляют собой координату «центра тяжести» плотности распределения X на оси х. Параметры масштаба характе­ ризуют рассеивание X на этой оси, а параметры формы определяют конфигурацию кривой / (х) и непосредственно связаны с такими важными характеристиками распределения, как скошенность или асимметрия, плосковершинность или эксцесс.

Не все распределения содержат каждый из этих параметров. Например, нормальное распределение не имеет параметра формы, поэтому его асимметрия и эксцесс постоянны. Бета-распределение имеет два параметра формы, которые определяют математическое ожидание, дисперсию, асимметрию и эксцесс этого распределения.

Квантиль порядка Р. Квантилем, отвечающим заданному уровню вероятности Р, называют такое значение х = хр, при котором функ­ ция распределения принимает значение, равное Р, т. е. F (хр) = Р. Некоторые квантили получили особые названия. Так, например, медианой распределения называют квантиль, отвечающий значе­

нию Р = 0,5; квантили, соответствующие значениям Р =

0,25;

0,5; 0,75, называют квантилями; Р = 0,1; . . .; 0,9 — децилями,

а Р =

0,01;. . . .; 0,99 — процентилями. Квантили, децили и процентили делят область изменения X соответственно на 4,10 и 100 интервалов, попадания в которые имеют равные вероятности. Зная значения достаточного числа квантилей, легко представить ход возраста­ ния F (х).

Точечные и интервальные оценки числовых характеристик слу­ чайной величины. Оценкой числовых характеристик X называется статистика ср (хъ . . ., х„), предназначенная для определения пара­ метров (или аргументов) функции распределения (математического ожидания, дисперсии, асимметрии и т. д.). Оценки, которые исполь-

3 9 0


зуются вместо истинных значений параметров, называются точеч­ ными. Выбор подходящих точечных оценок неоднозначен. Предпочти­

тельны те оценки, которые,

во-первых, сходятся по вероятности

к оцениваемому параметру

при п —» оо (состоятельные оценки);

во-вторых, у которых математическое ожидание равно самому пара­ метру (несмещенные оценки); в-третьих, у которых выборочное распределение имеет наименьшую дисперсию (эффективные оценки).

Так как статистики <р {хъ . . ., хп) являются случайными вели­ чинами, рассеивание которых возрастает с уменьшением объема наблюдений, точечные оценки, полученные на основе двух выборок разного объема, могут быть неравноценными. Поэтому наряду с то­ чечными широко применяются интервальные оценки числовых ха­ рактеристик случайных величин. Интервальная оценка выражается границами интервала, внутри которого с вероятностью р заключено истинное значение параметра. Вероятность р называется доверитель­ ной вероятностью или коэффициентом доверия. Интервальная оценка строится на основе точечной оценки.

Статистическая проверка гипотез; доверительные интервалы.

К статистической гипотезе относится всякое предположение о виде закона или о типе распределения X, о вероятности того или иного события, о величине какого-либо параметра и пр. Проверка гипотез осуществляется на основе статистик, называемых критериями. Кри­ терий проверяемой (нулевой) гипотезы Н 0дает возможность построить правило, позволяющее отвергнуть или принять эту гипотезу, осно­ вываясь на выборке x lt . . ., хп. Критерий определяет критическое множество, попадание в которое означает необходимость отвергнуть гипотезу. Такая процедура не дает ее логического доказательства

или опровержения. Здесь возможны четыре случая: гипотеза

Н 0

верна и принимается согласно критерию; гипотеза

Н 0 неверна

и

отвергается согласно критерию; гипотеза Н 0 верна,

но отвергается

согласно критерию (ошибка первого рода); гипотеза # 0 неверна, но принимается согласно критерию (ошибка второго рода).

Обычно стремятся использовать такую критическую область, где вероятность отвергнуть проверяемую гипотезу была бы мала, если она верна, и велика в противном случае. Если проверяемая гипотеза верна, то вероятность ее отвергнуть называется уровнем значи­ мости данного критерия.

Метод построения интервальных оценок числовых характери­

стик

X, основанный на проверке гипотезы Н 0 о нахождении истин­

ного

значения параметра в случайном интервале, носит название

метода доверительных интервалов. Критерий этого метода строится

на статистике ypl, i =

1 , 2 , значения которой являются границами

интервала. Гипотеза

Н 0 отвергается,

если

точечная оценка пара­

метра у

попадает вне

интервала.

При

этом

 

р (Ург «£ У < Ур.) = Pi — P i = l — (аI + а2) = р,

где Р( =

Р (у < ур.)

= F (ур.),

i = 1, 2;

а г = Р г; а а = 1 — Р 2;

а х + а 2 — уровень значимости

критерия;

р — доверительная ве­

роятность.

 

 

 

 

391


Указанные соотношения приведены на рис. 166, где Fy и fy — соответственно функция и плотность распределения точечной оценки искомого параметра у.

Для упрощения соответствующих таблиц и процедуры оценива­ ния часто полагают а х = а 2 = а . Вследствие этого уровень значи­ мости становится равным 2 а, а доверительная вероятность р = = 1—2а. Рассмотренный случай относится к определению так называемого двустороннего доверительного интервала у. Поэтому в дальнейшем соответствующая доверительная вероятность обозна­

чается р 2. Верхним (оо, уР2] и нижним [yPl, оо)

односторонними

доверительными

интервалами

называют такие случайные ин­

тервалы для которых при лю­

бом у:

 

 

 

 

 

 

 

 

Рв (

ОО <6 у

Ур2)

=

 

 

 

 

 

 

 

=

Р2— О = 1

— а 2 = pin,

 

 

 

 

 

 

 

Рн pt '

У

с*3)

 

 

 

 

 

 

 

 

---= 1

P i =

1

— aj =

pi„.

 

 

 

 

 

 

Если

а х =

а 2,

Р 1и(В) =

1

— а.

 

 

 

 

 

 

Критическое

значение

мно­

 

 

 

 

 

 

гих

распространенных

крите­

Рис.

 

166.

Доверительный интервал (ур

риев

строится

 

как

функция

ур ),

 

критическая область — (—сю, ур ф

уровня

значимости

верхнего

[ур

,

оо), уровень

значимости

a i + a 2

одностороннего

доверительного

2

и доверительная

вероятность

р

интервала.

Причем

часто

его

 

 

 

 

 

 

обозначают

не a, a

Q и выра­

жают в процентах. Например, при a = 0,05

Q =

5%.

Поэтому Q

называют процентной точкой распределения

соответствующего

кри­

терия или Q-процентными критическими значениями. В

част­

ности,

такое обозначение

принято

в таблицах Л.

Н.

Болынева

и Н.

В.

Смирнова

[16]. Так как использование многих из приведен­

ных ниже статистических методов основывается именно на этих таб­ лицах, в тексте сохраняется последнее обозначение во всех случаях.

Понятие о малых и больших выборках. Используемые при обра­ ботке результатов измерения статистики характеризуются распре­ делениями вероятностей, поведение которых в значительной мере определяются объемом наблюдений. В частности, с уменьшением числа наблюдений растет дисперсия этих распределений и статисти­ ческие выводы становятся все менее достоверными. В связи с этим существует понятие малые и большие выборки. В математической статистике нет строгого определения этого понятия, однако его чаще всего связывают с возможностью использования нормальной аппро­ ксимации распределения соответствующих статистик. Например, при п > 20 функция распределения Стьюдента настолько близка к нормальной, что расхождением доверительных вероятностей, вычисленных на их основе, можно пренебречь. В этом случае малыми можно считать выборки объемом п <6,20,

392