Файл: Бошняк, Л. Л. Измерения при теплотехнических исследованиях.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 137

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

наблюдений и числом интервалов, употребляемых для построения гистограммы [128]. Тем не менее гистограмма по внешнему виду напоминает плотность распределения и может служить для предва­ рительного заключения о типе распределения.

При построении гистограммы на основе ограниченного числа наблюдений возникает вопрос, какой объем выборки следует считать минимально приемлемым для того, чтобы не получить слишком грубого результата. В [156] рекомендуется чтобы в каждом интерва­ ле было не менее пяти наблюдений. Следовательно, если принять мини­ мальным число интервалов 1 0 , то приемлемые результаты могут получится при построении гистограммы на основе приблизительно 50 наблюдений из распределения близкого к равномерному. Для других тиров распределения число наблюдений должно быть больше. В [26 ] рекомендуется число интервалов выбирать в зависимости от числа наблюдений согласно следующим данным:

 

п

т

40—100 ............................

7—9

100—500

8—12

500—1 000

10—16

1 000—

10 000 ...........................

12— 22

При небольших значениях п строить гистограмму бессмысленно. Уместно заметить, что одним из достоинств эмпирической функции распределения Fn (х) является то, что утверждение Fn (х) —♦ F (х)

П - > СО

верно без всяких ограничений, а построение Fn (х) может быть исполь­ зовано для статистических выводов и при небольших значениях п.

Рассмотренный способ оценки типа распределения страдает субъективизмом и успех его использования в значительной мере зависит от опыта исследователя. К объективным, с этой точки зре­ ния, методам относятся методы проверки гипотез на основе непа­ раметрических статистик. Для этого, используя х 1; . . ., х„, вы­ числяют некоторое число, инвариантное к параметрам сдвига и масштаба и называемое критерием согласия. Затем определяется вероятность получения вычисленного критерия при условии, что модель распределения выбрана правильно. Если вероятность полу­ чить вычисленное значение критерия оказывается мала, то исходная статистическая модель отвергается. В инженерной практике малой вероятностью обычно считают 0,10; 0,05 и реже 0,01 или 0,001. Для этих значений составляются необходимые статистические таблицы. Заметим, что если вероятность получения вычисленного критерия не мала, то это еще не дает основания считать, что принятый тип распределения является таковым на самом деле. Другими словами, подобная методика позволяет только отвергнуть модель как непра­ вильную, но она не доказывает, что принятая модель верна. Исход проверки гипотез, как и любого статистического испытания, в зна­ чительной мере зависит от количества имеющихся данных: чем больше данных, тем больше шансов отвергнуть неправильную модель. Если данных очень мало, то часто невозможно установить неадекватность даже двух существенно различных моделей.

412


В качестве примера непараметрического критерия

проверки

типа распределения рассмотрим критерий W Шапиро

и Уилка.

Этот критерий является одним из наиболее мощных для выявления отклонения распределения от нормального типа и может успешно использоваться когда число наблюдений п ^ 50 [136].

Использование критерия W сводится к следующему. Получен­ ные наблюдения перестраиваются в вариационный ряд, затем вы­ числяется статистика

Если п — четное число, принимается к = 0,5/г; если п — нечетное число, принимается к = 0,5 (я — 1) и вычисляется

К

Ь = := i=l ^ n - i + 1 ( - ''г а - г '+ l •*•(')■

Значения an_i+1 для г = 1, . . ., к табулированы [136]. Причем, когда п — нечетное число, хк+1 при вычислении не используется. В заключение вычисляется критерий

Если W 5 з WKP, предположение о нормальности распределения отвергается. Значения 1ЕкР для различных критических уровней критерия табулированы [136].

Критерий W можно также использовать для оценки допущения о справедливости логарифмически нормального распределения. В данном случае критерий применяется к десятичным или натураль­ ным логарифмам наблюдаемых значений. Это объясняется тем, что если логарифмы значений имеют нормальное распределение, то пер­ воначальные наблюдения распределены по логарифмически нормаль­ ному закону.

Если объем исходной совокупности превышает 50 наблюдений, то используются критерии проверки гипотезы о несоответствии моментных отношений их значениям при нормальном распределении X, а именно проверяются гипотезы:

М I

М (х т)3

М (х — т )4

 

Ф 0; Р2

Ф 3,

где X — нормированное среднее абсолютное отклонение; у 1; |32 —■ соответственно коэффициенты асимметрии и эксцесса. При исполь­ зовании этого метода на основании выборочной совокупности вы­ числяются оценки этих величин, а именно:

оценка среднего абсолютного отклонения

j «

\х, — х\]

тг = 1

413


оценка коэффициента асимметрий

оценка коэффициента эксцесса

где

Каждая из этих оценок является критерием согласия. 'Если d 5 » dKP,

или gi Ss gKP, или b%^ bKP, то следует признать нормальность распределения в соответствии с тем или иным критерием, противо­ речащим результатам наблюдения. Процентные точки распределения критических значений статистик d, и b2 табулированы [16].

После оценки типа распределения на основе х ъ . . ., хп. опреде­ ляются параметры этого распределения. Обычно вычисляются эмпи­ рические моменты

при к = 1, 2, а иногда при к = 3, 4. Полученные значения п \ под­ ставляют в формулы F {х) или / (х). Например, в формулу плотности нормального закона

(х—т ) г

вместо т подставляют m u вместо а — выражение У т 2 ml. Применительно к другим типам распределения этот вопрос

наиболее просто изложен в [136].

Если тип распределения оценивался графически, полученную плотность (функцию распределения) строят на том же графике, где была построена гистограмма (эмпирическая функция распределения). Если согласие оказывается не особенно хорошим, его можно улучшить, привлекая момент более высокого порядка. Так вместо нормального закона (для функции распределения) берут закон, выражаемый следующей формулой:

^М =Фа(^)-|1фр(£^£) + ФЪ<> ( £ = £ ) +

414

где х и s вычисляются согласно формулам (X III.1), (XIII.3);

Фо (*) — функции Лапласа

X

Фок) (х) означает йхк Ф0 (х).

В результате приближение часто становится хорошим. Такое улуч­ шение нормального закона не является единственным средством сглаживания эмпирической функции распределения. Другую си­ стему универсальных (в смысле типа распределения) кривых, опре­ деляемых по четырем параметрам, предложил К- Пирсон (кривые Пирсона). Эти кривые столь же хорошо приближают эмпирические данные, как и только что указанные.

Пока речь идет о приближении эмпирического распределения в области не слишком больших и не слишком малых вероятностей, более или менее безралично, каким семейством кривых пользоваться. Однако практически наибольший интерес представляют именно «хвосты» функций распределения. Оценка хвостов с помощью раз­ ных семейств распределения приводит к резко различным результа­ там. Следует признать, что не существует общих способов, имеющих научное обоснование при выборе того или иного семейства распре­ деления для получения результатов, заслуживающих доверия в об­ ласти хвостов [128].

Методы статистической проверки гипотез применяются не только для оценки типа распределения, но и для проверки предположения о законе распределения. Наиболее часто в практике последнего предположения упоминается критерий хи-квадрат (%-квадрат). Суть

его состоит в следующем. Пусть дана выборка х г,

. .

.,

хп из какого-

то теоретического

закона распределения F (х;

аг,

. .

., cQ. Здесь

символы аъ . . .,

ак указывают на то, что этот закон распределения

зависит от к параметров а£. Разобьем вещественную ось на г интер­ валов (—оо, сх], [съ с2), • • ., г_2, сг_х), [сг_г, оо) и обозначим число значений величин хх, . . ., хп, попавших в интервал с номе­

ром

г:

есть число

таких

xit

что

с£_х

х} <

с£ (где с0 = —оо;

сг =

оо).

Вектор (£1;

. . ., £г) можно рассматривать как результат п

полиномиальных

испытаний

с

вероятностями

успеха

 

 

Pi =

Pt

 

« к )

=

F (cf; аъ

. . ., a j —

 

 

 

 

F (с,_х; а г ,

. . ., ак).

 

 

415


Параметры аг, . . ., ак обычно неизвестны. Но если они определены

методом минимума расхождения

% 2

(обозначим

эти

оценки ах , . ак, то мера

2

V.

[ j i

nPt (щ, . .

«к)13

 

 

n P i

( а ъ

(XIII.7)

Xv

 

 

 

 

 

 

f=l

между теоретическим и выборочным распределениям имеет асимпто­ тическое распределение в котором число степеней свободы v =

— г k — 1. Практически оказывается, что применение метода

минимума х2 для нахождения оценок аъ . . ., ак неудобно. Поэтому эти оценки обычно заменяются оценками моментов распределения. Однако такая замена в отдельных случаях может привести к нару­ шению распределения %2 для меры расхождения между теорети­ ческим и выборочным распределениями. Об этом необходимо помнить при практической работе [128]. Более подробно этот вопрос рас­ сматривается в [28] и [71].

Для проверки предположения о F (х) по критерию Х"кваДРаБ вычисленное значание Xv сравнивается с процентилями распределе­ ния Х'кваДРа т 1 которые табулированы. Значения Xv, превосходящие выбранные критические уровни, означают, что наблюдения противо­ речат принятому закону распределения. Преимуществом критерия Х-квадрат является простота использования его для проверки до­ пущения о любом законе распределения, а недостаток, кроме отме­ ченного выше, заключается в нечувствительности к обнаружению адекватной модели, когда число наблюдений невелико. Практически п не должно быть меньше по крайней мере 50. При использовании кри­ терия х-квадрат внимательного отношения требует и группировка исходных данных по произвольным интервалам, так как она может быть связана со значительной потерей информации, содержащейся в выборке.

В том случае, когда тип и параметры теоретического закона рас­ пределения не определяются по данной выборке, а принимаются из каких-либо теоретических соображений или определены из дру­ гих опытов, проверить гипотезу о том, что F (х) есть заданная функ­ ция распределения можно с помощью критерия Колмогорова [16], [114]. Отметим, что неверно за F (х) принимать функцию, пара­

метры которой определяются на основе оценок х и s по той же вы­ борке хь . . ., хп, так как за счет такого подбора параметров

F (х, х, s) искусственно приближается к данной эмпирической функ­ ции распределения Fn (х). Между тем распределение функции Кол­ могорова относится к случаю, когда никакого подбора параметров не производится. Область применения этого критерия ограничена только случаем, когда теоретический закон распределения известен точно.

В заключение рассмотрим способ определения закона распре­ деления, основанный на графическом изображении функции F (х)

416


в таком масштабе по оси ординат, чтобы ее график был бы прямой линией. Применение этого способа связано с использованием так называемых вероятностных бумаг. Рассмотрим возможность исполь­ зования нормальной вероятностной бумаги для определения адек­ ватности исследуемой вероятностной модели нормальному типу, а также оценки его параметров (если принимается гипотеза о нор-

Рис. 171. Нормальная вероятностная бумага

мальности) и для квалификации отклонения от распределения нор­ мального типа (если гипотеза о нормальности отвергается). Для этого используем уравнение

 

Фо1 (F) = Фо1

— Хр

х т

 

 

где Фо1 (F) — обратная

функция

Лапласа;

хР — квантиль нор­

мального

распределения.

В координатах хР—х — это уравнение

прямой с

угловым коэффициентом

k = 1

и параметром сдвига

Ь = —mlа, которые легко снимаются с графика. Однако при опреде­ лении b и k, необходимо учитывать масштабы шкалы хР и х. Если

отношение

единиц,

в

которых градуируются

шкалы, обозначить

у =

Рх/Рхр,

то Ь — yb'

и k = у tg е, где Ь'

и

е — параметры, сни­

маемые с чертежа.

Если масштаб шкал одинаков, то у = 1. Так как

при

хР = 0 , х — т, то т снимается непосредственно с чертежа как

абсцисса ОА (рис.

171).

вероятностную бумагу

В

случае необходимости нормальную

легко построить. Для этого ось абсцисс х разбивается на произвола ное число равных делений длиной р* мм, а ось ординат хР делится на равномерные отрезки либо в диапазоне от —3,719 до 3,719, что соответствует изменению функции распределения от 0,0001 до 0,9999,

27 л. л. Бошняк

417