Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 637

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

154

Глава 3

Д л я

многих экспериментов предположение о том, что наблю­

даемые случайные величины распределены по нормальному зако­ ну, весьма обосновано; исследователь может выполнить подходя­

щие проверки этого

предположения, часть из

которых

описана

в разд. 3.7. Однако

допустим, что наблюдаемые

случайные

вели­

чины не распределены по нормальному закону.

Что

можно

ска­

зать в таком случае

о применимости критерия

F?

Критерий F

и особенно критерий

Бартлетта для сравнения

дисперсий

весьма

Ф и г . 3.6.1. Логарифмическое преобразование .

чувствительны к отклонениям от нормального закона; если пред­ положение о нормальности распределения не выполняется, эти критерии должны быть видоизменены или нужно использовать другие критерии.

Другим методом решения проблемы, связанной с отклонением "распределения измеряемых случайных величин от нормального,

является

использование некоторого

преобразования

переменных

•с целью

приблизить распределение

данных к

нормальному

и уменьшить различия между дисперсиями отдельных групп дан­ ных. Эти преобразования можно рассматривать как некоторое изменение масштаба для первоначальных переменных, позволяю­ щее расположить их наиболее благоприятным образом. Например, логарифмическое преобразование заменяет резко асимметричное распределение, изображенное на фиг. 3.6.1, а, на распределение, гораздо более похожее на нормальное (фиг. 3.6.1, б). Однако, пытаясь разрешить существующие проблемы с помощью пре­ образований, следует быть достаточно осторожным, чтобы случай­ но не создать новые трудности.

Пример 3.6.4. Преобразование плотности распределения

вероятности

Роуз и Инглиш [10] исследовали распределение прочности на разрыв для одинаковых бумажных пакетов, содержащих равное количество некоторого вещества, при бросании в заданных уело-


Статистический

анализ и его

применения

155

виях. Соответствующее распределение относительных частот для 200 пакетов изображено на фиг. П.3.6.4а в зависимости от числа бросаний, т. е. числа бросаний с определенной высоты до того

 

о

20

40

60

80

100

120

140

160

 

 

 

Число бросаний

N

 

 

 

Ф и г .

П . 3 . 6 . 4а . Распределение

прочности на разрыв пакетов [10].

Вещество: песок; средний размер частиц 150

мкм; размеры пакета: 10

х 6,3 см; партия:

 

 

 

 

200

пакетов.

 

 

 

момента,

когда пакет

лопнет.

Те

же данные

представлены на

фиг. П.3.6.46 в виде зависимости от логарифма числа бросаний. Авторам удалось, используя соответствующие статистические критерии, связать распределение относительных частот с лога­ рифмически нормальным распределением. Затем они теоретически

Ф и г . П . 3 . 6 . 46 . Данные фиг. П . 3 . 6 . 4а в логарифмическом масштабе [10].

обосновали, почему такое распределение следовало ожидать. Кроме того, зная исходное распределение, оказалось возможным только двумя параметрами, средним значением и стандартным


156

Глава 3

отклонением, описать ~2000 испытаний пакетов с другим напол­ нением.

Если данные можно получить без особых затруднений и затрат, простейшим методом нормализации распределения является усреднение данных по группам и проведение проверок по сред­ ним в группе. Рациональность такого подхода базируется на центральной предельной теореме, упомянутой в разд. 2.4.1, согласно которой распределение суммы п случайных (распреде­ ленных не обязательно по нормальному закону) величин имеет тенденцию приближаться к нормальному распределению по мере возрастания объема выборки.

Выборочные дисперсии, если они получены из генеральной совокупности с одной и той же дисперсией а 2 , могут быть объеди­ нены для улучшения оценки а 2 . Однако, если выборочные диспер­

сии основаны на выборках из неоднородной совокупности,

объеди­

ненная величина s2 не является

удовлетворительной оценкой а 2 ;

доверительные интервалы и уровни значимости,

связанные с нейг

в таком случае искажаются.

 

 

 

В заключение следует сделать одно замечание. Так как пред­

ставление информации в виде доверительных пределов и

провер­

ка гипотез опираются на одни и те же исходные параметры,

можно

поставить вопрос, какая форма

представления

предпочтитель­

нее? Можно сделать заключение, что если доверительный интервал не включает выборочное среднее, нулевая гипотеза отвергается — такой же вывод можно получить при проверке гипотезы. Однако использование доверительных пределов может оказаться более предпочтительным, так как это дает исследователю представление

о степени неопределенности параметров, а не

просто ответ «да»

или «нет», который получается

при проверке

гипотез.

3.7. Н Е П А Р А М Е Т Р И Ч Е С К И Е

К Р И Т Е Р И И

( К Р И Т Е Р И И

С П Р О И З В О Л Ь Н Ы М

Р А С П Р Е Д Е Л Е Н И Е М )

Все критерии, которые рассматривались до сих пор, явно включали предположение о том, что исследуемые случайные величины распределены по некоторому известному закону, как правило, по нормальному. Такие критерии называются параме­ трическими. Существуют другие типы критериев, включающие ранговую корреляцию и проверку знаков, которые не требуют таких предположений и называются непараметрическими, крите­ риями или критериями с произвольным распределением. (Непара­ метрические характеристики реально применимы только к уровню значимости и лишь для выборок непрерывных величин. Во многих непараметрических критериях вероятностные соотношения в дей­ ствительности зависят от распределения вероятности случайной


Статистический

анализ и его

применения

157

переменной.) Непараметрические методы можно использовать при проверке гипотез для того, чтобы найти интервальную или даже точечную оценку параметров и т. д. Например, непараметриче­ ской оценкой среднего по ансамблю служит медиана случайной выборки (центральное значение переменной для нечетных п и сред­ нее двух центральных значений для четных п)\ непараметриче­ ской оценкой стандартного отклонения является размах (абсо­ лютная величина разности между наибольшим и наименьшим значениями в выборке). Ни одна из этих статистик не является столь эффективной, как выборочное среднее и выборочное стан­ дартное отклонение, которые описывались выше.

Здесь будет рассмотрено лишь несколько непараметрических критериев, главным образом те, которые могут заменить пара­ метрические критерии для средних и дисперсий, описанные в раз­ делах 3.4 и 3.5, а также критерии, которые могут быть исполь­ зованы при установлении стационарности, случайности и нор­ мальности случайных переменных. Большинство монографий по статистике содержит главу, в которой описаны различные типы непараметрических критериев; Сэвидж [11] составил хорошую библиографию, посвященную применениям таких критериев.

3.7.1. Критерий

знаков

для разности

медиан

в парных

наблюдениях

 

Простейшим непараметрическим критерием, который можно использовать вместо критерия t, является критерий знаков для парных наблюдений. Предположим, что проведено п пар изме­ рений некоторой случайной величины, причем одно из каждой пары при условии А, а другое при условии В. Если нет нулевых разностей, то разности At — Bt либо положительны, либо отри­ цательны; положительный результат распределен как биномиаль­ ная переменная с Ѳ = Ѵ2 . (Полученные при расчете нулевые разности могут быть обработаны различными способами, ни один из которых не является полностью удовлетворительным. Но если доля нулевых разностей невелика, скажем меньше 5%, пары наблюдений с нулевой разностью можно опустить из рассмотрения или поделить поровну между положительными и отрицательными исходами.) Так как критерий знаков основан на биномиальном распределении, биномиальные события должны быть независимы (табл. 2.3.1), т. е. знак разности для одной пары измерений никак не должен влиять на знак разности любой другой пары, а выборка должна быть случайной. Кроме того, исходы должны быть непре­ рывными.

Д л я

каждой

разности At

— Bt

вероятность P {At >

Bt}

— Р {At

< Bi)

= У2, если % {Ai

— В{} = 0.

Критерий

знаков

просто

проверяет гипотезу,

утверждающую,

что параметр

Ѳ


158

Глава

3

в биномиальной

плотности равен

Ѵ2 , т. е. по экспериментальным

данным проверяется нулевая гипотеза, что совокупность разно­ стей А — В имеет медиану, равную нулю. Пусть г — число слу­ чаев реже встречающегося знака, а п г — число случаев чаще встречающегося знака после распределения случаев нулевой разности. Тогда накопленная вероятность получения г или мень­

шего числа

знаков, если справедлива нулевая гипотеза ( Я 0 :

эффекты А

и В одинаковы), равна

• і=0

Нулевая гипотеза отвергается согласно двустороннему критерию, если

P<Y или і > > 1 _ - J - .

Если используется односторонний критерий и альтернативная гипотеза состоит в том, что разность медиан меньше нуля, то

нулевая гипотеза

отвергается,

если Р ^ а; при

противополож­

ной альтернативной гипотезе нулевая гипотеза

отвергается, если

Р > 1 — ос. Д л я

разностей,

распределенных

по

нормальному

закону, односторонний критерий знаков имеет асимптотическую эффективность относительно критерия t, равную 2/я « 0,637.

Пример 3.7.1. Критерий знаков

В табл. П.3.7Л записаны десять пар измерений процентного содержания двуокиси серы в отходящих газах дымовой трубы для двух различных степеней измельчения топлива А ж В. Прове­ рим предположение, что в обоих случаях степень загрязнения двуокисью серы одинакова-

 

 

 

 

 

 

 

 

Таблица

П.3.7.1

 

 

Процентное

содержание

двуокиси серы

 

 

 

Степень

 

 

 

 

Номер выборки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

измель­

1

2

3

4

5

6

7

8

9

10

чения

А

2,4

2,7

2,0

1,9

2,2

2,3

2,3

2,1

2,4

2,6

В

2,6

2,6

2,0

1,8

2,0

2,0

2,4

2,1

2,1

2,5

Знак А—В

+

0

+

+

+

0

+

+

Было получено шесть плюсов и два минуса. Если нулевые разности разделить поровну между положительными и отрица­ тельными, то будем иметь г = 3, n — г = 7. Затем, используя