Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 629

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Статистический

анализ и его

применения

131

зой Н0 может быть утверждение, что ц = 16; альтернативные гипо­ тезы — Hi', il > 16 и Н2: ц < 16. Или испытываемая гипотеза может состоять в том, что не будет никакого улучшения произво­ дительности некоторого процесса, а альтернативная гипотеза предполагает, что будет некоторое улучшение.

Пусть известна плотность распределения вероятности р (Ѳ) для оценки Ѳ (которая является несмещенной оценкой Ѳ).^Пред­ положив, что описание случайной переменной Ѳ с помощью р (Ѳ) корректно и что значение параметра ансамбля Ѳ равно, скажем,

 

р(Ѳ)

Область

J Область

приня-^ I

Область

 

 

 

 

неприня-

г тия

гипотезы

1

непринятия

 

 

 

 

тия

 

 

 

 

 

 

 

 

 

 

 

Площадб=\

 

/Площадь

»

\

1

Площадь=&.

 

 

 

 

-g.

/

= (1-се)

 

\

1

\

 

 

 

 

\

У

 

 

 

 

 

 

 

 

 

 

.,/ЖЖ

 

 

 

 

 

 

 

 

Ф и г . 3.4.1. Области п р и н я т и я

и непринятия

гипотезы для симметричного

 

 

 

 

 

 

к р и т е р и я .

 

 

 

00 ,

зададим следующий вопрос: если в качестве истинной гипотезы

принять, что Ѳ = Ѳ0 , как сильно

должна

отличаться величина Ѳ

от Ѳ0 , чтобы эта гипотеза была отвергнута как ложная?

Ответить

на

этот вопрос

помогает

фиг. 3.4.1. Если гипотеза Ѳ =

Ѳ0 верна,

то

Ш { Ѳ } =

Ѳ0 , как показано на

этой

фигуре. Вероятность того,

что значение

Ѳ окажется

равным

или меньшим, чем Ѳа/2> равна

 

 

 

 

 

 

J a/2

 

 

 

 

 

 

 

 

Р{в<Ѳа/2}

=

р (Ѳ)гіѲ

= •

(3.4.1)

и

вследствие

 

симметрии

 

 

 

 

 

 

 

 

 

 

P{Q>Qi-aj2}=

 

] р ( Ѳ ) е Ю = - 5 - .

(3.4.2)

е1 - а / 2

Дл я того чтобы принять некоторое решение относительно этой гипотезы, нужно еще до получения выборки задать некоторое

число а,

которое

называется уровнем

значимости

критерия;

обычно а

выбирается произвольным, но достаточно малым, с тем

чтобы можно было

считать совершенно

невероятным,

что Ѳ пре-



132

Глава

3

выситвыбранную

величину Q\-a/2

или окажется меньше, чем Ѳ а / 2 .

Например, а может иметь значение 0,05 или 0,01. Затем берется

выборка и вычисляется Ѳ. Если Ѳ больше, чем Ѳі_а /2> или меньше,

чем Ѳа / 2> гипотеза отвергается. В

противном случае она прини­

мается. Интервал значений Ѳ, при

которых гипотеза

отвергается,

называется областью непринятия гипотезы; интервал

значений Ѳ,

при

которых гипотеза принимается, называется областью

приня­

тия

гипотезы.

 

Описанный выше критерий является двусторонним. Односто­ ронний критерий основывается либо на том, что Ѳ больше, чем некоторое значение Ѳ^а, и гипотеза Ѳ = Ѳ0 отвергается, если действительно Ѳ > Ѳ ^ , либо на том, что Ѳ меньше, чем Ѳ а . Непринятие гипотезы не предполагает ее безоговорочное отбрасы­ вание, а требует внимательного изучения экспериментальной процедуры и полученных данных, чтобы убедиться, нет ли какихлибо ошибок в эксперименте. Выяснение причин ошибок в методе исследования имеет большое значение.

Метод проверки гипотез имеет простейшую структуру в случае,

когда

существует

дихотомия состояний случайной величины:

1.

Н0: x —- истинное значение случайной

величины (нулевая

гипотеза).

 

 

2.

НІ'. x ne является истинным значением случайной величины

(альтернативная

гипотеза).

 

Например, два

значения параметра могут

представлять неко­

торую плотность распределения вероятности. В качестве гипотезы

Н0

принимается,

что эта плотность распределения

вероятности

равна р (х;

Ѳ0 ),

а альтернативная гипотеза состоит в том,

что

она

равна

p (x;

QT). Другой пример: гипотеза Н0

означает,

что

среднее по ансамблю значение переменной процесса не изменилось после модификации процесса, а гипотеза НХ означает, что это среднее изменилось. Применяются также критерии проверки, учитывающие одновременно несколько альтернативных гипотез, но их описание выходит за рамки данной книги.

При проверке гипотез решение принимается следующим обра­ зом. Основываясь на предположении, что нулевая гипотеза верна, вычисляют статистику по случайной экспериментальной выборке и проверяют, попадает ли вычисленное значение в область приня­

тия гипотезы; если оно не попадает в эту область, нулевая

гипотеза

отвергается, a

Н^ принимается. В противном случае Н0

прини­

мается,

a НІ

отвергается.

 

 

 

При проверке гипотез можно различить ошибки двух

типов.

О ш и б к а

п е р в о г о

р о д а . Эта ошибка возникает,

когда

гипотеза

верна, но

отвергается.

 

 

О ш и б к а

в т о р о г о

р о д а . Эта ошибка возникает,

когда

гипотеза

не верна,

но принимается.

 

 


 

Статистический

анализ

и его

применения

133

Ясно,

что появление ошибки

первого

рода связано

с тем, что

значение

а выбрано отличным

от

нуля. Если гипотеза верна

и, например, а = 0,05, то эта гипотеза будет отвергнута в 5% испытаний.

Фиг. 3.4.2 иллюстрирует ошибку второго рода применительно к среднему по ансамблю. В данном случае выдвигается гипотеза,

что р. =

\ І А .

Но для того,

чтобы продемонстрировать ошибку

второго

рода, предполагается,

что истинное значение

р, в действи­

тельности равно

А + о, как показано на фиг. 3.4.2.

Выбирается

 

 

 

р(£)

Рассеяние

X относительно

*

предполаваелюго

сред-

\

/

него по ансамблю

А

\

/

Область

принятия

 

 

гипотезы

 

 

 

Рассеяние X относительно истинного среднего по ансамблю /гА * s

Лис

2

 

 

MA

 

 

Ф и г .

3.4.2. Ошибка

второго рода.

а — вероятность отвергнуть

гипотезу

и = иА,

когда она верна; ß — вероятность

не отвергнуть гипотезу р. =

цА, когда

она неверна; (1 — ß) — вероятность отвергнуть

гипотезу

р. = &А,

когда она неверна.

некоторое значение а, которое фиксирует область непринятия (пунктирная штриховка). В этом случае гипотеза и- = р.А является ложной, однако имеется некоторая вероятность ß, что выборочное

среднее

попадет

в область принятия

гипотезы.

Если

гипотеза

р, == f i A

верна,

как

предполагалось,

двусторонний

критерий

(фиг. 3.4.2) приведет к правильному

решению в

100(1 — а ) %

испытаний и к ложному

решению (отклонению гипотезы) в 100а %

испытаний, что объяснялось выше. Однако если гипотеза

действи­

тельно

ложная, то

можно рассчитать

вероятность попадания

X в область непринятия, если значение

ô известно или

принято

равным

известному

числу.

 

 


1.0

Ф и г .

3.4.3а.

Оперативные характеристики

д л я двустороннего к р и т е р и я

 

 

 

 

 

t

=

0,05)

[5].

 

б =

I ц. — ц 0 I или

б* = I р,д — Ив ]

при объеме выборки п ; а — стандартное отклоне­

ние

по

ансамблю,

которое

должно оцениваться,

если неизвестно; ц 0 — известное сред­

нее по ансамблю;

А и и в

— средние по ансамблю соответственно для выборок А и В;

 

 

 

 

ß — вероятность

не заметить

различие.

 

 

1,00

 

 

 

 

 

Ф и г . 3.4.36. Оперативные характеристики д л я одностороннего к р и т е р и я t (а = 0,05) [6] .

Обозначения те же, что на фиг. 3.4.3а.

 

Статистический

анализ

и его применения

135

Вероятность ß представляет собой вероятность не обнаружить

разницу,

когда

она существует.

На фиг. 3.4.3 представлены

типичные

кривые

зависимости ß от разности d для выборок раз­

личных объемов; эти кривые называются оперативными

характе­

ристиками.

Вероятность 1 — ß называется мощностью

критерия

и определяет вероятность принятия правильного решения, когда в действительности гипотеза является ложной. С увеличением ô величина 1 — ß возрастает, a ß уменьшается.

Из этого описания двух типов ошибок следует, что попытка уменьшить ошибку одного типа ведет к увеличению ошибки друго­ го типа. Единственный способ уменьшить одновременно ошибки обоих типов состоит в увеличении объема выборки, что на прак­ тике может оказаться слишком сложным. Возможно, что ошибки одного типа могут иметь менее серьезные последствия, чем ошибки другого типа, и в этом случае можно найти некоторое приемлемое решение относительно выбора величины а и необходимого числа наблюдений. Опытный исследователь, чтобы сделать экономичный выбор величин а и ß, принимает во внимание оборудование, харак­ тер процесса и стоимость эксперимента.

Понятия оперативной характеристики и мощности критерия в равной степени применимы к проверке гипотез как для диспер­ сий (разд. 3.6), так и для других характеристик ансамбля, в частно­

сти

среднего значения.

 

Пример 3.4.1. Проверка гипотезы относительно среднего

Предположим, что некоторая

случайная переменная процес­

са X имеет среднее значение х

6,80. Взята выборка для этой

переменной и

для выборки объема п = 9 получено X = 6,50

ж sx

= 0,25 (sx

= 0,50). Проверим гипотезу Н0, состоящую в том,

что

случайная

переменная имеет прежнее среднее по ансамблю,

а именно х =

6,80. Альтернативная гипотеза Hi состоит в том,

что ц,х Ф 6,80. Если уровень значимости а выбран равным 0,05,

то для симметричного двустороннего критерия t гипотеза

Н0

принимается, если

| X — \іх | << ti^a/2SX.

В противном случае

Н0 отвергается

и

принимается

Hi.

 

 

Здесь

 

 

 

 

 

 

 

s- = - ^ - = - ^ - = 0 167

 

 

а величина ti-a/z

 

для п — 1 = 8

степеней

свободы и а =

0,05

равна 2,306.

 

 

 

 

 

0,30 =

I 6,50 - 6,80 I <

2,306 -0,167 = 0,39.