Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 642

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Статистический

анализ и его

применения

159

таблицы для биномиального распределения накопленной вероят­ ности, вычислим

р { Г <^ 3} =

Р {г =

0} +

Р {г =

1} + Р {г = 2} +

 

 

 

+

Р {г =

3} =

0,001 +

0,010 + 0,044 + 0,117

=

0,172.

 

Если уровень значимости а выбран равным 0,05, а/2 =

0,025,

и

так как 0,172 > 0,025, то нулевую гипотезу следует

принять.

В

табл. В.5 (взята

из

работы

[12]) приводится число

плюсов,

необходимое для того, чтобы отвергнуть гипотезу, для различных критических областей. При пользовании этой таблицей нулевые разности нужно отбросить. Например, пусть п = 8, г = 2, а и»

таблицы

при а/2 =

0,025

критическое

значение г равно нулю.

Так как

2 > 0, гипотеза

принимается.

 

3.7.2.

Критерий U* Манна

— Уитни

Среди непараметрических критериев критерий U* Манна — Уитни является наиболее мощным критерием, заменяющим кри­ терий t. Этот общий метод, впервые предложенный Уилкоксоном и другими, был усовершенствован и представлен в форме таблиц Манном и Уитни [13]. Он может быть применен для проверки идентичности двух совокупностей. Пусть взята некоторая выборка, состоящая из п наблюдений (обозначаемых символом х), и выбор­ ка из m наблюдений (обозначаемых символом у) предположи­ тельно из одного и того же непрерывного ансамбля. Затем эти n + m наблюдений записываются в порядке возрастания значений независимо от их принадлежности к той или иной выборке. Каждое упорядоченное таким образом наблюдение заменяется символом х или у в соответствии с тем, из какой выборки взято это наблюде­ ние. В результате получается некоторый структурный ряд, содер­ жащий п символов X и m символов у, перемешанных между собой. Если все m + п наблюдений были различны, то можно было бы получить (т + п)\ различных структур. Однако для каждой действительно отличной от других структуры возможны п\ пере­ становок символов X, которые ее не меняют, и аналогично ml перестановок символов*!/. Поэтому всего имеется

(т-\-п)\

fm-\-n\

п\т\

V m I

различных структур.

 

Если две выборки извлекаются из одного'и того же ансамбля,

то каждая

из структур равновероятна; однако, если выборки

берутся из

разных ансамблей, следует ожидать, что возникнут

структуры, в которых символы X будут скапливаться на одном

конце ряда, а символы у — на другом. Статистикой U*,

лежащей

в основе рассматриваемого критерия, является число

случаев,


160 Глава 3

когда символ у предшествует символу х. Величина U* равна числу символов у, предшествующих наименьшему символу х, плюс число символов у, предшествующих следующему по величине символу х, включая все символы у, уже вошедшие в первую группу, и так далее, пока не будет подсчитано и включено в сумму число симво­ лов у, предшествующих последнему символу х. Если нулевая

гипотеза справедлива, то вероятность обнаружить

некоторое

значение U* равна той доле полного числа возможных

структур

Im 4-

д\

 

 

 

U* равны

 

 

 

I

I , в которых

величины

или больше

величин,

полученных

экспериментально.

(Нулевая

гипотеза Н0

состоит

 

 

 

Im

4 - п\

 

 

 

 

в том, что

каждая из I

I

структур

равновероятна;

тем

самым

это

означает,

что

обе

выборки

извлекались

случайно

и независимо друг от друга

из одной и той же генеральной

сово­

купности.) Испытание будет значимым при уровне значимости а, если P {U* ^ £/„} = а. В случае совпадения величин реко­ мендуется приписывать каждому члену группы совпадающих величин среднее значение рангов совпадающих членов, подсчитан­ ных последовательно. Если сумма рангов, т. е. сумма значений, приписанных рангам, не является целой, ее следует округлить до ближайшего целого числа; в литературе, приведенной в конце этой главы, описаны некоторые другие способы применения дан­ ного критерия.

Чтобы применить этот критерий, некоторый член xt выборки меньшего объема нужно заменить і-ш символом х (в порядке возрастания значений) и выписать его ранг согласно структуре, содержащей символы х и у. Обозначим через ut число символов у, предшествующих значению xt. Пусть Тх обозначает сумму рангов наблюдений х (Т представляют собой критические значения Т Уилкоксона [14], приведенные во многих монографиях по ста­ тистике). Статистика U* Манна —Уитни связана с Тх следую­ щим образом: •

 

n

n

n

 

Г я =

2 г , =

2 (і + и , ) = п Л + і + 2 т = пЦ±

+ и*, (3.7.2)

 

і=1

i=l

i=l

 

где n — число

элементов в выборке меньшего объема. Сумму

рангов для у, Ту, также можно выразить через U*. Сумма всех

рангов

просто

равна их числу,

умноженному

на средний ранг,

или х / 2 (m 4- n) (m 4- п 4- 1).

Статистика Ту

равняется

V 2 (m -f- n) (m 4- n 4-

1) — Tx,

или

 

Ty

= mn+

го("+4)—17*.

(3.7.3)


 

Статистический

анализ

и его

применения

 

 

161

Таким образом,

нет

необходимости

подсчитывать

статистику

U*,

вычисляя

2 иі

( ч т о

может

оказаться

весьма

утомительным),

а достаточно

воспользоваться

соотношениями

(3.7.2)

или

(3.7.3).

 

 

у, которые или предшествуют,

 

 

 

Число

символов

или

следуют

за некоторым х,

равно объему выборки т. Так как всего

имеется

п символов x, то общее число символов у, предшествующих или следующих за символами х, равно тп. Следовательно, величина тп — U* равна числу случаев, когда некоторый символ у следует за некоторым символом х, или когда х предшествует у. В боль­ шинстве таблиц, таких, как табл. В.6 приложения В, приводятся

лишь меньшие из значений U* или U*' =

тп

U*. В табл. В.6

m относится к выборке меньшего объема,

are

к выборке боль­

шего объема. Для выборок большого объема, превышающего таб­

личные значения, среднее значение U*

равняется Щ {U*} = х!гтп,

дисперсия

 

 

\т <тт&\

ліге (m +

ra-r-1)

Var {U*} =

S

'

a величина1 )

 

 

Z =

.

(3.7.4)

 

y V a r { £ / * }

представляет собой (приближенно) нормированную величину, рас­ пределенную по нормальному закону.

Асимптотическая эффективность критерия Манна — Уитни относительно критерия t равна 3/я « 0,955, если оба критерия применяются к нормальным совокупностям с однородными дис­ персиями. Таким образом, преимущество критерия t невелико; если данные отклоняются от нормального закона, то критерий Манна — Уитни может оказаться более мощным. Детали расчета иллюстрируются следующим примером.

Пример 3.7.2. Критерий Манна —Уитни

 

 

 

Пусть при

различных катализаторах

взяты

для

испытания

две выборки

А

и В.

Прирост

выхода для каждой из выборок

представлен

в

виде

таблицы

в порядке

возрастания

значений,

и имеется вторая таблица (здесь не приводится),

объединяющая

обе выборки

тоже в

порядке

возрастания:

 

 

•) Вычитание Ѵ 2 необходимо д л я непрерывности.



162

Глава

3

 

А

 

в

 

Прирост, %

Ранг

Прирост, %

Ранг

- 1 , 4

1

- 0 , 3

5

- 1 , 2

2,5

0,5

8

- 1 , 2

2,5

0,7

9

- 1 , 0

4

0,8

10

- 0 , 2

6

0,9

11

0,2

7

1,5

12

 

 

2,4

13

Сумма рангов

23

Сумма рангов

68

В этой таблице ранг каждого прироста, определенный по второй таблице, записан во втором столбце и пробегает значения от 1 до 13.

Один

из способов расчета

U*

состоит

в замене

наблюдений

во второй таблице символами

А

или В в

зависимости

от того,

из какой выборки взято данное наблюдение:

 

 

 

ААААВААВВВВВВ.

 

 

 

 

(а)

Число случаев, когда В предшествует

А, равно 2. Значение U*,

которое

меньше или равно 2,

можно

получить из

следующих

структур:

 

 

 

 

 

 

 

 

ААААААВВВВВВВ

 

 

U* = 0,

 

 

 

АААААВАВВВВВВ

 

 

U* =

1,

 

(б)

 

АААААВВАВВВВВ

 

 

U* = 2,

 

 

 

ААААВААВВВВВВ

 

 

U* =

2.

 

 

 

 

 

 

 

 

/6 +

7\

 

Полное число возможных структур равно

I g

I = 1716.

Следовательно, уровень значимости для одностороннего

критерия

гипотезы, утверждающей, что А равно или превышает В,

следует

выбрать порядка 4 / 1 7 і 6 . Иначе говоря,

вероятность того, что вели­

чина U* будет равна или меньше 2, равняется 0,0023.

Следова­

тельно, если в качестве приемлемого уровня значимости взять 0,05, то гипотезу об одинаковом влиянии двух катализаторов следует отвергнуть. Для двустороннего критерия нужно учесть четыре зеркально симметричные структуры со значениями U*, равными соответственно 40, 40, 41 и 42. Следовательно, уровень значимости для двустороннего критерия приблизительно равен 8/1716.

Вместо того чтобы подсчитывать структуры, как это делалось выше, значение U* проще можно установить по формулам (3.7.2) или (3.7.3). Затем по табл. В.6 приложения В можно получить