Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 642
Скачиваний: 2
Статистический |
анализ и его |
применения |
159 |
таблицы для биномиального распределения накопленной вероят ности, вычислим
р { Г <^ 3} = |
Р {г = |
0} + |
Р {г = |
1} + Р {г = 2} + |
|
|
|
|
+ |
Р {г = |
3} = |
0,001 + |
0,010 + 0,044 + 0,117 |
= |
0,172. |
|
Если уровень значимости а выбран равным 0,05, а/2 = |
0,025, |
|||||
и |
так как 0,172 > 0,025, то нулевую гипотезу следует |
принять. |
|||||
В |
табл. В.5 (взята |
из |
работы |
[12]) приводится число |
плюсов, |
необходимое для того, чтобы отвергнуть гипотезу, для различных критических областей. При пользовании этой таблицей нулевые разности нужно отбросить. Например, пусть п = 8, г = 2, а и»
таблицы |
при а/2 = |
0,025 |
критическое |
значение г равно нулю. |
Так как |
2 > 0, гипотеза |
принимается. |
||
|
3.7.2. |
Критерий U* Манна |
— Уитни |
Среди непараметрических критериев критерий U* Манна — Уитни является наиболее мощным критерием, заменяющим кри терий t. Этот общий метод, впервые предложенный Уилкоксоном и другими, был усовершенствован и представлен в форме таблиц Манном и Уитни [13]. Он может быть применен для проверки идентичности двух совокупностей. Пусть взята некоторая выборка, состоящая из п наблюдений (обозначаемых символом х), и выбор ка из m наблюдений (обозначаемых символом у) предположи тельно из одного и того же непрерывного ансамбля. Затем эти n + m наблюдений записываются в порядке возрастания значений независимо от их принадлежности к той или иной выборке. Каждое упорядоченное таким образом наблюдение заменяется символом х или у в соответствии с тем, из какой выборки взято это наблюде ние. В результате получается некоторый структурный ряд, содер жащий п символов X и m символов у, перемешанных между собой. Если все m + п наблюдений были различны, то можно было бы получить (т + п)\ различных структур. Однако для каждой действительно отличной от других структуры возможны п\ пере становок символов X, которые ее не меняют, и аналогично ml перестановок символов*!/. Поэтому всего имеется
(т-\-п)\ |
fm-\-n\ |
п\т\ |
V m I |
различных структур. |
|
Если две выборки извлекаются из одного'и того же ансамбля, |
то каждая |
из структур равновероятна; однако, если выборки |
|
берутся из |
разных ансамблей, следует ожидать, что возникнут |
|
структуры, в которых символы X будут скапливаться на одном |
||
конце ряда, а символы у — на другом. Статистикой U*, |
лежащей |
|
в основе рассматриваемого критерия, является число |
случаев, |
160 Глава 3
когда символ у предшествует символу х. Величина U* равна числу символов у, предшествующих наименьшему символу х, плюс число символов у, предшествующих следующему по величине символу х, включая все символы у, уже вошедшие в первую группу, и так далее, пока не будет подсчитано и включено в сумму число симво лов у, предшествующих последнему символу х. Если нулевая
гипотеза справедлива, то вероятность обнаружить |
некоторое |
|||||||
значение U* равна той доле полного числа возможных |
структур |
|||||||
Im 4- |
д\ |
|
|
|
U* равны |
|
|
|
I |
I , в которых |
величины |
или больше |
величин, |
||||
полученных |
экспериментально. |
(Нулевая |
гипотеза Н0 |
состоит |
||||
|
|
|
Im |
4 - п\ |
|
|
|
|
в том, что |
каждая из I |
I |
структур |
равновероятна; |
тем |
|||
самым |
это |
означает, |
что |
обе |
выборки |
извлекались |
случайно |
|
и независимо друг от друга |
из одной и той же генеральной |
сово |
купности.) Испытание будет значимым при уровне значимости а, если P {U* ^ £/„} = а. В случае совпадения величин реко мендуется приписывать каждому члену группы совпадающих величин среднее значение рангов совпадающих членов, подсчитан ных последовательно. Если сумма рангов, т. е. сумма значений, приписанных рангам, не является целой, ее следует округлить до ближайшего целого числа; в литературе, приведенной в конце этой главы, описаны некоторые другие способы применения дан ного критерия.
Чтобы применить этот критерий, некоторый член xt выборки меньшего объема нужно заменить і-ш символом х (в порядке возрастания значений) и выписать его ранг согласно структуре, содержащей символы х и у. Обозначим через ut число символов у, предшествующих значению xt. Пусть Тх обозначает сумму рангов наблюдений х (Т представляют собой критические значения Т Уилкоксона [14], приведенные во многих монографиях по ста тистике). Статистика U* Манна —Уитни связана с Тх следую щим образом: •
|
n |
n |
n |
|
Г я = |
2 г , = |
2 (і + и , ) = п Л + і + 2 т = пЦ± |
+ и*, (3.7.2) |
|
|
і=1 |
i=l |
i=l |
|
где n — число |
элементов в выборке меньшего объема. Сумму |
|||
рангов для у, Ту, также можно выразить через U*. Сумма всех |
||||
рангов |
просто |
равна их числу, |
умноженному |
на средний ранг, |
или х / 2 (m 4- n) (m 4- п 4- 1). |
Статистика Ту |
равняется |
|
V 2 (m -f- n) (m 4- n 4- |
1) — Tx, |
или |
|
Ty |
= mn+ |
го("+4)—17*. |
(3.7.3) |
|
Статистический |
анализ |
и его |
применения |
|
|
161 |
|||
Таким образом, |
нет |
необходимости |
подсчитывать |
статистику |
U*, |
|||||
вычисляя |
2 иі |
( ч т о |
может |
оказаться |
весьма |
утомительным), |
||||
а достаточно |
воспользоваться |
соотношениями |
(3.7.2) |
или |
||||||
(3.7.3). |
|
|
у, которые или предшествуют, |
|
|
|
||||
Число |
символов |
или |
следуют |
|||||||
за некоторым х, |
равно объему выборки т. Так как всего |
имеется |
п символов x, то общее число символов у, предшествующих или следующих за символами х, равно тп. Следовательно, величина тп — U* равна числу случаев, когда некоторый символ у следует за некоторым символом х, или когда х предшествует у. В боль шинстве таблиц, таких, как табл. В.6 приложения В, приводятся
лишь меньшие из значений U* или U*' = |
тп |
— |
U*. В табл. В.6 |
m относится к выборке меньшего объема, |
are |
— |
к выборке боль |
шего объема. Для выборок большого объема, превышающего таб
личные значения, среднее значение U* |
равняется Щ {U*} = х!гтп, |
|
дисперсия |
|
|
\т <тт&\ |
ліге (m + |
ra-r-1) |
Var {U*} = |
S |
' |
a величина1 ) |
|
|
Z = |
. |
(3.7.4) |
|
y V a r { £ / * } |
представляет собой (приближенно) нормированную величину, рас пределенную по нормальному закону.
Асимптотическая эффективность критерия Манна — Уитни относительно критерия t равна 3/я « 0,955, если оба критерия применяются к нормальным совокупностям с однородными дис персиями. Таким образом, преимущество критерия t невелико; если данные отклоняются от нормального закона, то критерий Манна — Уитни может оказаться более мощным. Детали расчета иллюстрируются следующим примером.
Пример 3.7.2. Критерий Манна —Уитни |
|
|
|
||||
Пусть при |
различных катализаторах |
взяты |
для |
испытания |
|||
две выборки |
А |
и В. |
Прирост |
выхода для каждой из выборок |
|||
представлен |
в |
виде |
таблицы |
в порядке |
возрастания |
значений, |
|
и имеется вторая таблица (здесь не приводится), |
объединяющая |
||||||
обе выборки |
тоже в |
порядке |
возрастания: |
|
|
•) Вычитание Ѵ 2 необходимо д л я непрерывности.
162 |
Глава |
3 |
|
А |
|
в |
|
Прирост, % |
Ранг |
Прирост, % |
Ранг |
- 1 , 4 |
1 |
- 0 , 3 |
5 |
- 1 , 2 |
2,5 |
0,5 |
8 |
- 1 , 2 |
2,5 |
0,7 |
9 |
- 1 , 0 |
4 |
0,8 |
10 |
- 0 , 2 |
6 |
0,9 |
11 |
0,2 |
7 |
1,5 |
12 |
|
|
2,4 |
13 |
Сумма рангов |
23 |
Сумма рангов |
68 |
В этой таблице ранг каждого прироста, определенный по второй таблице, записан во втором столбце и пробегает значения от 1 до 13.
Один |
из способов расчета |
U* |
состоит |
в замене |
наблюдений |
|||
во второй таблице символами |
А |
или В в |
зависимости |
от того, |
||||
из какой выборки взято данное наблюдение: |
|
|
||||||
|
ААААВААВВВВВВ. |
|
|
|
|
(а) |
||
Число случаев, когда В предшествует |
А, равно 2. Значение U*, |
|||||||
которое |
меньше или равно 2, |
можно |
получить из |
следующих |
||||
структур: |
|
|
|
|
|
|
|
|
|
ААААААВВВВВВВ |
|
|
U* = 0, |
|
|
||
|
АААААВАВВВВВВ |
|
|
U* = |
1, |
|
(б) |
|
|
АААААВВАВВВВВ |
|
|
U* = 2, |
|
|
||
|
ААААВААВВВВВВ |
|
|
U* = |
2. |
|
|
|
|
|
|
|
|
|
/6 + |
7\ |
|
Полное число возможных структур равно |
I g |
I = 1716. |
||||||
Следовательно, уровень значимости для одностороннего |
критерия |
|||||||
гипотезы, утверждающей, что А равно или превышает В, |
следует |
|||||||
выбрать порядка 4 / 1 7 і 6 . Иначе говоря, |
вероятность того, что вели |
|||||||
чина U* будет равна или меньше 2, равняется 0,0023. |
Следова |
тельно, если в качестве приемлемого уровня значимости взять 0,05, то гипотезу об одинаковом влиянии двух катализаторов следует отвергнуть. Для двустороннего критерия нужно учесть четыре зеркально симметричные структуры со значениями U*, равными соответственно 40, 40, 41 и 42. Следовательно, уровень значимости для двустороннего критерия приблизительно равен 8/1716.
Вместо того чтобы подсчитывать структуры, как это делалось выше, значение U* проще можно установить по формулам (3.7.2) или (3.7.3). Затем по табл. В.6 приложения В можно получить