Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 727

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Стратегия

эффективного

экспериментирования

597

рые должен (n - f 1)-й эксперимент. Используя матрицу относи­ тельного правдоподобия и вектор априорных вероятностей, можно образовать скалярную дискриминантную функцию

PÏI

X

 

 

 

 

 

[ 7 ( 1 : 1 )

7 ( 1 : 2 )

 

/ ( 1 : ^ ) 1

pin)

 

7

( 2 : 1 )

7 ( 2 : 2 )

 

І(2:ѵ)

 

 

 

 

X

 

 

 

 

 

 

(8.5.4)

. 7

( ^ : 1 )

7 (v: 2) . . .

I

(v:v)\

V

J

 

 

 

 

 

 

Каждый элемент главной диагонали матрицы 7 (г : s) равен нулю,

так что дискриминантная

функция

имеет вид

 

 

Kv = PiP2J(l,

2) + 7 W

(

l ,

3 ) + . . . - f i y V ( l ,

ѵ) +

 

 

+ P2PVJ

(2,

v) +

. . . + Т Ѵ І Т Ѵ (v—l,v)

=

 

it

r>

 

 

 

.0«)«

 

 

 

 

 

,(n)p(n)

 

п + 1 ) - y(n+D ) 2 x

r=l

s=r-j-l

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

1

 

 

 

 

 

 

 

 

 

-ol

a-)].

(8-5.5)

 

 

 

 

 

O y

 

 

 

 

 

 

 

 

T

(Заметим, что / (r,

r) =

0.)

Выражение (8.5.5) совпадает

с выра­

жением, найденным Боксом и Хиллом.

Один из способов получения апостериорной вероятности того, что модель г правильна после совершения п наблюдений, состоит в том, что к каждой модели последовательно применяется теорема

Байеса в

следующей

форме:

 

 

 

 

 

 

Р(Г^ЛУІП))

,

 

( 8 5 Б )

 

р(^=-

 

 

 

 

 

 

2

Р?-1)РГЫ(П))

 

 

 

где T*}.7 1 - 1 '— априорная

вероятность,г=1

относящаяся к г-й

модели.

Если начальные вероятности Р{г0) неизвестны, их можно

положить

равными

1/ѵ.

 

 

 

 

 

Вообще говоря, ни дисперсия а\, ни дисперсии о£, r=

1,

. . ., ѵ,

неизвестны; следовательно, их значения нужно оценить. Чтобы найти дисперсию Yr для некоторой модели, можно использовать расчеты, выполненные при оценивании коэффициентов ß методом наименьших квадратов. Если величину YT линеаризовать, разла­

гая в ряд Тейлора, ее дисперсия а? дается выражением

(6.4.4),

а элементы матрицы С определяются выражением (6.4.1).

Однако

оценку дисперсии Oy, даваемую формулой (6.4.2), нельзя

исполь-


598

 

Глава 8

 

зовать для каждой модели ввиду того, что эта формула

опирается

на

предположение

о том, что модель корректна. Таким образом,

в

качестве дисперсии о \ следует взять al и оценить

последнюю

из повторных экспериментов (с помощью sf).

 

 

Итак, последовательная процедура различения моделей вклю­

чает

следующие

этапы:

 

 

1.

Опираясь на план эксперимента, составленный

произволь­

ным или почти оптимальным способом, получают п эксперименталь­ ных точек.

•3* Qj

 

 

 

 

 

^s*"^

Модель

A

 

 

 

 

 

 

 

 

а !

 

 

 

 

 

 

 

 

 

Начальный

 

 

 

 

.Модель В

 

 

эксперимент

 

 

 

 

 

И

 

 

 

 

Чу

 

/ Модель С

 

1 1 1

1

| Ѵ ^ - - Ж ^ 5 = = 5

I

=4 О

1

2

3

4

5

6 7

6

10

 

 

 

Число

наблюдений

п

 

 

Ф и г . 8.5.2. Различение моделей с помощью последовательных планов .

2.

Оценивают параметры всех ѵ моделей с помощью линейной

или

нелинейной

регрессии;

оценивают

оу

и

каждую

из а\,

используя

выражение (6.4.4).

 

 

 

 

 

 

 

 

3. Вычисляют априорные вероятности для (п + 1)-го опыта,

которые

равны

 

апостериорным

вероятностям

для п-то опыта,

используя

для

этой цели

выражения (8.5.6)

и

(8.5.3)

с

заменой

в последнем из них числа

(п

- j -

1) на п.

Начальные

вероятности

РУ?\ если нет лучшего выбора, можно приравнять

ІІѵ.

 

4. Выбирают вектор экспериментальных условий для (п -f- 1)-

го опыта

(вектор

x ( W f l ) ) ,

максимизируя

Кѵ

каким-либо

методом

численной оптимизации.

 

 

 

 

 

 

 

 

 

5.

Проводят

эксперимент в точке x ( f l + 1 )

и повторяют всю про­

цедуру, начиная со второго этапа. На фиг. 8.5.2

показана

вероят­

ность

описания

экспериментальных данных

тремя

конкурирую­

щими моделями для нескольких циклов предлагаемой

процедуры.

Последовательную процедуру продолжают до тех пор, пока

одна (или несколько) из вероятностей Р^

не достигнет значения,

которое требует принятия модели согласно некоторому критерию. Или же экспериментатор может просто обнаружить тенденцию изменения Рт с увеличением числа экспериментов, отбросить моде­ ли с малыми значениями Рт и при желании добавить другие моде-


Стратегия эффективного экспериментирования 599

ли, прекращая эксперименты, если он удовлетворен полученным результатом.

Так как на практике модели обычно оказываются нелинейны­ ми, предполагаемое распределение вероятности, лежащее в основе вывода формулы (8.5.3), будет лишь приближенно правильным. Кроме того, поскольку дисперсии а\ и al должны оцениваться по экспериментальным данным, как и коэффициенты, используе­ мые для предсказания YT, вектор х < п + 1 ) , реализующий максимум Кѵ, может быть найден лишь приближенно. Однако последователь­ ная процедура планирования эксперимента позволяет в процессе анализа преодолеть эти затруднения.

Одна из привлекательных черт метода Бокса и Хилла состоит в том, что он позволяет различать модель и ее обобщение. Пусть, например, две модели таковы:

т.

тт.

 

 

hx\

+ Ргз^з

 

У і

1 +

ßaafi +

ß 4 x 2 + ßsx8 +

ße*4 '

.__

 

ßiaj +

ßza^s

 

У г

l +

ßs*l +

ß 4 * 2 + ßü*8

'

Если в модели I ß 6 = 0, обе модели

идентичны. На первый

взгляд

кажется, что различить эти модели

невозможно,

ибо если

модель

I I оказывается правильной, то модель I также

представляется

правильной. Однако метод различения моделей, описанный выше, эффективен и в этом случае, так как дисперсии зависимых пере­ менных а\ и а\ являются некоторой функцией числа коэффициен­

тов

модели. В

случае одинаковой

суммы квадратов модель

с наименьшим числом коэффициентов

оказывается наилучшей.

 

Теперь проведем детальный расчет по методу Бокса и Хилла

для

некоторого

примера.

 

Пример 8.5.1. Последовательное различение моделей

Кормовые участки для рогатого скота являются источником загрязнения воды. Для того чтобы моделировать стоки с таких участков для оценивания необходимых мер против загрязнения, были предложены три модели нарастающей степени сложности:

1. Модель смесителя:

с = ß 0 ехр ( — ß i z ) .

2. Модель смесителя с подпиткой:

с = ß 2 ехр (—ß3 .z) + ß 4 .

3. Каскад из двух смесителей с подпиткой первого:

с = ß 9 ехр (—ßbx) + ß6 exp (—fax) + ß 8 .



600

Глава 8

 

Обозначения:

 

 

С = с + е — концентрация поглощаемого кислорода

(КПК);

x — количество

воды, мм/ч.

 

Зависимая С и независимая х переменные изменялись

соответ­

ственно в интервалах: 3000 — 10 000 и 0 — 12. Требовалось оце­

нить следующие

параметры:

 

 

 

Модель 1: ß 0 и ß 4 .

 

 

 

 

 

Модель 2: ß 2 ,

ß 3 и ß 4 .

 

 

 

 

 

Модель 3: ß5 ,

ß6 , ß 7 ,

ß 8

и ß 9 .

 

 

 

Для того чтобы оценить параметры модели 3, требуется по

крайней мере пять экспериментов;

с учетом этого было проведе­

но шесть экспериментов

и два

повторных, которые

состояли

в орошении, по возможности равномерном,

небольшого

бетониро­

ванного участка. Были получены следующие результаты:

 

С, г/м3

ос, мм/ч

С, г/м3

X, мм/ч

 

 

8140

0,1

5390

5,0

 

 

7430

1,0

5250

6,0

 

 

6310

2,0

6140

2,0

 

 

5510

4,0

6490

2,0

 

Повторные опыты, проведенные по существу при одинаковых усло­ виях, дали информацию для оценивания остаточной дисперсии.

Ни один из критериев гл. 7 не позволил выяснить, какая из мо­ делей наилучшим образом описывает эти данные. Поэтому было решено провести последовательные эксперименты для различения моделей. Из начальных восьми экспериментов были найдены сле­ дующие оценки коэффициентов:

ъ0

=

7919,

h = -2,490-10-2 :

 

=

0,07937,

К =

8,64940*,

 

=

3431,

b, =

3,730-Ю-2

 

=

0,3630,

К = —1,908-105,

ъ,

=

4797,

h =

1,102-І05 .

Оценки

параметров Ъъ ~

ba

находились

для

преобразованной

модели

 

 

 

 

 

с =

ß 9 exp [ - ß , (х-х)]

+

ß 6 ехр [ - ß 7

(х -

х)] + ß s ,

где x = 3,000. Как упоминалось в гл. 6, для такой модели значи­ тельно улучшается сходимость метода нелинейного оценивания (метода Маркуардта) по сравнению с не преобразованной моделью.