Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 756

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Нелинейные модели 425

ные. так и отрицательные

значения.

Следовательно, величина

det А не близка к нулю и

матрица

А не будет вырожденной.

5,0

 

 

Ж

2,0\

I

I

I

I

I

I

I

I

^

432

4,34

4,36

4,36

4,40

4,42

4,44

4,46

4,48

 

 

 

Энергия

активации

ЕилиЕ*

К-/О'4

 

Ф и г . П . 6 . 3 . 1 . Сравнение приближенных 95% - ных доверительных областей,, полученных при подгонке двух связанных моделей.

Подобное часто используемое преобразование состоит в том, что полагают

 

 

r = k*e

/_і î_\

 

(д),

 

 

 

RTJ,

 

где в качестве Т0

можно взять Т или любую другую

температуру.

На фиг. П.6.3.1

сравниваются

приближенные 95%-ные довери­

тельные области, полученные для модели г

= ке~в/т

и модели (д).

Пример 6.3.2. Масштабные множители и преобразования

Фарисс

и Лоу подсчитали

коэффициенты ки al 5

к2 и а2 Для.

наилучшей

подгонки нелинейной

целевой

функции

 

г =

кі.ще-^*215)

+

А2 ц2 е-«2/«+273)5

(а ),

где переменная t измерялась в градусах Цельсия. Дл я постоянных

кі

=

20e1 1 .8 2 0 3

3 ,

at

=

5000,

кг

=

2 е 4 ' . 2 8 1 3 2

,

а 2

=

20 000


426

Глава 6

"были имитированы 100 экспериментальных точек, для чего исполь­ зовались случайные значения щ и и2 из интервала от 0 до 1 и слу­ чайные значения t из интервала от 100 до 200. Случайная ошибка, распределенная по нормальному закону со средним значением, равным нулю, и дисперсией

 

 

 

 

о| =

0,01 +

(0,05г)2 ,

 

(б)

прибавлялась

к каждому

детерминированному

«эксперименталь­

ному»

значению:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ri = rt + et.

 

 

(в)

Для

получения

оценок

коэффициентов ки к2,

« і и а 2 миними­

зировалась сумма

квадратов

отклонений

ф, определяемая

форму­

лой (6.2.1), с весом Wi = aï"1. Начальные

предположения о пара­

метрах

и конечные

результаты, полученные методом оценивания

с производными,

представлены

в табл. П.6.3.2.

 

 

 

 

 

 

 

 

 

 

 

Таблица

П.6.3.2

 

 

 

 

 

 

к2

 

ai

0 2

Ф

Начальные

 

10в20

 

5 е 2 0

 

 

8460

8 460

7671

оценки

 

 

 

 

 

 

 

 

 

 

Оценки

пара ­

2 0 , 0 8 5 e 1 1 - 7 3 5 8

 

1,9220e 4 7 ' 7 6 1 3

4964

20 203

90,7

метров,

соот­

 

 

 

 

 

 

 

 

 

ветствующие

 

 

 

 

 

 

 

 

 

минимуму ф

2 0 е 11,82083

 

2 в 47,28132

 

 

 

 

Параметры

мо­

 

 

5000

20 000

100

 

 

 

 

 

 

дели (а)

 

 

 

 

 

 

 

 

 

 

Производные вычислялись аналитически. При расчетах исполь­

зовались

следующие масштабные

множители:

 

 

 

 

 

Параметр

 

к^

кг

о 4

а 2

 

 

 

 

 

Множитель

к2

1000

1000

 

 

которые вводились соответственно в ки

к2,

ауяа2в

начале

каждо­

го итерационного

цикла.

 

 

 

 

 

 

 

Преобразование абсолютной температуры, описанное в при­ мере 6.3.1, применялось также к выражению (а); величина Т полагалась равной 423 (t — 150). Минимизация преобразованной целевой функции дала следующие результаты:


 

 

Нелинейные

модели

 

427

 

 

kl

 

ht

ai

02

Исходные

оценки

10

5

 

20

20

Масштабный мно­

10

5

 

20

20

ж и т е л ь

 

20,085

1,9220

11,7358

47,7613

Оценки

парамет­

ров, соответст­

 

 

 

 

 

вующие

" мини ­

 

 

 

 

 

муму ф

 

 

 

 

 

 

Д ля минимизации суммы квадратов отклонений использова­ лось несколько различных методов. Накопленный опыт позволяет сделать следующие выводы. (Число шагов, приведенное ниже, определялось по 1/100 доли суммы: 1) числа подсчетов величины (Ri rt) и 2) числа подсчетов частных производных от г по одному параметру.)

1.Метод наискорейшего спуска для невзвешенной целевой функции с непреобразованной температурой, но использующий масштабный и ускоряющий множители: после 579 шагов значение ф было уменьшено всего до 3615; после 1019 шагов значе­ ние ф равнялось все еще 3523. Вывод: метод неэффективен.

2.Метод наискорейшего спуска с преобразованной температу­ рой, ускоряющим множителем h и масштабными множителями полученными из соотношения

In l} = In q ( 1 - e x p [ - - ^ In (-щщ-) J } ,

где q — максимальный масштабный

множитель, равный 100:

после 206 шагов значение ф было

равно 100, после 471 шага

ф равнялось 90,95. Вывод: метод эффективен, но сходимость слабая

(характерно

для метода наискорейшего спуска).

3. Метод

Гаусса — Зайделя с непреобразованной температу­

рой: получилось значение ф, равное 2904, после 1265 шагов и зна­

чение

90,7

после 1317 шагов. Вывод: за исключением последних

10 шагов,

сходимость слабая.

 

4.

Метод Гаусса — Зайделя

с преобразованной

температурой:

получилось

значение ф, равное 90,7, после 28

шагов. Вывод:

метод

эффективен и быстро

сходится.

 

5. Метод Маркуардта с начальным значением % = 1, после каждых 10 циклов значение К регулировалось: для непреобразо­ ванной температуры ф равнялось 90,7 после 1501 шага; для пре­ образованной температуры ф равнялось 90,7 после 21 шага. Вывод; метод эффективен и быстро сходится, как и метод Гаусса — Зайделя.


428

Глава 6

Было использовано другое преобразование, приводящее выра­ жение (а) к виду

при замене

к' = In &.

Исходные значения к' равнялись логарифмам первоначальных исходных значений; масштабные множители для к\ и к'% были приняты равными 1. Результаты получились приблизительно такие же, как для преобразования из примера 6.3.1, хотя число шагов пришлось несколько увеличить.

Была также проведена процедура оценивания, при которой численная аппроксимация производных достигалась с помощью правых разностных схем с мелкой сеткой. Для приращения пара­ метров в 0,001 части масштабного множителя существенного раз­ личия между двумя методами не было обнаружено. Однако при более крупной сетке потребовалось дополнительное число шагов.

Э ф ф е к т н у л я . Эта ситуация может быть проиллюстри­ рована на примере следующей целевой функции:

ф = ß» + 2 ß 4 ß 2

+ ß 2

+ 2 = (ß4 + ß 2 ) 2 + 2.

После преобразования ßi

+

ß 2

=

ßi

получаем

 

«I»

=

ß?

+

2.

Замечаем, что в целевой функции осталась лишь одна переменная

ßi. Геометрический смысл целевой функции ф =

(ßj + ß 2 ) 2 + 2

пояснен на фиг. 8.2.2, д; постоянные значения

этой

функции

располагаются на прямых, параллельных пунктирной оси ß 2

(кото­

рая соответствует х2 на этой фигуре). Хотя

и ß t

и ß 2

считаются

параметрами, в

действительности имеется

лишь

один

параметр

ß t (xt), который

следует варьировать, чтобы реализовать

мини­

мум ф. Особенно чувствителен к эффекту нуля метод Гаусса — Зайделя, так как в этом случае матрица А становится вырожден­ ной. С другой стороны, метод наискорейшего спуска продолжает работать и в случае, когда имеет место незамеченный эффект нуля, за что приходится расплачиваться большим числом зигзагообраз­ ных шагов. Что касается метода Маркуардта. то влияние на него эффекта нуля зависит от величины X. Для малых значений X метод

Маркуардта

подобен методу Гаусса — Зайделя и чувствителен

к

эффекту

нуля; для больших значений X метод Маркуардта

в

большей

степени соответствует методу наискорейшего спуска.

При использовании методов прямого поиска в задачах, в которых имеет место эффект нуля, в основном сталкиваются с трудностями, связанными с выбором неправильного масштаба и взаимодействием параметров.


Нелинейные

модели

429

6.4. П Р О В Е Р К А Г И П О Т Е З И Д О В Е Р И Т Е Л Ь Н А Я

О Б Л А С Т Ь

Кроме оценок параметров нелинейной модели, для исследовате­ ля представляет интерес мера рассеяния этих оценок, а также мера рассеяния предсказываемых значений зависимой перемен­ ной Y. Эти характеристики можно получить с помощью описывае­ мых ниже методов.

6.4.1. Линеаризация

модели

в области вблизи

минимума

 

суммы

квадратов

 

Приближенную доверительную область для параметров можно построить, линеаризуя нелинейную модель (как описано в раз­ деле 6.2.3) в пространстве параметров вблизи оценки Ь, получен­ нойметодом наименьших квадратов. Дисперсии и ковариации оценок b тогда определяются приближенно по аналогии с выраже­ нием (5.1.14):

Сот {Ь} « (ТІТу/Х)-1 оу. = Соі..

(6.4.1)

Каждый элемент матрицы X вычисляется в точке Ь. Если произ­ водные n нельзя рассчитать аналитически, их можно оценить численно. Чтобы получить оценку оу{ , если модель корректна, можно вычислить

2

_ _ E T w E

(6.4.2)

Т

п — m

 

в точке минимума ф, а затем

 

Сот {Ь} «

(X*wX)-i - f ^ J - ,

(6.4.3)

где п — число наборов данных (число опытов), a m — число оце­ ниваемых параметров. Конечно, если используемая модель некор­ ректна, выражение (6.4.2) дает смещенную оценку ауг', следо­ вательно, как всегда, желательно получить величину s% из повторных наблюдений для того, чтобы определить, насколько хорошо данные описываются этой моделью.

Из выражения (6.4.3) можно рассчитать приближенные индиви­ дуальные доверительные интервалы для параметров ßj, как описывалось в разд. 5.2 для линейных моделей; доверительный интервал для и можно приближенно получить, используя вели­ чину sy , вычисленную следующим образом. Прежде всего найдем

sJy ==Var{bj}»4CW f

где Cjj — диагональные элементы матрицы С = ( X r w X ) _ 1 .

Затем

используем линеаризованный (вблизи Ь) предсказываемый

отклик