Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 757

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

420

Глава

6

«менее

вытянутой»:

 

 

А*} —

\i\jAij,

Здесь символ * означает элемент в измененном масштабе, а мас­ штабный множитель \І = (АЦ)~^12. Элементы вектора В* пере­ водятся обратно в элементы вектора В заменой

Однако в работе [15] показано, что рекомендуемое изменение масштаба полностью эквивалентно замене матрицы I в выраже­ нии (6.2.19) на диагональную матрицу D:

 

 

(А +

ÀD) В = Z,

 

 

(6.2.20)

составленную

из элементов,

стоящих на

главной

диагонали

матрицы

А =

Х Т Х . Выражения (6.2.19)

и

(6.2.20)

оказались

одинаково эффективными при оценивании

большого числа кине­

тических

моделей.

 

 

 

 

Метод Маркуардта был испытан и рекомендуется как весьма эффективный. Он безусловно лучше как метода Гаусса — Зайделя, так и метода наискорейшего спуска. Поскольку в точке миниму­ ма ф производные аналитически или численно известны, он лучше симплексного метода в том отношении, что легко позволяет полу­ чить последовательные оценки точности параметров. С другой стороны, симплексный метод обладает тем преимуществом, что вообще не требует вычисления частных производных от ф, что существенно уменьшает машинное время, необходимое для оцени­ вания. Для очень сложных моделей симплексный метод оказы­ вается более эффективным при оценивании параметров моделей.

Пример 6.2.6. Нелинейное оценивание методом Маркуардта

С помощью метода Маркуардта по специальной программе проводилась подгонка той же самой модели, которая использова­ лась в примере 6.2.3. Для различных начальных векторов пара­ метров при минимизации возникли некоторые трудности, так как расчет приводил к неограниченным или нулевым значениям некоторых параметров. После того как в машинную программу были введены ограничения на параметры, было получено то же минимальное значение суммы (функции) ф, что и методом прямого поиска, но большее, чем дает симплексный метод (см. пример 6.2.3). Процесс поиска показан в табл. П.6.2.6; X — параметр выраже­ ния (6.2.19); у — угол в градусах между направлением поиска, которое дает линеаризация модели, и направлением, полученным градиентным методом.


 

 

 

Нелинейные

модели

 

 

421

 

 

 

 

 

 

Таблица

П.6.2.6

Номер

Ф

m

n

 

а

 

V

цикла

 

 

0

1,284

6,00

25,0

0,500

1,000

10-2

27,3

1

0,831

1,00

19,2

0,432

0,760

Ю-з

29,9

5

0,0284

3,22

25,1

0,371

0,722

10-7

52,3

10

0,0267

3,13

23,9

0,398

0,717

10-8

50,5

15

0,0267

3,13

23,9

0,398

0,717

10-8

50,9

Частные производные, полученные численно на машине, исполь­ зовались при оценивании, что потребовало почти вдвое большего машинного времени, чем необходимо для симплексного метода или метода прямого поиска.

Матрица (Х1 ^)""1 [которая позволяет грубо оценить корреля­ цию оценок параметров (см. разд. 6.4)] имела вид

1,000

0,047

0,853

—0,711"

0,047

1,000

0,008

0,285

0,853

0,008

1,000

-0,851

0,711

0,285

-0,851

1,000.

Для £і_а /2 » 2,00 индивидуальные доверительные пределы для параметров равнялись:

 

Нижний предел

Верхний предел

m

2,65

3,61

n

16,1

31,7

f

0,29

0,49

а

0,64

0,78

Совместную доверительную область можно оценить, как описы­ вается в разд. 6.4.

6.3. Р А З Р Е Ш Е Н И Е Н Е К О Т О Р Ы Х П Р А К Т И Ч Е С К И Х Т Р У Д Н О С Т Е Й П Р И Н Е Л И Н Е Й Н О М О Ц Е Н И В А Н И И

Любой из методов минимизации суммы квадратов отклонений, описанных в разд. 6.2, может не обнаружить абсолютный минимум из-за: 1) неверных начальных предположений о параметрах и (или) 2) неограниченности целевой функции, как указывалось

вразд. 6.2.

Вэтом разделе обсуждаются дополнительные трудности, кото­ рые могут проявиться все вместе или по отдельности. Ими являют­

ся

неправильный

выбор масштаба,

взаимодействие

параметров

и

эффект

нуля.

 

 

 


422

Глава 6

Н е п р а в и л ь н ы й

в ы б о р м а с ш т а б а . Масштаб­

ные трудности могут возникнуть, когда значение одного из членов целевой функции сильно отличается по порядку величин от дру­ гого члена. В таком случае целевая функция оказывается нечув­ ствительной к изменениям значений параметров малого члена. Например, функция

ф = lOOßJ - 0,010ß2 2

может оказаться нечувствительной к изменениям параметра ß 2 , если значения последнего в соответствующих единицах измере­ ния не оказываются намного больше значений ß t . Если же ß 2 и ß t

одинаковы по величине,

одну или обе переменные следует

умно­

жить

на

соответствующие масштабные множители, что

сде­

лает

оба члена правой

части

этого

выражения приблизительно

равными

по величине.

Пусть

 

 

 

 

 

ß i

=

1 0 ß i ,

ß j

= 10~2 ß2 ,

 

 

 

ß 2

= io-x ß2 ,

ßi = іо21-

 

Тогда члены целевой функции будут иметь один и тот же порядок

величин. После

нахождения минимума

функции

 

ф =

 

значения [оценок

bj и Ъ2 параметров ß 4

и ß 2 можно определить

по оценкам Ьу и &2 .

Из этого примера ясно, что; прежде чем пытаться минимизиро­ вать ф, целесообразно затратить некоторое время на установление правильного масштаба. Плохой выбор масштаба может привести к плохим оценкам параметров модели. Однако масштаб для нели­ нейных моделей обычно не удается выбрать так, чтобы он был

эффективным

сразу для всех

интервалов изменений независимых

переменных.

 

 

 

 

В з а и м о д е й с т в и е

п а р а м е т р о в .

Этот

термин

используется

для описания

вредного взаимного

влияния

оценки

одного параметра на оценку другого. Если один из параметров оценен некорректно и оценка другого параметра также некор­ ректна (смещена), совместное влияние этих оценок при подста­ новке их в модель может привести к весьма разумным предсказа­ ниям. Взаимодействие параметров можно заметить, исследуя крайне простую целевую функцию, в которую два параметра входят в виде сомножителей:

ф = 2 ß , ß 2 +

10.

 

 

Индивидуальные оценки параметров

ß j и

ß 2 могут

принимать

ряд значений при заданной оценке

произведения

ß i ß 2 . Таким

образом, приписывая одному из параметров

некоторое заданное


Нелинейные

модели

423

значение, другой параметр можно подобрать так, чтобы произве­ дение их получилось удовлетворительным, даже если обе оценки сильно смещены. Если имеет место взаимодействие параметров, выбор масштаба становится более трудным. Квадратичные функ­ ции, как объясняется в приложении Б . 5, можно привести к кано­ нической форме, так что член взаимодействия будет отсутствовать. Для этой цели переходят к новым координатным осям, показанным на фиг. 8.2.2 пунктирными линиями, относительно которых «квадратичная» поверхность симметрична. Например, уравнение поверхности

ф = Щ + 6ßJ + 5ß23 -

4ßiß 2

-

4 ß 2 ß 3 - 6ß, - 24ß 2 + 18ß3

+18

можно преобразовать к

виду

 

 

 

 

Ф -

is =

3ßf

+ 6ß; +

щ

 

переносом начала координат

и

поворотом

координатных

осей

(см. пример 8.2.1). В новой системе координат выбор масштаба для каждого члена намного проще осуществить, чем в первона­ чальной системе. Нелинейные (по параметрам) целевые функции

становятся

квадратичными

только

после

линеаризации

модели

с

помощью

подходящего преобразования

или

при

разложении

в

ряд Тейлора. При этом

функция

ф

определяется

выраже­

нием

(6.2.1).

 

 

 

 

 

 

 

 

 

 

 

 

 

Более тонким примером, в котором столь же существенно

взаимодействие между

параметрами,

служит модель

 

вида

т)

=

=

ßjeßa*, где

параметр

ß t

фактически

умножается на

ß 2 ,

в

чем

легко

убедиться, разлагая

экспоненту в

ряд

е&>* »

1 +

ß 2 x

+

+

V 2

2 ^) 2

+

. . . . Взаимодействие

параметров

и плохой

выбор

масштаба особенно сильно сказываются на методе наискорейшего спуска.

Чтобы оценить взаимодействие переменных, имеет смысл исследовать элементы матрицы А. Чем меньше недиагональные элементы этой матрицы по сравнению с элементами главной диа­ гонали, тем менее вероятно, что матрица А окажется вырожден­ ной, и тем меньше будет взаимодействие между параметрами.

Пример 6.3.1.("(Уменьшение взаимодействия

между параметрами

с помощью преобразования

переменных

Типичным примером нелинейного уравнения, оценивание кото­ рого осложнено взаимодействием параметров, служит уравнение Аррениуса г = ке~Е/т, а также другие подобные уравнения, в которых предэкспоненциальный множитель к и энергия актива­ ции Е являются постоянными, которые требуется оценить, а г и Г служат соответственно зависимой и независимой переменными.


424 Глава 6

Если образовать

матрицу

А

 

 

 

 

і д г

._ „-Е/Т

=

_1_

 

 

дк

е

 

 

 

 

 

 

 

 

 

д г

L

 

=

L

 

дЕ~

T

 

 

Т

 

г 1

,

 

1

" 2

 

А =

 

 

 

 

 

—т21г7

 

2 (тг)

и вычислить ее

определитель, то

 

получим

detA = A . [ 2 r ! 2 ( ^ ) 2 - ( S 4 ) 2 ] -

<а>

Так как г|, {ГІ/ТІ)2 И г 2 г являются положительными

при

любых интервалах изменения rt и 2"г, величина det А может стать

очень малой, если переменная Т% берется только для небольшого

интервала значений, и матрица А становится вырожденной,

когда

значения

двух членов в скобках приближаются друг к

другу.

С другой

стороны, если произвести преобразование

переменной

 

 

 

(б)

где Т — среднее значение абсолютной температуры,

то

пере­

менная Т* может принимать как положительные, так и отрица­

тельные

значения.

Преобразование

уравнения Аррениуса

 

 

 

 

г = кеЕТ*

= ке Ѵ

т

> = (кеЕ)

е~ЕѴт

 

(в)

позволяет сопоставить параметры

 

 

 

 

 

 

 

 

 

 

к = кеЕ

и

Е =

ЕТ.

 

 

 

 

Для

преобразованной

переменной

Т*

частные

производные

от

г по новым

параметрам равны

 

 

 

 

 

 

 

 

 

 

дк

 

к

'

 

 

 

 

 

 

 

 

-^г

= kT*eÏÏT*

 

= гТ*

 

 

 

 

 

 

 

дЕ

 

 

 

 

 

 

 

и

выражение

для

определителя

 

det А,

соответствующее

(а),

имеет вид

 

 

 

 

 

 

 

 

 

 

 

 

det А = Jg. [2

Л 2

( п П ) 1 -

( 2

да)']

*

(г>

В этом выражении второй член в скобках оказывается относи­ тельно малым, так как переменная Т* принимает как положитель-