Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 757
Скачиваний: 2
420 |
Глава |
6 |
«менее |
вытянутой»: |
|
|
А*} — |
\i\jAij, |
Здесь символ * означает элемент в измененном масштабе, а мас штабный множитель \І = (АЦ)~^12. Элементы вектора В* пере водятся обратно в элементы вектора В заменой
Однако в работе [15] показано, что рекомендуемое изменение масштаба полностью эквивалентно замене матрицы I в выраже нии (6.2.19) на диагональную матрицу D:
|
|
(А + |
ÀD) В = Z, |
|
|
(6.2.20) |
составленную |
из элементов, |
стоящих на |
главной |
диагонали |
||
матрицы |
А = |
Х Т Х . Выражения (6.2.19) |
и |
(6.2.20) |
оказались |
|
одинаково эффективными при оценивании |
большого числа кине |
|||||
тических |
моделей. |
|
|
|
|
Метод Маркуардта был испытан и рекомендуется как весьма эффективный. Он безусловно лучше как метода Гаусса — Зайделя, так и метода наискорейшего спуска. Поскольку в точке миниму ма ф производные аналитически или численно известны, он лучше симплексного метода в том отношении, что легко позволяет полу чить последовательные оценки точности параметров. С другой стороны, симплексный метод обладает тем преимуществом, что вообще не требует вычисления частных производных от ф, что существенно уменьшает машинное время, необходимое для оцени вания. Для очень сложных моделей симплексный метод оказы вается более эффективным при оценивании параметров моделей.
Пример 6.2.6. Нелинейное оценивание методом Маркуардта
С помощью метода Маркуардта по специальной программе проводилась подгонка той же самой модели, которая использова лась в примере 6.2.3. Для различных начальных векторов пара метров при минимизации возникли некоторые трудности, так как расчет приводил к неограниченным или нулевым значениям некоторых параметров. После того как в машинную программу были введены ограничения на параметры, было получено то же минимальное значение суммы (функции) ф, что и методом прямого поиска, но большее, чем дает симплексный метод (см. пример 6.2.3). Процесс поиска показан в табл. П.6.2.6; X — параметр выраже ния (6.2.19); у — угол в градусах между направлением поиска, которое дает линеаризация модели, и направлением, полученным градиентным методом.
|
|
|
Нелинейные |
модели |
|
|
421 |
|
|
|
|
|
|
Таблица |
П.6.2.6 |
Номер |
Ф |
m |
n |
|
а |
|
V |
цикла |
|
|
|||||
0 |
1,284 |
6,00 |
25,0 |
0,500 |
1,000 |
10-2 |
27,3 |
1 |
0,831 |
1,00 |
19,2 |
0,432 |
0,760 |
Ю-з |
29,9 |
5 |
0,0284 |
3,22 |
25,1 |
0,371 |
0,722 |
10-7 |
52,3 |
10 |
0,0267 |
3,13 |
23,9 |
0,398 |
0,717 |
10-8 |
50,5 |
15 |
0,0267 |
3,13 |
23,9 |
0,398 |
0,717 |
10-8 |
50,9 |
Частные производные, полученные численно на машине, исполь зовались при оценивании, что потребовало почти вдвое большего машинного времени, чем необходимо для симплексного метода или метода прямого поиска.
Матрица (Х1 ^)""1 [которая позволяет грубо оценить корреля цию оценок параметров (см. разд. 6.4)] имела вид
1,000 |
0,047 |
0,853 |
—0,711" |
0,047 |
1,000 |
0,008 |
0,285 |
0,853 |
0,008 |
1,000 |
-0,851 |
0,711 |
0,285 |
-0,851 |
1,000. |
Для £і_а /2 » 2,00 индивидуальные доверительные пределы для параметров равнялись:
|
Нижний предел |
Верхний предел |
m |
2,65 |
3,61 |
n |
16,1 |
31,7 |
f |
0,29 |
0,49 |
а |
0,64 |
0,78 |
Совместную доверительную область можно оценить, как описы вается в разд. 6.4.
6.3. Р А З Р Е Ш Е Н И Е Н Е К О Т О Р Ы Х П Р А К Т И Ч Е С К И Х Т Р У Д Н О С Т Е Й П Р И Н Е Л И Н Е Й Н О М О Ц Е Н И В А Н И И
Любой из методов минимизации суммы квадратов отклонений, описанных в разд. 6.2, может не обнаружить абсолютный минимум из-за: 1) неверных начальных предположений о параметрах и (или) 2) неограниченности целевой функции, как указывалось
вразд. 6.2.
Вэтом разделе обсуждаются дополнительные трудности, кото рые могут проявиться все вместе или по отдельности. Ими являют
ся |
неправильный |
выбор масштаба, |
взаимодействие |
параметров |
|
и |
эффект |
нуля. |
|
|
|
422 |
Глава 6 |
Н е п р а в и л ь н ы й |
в ы б о р м а с ш т а б а . Масштаб |
ные трудности могут возникнуть, когда значение одного из членов целевой функции сильно отличается по порядку величин от дру гого члена. В таком случае целевая функция оказывается нечув ствительной к изменениям значений параметров малого члена. Например, функция
ф = lOOßJ - 0,010ß2 2
может оказаться нечувствительной к изменениям параметра ß 2 , если значения последнего в соответствующих единицах измере ния не оказываются намного больше значений ß t . Если же ß 2 и ß t
одинаковы по величине, |
одну или обе переменные следует |
умно |
|||||
жить |
на |
соответствующие масштабные множители, что |
сде |
||||
лает |
оба члена правой |
части |
этого |
выражения приблизительно |
|||
равными |
по величине. |
Пусть |
|
|
|
||
|
|
ß i |
= |
1 0 ß i , |
ß j |
= 10~2 ß2 , |
|
|
|
ß 2 |
= io-x ß2 , |
ßi = іо21- |
|
Тогда члены целевой функции будут иметь один и тот же порядок
величин. После |
нахождения минимума |
функции |
|
ф = |
|
значения [оценок |
bj и Ъ2 параметров ß 4 |
и ß 2 можно определить |
по оценкам Ьу и &2 .
Из этого примера ясно, что; прежде чем пытаться минимизиро вать ф, целесообразно затратить некоторое время на установление правильного масштаба. Плохой выбор масштаба может привести к плохим оценкам параметров модели. Однако масштаб для нели нейных моделей обычно не удается выбрать так, чтобы он был
эффективным |
сразу для всех |
интервалов изменений независимых |
||
переменных. |
|
|
|
|
В з а и м о д е й с т в и е |
п а р а м е т р о в . |
Этот |
термин |
|
используется |
для описания |
вредного взаимного |
влияния |
оценки |
одного параметра на оценку другого. Если один из параметров оценен некорректно и оценка другого параметра также некор ректна (смещена), совместное влияние этих оценок при подста новке их в модель может привести к весьма разумным предсказа ниям. Взаимодействие параметров можно заметить, исследуя крайне простую целевую функцию, в которую два параметра входят в виде сомножителей:
ф = 2 ß , ß 2 + |
10. |
|
|
Индивидуальные оценки параметров |
ß j и |
ß 2 могут |
принимать |
ряд значений при заданной оценке |
произведения |
ß i ß 2 . Таким |
|
образом, приписывая одному из параметров |
некоторое заданное |
Нелинейные |
модели |
423 |
значение, другой параметр можно подобрать так, чтобы произве дение их получилось удовлетворительным, даже если обе оценки сильно смещены. Если имеет место взаимодействие параметров, выбор масштаба становится более трудным. Квадратичные функ ции, как объясняется в приложении Б . 5, можно привести к кано нической форме, так что член взаимодействия будет отсутствовать. Для этой цели переходят к новым координатным осям, показанным на фиг. 8.2.2 пунктирными линиями, относительно которых «квадратичная» поверхность симметрична. Например, уравнение поверхности
ф = Щ + 6ßJ + 5ß23 - |
4ßiß 2 |
- |
4 ß 2 ß 3 - 6ß, - 24ß 2 + 18ß3 |
+18 |
|
можно преобразовать к |
виду |
|
|
|
|
Ф - |
is = |
3ßf |
+ 6ß; + |
щ |
|
переносом начала координат |
и |
поворотом |
координатных |
осей |
(см. пример 8.2.1). В новой системе координат выбор масштаба для каждого члена намного проще осуществить, чем в первона чальной системе. Нелинейные (по параметрам) целевые функции
становятся |
квадратичными |
только |
после |
линеаризации |
модели |
||||||||||
с |
помощью |
подходящего преобразования |
или |
при |
разложении |
||||||||||
в |
ряд Тейлора. При этом |
функция |
ф |
определяется |
выраже |
||||||||||
нием |
(6.2.1). |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Более тонким примером, в котором столь же существенно |
||||||||||||||
взаимодействие между |
параметрами, |
служит модель |
|
вида |
т) |
= |
|||||||||
= |
ßjeßa*, где |
параметр |
ß t |
фактически |
умножается на |
ß 2 , |
в |
чем |
|||||||
легко |
убедиться, разлагая |
экспоненту в |
ряд |
е&>* » |
1 + |
ß 2 x |
+ |
||||||||
+ |
V 2 |
(ß 2 ^) 2 |
+ |
. . . . Взаимодействие |
параметров |
и плохой |
выбор |
масштаба особенно сильно сказываются на методе наискорейшего спуска.
Чтобы оценить взаимодействие переменных, имеет смысл исследовать элементы матрицы А. Чем меньше недиагональные элементы этой матрицы по сравнению с элементами главной диа гонали, тем менее вероятно, что матрица А окажется вырожден ной, и тем меньше будет взаимодействие между параметрами.
Пример 6.3.1.("(Уменьшение взаимодействия |
между параметрами |
с помощью преобразования |
переменных |
Типичным примером нелинейного уравнения, оценивание кото рого осложнено взаимодействием параметров, служит уравнение Аррениуса г = ке~Е/т, а также другие подобные уравнения, в которых предэкспоненциальный множитель к и энергия актива ции Е являются постоянными, которые требуется оценить, а г и Г служат соответственно зависимой и независимой переменными.
424 Глава 6
Если образовать |
матрицу |
А |
|
|
|
|
і д г |
._ „-Е/Т |
= |
_1_ |
|
|
дк |
е |
|
|
|
|
|
|
|
|
|
|
д г |
L |
|
= |
L |
|
дЕ~ |
T |
|
|
Т |
|
г 1 |
, |
|
1 |
" 2 |
|
А = |
|
|
|
|
|
—т21г7 |
|
2 (тг) |
||
и вычислить ее |
определитель, то |
|
получим |
detA = A . [ 2 r ! 2 ( ^ ) 2 - ( S 4 ) 2 ] - |
<а> |
Так как г|, {ГІ/ТІ)2 И г 2 /Г г являются положительными |
при |
любых интервалах изменения rt и 2"г, величина det А может стать
очень малой, если переменная Т% берется только для небольшого |
|||
интервала значений, и матрица А становится вырожденной, |
когда |
||
значения |
двух членов в скобках приближаются друг к |
другу. |
|
С другой |
стороны, если произвести преобразование |
переменной |
|
|
|
|
(б) |
где Т — среднее значение абсолютной температуры, |
то |
пере |
менная Т* может принимать как положительные, так и отрица
тельные |
значения. |
Преобразование |
уравнения Аррениуса |
|
||||||||
|
|
|
г = кеЕТ* |
= ке Ѵ |
т |
> = (кеЕ) |
е~ЕѴт |
|
(в) |
|||
позволяет сопоставить параметры |
|
|
|
|
|
|
||||||
|
|
|
|
к = кеЕ |
и |
Е = |
ЕТ. |
|
|
|
||
|
Для |
преобразованной |
переменной |
Т* |
частные |
производные |
||||||
от |
г по новым |
параметрам равны |
|
|
|
|
|
|
||||
|
|
|
|
дк |
|
к |
' |
|
|
|
|
|
|
|
|
|
-^г |
= kT*eÏÏT* |
|
= гТ* |
|
|
|
||
|
|
|
|
дЕ |
|
|
|
|
|
|
|
|
и |
выражение |
для |
определителя |
|
det А, |
соответствующее |
(а), |
|||||
имеет вид |
|
|
|
|
|
|
|
|
|
|
||
|
|
det А = Jg. [2 |
Л 2 |
( п П ) 1 - |
( 2 |
да)'] |
* |
(г> |
В этом выражении второй член в скобках оказывается относи тельно малым, так как переменная Т* принимает как положитель-