Файл: Химмельблау Д. Анализ процессов статистическими методами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 750

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Нелинейные

модели

407

Тогда

А< 0 ) = ( X r w X )(0) .

2"" ( ж ) 0

( ж ) о

"

a £ ) 0 ( o ß | ) 0

 

 

i=l

 

п

 

 

 

\ ößi to

Vdßm ) {

•• 2

(^)о(жг)

Ц=1

 

 

 

i=l

Z<°) = (Xr wE)( 0 > =

и уравнения (6.2.14) в матричной записи будут иметь вид

(XrwX)<°> В<°» = (Хт\ѵЕ)<°>,

(6.2.15)

или

 

А<0>В<°> == Z'°\

 

так что

 

 

 

 

В ( 0 ,

=

oo>Z<°),

(6.2.16)

где С( 0 ) == ( А ( 0 ) ) _ 1 .

Отметим

тесную связь между

выкладками,

проведенными

здесь и

в разд. 5.1.

 

После того

как

по

формуле

(6.2.16) вычислен

вектор В< 0 > ,

можно получить новые оценки для каждого из параметров ß^-,

повторяя

предыдущие

вычисления, причем

вместо &(°> в выраже­

ние (6.2.16)

и в матричные элементы Xtj

подставляются bf\

улучшенные

оценки ßy-. Для вычисления Uf

используется рекур­

рентная

формула

bJn+1> = b5n) + Äjn>AbSn),

 

где hj—«ускоряющий

(6.2.17)

множитель», т. е. множитель, введенный

исследователем для ускорения поиска минимума ф. Действитель­ но, значения А ^ о п р е д е л я ю т направление поиска минимума ф в пространстве параметров, a hj задает размер шага. В методе Гаусса — Зайделя полагают hj == 1. Множитель hj, который используется с большой эффективностью, можно подсчитать следующими способами:

1. Выбирают длину каждого шага вдоль вектора В пропор­ циональной наклону аппроксимирующей плоскости для целевой функции ф.


408

Глава 6

2. Выбирают постоянный размер шага до тех пор, пока не будет замечено увеличение ф.

3.Для определения положения наинизшей точки вдоль направления, определяемого вектором В, применяется метод поиска Фибоначчи г ) .

4.Используют некоторое кратное, большее или меньшее еди­ ницы, от первоначально выбранного размера шага, пропорцио­ нальное числу предыдущих успешных шагов в данном координат­ ном направлении.

Ф

Ф и г . 6.2.5. Влияние начального п р и б л и ж е н и я дл я ß на:

1) сходимость

суммы квадратов

отклонений к относительному минимуму (сплошная линия)

и 2) колебания

ф при поиске (пунктир) и последующую

расходимость.

Введение корректирующего множителя hj объясняется тем, что определение минимума можно автоматически ускорить или замед­ лить, увеличивая скорость приближения к минимуму ф на началь­ ной стадии поиска, а также уменьшая ее в конце, чтобы избежать излишних колебаний. Последовательные приближения для векто­ ра В вычисляются до тех пор, пока каждая из разностей Аб^ не станет достаточно малой и (или) абсолютное или относительное изменение ф не будет меньше некоторого заранее выбранного числа, после чего поиск минимума ф прекращается.

Теперь следует упомянуть некоторые практические трудности,

которые возникают

при этой процедуре.

1.

Каким образом

можно выбрать разумные начальные оценки

O j 0 ) ?

Так как функция ф нелинейна, она может иметь несколько

минимумов — в этом отличие рассматриваемой ситуации от линей­ ного анализа гл. 5. Следовательно, если начальные оценки пара­ метров будут слишком далеки от значений, минимизирующих ф, поиск может быть прекращен не на абсолютном, а на одном из относительных минимумов ф. На фиг. 6.2.5 на двумерной картине

х ) Поисковый метод с использованием чисел Фибоначчи описан, в част­ ности, в книге Воробьева Н . Н . , Числа Фибоначчи, изд-во «Наука», 1969.—

Прим. ред.


Нелинейные

модели

409

показано, что может случиться при плохом выборе

начального

вектора Ь ( 0 ) . Одно из предложений,

позволяющих сделать разум­

ные начальные предположения о ß^, состоит в том, чтобы предста вить отклик в виде функции одной переменной, полагая другие переменные фиксированными, и взять некоторое асимптотическое значение или другое выделенное значение в качестве Щ\ Началь­ ные значения других параметров тогда можно выбрать на основе

этих

полученных значений.

Приближенные

значения параме­

тров

ß;- часто бывают известны

из предыдущих

расчетов или опре­

деляются из физических соображений. В конце концов можно просто испытать несколько исходных векторов Ь( 0 ) из некоторого

разумного

интервала и убедиться, приводят ли

они к одному

и тому же

значению минимума

ф~. Другие методы получения

начальных

оценок параметров

описаны

в работе [8].

2. Целевая функция или

ее

первые

частные

производные

в области поиска минимума ф могут стать неограниченными. Осо­ бенно критичными в этом отношении являются модели с поли­ номами в знаменателе, например модель

ßo -г ßl^l

?>2xl+?>Sx2 '

в которой как функция и, так и ее частная производная по ß 2

 

 

ді) =

(ßo+ßi^i)^

 

 

 

 

2

( ß 2 ^ + ß 3 X 2 ) 2

 

 

обращаются в

бесконечность

при Ь^хі

= —b™x2 . Преодолеть

эту трудность можно,

лишь ограничивая

область поиска

для ßj

и (или) уделяя

особое

внимание построению модели процесса.

3. Матрица А( 0 > может стать вырожденной из-за избыточности

данных или почти вырожденной при одном или нескольких

значе­

ниях ß в процессе поиска. Эта трудность преодолевается

путем

сбора данных в соответствии с правильным планом

эксперимента.

4. Метод итераций на некоторой стадии может

привести не

к уменьшению, а к увеличению ф. Такой случай иллюстрируется на фиг. 6.2.5. Эта ситуация исправляется с помощью подходящей логической операции, вводимой в вычислительную машину, такой, как проверка на каждом цикле неравенства фіП+1) < фт, и, если оно нарушено, уменьшение множителя hj в заданное число раз.

Теперь рассмотрим пример использования метода Гаусса — Зайделя. Для него характерна медленная сходимость, если началь­ ные оценки параметров сильно отличаются от окончательных оценок, однако вблизи точки остановки этот метод сходится быстро (в отличие от метода наискорейшего спуска, описанного в следую­ щем разделе, который сходится очень медленно).



410

Глава 6

Пример 6.2.4. Применение метода Гаусса — Зайделя Для ознакомления с оцениванием по методу Гаусса — Зайделя

используем имитированные

данные.

Эти

данные, приведенные

 

 

 

Таблица

П.6.2.4а

 

Имитированные

д а н н ы е

 

 

 

V

 

 

У

 

 

 

(имитированное

 

 

(точное значение)

значение)

0,0

0,0

3,0

 

 

2,93

0,0

1,0

' 1,82

 

 

1,95

0,0

2,0

1,10

 

 

0,81

0,0

3,0

0,67

 

 

0,58

1,0

0,0

6,00

 

 

5,90

1,0

1,0

4,82

 

 

4,74

1,0

2,0

4,10

 

 

4,18

1,0

2,0

4.10

 

 

4,05

2,0

0,0

9,00

 

 

9,03

2,0

1,0

7,82

 

 

7,85

2,0

2,0

7,10

 

 

7,22

2,5

2,0

8,60

 

 

8,50

2,9

1,8

9,92

 

 

9,81

в

табл. П.6.2.4а, были получены путем

прибавления к

функции

л

= Зжі + З е _ 1 / г ж 2

случайных

ошибок

со средним

значением,

равным нулю, и

с дисперсией 0,01.

 

 

 

 

Теперь забудем

о том, как

были подготовлены

эти

данные,

и просто воспользуемся ими, чтобы оценить параметры известной

(или

предполагаемой) модели

 

 

 

 

 

 

 

т)

= ß i S i

+ ß 2 e p 3 X 2 ,

(а)

минимизируя функцию

 

 

 

 

 

 

 

 

Ф= S C F i - ß i X i - ß a e B ^ .

(б)

 

 

 

і=1

 

 

 

оценки Ь \ Й \

Прежде

всего

необходимо

выбрать

начальные

Ь { 2 Т

и fr(3°\

Можно

было

бы,

например,

положить

 

 

 

 

Ь(о)

= 6> =

ь<о) = !

 

 

или

 

 

 

 

 

 

 

 

Вместо этого для иллюстрации получим эти оценки вблизи истин­ ного минимума с помощью некоторого предварительного графиче­ ского построения. Из выражения (а) следует, что если переменную

х2 поддерживать постоянной, можно

получить

прямую линию,

угловой коэффициент которой {дг\Ідхі)Х2

равен ß 4

. На фиг. П.6.2.4а

представлены графики зависимости Y

от х^ для ряда различных