Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 107

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Используя уравнения (243) и (241), получим

iS= o hQ (** - a) = 0 = Q/ =èо

Kx‘ -

 

1=1

 

4

 

 

Qaé*4 = Q(хП+1 -

 

Следовательно, xn+1 — а, так как

матрица

Q положительно

определенная и поэтому неособенная. Таким образом, показано, что точка хп+1 совпадает с точкой минимума квадратичной формы

(242).

Как следует из алгоритма метода Вольфа, перед началом его применения требуется провести п + 1 вычисление градиента функции. Если предварительно использовался градиентный метод, то за систему базисных точек можно взять последние итерационные точки этого метода. При совершении каждого нового шага тре­ буется вычислить градиент и значение функции всего в одной точке, т. е. существенно меньше, чем в конечно-разностном ва­ рианте метода Ньютона.

Для расширения области сходимости метода Вольфа рекомен­ дуется применять следующие меры:

1. Предотвращать слишком большие шаги. Если параметры Ягвелики (I Кі 1 20), то делается неполный шаг по направлению

хп+1. Результирующая точка * п+1 определяется соотношением

1= 1Д т £** + С1 I

)

( Д т + С1- Ч:Ч) •

1=0

 

£=0

Параметр Я выбирается как наименьшее значение, при котором удовлетворяется система неравенств:

0 < Я <

1 ,

¥ 4 т + (1 -Я )Я 1. | < 20,

і 0, I, 2, . . ., п.2

2. Во вновь полученной точке хп+х всегда проверять усло­

вие F (хп+1) s=^ max F (xl). Если это условие не выполнено, то из

І

точки хп+1 производится спуск градиентным методом до выпол­ нения этого условия. Конечная точка и вводится в систему базисных точек.

Теоретически при использовании метода Вольфа может воз­ никнуть затруднение, связанное с отсутствием решения системы уравнений (240). Такое положение, например, может возникнуть при минимизации квадратичной функции (242), когда базовые точки х°, X1, . . ., хп находятся в подпространстве размерности, меньшей п. Практический опыт применения метода Вольфа не оправдывает этого опасения, однако при появлении трудностей

104


такого типа естественно определять

параметры Х0, A,lt

. . ., Хп

не из условия (240), а из условия минимума выражения

 

2

 

V R dF(X1)

 

=

min

 

Zj Рг' dx

 

1=0

è ß,=i

t=o

 

Изложенный метод является квадратичным методом первого

порядка. В работе Лаврова

[54] предлагается сходный

по идее

метод барицентрических координат, который не требует вычисления производных функции F (X) и ограничивается только вычисле­ нием функции F (х) в некоторых точках. Разумеется, метод Вольфа легко свести к методу нулевого порядка, используя замену частных производных функции F (X) отношением конечных разностей, од­ нако метод Лаврова требует примерно в 2 раза меньшее количе­ ство вычислений значения функции для осуществления первой итерации, чем метод Вольфа.

Аналогично предыдущему при использовании метода Лаврова

выбирается система п + 1 базисных точек х°,

х1,

. . .,

 

хп и вы-

 

 

 

^

 

= 0

 

1

 

2

 

 

 

 

^— >(*\ у

,

,

, . . .

числяются значения функции в точках —.J

 

 

 

 

. . ., п). Обозначим

 

 

 

 

 

 

 

 

 

 

F4 = F { ^ T ^ \

^

/ = °.

1, 2, •

• -

«)•

 

 

 

 

 

Далее на основании решения системы (п +

2) уравнений отно­

сительно параметров X, Х0, Xlf Х2, . . .,

Х„ вида]

 

 

 

 

 

 

4 2 F^-Xj'-j-X =

Fа,

і = 0,

1, 2, . . ., п\

 

 

 

 

 

/=о

 

 

 

 

 

 

 

 

 

 

/=0

 

 

 

 

 

 

 

 

 

п

 

 

 

 

 

 

 

 

 

 

строится точка хп+1 = 2 Хсх \

которая затем

вводится в систему

1=0

 

 

 

 

 

 

 

 

 

 

базисных точек аналогично методу Вольфа. Легко показать, что для случая чисто квадратичных функций метод Лаврова дает точ­ ное решение за один шаг.

Все рекомендации по практическому осуществлению метода Вольфа непосредственно переносятся на метод барицентрических координат.

5. Метод сопряженных градиентов

Метод сопряженных градиентов, предложенный Хестеном и Штифелем в 1952 г. [132], является одним из эффективнейших со­ временных методов безусловной минимизации функций. Как бу­

105


дет показано ниже, этот метод можно рассматривать как оптималь­ ную реализацию градиентного метода применительно к квадратич­ ной функции. Метод сопряженных градиентов дает точное решение задачи минимизации произвольной квадратичной функции за п или меньшее число шагов, где п — число переменных. При этом метод сводит исходную задачу к последовательности задач мини­ мизации функций одной переменной и в процессе его применения необходимо вычислять только значение градиента исходной функ­ ции. Реализация этого метода практически не сложнее реализации метода наискорейшего спуска.

Выведем основные расчетные соотношения метода сопряженных градиентов. Пусть требуется найти точку минимума х+ для квад­ ратичной формы q (х), определяемой выражением

д(х) = ~ х*Ах + Ь*х + с,

(244)

где А — положительно определенная симметричная матрица. Зададимся точкой начального приближения х° и построим первое приближение вида

X1 = х° — а 0

dq (х0)

= х° — a 0s\

 

д х

 

где а 0 — выбирается из равенства

q (х° — ocqS1) = min q (х° ts-1). t

Обозначим через sl вектор, определяющий направление дви­

жения на t-м шаге.

В общем

случае,

если dq (х1)/дх Ф 0, то

(/ + 1)-е приближение будем строить следующим образом:

*'+■ =

-

а, ( Д Й -

+ S

w

)

=

*“ -

<м‘+\

(245)

где параметры а.

и ßj. (/ = 1, 2,

. . .,

i\

і

=

0, 1,

2 ,

.) опреде-

ляются из условия минимума:

 

(246)

до fjcO

о

Если —^ - =

0, то в соответствии с положительной опре-

деленностью матрицы А точка х1 есть точка минимума функции х‘ = х+ и итерационная процедура считается законченной.

106



Из равенств (244) и (245) легко вывести рекуррентное соотно­

шение для градиентов функции

 

в последующих

итерациях:

= Лх‘'+1 + b = Лхг + 6 _ а (Л/ +1 =

дд U0

■а[As(+1

 

 

 

дх

 

 

(247)

 

 

 

 

 

 

Учитывая выражение функции q (х) и положительную опре­

деленность матрицы А, преобразуем

условие

(246)

к виду

a i s>* (Ах1+ b ~ a tAsl+l) ~ « is,t

 

= 0,

/ =

1,

2,

. . ., t;

(si+l)* (Я ? + Ь - а ^ +

1) =

(У+Т

 

=

0.

 

Очевидно, что из условия —^

-

=4=0 следует а г =4=0.

Поэтому

вышеприведенное условие можно

представить в виде

 

 

=/ = 1, 2, . . і + 1; I - 0, 1, 2 , . . . (248)

Сопоставляя равенство (248) и тождество

дд(*0

si+l - £ ß k \

дх

которое следует из формулы (245), получим

( - ^ ) * Д М = о , , +

Иначе говоря, при реализации итерационной процедуры (245) векторы градиентов в различных итерациях взаимно ортогональны. Это указывает на конечность данной процедуры, так как в я-мер- ном пространстве не может существовать более чем я взаимно ортогональных векторов, т. е. итерационная процедура должна закончиться не более, чем за я шагов. Условие (248) при / = 1, 2, . . ., і можно также представить в виде

W

= Ы У [ Ц р -

-

« А ‘+‘) =

- « , (*')•

= 0;

 

/= = 1 , 2 , . . . , / .

*

 

Следовательно,

 

 

 

 

 

(si)* A s 1

=

0; і Ф і .

 

(249)

Это означает, что направления движения в различных итера­ циях процедуры (245) взаимно Л-ортогональны [98].

107