Файл: Методы оптимизации в статистических задачах управления..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 107
Скачиваний: 0
Используя уравнения (243) и (241), получим
iS= o hQ (** - a) = 0 = Q/ =èо |
Kx‘ - |
|
1=1 |
|
4 |
|
|
Qaé*4 = Q(хП+1 - |
|
||
Следовательно, xn+1 — а, так как |
матрица |
Q положительно |
определенная и поэтому неособенная. Таким образом, показано, что точка хп+1 совпадает с точкой минимума квадратичной формы
(242).
Как следует из алгоритма метода Вольфа, перед началом его применения требуется провести п + 1 вычисление градиента функции. Если предварительно использовался градиентный метод, то за систему базисных точек можно взять последние итерационные точки этого метода. При совершении каждого нового шага тре буется вычислить градиент и значение функции всего в одной точке, т. е. существенно меньше, чем в конечно-разностном ва рианте метода Ньютона.
Для расширения области сходимости метода Вольфа рекомен дуется применять следующие меры:
1. Предотвращать слишком большие шаги. Если параметры Ягвелики (I Кі 1 20), то делается неполный шаг по направлению
хп+1. Результирующая точка * п+1 определяется соотношением
1= 1Д т £** + С1 I |
) |
( Д т + С1- Ч:Ч) • |
1=0 |
|
£=0 |
Параметр Я выбирается как наименьшее значение, при котором удовлетворяется система неравенств:
0 < Я < |
1 , |
¥ 4 т + (1 -Я )Я 1. | < 20, |
і — 0, I, 2, . . ., п.2 |
2. Во вновь полученной точке хп+х всегда проверять усло
вие F (хп+1) s=^ max F (xl). Если это условие не выполнено, то из
І
точки хп+1 производится спуск градиентным методом до выпол нения этого условия. Конечная точка и вводится в систему базисных точек.
Теоретически при использовании метода Вольфа может воз никнуть затруднение, связанное с отсутствием решения системы уравнений (240). Такое положение, например, может возникнуть при минимизации квадратичной функции (242), когда базовые точки х°, X1, . . ., хп находятся в подпространстве размерности, меньшей п. Практический опыт применения метода Вольфа не оправдывает этого опасения, однако при появлении трудностей
104
такого типа естественно определять |
параметры Х0, A,lt |
. . ., Хп |
|
не из условия (240), а из условия минимума выражения |
|
||
2 |
|
V R dF(X1) |
|
= |
min |
|
|
Zj Рг' dx |
|
||
1=0 |
è ß,=i |
t=o |
|
Изложенный метод является квадратичным методом первого |
|||
порядка. В работе Лаврова |
[54] предлагается сходный |
по идее |
метод барицентрических координат, который не требует вычисления производных функции F (X) и ограничивается только вычисле нием функции F (х) в некоторых точках. Разумеется, метод Вольфа легко свести к методу нулевого порядка, используя замену частных производных функции F (X) отношением конечных разностей, од нако метод Лаврова требует примерно в 2 раза меньшее количе ство вычислений значения функции для осуществления первой итерации, чем метод Вольфа.
Аналогично предыдущему при использовании метода Лаврова
выбирается система п + 1 базисных точек х°, |
х1, |
. . ., |
|
хп и вы- |
||||||
|
|
|
^ |
|
= 0 |
|
1 |
|
2 |
|
|
|
|
^— >(*\ у |
, |
, |
, . . . |
||||
числяются значения функции в точках —.J — |
|
|
|
|
||||||
. . ., п). Обозначим |
|
|
|
|
|
|
|
|
|
|
F4 = F { ^ T ^ \ |
^ |
/ = °. |
1, 2, • |
• - |
«)• |
|
|
|
|
|
Далее на основании решения системы (п + |
2) уравнений отно |
|||||||||
сительно параметров X, Х0, Xlf Х2, . . ., |
Х„ вида] |
|
|
|
|
|
|
|||
4 2 F^-Xj'-j-X = |
Fа, |
і = 0, |
1, 2, . . ., п\ |
|
|
|
|
|
||
/=о |
|
|
|
|
|
|
|
|
|
|
/=0 |
|
|
|
|
|
|
|
|
|
|
п |
|
|
|
|
|
|
|
|
|
|
строится точка хп+1 = 2 Хсх \ |
которая затем |
вводится в систему |
||||||||
1=0 |
|
|
|
|
|
|
|
|
|
|
базисных точек аналогично методу Вольфа. Легко показать, что для случая чисто квадратичных функций метод Лаврова дает точ ное решение за один шаг.
Все рекомендации по практическому осуществлению метода Вольфа непосредственно переносятся на метод барицентрических координат.
5. Метод сопряженных градиентов
Метод сопряженных градиентов, предложенный Хестеном и Штифелем в 1952 г. [132], является одним из эффективнейших со временных методов безусловной минимизации функций. Как бу
105
дет показано ниже, этот метод можно рассматривать как оптималь ную реализацию градиентного метода применительно к квадратич ной функции. Метод сопряженных градиентов дает точное решение задачи минимизации произвольной квадратичной функции за п или меньшее число шагов, где п — число переменных. При этом метод сводит исходную задачу к последовательности задач мини мизации функций одной переменной и в процессе его применения необходимо вычислять только значение градиента исходной функ ции. Реализация этого метода практически не сложнее реализации метода наискорейшего спуска.
Выведем основные расчетные соотношения метода сопряженных градиентов. Пусть требуется найти точку минимума х+ для квад ратичной формы q (х), определяемой выражением
д(х) = ~ х*Ах + Ь*х + с, |
(244) |
где А — положительно определенная симметричная матрица. Зададимся точкой начального приближения х° и построим первое приближение вида
X1 = х° — а 0 |
dq (х0) |
= х° — a 0s\ |
|
д х |
|
где а 0 — выбирается из равенства
q (х° — ocqS1) = min q (х° — ts-1). t
Обозначим через sl вектор, определяющий направление дви
жения на t-м шаге. |
В общем |
случае, |
если dq (х1)/дх Ф 0, то |
||||||
(/ + 1)-е приближение будем строить следующим образом: |
|||||||||
*'+■ = |
- |
а, ( Д Й - |
+ S |
w |
) |
= |
*“ - |
<м‘+\ |
(245) |
где параметры а. |
и ßj. (/ = 1, 2, |
. . ., |
i\ |
і |
= |
0, 1, |
2 , |
.) опреде- |
ляются из условия минимума:
|
(246) |
до fjcO |
о |
Если —^ - = |
0, то в соответствии с положительной опре- |
деленностью матрицы А точка х1 есть точка минимума функции х‘ = х+ и итерационная процедура считается законченной.
106
Из равенств (244) и (245) легко вывести рекуррентное соотно
шение для градиентов функции |
|
в последующих |
итерациях: |
|||
= Лх‘'+1 + b = Лхг + 6 _ а (Л/ +1 = |
дд U0 |
■а[As(+1 |
||||
|
|
|
дх |
|
|
(247) |
|
|
|
|
|
|
|
Учитывая выражение функции q (х) и положительную опре |
||||||
деленность матрицы А, преобразуем |
условие |
(246) |
к виду |
|||
a i s>* (Ах1+ b ~ a tAsl+l) ~ « is,t |
|
= 0, |
/ = |
1, |
2, |
. . ., t; |
(si+l)* (Я ? + Ь - а ^ + |
1) = |
(У+Т |
|
= |
0. |
|
Очевидно, что из условия —^ |
- |
=4=0 следует а г =4=0. |
Поэтому |
|||
вышеприведенное условие можно |
представить в виде |
|
|
=/ = 1, 2, . . і + 1; I - 0, 1, 2 , . . . (248)
Сопоставляя равенство (248) и тождество
дд(*0 |
si+l - £ ß k \ |
дх |
которое следует из формулы (245), получим
( - ^ ) * Д М = о , , +
Иначе говоря, при реализации итерационной процедуры (245) векторы градиентов в различных итерациях взаимно ортогональны. Это указывает на конечность данной процедуры, так как в я-мер- ном пространстве не может существовать более чем я взаимно ортогональных векторов, т. е. итерационная процедура должна закончиться не более, чем за я шагов. Условие (248) при / = 1, 2, . . ., і можно также представить в виде
W |
= Ы У [ Ц р - |
- |
« А ‘+‘) = |
- « , (*')• |
= 0; |
|
/= = 1 , 2 , . . . , / . |
* |
|
||
Следовательно, |
|
|
|
|
|
|
(si)* A s 1 |
= |
0; і Ф і . |
|
(249) |
Это означает, что направления движения в различных итера циях процедуры (245) взаимно Л-ортогональны [98].
107