Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 250

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

100

М И Н И М И З А Ц И Я Ф У Н К Ц И Й М НОГИ Х ПЕРЕМЕННЫ Х

[ Г л . 2

где Г =

inf J (и), а В >■ 0 — некоторая константа, не зависящая от п.

 

иеи

 

Д о к а з а т е л ь с т в о . Сначала покажем, что при выполнении условий теоремы величину а п из (8) можно искать в виде [82, 155] an==YnPn, где

• - min ( l ; - L - - — ),

0 < e i < V „ < 2(1~

e)-

(« = 0 , 1 , . . . ) , (Ю)

l

I

- UnP J

 

 

 

 

L

 

 

 

a e, Sj — заданные параметры алгоритма,

0<^е1 <

2 ^ ~ е^г 0<<в<<1.

Возможно,

или

 

 

 

 

 

 

 

 

 

Р„ =

К

I J п(Цп) 1

> ИЛИ

1J п(цп) |

<Р„ =

[ ^п (Цп) |

J

_

 

D 2

 

 

 

 

 

IUn Un Р

 

 

 

 

 

\ и п и п

 

где D — диаметр множества U. В

обоих

случаях

имеем

 

0 < P n —

~ -

< 1 ;

min | l;

■' ^

--'j <

Р„ < 1 (л =

0 , 1 , . . . ) .

 

 

 

 

 

 

 

 

 

 

( И )

Заметим, что

если ип= ип или / п (« л )= 0,

то ип — стационарная

точка. В этом случае, как уже говорилось выше, итерации прекра­ щаются и при необходимости проводится дополнительное изуче­

ние поведения функции в_ окрестности

точки

В дальнейшем

будем предполагать, что ипф и п> J n(un) # 0 .

 

 

Из формулы (1.18) при v = и„, « =

«„4-1 имеем

 

J . K ) J

(“п+1) >

a n\JnЮ |-------I ипип |2 =

 

= « J

J а (“я) I

2

I Jn (Ия) | )

 

 

 

 

Отсюда с учетом (10— 11)

получим

 

 

 

J(u n) — J (Ия+ i) > о л |/л (йя)|^1 —

>

ССПЕ I J n (йп) I >

 

> e 1e m

i n | l ; ^ ^ i | | 4 ( « n)| (« =

0 , 1 , . . . ) .

(12)

Повторяя рассуждения, аналогичные проведенным в доказатель­ стве предыдущей теоремы,' из (12) имеем /п (йп)->-0 («->-оо), а также убеждаемся в том, что в случае выпуклости /(«) последо­ вательность {«л} будет минимизирующей.


§

7]

 

 

Метод

сопряженных градиентов

101

 

Так как

 

J n («„)-»• 0, то

 

 

 

 

 

 

 

 

 

т1П { 1; ~БГ I Jn (“»)l} =

 

i Jn[fan)\

 

при)£всех) п >

п0,

и неравенство

(12) перепишется в

виде

 

 

 

 

а п ап+х > -ЦЧ J n fan) |2, п >

п0.

 

Согласно оценке

(6) |/л (ы„) |>

а„,

поэтому

 

 

 

 

 

 

an — an+i > - ^ - a 2n ,

 

п > п 0.

 

С

помощью леммы 1.2

отсюда имеем

 

 

 

 

 

 

 

 

ап <

D2

»о Ч~ 1

« > л 0;

 

 

 

 

 

евх

 

п

 

 

 

 

 

 

 

 

 

 

 

 

в

оценке'(9)

остается

принять Д =

т а х / - ^ —;

<з01

(я0 + 1 ) . А

 

 

 

 

 

 

 

 

 

(

ева

/

 

 

Упражнение. Описать различные варианты метода условного

градиента

для

функций

J

(и)

упражнений

1.15— 16, когда

U = {и : |п— их| < ^ },

или

U = {и : а^ Щ г^ р ,-,

i = l , . . . , m},

щ ^ Е т, R, a*,

pi

заданы.

 

 

 

 

 

 

 

 

Написать оценки

(4),

(9)

с указанием явных выражений для

констант С,

В через данные рассматриваемой задачи.

§7. МЕТОД СОПРЯЖЕННЫХ ГРАДИЕНТОВ

1.Пусть функция J(u)<=Cl (Em). Для минимизации этой фу ции на всем пространстве Ет можно использовать метод сопря­ женных градиентов, суть которого заключается в построении сле­ дующего итерационного процесса. Пусть начальное приближение и0 известно. Далее строим последовательность {ип} по правилам

^л+1

CLnрп (П

0,

1, •••),

( 1)

Ро ^ fao) > Р п

J

fan)

РлРл—1

fa == 1, 2, •■•),

(2)

где величины ап, рл выбираются из условий

 

 

g n (ап) = min gn (a),

gn (а) =

J (ипарп)

(3)

а>0

 

 

 

 

 

 

и

 

 

 

 

 

 

 

(J'

п), J ' (M n -i)

J ' fan))

п £ 1 !,

 

Р„ =

 

1г (Ия- i ) Is

 

 

(4)

 

 

 

 

о, « 6 / 2,


102

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О Г И Х П ЕРЕМЕННЫ Х

а. 2

а множества индексов /2 таковы, что /iU^2 = {0, 1, 2, . . . } ,

0е / 2.

В зависимости от выбора множеств /i, /2 молено получить различ­ ные варианты метода сопряженных градиентов. В‘ частности, если

/ i — 0 ,

/2= {0, 1,

2, . . . },

то Рп= 0 при всех п, и метод превратится

в уже

известный

нам

метод скорейшего

спуска.

Если

/2 = {0},

/i = {l,

2, . . . }, то получим обычный, классический вариант метода

сопряженных градиентов. Если /2= { 0 , s,

2s, 3s, . . . },

то

придем к

так называемому s -шаговому методу скорейшего спуска

(на прак­

тике часто принимают s, равным размерности и). Те значения п,

для которых Р« = 0, называют моментами обновления метода.

Оче­

видно, что J (ий)

1)

(ип)^ -. ■.

 

Оказывается,

метод

сопрялсенных градиентов сходится,

вооб­

ще говоря, быстрее градиентного метода и в то лее время нена­ много сложнее метода скорейшего спуска. Более того, для задачи минимизации квадратичной функции метод сопряженных градиен­ тов в отличие от градиентных методов сходится за конечное число шагов (см. ниже теорему 1). Отсюда следует, что эффективность метода сопрялсенных градиентов возрастает на завершающем эта­ пе поиска минимума, когда последовательные приблшкення близки к точке минимума, ибо в окрестности минимума достаточно глад­ кая функция, вообще говоря, близка к квадратичной выпуклой функции. Это обстоятельство подтверждается таклсе и практиче­ ским опытом решения конкретных задач минимизации.

Принятая здесь схема (1) — (4) метода сопряженных градиен­

тов предложена и исследована в работе [190]1; обзор

других схем

и модификаций, обсуждение практического опыта

применения

этого метода см. в работах [27, 35, 84, 149, 166, 170, 190, 235, 266].

Перейдем к исследованию сходимости метода сопрялсенных

градиентов. (1) — (4). Для этого сначала докалсем

некоторые свой­

ства последовательностей,

получаемых

по формулам (1)-— (4).

 

Л е м м а

1. Пусть

J ( u ) ^ C l (E,„).

Тогда

при любом

выборе

множества индексов Д,

/2,

лишь бы /1U/2 =

{0,

1,

2, . . . }, Of=/2,

по­

следовательности {пп}, {Рп} удовлетворяют соотношениям

 

(J'(un+l) ,p n) = О,

(J'(u n) ,p n) = \J’ (un)\z

(п =

0, 1, . . . )

(5)

и

 

 

 

 

 

 

 

 

 

|р„Г =

1^(«„)|2 +

Рл|рп-.|2 > | Д (и л)|2 (Л =

1,2, . . . ) .

 

(6)

Д о к а з а т е л ь с т в о .

Соотношения

(6)

являются

простым

следствием равенств (2), (5), поэтому достаточно доказать (5). Воспользуемся методом полной математической индукции. Так

как /?о = Д («о), то второе из

равенств

(5)

при

п = 0

очевидно, а

1 Следует заметить, что в [190]

выражение для

|3П дано с точностью до зна­

ка. Это проще всего обнаружить проверкой условия

[Арп, Рп-0 = 0 , имеющего

место для квадратичных функций^

(см. ниже

лемму

2);

эта же

ошибка по­

вторена в работе [35].

 

 

 

 

 

 


S 7]

 

Метод сопряженных градиентов

 

103

равенство

 

 

J'(u 0) ) —0

следует

из того, что

g '(a 0) = 0 при ао> 0

и

g'Q(ct-0) > 0 при а0 = 0 и формулы

(1.4).

"Пусть равенства

(5)

имеют место при некотором п^О . Пока­

жем, что тогда

(5)

 

верно и для

п + 1.

В самом деле, если

а „ > 0 ,

то согласно (3)

 

 

 

 

 

 

 

 

 

ё'пК ) =

~

(J>(ип — апРп), Рп) =

(J' (Ы/Н-l). р„) = о.

 

Если же а„ = 0,

то ип+1 = и„ и

 

 

 

 

 

0 < g'n (0) =

( j’ («„), р„) =

— (/' (иа),

J' (ип) — P„pn_l) =

 

=

— |

(«„) I2 =

— |/' (un+i) |2 < О,

 

 

следовательно, /' («„+]) =

0 и ( J ' (ип+1), рп) = 0. Наконец,

 

(J ' (Un+l)i p n + l) — { J ' (Un+l), j ' (Цл+1)

Рл+lPn) = |J '

( Lin + 1)|2- A

2.Сначала остановимся на случае квадратичной функции

J(u) = ± ( A u ,u ) - { b ,u ) ,

(7)

где Л — известная симметричная положительно определенная матрица порядка m X m , Ь— заданный вектор. К задаче миними­ зации такой функции сводится решение системы линейных алге­ браических уравнений А и = Ь . В самом деле, здесь

J' (и) = Аи Ь.

(8)

Так как J (и) — выпуклая (и даже сильно выпуклая) функция, то согласно теореме 1.3 m in/(«) будет достигаться в точке и* тогда

Еm

и только тогда,

когда / '(«*) = А и * —Ь0.

 

Для минимизации функции (7) применим метод сопряженных

градиентов.

Так как

 

 

 

8п («) =

J

(«л — арл) =

-j-

а 2 (Лрп, Рп) — a (J' («„), р„) + J Ю ,

то min g n (а)

достигается

при .

 

а>0

 

 

 

 

 

 

а = а п

( J (Цд), Рп)

I г Ы I2 > 0 , п = 0, 1,

О)

 

 

 

( Арп ,Рп)

(Арп, Рп)

 

Преобразуем выражение для (Зп. Для этого прежде всего заметим, что

J' (un) — J' (Un+l) = а пАрп, П = 0, 1, . . .

(10)

Это равенство непосредственно следует из (1), (8). Пользуясь исходными формулами (1) — (4) и равенствами (5), (10), полу­ чаем