Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 251

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

104 М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х [О . 2

 

(J'

(«„),. J' (u„_i) — J' {и,,)) =

а „ _ 1

(/' («„), Лр„_1) ,

IJ'

( « л - 1) I2 =

 

 

 

 

=

(J7 («л—0> Pn—l)

(Цп—l)

Д

{Цп)г Pn—l)

 

 

 

 

 

 

 

 

-

ал_1 (Лр„_ь р„_0

(/г =

1, 2, ...)•

 

 

 

 

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п) ,

Дрл-х)

п =

1,2,

 

 

 

 

( П )

 

 

 

 

 

 

№ л -1 , P n -l)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Как

видим,

для

функции

(7)

‘ метод

(1) — (4)

 

при /2 =

{0},

(/Г1= {1, 2, ...} совпадает

 

с

 

методом

сопряженных

градиентов,

описанным, например, в работе [9].

 

 

 

 

 

 

 

 

Л е м м а

2. Если /2 =

{0},

/i =

{l, 2,

...}, то

для

последова­

тельностей {tin}, {Рп}, получаемых по

формулам

(1),

(2),

(9),

(11),

справедливы соотношения

 

 

 

 

 

 

 

 

 

 

 

 

(J' («(). Pi) =

0

(I >

/),

(Д («О, Д («0) = 0

(t

 

/),

 

 

 

 

 

(Pi. APj) =

 

0

(iф j),

i, j =

0, 1, 2, . . .

 

 

 

 

(12)

 

Д о к а з а т е л ь с т в о

проведем по индукции. Имеем (Д(«х), р0) =

=

(Д(«х), Д (« о)) =

0

в силу

(5) ;

 

 

 

 

 

 

 

 

 

 

 

 

И Р х . Ро) =

(Pi. АРо) =

Ы — PiPo. АРо) =

 

0

 

 

в

силу

(11).

Предположим,

что

равенства

(12) доказаны

для ^всех

I,

/ < «

при некотором « >

1

и покажем, что (12) тогда

будут верны

при всех i, / < « - 1 - 1 .

Для

этого достаточно доказать,

что

 

 

(Ия+i), рг) = (Л («„+,), Д (up) = (р„+1, Лр,)]= 0, t = 0, 1, . . . , п.

Сначала убедимся в том,

что (Д («„+i), р;) = 0. При W — п

это сле­

дует из (5), а при

с учетом (10) и предположения

индукции

будем иметь

 

 

(7' (ы„+1), р;) = (Л («„) — а„Лр„, р;) = 0.fJ

Тогда

(Л («„+1), 7' («,)) = (Л («„-и), рг + PiPi-i) = 0!)’

при i = 1 ,■2, .. •, п и при i = 0

 

(J' («л+l),

Л («о)) = (Л (fi/l+l)i Ро) = 0.

Наконец,

с учетом (2), (10) и

предположения индукции при'всех i,

0 -< i < п

имеем

 

 

(Лр„+ь р£) = (р„+ь Лрг) = (Л («л+0 — pn+ip„, Лр(.) =

=

(Л («л+i), Лр,) =

(Л («„+]), Л («г) — Л («г+i)) = 0,

 

 

а,-

 


§

7]

 

Метод сопряженных градиентов

 

 

105

а

в случае i =

n

(рп+ь Арп) = (/' (ип+\) — pn+iPn> Ар„) = 0

в силу

формулы (И ). А

 

 

 

 

 

 

 

 

 

Т е о р е м а

1.

Если

/2 = {0}, / ]= {1 , 2, . . . },

то

метод

сопря­

женных градиентов для

квадратичной

функции

(7)

сходится к

точке минимума не более, чем за tn шагов

размерность и).

 

Д о к а з а т е л ь с т в о .

Как следует

из

леммы 2, последова­

тельность У '(ип)}, получаемая методом сопряженных градиентов,

ортогональна: (/'(ы,-), 1 '( щ ))= 0 ( i^ j, i, /=0, 1, 2, . . . ) . Однако в m-мерном пространстве не может быть более чем т ненулевых взаимно ортогональных векторов. Следовательно, найдется наи­ меньший номер п, 0-^.п^.т , такой, что J'(u n) = 0 . Так как /(и) — выпуклая функция, то ип— точка минимума функции (7) в Ет. А

3.

 

Рассмотрим метод сопряженных градиентов для сильно в

пуклых функций.

 

 

J (и) — сильно

 

 

 

 

 

 

Ет,

Т е о р е м а

2.

Пусть

 

выпукла

на

J (и) <=С1(Ет) , и

\J'{u)—J'(v) \ ^ Ь\иv\

при

всех

и, а е £ т ,

L = const. Тогда

при любом

выборе

множества

индексов

h ,

0е / 2

и любом начальном приближении и0 для

последовательности

{«„}

из (1 )— (4)

справедливы оценки

 

 

 

 

 

 

 

 

 

 

0 <

а п=

J («„) — J* < a0qn, \ип — и‘ |2 <

a0qn, п =

0,

1, . ••, (13)

 

 

 

 

 

 

 

 

 

 

И-

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J" —

 

inf

 

=

 

< 7 = 1 -

 

L2)

,

0 < ? < 1 ,

 

 

 

 

и € Е т

 

 

 

 

 

2L (р2 +

 

 

 

 

 

 

 

р — константа из

(1.12).

 

 

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Из

теоремы

1.7 следует,

что

нижняя

грань /(и)

 

на Е т конечна

и достигается в

единственной точке и*:

/ (и *)= / *.

 

Функция g n ( a )

= J (ип— арп)

при рпФ 0 также сильно

выпукла при а 13г0 ,

поэтому

an

из условия

(3)

определяется одно­

значно.

Можно

считать,

что

рп¥=0, а п> 0,

/'(.«„)

0

 

при

всех

п = 0, 1, ...

,

ибо в противном случае J'{iin) — 0,

и ип= и*

— точка

минимума.

 

В силу

выбора

a„: J(u n+i) ^

J (ип— арп) при всех

а ^ 0 . Поэтому с помощью формулы

(1.18)

при v =

un, и= ипа р п

будем иметь

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J (Цп)

J ( u n + l)

^

j (Цп)

{Цп

 

ЫРп)

 

 

 

 

 

 

 

 

 

> a (J' (ип), рп) -----'EL. |

|3,

а > 0 .

 

 

 

 

 

Используя

второе равенство

(5),

отсюда получаем

 

 

 

 

 

J (и„) J

(ип+1) > а |J' (и„) |2 —

a2L

[р„|2,

a > 0 ,

л =

0,

1,

. . .

(14)

2


106

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х

ПЕРЕМЕННЫ Х

[Гл. 2

Далее докажем оценку

 

 

 

 

 

 

vL|p„|2<

|/'(«„) |2, у =

*

,

п = 0, 1, . . .

 

(15)

 

 

L (1 + L-p, 2)

 

 

 

По теореме 1.4

(/' (ип)

 

 

р |

 

|2, а

так как

ипип-\— an_i/?„_i, то с

учетом

соотношений

(5),

(6)

имеем

ра2_, |рп- 1 12

< а;г_ , (/' (и„_i),

p„_i)

=

a„_i |/' (u„_i)

|2,

или

pa„_i |p„_i |2 < |J' («„_i)|2. Тогда из (4)

to | I J' (un) I L I ип — un_i 1 ^ - 1

J' (un) I Lo.n-i I Pn-i I

_

L,

\J' (un) |

I Ря I

 

* т// \(Л

^

 

 

,

 

,9

'

|X

.

, 9

 

 

U

(“n-l)|S

 

 

 

p-a,,,! I

 

I2

I Pn-l I

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

| M lP n - l| < — \J'{Un)\.

 

 

 

 

 

 

 

 

 

 

 

V-

 

 

 

 

 

 

 

Подставим это неравенство в

(6)

и получим

 

 

 

 

I РпI2=

I J' (un) Is +

Рд I Рп-: I2<

(1 +

 

|J' («„) Г,

 

что равносильно

(15).

 

 

 

 

 

 

 

 

 

 

 

Теперь нетрудно доказать оценки (13).

С

учетом

неравенства

(15) и (14)

имеем апап+1 >

cz ^ 1

Ц'(«„)|2 при любых а > 0 .

Следовательно,

 

 

 

 

 

2v

J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ап — ап+1 >

max а ( 1 —

 

|J' (ы„) |2 =

 

\J'.(u„)\2

(п — 0,

1, . . . ) .

Но |J' (un) I2 >

\хап (см. теорему

1.6),

 

поэтому

ап — an+i >

^ ~ -аП,

илиап+1 < ^ 1 -----y ^ ^ an = qa,„

(л = 0 , 1 , . . . ) . Отсюда

имеем а п <

(л =

0,

1, . ■•)• Вторая из оценок

 

(13)

немедленно следует из

первой оценки и

неравенства

(1.15) при u =

un.

Остается заметить,

что 0 < < 7 < 1 ,

ибо р < L (см. замечание к теореме 1.5). ^

 

4.

В

заключение

заметим,

что

для'

минимизации гладк

функции J (и)

на замкнутом

выпуклом

множестве

1]ф Е т можно

использовать метод проекции сопряженных градиентов по схеме:

ип+\ = Ри(ипa-nPn) (n = 0 ,

1; .. . ), где

рп определяется согласно

(2), (4), величина ап> 0

выбирается

из условия

монотонности

J(u n)^J(u-n+\)■ Этот метод позволяет

за конечное

число шагов

найти точку минимума квадратичной функции (7) на параллелепи­ педе [190]; в общем случае сходимость метода проекции сопряжен­ ных градиентов, по-видимому, не исследована.


S «]

 

 

 

 

 

 

Метод Ньютона

 

 

 

 

 

 

 

 

107

Упражнения. 1. Показать, что точка ип, полученная методом

сопряженных градиентов для функции

(7)

при / г = {0 },

есть точка

минимума J (и) на гиперплоскости, проходящей через

точку

и0 и

натянутой

на векторы {/'(«й)}

(&= 0,

1, . . . ,

п— 1).

 

Опираясь на

лемму

2, выяснить

геометрический

смысл

метода

сопряженных

градиентов [19].

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2.

 

 

Описать

метод

сопряженных

градиентов

для

функц

J(u ) =

 

\Au—b |2

из упражнения 1.16.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

§

8. МЕТОД НЬЮТОНА

 

 

 

 

 

 

 

1.

 

Пусть функция / (u )^ C 2(U) , где

U — заданное

множес

в Ет, в частности, может быть

U = E m. Для

решения

задачи

ми­

нимизации J (и) на

U можно использовать метод Ньютона, заклю­

чающийся

в

следующем

[155].

Пусть

взято

некоторое

начальное

приближение u0^.U. Если уже

известно

n-е

приближение ип-, то

приращение функции J ( u ) ^ C 2(U)

в точке ип можно

представить

в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J ( и )

J

 

 

= ( J ’ ( « „ ) , и — ип) +

Y

(J" ( и „ )

и„),

и ип) +

 

 

 

 

 

 

 

+ о(\и — ип\у.

 

 

 

 

 

 

 

 

 

Возьмем квадратичную часть этого приращения:

 

 

 

 

 

 

 

 

 

J n (u) =

(J'(u n), и — ип) + ~^(J"(un)(u — ип),

и — ип).

 

 

Следующее

приближение

 

1

определяем

из

условия

минимума

J n{u)

на JJ:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J п (un+i) =

min J n (и).

 

 

 

 

 

 

 

(1)

 

 

 

 

 

 

 

 

 

u&U

 

 

 

 

 

 

 

 

 

 

В

случае,

когда

и =

Еф

в точке

минимума

J n (u)

на U

произ­

водная

j'n (и) = J' (ип) + J" (ип) (иtun)

обращается в

 

нуль,

т.

е.

f n (un+l) = J' (ип) + J" (ип) («п+1 ип) = 0.

Если

 

матрица

J" уип)

не­

вырождена,

 

то

отсюда

будем

иметь

ип+\ =

ип[J" (un)]~l J ' (ип),

п — 0,

 

1 , . . . .

Как

видим,

в

случае U = Em описанный

итера­

ционный. процесс превращается в хорошо известный метод Нью­ тона [19] для решения уравнения //(и )= 0 , определяющего стацио­ нарные точки функции /(ц). Отсюда происходит название метода и в общем случае.

Будем

предполагать,

что

имеется

некоторый эффективный

алгоритм

для решения

задачи (1)

при каждом п = 0, 1, 2,....

В случае

£ / = £ т таким

алгоритмом может служить метод сопря­

женных градиентов, описанный

в предыдущем параграфе, а- так:


108

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х

же различные другие методы (см., например, [19]) решения систем

линейных

алгебраических уравнений

J'{u n) + J" (u n) (un+i—un) = 0 .

В случае

U=^=Em при решении задачи

(1) можно воспользоваться

одним из методов, описанных в предыдущих параграфах.

Нужно заметить, что задача (1)

в общем случае может ока­

заться весьма трудоемкой. Но несмотря на это, применение метода Ньютона во многих случаях оправдано, ибо он сходится значи­ тельно быстрее, например, градиентных методов, если только на­ чальное приближение выбрано Достаточно близко к искомой точке минимума функции. Обычно метод Ньютона и его модификации применяют на завершающем этапе поиска минимума, когда с по­ мощью каких-либо более 'грубых, но менее трудоемких методов уже найдена некоторая точка, достаточно близкая к точке мини­ мума.

Т е о р е м а

1.

Пусть

J (u ) ^ C 2(U)

на

выпуклом замкнутом

множестве

U ^ E m,

пусть

р|£|2<

(/ "(« )ё,

£)

при всех

и

u^ U , и

\\J"(и )— /"(и) ||<^L|u— v\

при

всех

и,

v^ U ,

где р, L

некоторые положительные константы. Тогда

задача

 

(1)

разреши­

ма при всех п — 0,

1, ... Кроме того, если

начальное

приближение

Ыо выбрано так,

что q = —

[

— Ио|<1,

то имеет место следующая

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оценка скорости сходимости метода Ньютона:

 

 

 

 

 

 

 

 

 

оо

 

 

 

 

 

 

 

 

 

 

K - « * K - f - £ < 7 24

 

 

 

 

 

 

 

 

 

где и — точка минимума J

(и) на U.

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

По условию

(/"(«)£,

|)^ р | ё|2 при всех

u e t i и

 

 

p = co n st> 0 .

Отсюда и

из теоремы

1.5 вытекает,

что функция J (и) сильно выпукла на U, и, следовательно, соглас­

но теореме 1.7 ограничена снизу на U

и достигает своей нижней

грани

в

единственной

 

точке

u *^ U .

 

Далее,

поскольку

J п (и) =

J" (ип),

то

функция J n (u)

также сильно выпукла на U и

достигает своей

нижней

грани

в единственной

точке

un+i^ U .

Таким образом, задача (1) всегда имеет и

притом

единственное

решение. Применив теорему 1.3 к

функции J n (u),

получим

(J'n{un+X), и ип+1 ) > 0 ,

u £ U ,

 

п = 0,

1 , . . .

(3)

Так как

J n(u) =

J'(u n) + J''(u„)(u ип),

то (3)

перепишется в виде

(J' (ип) + J" (u n) (un+i — un),

и — ип+{) > 0,

 

u £ U ,

 

п =

0 , 1 , . . . .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4)

Может случиться, что ип+\= ип. Тогда и* = ип+х= ип. В самом, деле, в этом случае из (4) имеем (J'(un), и— « „ )^ 0 , ыеС/. Со­