Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 284

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

72

М И Н И М И З А Ц И Я

Ф У Н К Ц И И МНОГИХ ПЕРЕМЕННЫХ

[Гл. 2

с меньшей

«кривизной»,

наоборот, cos а„ — cos а)г_ !> 0 ,

поэтому

овражный шаг увеличится и появится возможность сравнительно быстро пройти участки с малой «кривизной», в частности, прямо­

линейные участки на «дне оврага». Если

«кривизна дна оврага»

на некоторых участках остает­

ся постоянной,

 

то

разность

cosan— cosa„_i

будет

близка

к

нулю,

и поиск

 

минимума

на

таких

участках

будет прово­

диться

с

почти

постоянным

шагом,

сформированным

с

учетом

величины

«кривизны»

при

выходе

на

 

рассматривае­

мый участок.

с

 

 

 

(7)

Параметр

в

равенстве

регулирует

 

чувствитель­

ность метода к изменению «кривизны дна оврага», и правильный выбор этого параметра во многом определяет скорость движения по «оврагу». Некоторые эвристические соображения по поводу вы­ бора с и другие аспекты применения овражного метода обсужде­

ны в работе [211].

 

 

 

 

 

Выражение (7) для

овражного шага удобнее

преобразовать

так:

 

 

 

 

 

hn+i = hncC05a’~C0san-i =

йЛ_ 1ссмв« -ео**я-з =

. . .

=

/г2сС05а*“ С05е\

откуда окончательно

 

 

 

 

 

hn+l = Kccosa", К =

h„c~cosa' = const> 0 ,

п =

2 , 3 , . . .

Другой способ ускорения сходимости градиентного метода за ­

ключается в выборе подходящей замены

переменных

u = g (Q

с тем, чтобы поверхности

уровня функции J(g(£,))

в пространстве

переменных £ были близки к сферам [251—253].

 

 

Упражнение. Опишите метод скорейшего спуска для

функций

J(u) из упражнений 1.15

и 1.16. Укажите явное выражение для an

из условия (2). Пользуясь теоремой 1, оцените скорость

сходи­

мости.

 

 

 

 

 

§ 3. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА

Рассмотрим задачу минимизации функции /(ы )еС '(£/) для случая, когда 11фЕт. Непосредственное применение градиентного метода из § 2 здесь невозможно, ибо при каком-либо п точка ип из (2.1) может не принадлежать U. Однако нетрудно избежать эту неприятность, если каждый вновь полученный член последователь­


£ 3]

 

 

Метод проекции

градиента

 

■73

ности (2.1) проектировать на множество U. В результате мы при­

дем к так называемому методу проекции градиента.

 

1.

Для точного описания этого метода нам понадобятся вс

могательные сведения.

 

 

 

 

О п р е д е л е н и е 1.

Проекцией

точки « е £ т на множество

UczEm называется

точка

P u ( u ) d U ,

удовлетворяющая

условию

 

 

|и Рц (а) |= inf |и — о| = р (и,

U),

 

 

 

 

 

v£U

 

 

 

где р(и, U) — расстояние от точки и до множества U.

 

Если

u d U ,

го

очевидно, что Р и (и )= и .

Нетрудно

указать

множества U, когда проекция точки на это множество не сущест­

вует или определяется неединственным образом.

 

Т е о р е м а

1.

Если множество UczEm замкнуто и выпукло, то

для всякой точки u d E m существует и притом единственная проек­

ция Ри(и) на это множество.

Справедливы неравенства

 

(Ри(и)— и, v — P t/ («))> 0

при всех v£ U,

(1)

|Ри (и) — Ри (V) |<

I и v I при всех и, v в Ет.

(2)

Д о к а з а т е л ь с т в о .

Рассмотрим

непрерывную

функцию

g(o) = |w— и\2 переменного v<=Em при произвольном

фиксирован­

ном tid E m. Нетрудно

проверить тождество

g ( a o + ( l — a)ie>) =

= ag-(o) + ( l — a ) g (w ) — a ( l — a)\vw\z,

справедливое

 

при всех

v, ш е £ га и O ^ a ^ l .

Следовательно, g (o)

сильно

выпукла на

всем пространстве и согласно теореме 1.7 достигает своего мини­

мума на замкнутом выпуклом множестве U в

единственной точке

v, w d E m

и O ^ a ^ l .

Следовательно, g(v)

сильно

выпукла на

при всех

v d U , причем

равенство достигается

только

при v = v*.

Остается принять Pu(u} = v*.

Докажем неравенство (1). Согласно теореме 1.3 для достиже­ ния функцией g(v) минимума на U в точке v* необходимо и доста­

точно, чтобы (g' (и*),

V—v * ) ^ 0

при

всех

v d U .

Поскольку

g ' (v ) = 2 ( v и)

и v* = Pv (u), то

отсюда

сразу

получаем нера­

венство (1). Далее из

(1) имеем

 

 

 

 

(Ри (и) — и,

Ри (о) — Ри (и)) > О,

(Ра (v) —v, Ри (и) -

Ри (v)) > 0.

Сложив эти два неравенства, получим

 

 

 

0 < (Ри (v) — Ри (и), Ри (и) и Рц (v) + v),

или

\Ри(и) — Pu(v)\2< ( P u ( v ) ~ Ри(и), V — u)K\Pu(u) — Pu(v)\\v — u l

Разделив это неравенство на \ Ри (и )~Pu(v) |фО, придем к нера­ венству (2). Если же \Ри(и)—Pu (v) |= 0 , то (2), очевидно, также верно. А


74

М И Н И М И З А Ц И Я Ф У Н К Ц И И М НОГИ Х П ЕРЕМЕННЫ Х

[ Г л . 2

2.Опишем метод проекции градиента. Пусть начальное п

ближение un^ U известно. Строим

последовательность

{ип} по

правилу

 

 

 

 

Un+ 1 =

Рц (ы„ — a nJ' (un)),

п =

0 , 1 , 2 , . . . ,

(3)

где a n= const>0.

Существуют различные

способы выбора вели­

чины а п в равенстве (3), и в зависимости от этого можно получить различные варианты метода проекции, градиента. В частности, а„ можно выбирать из условий

. J (un) J (un+i) >

е I unun+1 12, a„ > 0,

(4)

где un+1 имеет вид (3), s > 0

— некоторое фиксированное

число.

Ниже будет показано, что при некоторых ограничениях на функ­

цию такой выбор а п возможен.

Если же в (4) может

быть лишь

а п= 0, то процесс прекращается

и при необходимости

проводится

дополнительное исследование точки ип на минимум.

 

Если U = E m, то (3) переходит в (2.1) и метод (3), (4) пре­ вращается в обычный градиентный метод § 2, а условие (4) для выбора a n перепишется в виде [82]

.

.

^

 

-..J Ю — J (Un+1) >

ea21 J' (u„) I2.

 

 

 

 

 

 

Т е о р е м а

2 .^1усть U — замкнутое

выпуклое

множество,

ф у й

 

к ц и я - и

ограничена

снизу

на

U,

градиент

Г {и)

удовлетворяет условию Липшица:

 

\Р(и) — Л (о )| ^ £ | ц — v\

при

всех и,

ш=£/,

L = const>0. Пусть

 

щ — произвольная

начальная

точка из

U и величины а п в

(3)

выбираются

из

условий

[155]

 

 

 

 

 

0 < e 1 < a , t < -

- ?

- ,

 

 

 

 

 

 

(5)

 

 

 

 

 

 

 

 

 

L + 2е

 

 

 

 

 

 

 

 

где 8i,

8 — заданные

числа,

 

 

 

2

 

в > 0 .

Тогда

по-

0<^ех < ------------,

 

 

 

 

 

 

 

 

 

L -J- 2е

 

 

 

 

 

 

 

следовательность

{«„}

из

(3)

удовлетворяет

условию

(4)

и

\ип—цп+1|-^0 (n-voo).

 

 

 

 

 

 

 

 

 

 

 

Если, кроме, того,

J (и)

выпукла, и множество

М(и0) = {и :

С u e U ,

 

J ( u ) ^ J ( u 0)}

ограничено,

то последовательность

{«„}

яв­

ляется минимизирующей и любая ее предельная

точка

и* будет

точкой минимума I(и)

на U, причем в случае единственности точки

минимума вся последовательность

{ип}-+и*

(я-*-оо).

Справедлива

оценка

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

0 <

ая =

/ (и„) — /* •< —

•— ,

л = 1 , 2 ,

 

 

 

 

(6)

 

 

 

 

 

 

 

 

е

п

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J * =

inf J (и) , С = sup

|J' (и) |4— — D,

 

 

 

 

и

М{и0)

еА


0 3]

 

Метод проекции

градиента

 

 

 

 

 

75

D — диаметр множества1

М (и0).

 

 

 

 

 

 

 

 

 

 

Если, кроме того, J

(и)

сильно выпукла на U, то

 

 

 

 

|ипи* |2 <

 

2с 2

 

1

 

1 , 2 , . . .

 

 

(7)

 

--------•— ,

 

 

 

 

 

 

 

к ■е

 

п

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о . Прежде всего, если в (1)

принять и = ип

— аЛУ' '(ип) и учесть (3),

то

получим

 

 

 

 

 

 

 

 

или

п+ 1 ип -f

а J '

(«„),

и — «я+0 >

О,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( / ' («„),

И — H„+i) >

(«„•

■ил+1, и — w„+i)

 

при всех

«££/,

 

 

 

 

п = 1 , 2 , . . .

 

 

 

 

 

 

(8)

Заметим, что если при каком-либо п оказалось, что

ип= и п+и

то из (8) следует

(Г ( и п),

и— ип)^=0 при

всех

и<=£/, т. е. «„ —

стационарная точка I (и) на U,

которая в случае выпуклости функ­

ции будет точкой ее минимума на U.

 

 

 

 

 

 

 

Воспользуемся формулой (1.18)

при v= un, и = и п+ь Получим

J («п) — J («Я-и) >

(J' (ип) , ип— ц„+1) ----- —1

L\un — ил+112.

Отсюда с учетом условий (5) и неравенства

(8)

при

и = ип

получим

 

j (Un)

J (ил+1) ^

 

-------- I ип

Ил+1 |2 ^

 

 

 

 

^ е |и „ — и п + 1 |2 > 0 ,

/г = 0,

1, 2, . . .

 

 

(9)

Как видим,

выбор

а п из

(5) здесь

гарантирует выполнение нера­

венства (4). Далее, из (9)

(или

(4)) следует,

что

последователь­

ность {J(u n)}, убывает. Так как

J(u n) ^ J * > — оо,

то существует

lim /(«„), и, следовательно,

J(u n) —J (u n+i)-+-0(n-+oo). А тогда из

/I—>00

|ип— «п+1 |-И)(ц-*-оо).

 

 

 

 

 

 

 

 

 

(9) имеем

 

 

 

 

 

 

 

 

 

Пусть теперь /(«)

дополнительно удовлетворяет еще условию

выпуклости и множество М (и0)

ограничено. Ясно,

что {и „}& М (и 0)

и 7* = in f/(и). Поскольку

/ (и)

непрерывна, то

она

на

ограничен-

М(и„)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 Ограниченность |7'(и)|

на М(и0) следует из ограниченности

множества

М(и0), условия Липшица для /'(и) и неравенств

 

 

 

 

 

 

 

IJ ' (и) |< |Г

(и) - Г

(и.) |+ IJ '

(«„) |<

L |и - иа |+ ' \ Г

(и0) |< LD +

|J ' (И#)|.‘


76 М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х [ Г л . i

ном замкнутом множестве М (и0) достигает своей нижней грани в

некоторой точке

и*е£/, причем J ( u * ) = J * .

Согласно

теореме

1.2

О <

ап = / («„) — J

(«*) < iJ ' («я). ип — «*) =

 

 

=

(J' («„). «п — Ид+l) — (^' («„), u* — u„+ i).

 

 

Отсюда с учетом (5) и неравенства (8) при u =

iC получим

 

О -С #л "С {J' (un) . ип— u/t+l)---------(“л — ип+1. и"ип+\) -<

 

 

 

 

 

 

 

 

 

< ( sup

I J ’ (u) |+

) |«Л — «Д+1 1=

cI un— ы„+ 1 1.

(10)

\M(«o)

 

el

J

 

 

 

 

Так как \unun+\|-*-0(/i-»-oo),

to a n= J (u n) — /*->■0, т.

e. последо­

вательность {«„}

минимизирующая. А тогда

любая

предельная

точка последовательности

{«„} является

точкой минимума

н в

случае единственности точки минимума и* вся последовательность

{ип}-*-и*(и-*-оо). Из неравенств (9), (10)

имеем

 

 

а п — Q«+i >

а 2,п (и = 0,

1,

2, . . . ) .

 

 

Так как а „ > 0 (если

ап = 0,

то ип — точка

минимума),

то

отсюда

с помощью леммы 1.2

получим оценку (6).

Наконец, из

(6)

и тео­

ремы 1.6 следует оценка ( 7 ) . ^

 

В тех случаях,

когда константа Липшица L для J'(u)

неиз­

вестна,

при

выборе

а п вместо условия (5) следует использовать

условие

(4).

В этом

случае часто полагают an = a = c o n s t> 0

и на

каждом шаге проверяют выполнение условия монотонности:

/(«7l+i) < / (« „ ). Если оно нарушается,

то а

дробится до

тех пор,

пока не восстановится монотонность;

время

от времени

следует

пробовать увеличить а с сохранением монотонности. Величина е > 0 в (4) является параметром алгоритма и в каждой задаче подби­ рается эмпирически. Следует иметь в виду, что если величина е слишком мала, то метод (3), (4) может сходиться медленно, если она слишком велика, то может затрудниться выбор а п из (4). Еще один способ выбора а п в (3) будет рассмотрен в § 5. Другие ва­ рианты метода проекции градиента, обсуждение различных вычис­ лительных аспектов этого метода см. в работах [9, 10, 31, 35, 97, 114, 116, 149, 155, 170, 189, 193, 235, 239, 267] и др.

Следует заметить, что задача отыскания проекции точки и на заданное множество U сама, в свою очередь, является задачей минимизации функции g{v) = \vи\2 на этом множестве, и уме­ ние решать эту задачу во многом обеспечивает эффективность ис­ пользования метода проекции градиента при минимизации функ­ ций. Для некоторых множеств II, когда, например, U есть шар в Ет или параллелепипед с гранями, параллельными осям коорди­