Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 284
Скачиваний: 2
72 |
М И Н И М И З А Ц И Я |
Ф У Н К Ц И И МНОГИХ ПЕРЕМЕННЫХ |
[Гл. 2 |
с меньшей |
«кривизной», |
наоборот, cos а„ — cos а)г_ !> 0 , |
поэтому |
овражный шаг увеличится и появится возможность сравнительно быстро пройти участки с малой «кривизной», в частности, прямо
линейные участки на «дне оврага». Если |
«кривизна дна оврага» |
||||||
на некоторых участках остает |
|||||||
ся постоянной, |
|
то |
разность |
||||
cosan— cosa„_i |
будет |
близка |
к |
||||
нулю, |
и поиск |
|
минимума |
на |
|||
таких |
участках |
будет прово |
|||||
диться |
с |
почти |
постоянным |
||||
шагом, |
сформированным |
с |
|||||
учетом |
величины |
«кривизны» |
|||||
при |
выходе |
на |
|
рассматривае |
|||
мый участок. |
с |
|
|
|
|||
(7) |
Параметр |
в |
равенстве |
||||
регулирует |
|
чувствитель |
ность метода к изменению «кривизны дна оврага», и правильный выбор этого параметра во многом определяет скорость движения по «оврагу». Некоторые эвристические соображения по поводу вы бора с и другие аспекты применения овражного метода обсужде
ны в работе [211]. |
|
|
|
|
|
Выражение (7) для |
овражного шага удобнее |
преобразовать |
|||
так: |
|
|
|
|
|
hn+i = hncC05a’~C0san-i = |
йЛ_ 1ссмв« -ео**я-з = |
. . . |
= |
/г2сС05а*“ С05е\ |
|
откуда окончательно |
|
|
|
|
|
hn+l = Kccosa", К = |
h„c~cosa' = const> 0 , |
п = |
2 , 3 , . . . |
||
Другой способ ускорения сходимости градиентного метода за |
|||||
ключается в выборе подходящей замены |
переменных |
u = g (Q |
|||
с тем, чтобы поверхности |
уровня функции J(g(£,)) |
в пространстве |
|||
переменных £ были близки к сферам [251—253]. |
|
|
|||
Упражнение. Опишите метод скорейшего спуска для |
функций |
||||
J(u) из упражнений 1.15 |
и 1.16. Укажите явное выражение для an |
||||
из условия (2). Пользуясь теоремой 1, оцените скорость |
сходи |
||||
мости. |
|
|
|
|
|
§ 3. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА
Рассмотрим задачу минимизации функции /(ы )еС '(£/) для случая, когда 11фЕт. Непосредственное применение градиентного метода из § 2 здесь невозможно, ибо при каком-либо п точка ип из (2.1) может не принадлежать U. Однако нетрудно избежать эту неприятность, если каждый вновь полученный член последователь
£ 3] |
|
|
Метод проекции |
градиента |
|
■73 |
|
ности (2.1) проектировать на множество U. В результате мы при |
|||||||
дем к так называемому методу проекции градиента. |
|
||||||
1. |
Для точного описания этого метода нам понадобятся вс |
||||||
могательные сведения. |
|
|
|
|
|||
О п р е д е л е н и е 1. |
Проекцией |
точки « е £ т на множество |
|||||
UczEm называется |
точка |
P u ( u ) d U , |
удовлетворяющая |
условию |
|||
|
|
|и — Рц (а) |= inf |и — о| = р (и, |
U), |
|
|||
|
|
|
|
v£U |
|
|
|
где р(и, U) — расстояние от точки и до множества U. |
|
||||||
Если |
u d U , |
го |
очевидно, что Р и (и )= и . |
Нетрудно |
указать |
||
множества U, когда проекция точки на это множество не сущест |
|||||||
вует или определяется неединственным образом. |
|
||||||
Т е о р е м а |
1. |
Если множество UczEm замкнуто и выпукло, то |
для всякой точки u d E m существует и притом единственная проек
ция Ри(и) на это множество. |
Справедливы неравенства |
|
||||
(Ри(и)— и, v — P t/ («))> 0 |
при всех v£ U, |
(1) |
||||
|Ри (и) — Ри (V) |< |
I и — v I при всех и, v в Ет. |
(2) |
||||
Д о к а з а т е л ь с т в о . |
Рассмотрим |
непрерывную |
функцию |
|||
g(o) = |w— и\2 переменного v<=Em при произвольном |
фиксирован |
|||||
ном tid E m. Нетрудно |
проверить тождество |
g ( a o + ( l — a)ie>) = |
||||
= ag-(o) + ( l — a ) g (w ) — a ( l — a)\v— w\z, |
справедливое |
|
при всех |
|||
v, ш е £ га и O ^ a ^ l . |
Следовательно, g (o) |
сильно |
выпукла на |
всем пространстве и согласно теореме 1.7 достигает своего мини
мума на замкнутом выпуклом множестве U в |
единственной точке |
|||
v, w d E m |
и O ^ a ^ l . |
Следовательно, g(v) |
сильно |
выпукла на |
при всех |
v d U , причем |
равенство достигается |
только |
при v = v*. |
Остается принять Pu(u} = v*.
Докажем неравенство (1). Согласно теореме 1.3 для достиже ния функцией g(v) минимума на U в точке v* необходимо и доста
точно, чтобы (g' (и*), |
V—v * ) ^ 0 |
при |
всех |
v d U . |
Поскольку |
|
g ' (v ) = 2 ( v — и) |
и v* = Pv (u), то |
отсюда |
сразу |
получаем нера |
||
венство (1). Далее из |
(1) имеем |
|
|
|
|
|
(Ри (и) — и, |
Ри (о) — Ри (и)) > О, |
(Ра (v) —v, Ри (и) - |
Ри (v)) > 0. |
|||
Сложив эти два неравенства, получим |
|
|
|
0 < (Ри (v) — Ри (и), Ри (и) — и — Рц (v) + v),
или
\Ри(и) — Pu(v)\2< ( P u ( v ) ~ Ри(и), V — u)K\Pu(u) — Pu(v)\\v — u l
Разделив это неравенство на \ Ри (и )~Pu(v) |фО, придем к нера венству (2). Если же \Ри(и)—Pu (v) |= 0 , то (2), очевидно, также верно. А
74 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М НОГИ Х П ЕРЕМЕННЫ Х |
[ Г л . 2 |
2.Опишем метод проекции градиента. Пусть начальное п
ближение un^ U известно. Строим |
последовательность |
{ип} по |
||
правилу |
|
|
|
|
Un+ 1 = |
Рц (ы„ — a nJ' (un)), |
п = |
0 , 1 , 2 , . . . , |
(3) |
где a n= const>0. |
Существуют различные |
способы выбора вели |
чины а п в равенстве (3), и в зависимости от этого можно получить различные варианты метода проекции, градиента. В частности, а„ можно выбирать из условий
. J (un) — J (un+i) > |
е I un— un+1 12, a„ > 0, |
(4) |
где un+1 имеет вид (3), s > 0 |
— некоторое фиксированное |
число. |
Ниже будет показано, что при некоторых ограничениях на функ
цию такой выбор а п возможен. |
Если же в (4) может |
быть лишь |
а п= 0, то процесс прекращается |
и при необходимости |
проводится |
дополнительное исследование точки ип на минимум. |
|
Если U = E m, то (3) переходит в (2.1) и метод (3), (4) пре вращается в обычный градиентный метод § 2, а условие (4) для выбора a n перепишется в виде [82]
. |
. |
^ |
|
-..J Ю — J (Un+1) > |
ea21 J' (u„) I2. |
|
|
|
|
|
|
||||||
Т е о р е м а |
2 .^1усть U — замкнутое |
выпуклое |
множество, |
||||||||||||||
ф у й |
|
к ц и я - и |
ограничена |
снизу |
на |
U, |
градиент |
Г {и) |
|||||||||
удовлетворяет условию Липшица: |
|
\Р(и) — Л (о )| ^ £ | ц — v\ |
при |
||||||||||||||
всех и, |
ш=£/, |
L = const>0. Пусть |
|
щ — произвольная |
начальная |
||||||||||||
точка из |
U и величины а п в |
(3) |
выбираются |
из |
условий |
[155] |
|||||||||||
|
|
|
|
|
0 < e 1 < a , t < - |
- ? |
- , |
|
|
|
|
|
|
(5) |
|||
|
|
|
|
|
|
|
|
|
L + 2е |
|
|
|
|
|
|
|
|
где 8i, |
8 — заданные |
числа, |
|
|
|
2 |
|
в > 0 . |
Тогда |
по- |
|||||||
0<^ех < ------------, |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
L -J- 2е |
|
|
|
|
|
|
|
|
следовательность |
{«„} |
из |
(3) |
удовлетворяет |
условию |
(4) |
и |
||||||||||
\ип—цп+1|-^0 (n-voo). |
|
|
|
|
|
|
|
|
|
|
|
||||||
Если, кроме, того, |
J (и) |
выпукла, и множество |
М(и0) = {и : |
||||||||||||||
С u e U , |
|
J ( u ) ^ J ( u 0)} |
ограничено, |
то последовательность |
{«„} |
яв |
|||||||||||
ляется минимизирующей и любая ее предельная |
точка |
и* будет |
|||||||||||||||
точкой минимума I(и) |
на U, причем в случае единственности точки |
||||||||||||||||
минимума вся последовательность |
{ип}-+и* |
(я-*-оо). |
Справедлива |
||||||||||||||
оценка |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, |
|
0 < |
ая = |
/ (и„) — /* •< — |
•— , |
л = 1 , 2 , |
|
|
|
|
(6) |
||||||
|
|
|
|
|
|
|
|
е |
п |
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J * = |
inf J (и) , С = sup |
|J' (и) |4— — D, |
|
|
|
|
и |
М{и0) |
еА |
0 3] |
|
Метод проекции |
градиента |
|
|
|
|
|
75 |
||||||
D — диаметр множества1 |
М (и0). |
|
|
|
|
|
|
|
|
|
|
||||
Если, кроме того, J |
(и) |
сильно выпукла на U, то |
|
|
|
||||||||||
|
|ип— и* |2 < |
|
2с 2 |
|
1 |
|
1 , 2 , . . . |
|
|
(7) |
|||||
|
--------•— , |
|
|
||||||||||||
|
|
|
|
|
к ■е |
|
п |
|
|
|
|
|
|
|
|
Д о к а з а т е л ь с т в о . Прежде всего, если в (1) |
принять и = ип— |
||||||||||||||
— аЛУ' '(ип) и учесть (3), |
то |
получим |
|
|
|
|
|
|
|
|
|||||
или |
(ип+ 1 — ип -f |
а J ' |
(«„), |
и — «я+0 > |
О, |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
( / ' («„), |
И — H„+i) > |
— |
(«„• |
■ил+1, и — w„+i) |
|
при всех |
«££/, |
||||||||
|
|
|
|
п = 1 , 2 , . . . |
|
|
|
|
|
|
(8) |
||||
Заметим, что если при каком-либо п оказалось, что |
ип= и п+и |
||||||||||||||
то из (8) следует |
(Г ( и п), |
и— ип)^=0 при |
всех |
и<=£/, т. е. «„ — |
|||||||||||
стационарная точка I (и) на U, |
которая в случае выпуклости функ |
||||||||||||||
ции будет точкой ее минимума на U. |
|
|
|
|
|
|
|
||||||||
Воспользуемся формулой (1.18) |
при v= un, и = и п+ь Получим |
||||||||||||||
J («п) — J («Я-и) > |
(J' (ип) , ип— ц„+1) ----- —1 |
L\un — ил+112. |
|||||||||||||
Отсюда с учетом условий (5) и неравенства |
(8) |
при |
и = ип |
получим |
|||||||||||
|
j (Un) |
J (ил+1) ^ |
|
-------- I ип— |
Ил+1 |2 ^ |
|
|
|
|||||||
|
^ е |и „ — и п + 1 |2 > 0 , |
/г = 0, |
1, 2, . . . |
|
|
(9) |
|||||||||
Как видим, |
выбор |
а п из |
(5) здесь |
гарантирует выполнение нера |
|||||||||||
венства (4). Далее, из (9) |
(или |
(4)) следует, |
что |
последователь |
|||||||||||
ность {J(u n)}, убывает. Так как |
J(u n) ^ J * > — оо, |
то существует |
|||||||||||||
lim /(«„), и, следовательно, |
J(u n) —J (u n+i)-+-0(n-+oo). А тогда из |
||||||||||||||
/I—>00 |
|ип— «п+1 |-И)(ц-*-оо). |
|
|
|
|
|
|
|
|
|
|||||
(9) имеем |
|
|
|
|
|
|
|
|
|
||||||
Пусть теперь /(«) |
дополнительно удовлетворяет еще условию |
||||||||||||||
выпуклости и множество М (и0) |
ограничено. Ясно, |
что {и „}& М (и 0) |
|||||||||||||
и 7* = in f/(и). Поскольку |
/ (и) |
непрерывна, то |
она |
на |
ограничен- |
||||||||||
М(и„) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 Ограниченность |7'(и)| |
на М(и0) следует из ограниченности |
множества |
|||||||||||||
М(и0), условия Липшица для /'(и) и неравенств |
|
|
|
|
|
|
|
||||||||
IJ ' (и) |< |Г |
(и) - Г |
(и.) |+ IJ ' |
(«„) |< |
L |и - иа |+ ' \ Г |
(и0) |< LD + |
|J ' (И#)|.‘ |
76 М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х [ Г л . i
ном замкнутом множестве М (и0) достигает своей нижней грани в
некоторой точке |
и*е£/, причем J ( u * ) = J * . |
Согласно |
теореме |
1.2 |
||||
О < |
ап = / («„) — J |
(«*) < iJ ' («я). ип — «*) = |
|
|
||||
= |
(J' («„). «п — Ид+l) — (^' («„), u* — u„+ i). |
|
|
|||||
Отсюда с учетом (5) и неравенства (8) при u = |
iC получим |
|
||||||
О -С #л "С {J' (un) . ип— u/t+l)---------(“л — ип+1. и"— ип+\) -< |
|
|||||||
|
|
|
|
&П |
|
|
|
|
< ( sup |
I J ’ (u) |+ |
— |
) |«Л — «Д+1 1= |
cI un— ы„+ 1 1. |
(10) |
|||
\M(«o) |
|
el |
J |
|
|
|
|
|
Так как \un— un+\|-*-0(/i-»-oo), |
to a n= J (u n) — /*->■0, т. |
e. последо |
||||||
вательность {«„} |
минимизирующая. А тогда |
любая |
предельная |
|||||
точка последовательности |
{«„} является |
точкой минимума |
н в |
случае единственности точки минимума и* вся последовательность
{ип}-*-и*(и-*-оо). Из неравенств (9), (10) |
имеем |
|
|
|||
а п — Q«+i > |
а 2,п (и = 0, |
1, |
2, . . . ) . |
|
|
|
Так как а „ > 0 (если |
ап = 0, |
то ип — точка |
минимума), |
то |
отсюда |
|
с помощью леммы 1.2 |
получим оценку (6). |
Наконец, из |
(6) |
и тео |
ремы 1.6 следует оценка ( 7 ) . ^ |
|
|||
В тех случаях, |
когда константа Липшица L для J'(u) |
неиз |
||
вестна, |
при |
выборе |
а п вместо условия (5) следует использовать |
|
условие |
(4). |
В этом |
случае часто полагают an = a = c o n s t> 0 |
и на |
каждом шаге проверяют выполнение условия монотонности:
/(«7l+i) < / (« „ ). Если оно нарушается, |
то а |
дробится до |
тех пор, |
пока не восстановится монотонность; |
время |
от времени |
следует |
пробовать увеличить а с сохранением монотонности. Величина е > 0 в (4) является параметром алгоритма и в каждой задаче подби рается эмпирически. Следует иметь в виду, что если величина е слишком мала, то метод (3), (4) может сходиться медленно, если она слишком велика, то может затрудниться выбор а п из (4). Еще один способ выбора а п в (3) будет рассмотрен в § 5. Другие ва рианты метода проекции градиента, обсуждение различных вычис лительных аспектов этого метода см. в работах [9, 10, 31, 35, 97, 114, 116, 149, 155, 170, 189, 193, 235, 239, 267] и др.
Следует заметить, что задача отыскания проекции точки и на заданное множество U сама, в свою очередь, является задачей минимизации функции g{v) = \v— и\2 на этом множестве, и уме ние решать эту задачу во многом обеспечивает эффективность ис пользования метода проекции градиента при минимизации функ ций. Для некоторых множеств II, когда, например, U есть шар в Ет или параллелепипед с гранями, параллельными осям коорди