Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 249
Скачиваний: 1
§ 8) |
|
|
Метод Ньютона |
|
|
113 |
||
Обозначим иа= и п+'а(ип— ип), |
0 < ;« ^ 1 . Из выпуклости функ |
|||||||
ции J n (и) |
следует, что |
|
|
|
|
|
|
|
|
J n («а) < a J n (ип) + (1 — а) J n (ип) = a J n (ип) < О, |
|
||||||
Тогда из формулы |
|
|
|
|
|
|
||
J (Иа) — J (и„) = |
J n («а) + |
((J" (иа + |
0а (ип — Un)) — |
|
||||
|
|
— Г ( и п))(ип — ип) , й п — ип), |
0 < а < 1 |
(11) |
||||
будем иметь |
|
|
|
|
|
|
|
|
j («„) — J Ы |
> — J n («а) — — (M — ll)\un — Un \2> 0.\Jn (un)\ — |
|||||||
|
|
- \ ^ М \ й п- и п\\ |
|
0 < а < 1 . |
|
(12) |
||
Так как /п {и) |
сильно выпуклая функция и достигает своего мини |
|||||||
мума на U в точке ип, то согласно теореме 1.6 |
|
|
||||||
\чп — «„12 < |
— Un(4n) — J n(u„)] = |
— |
|/„(“*) I» |
n = 0, 1 , . . . |
||||
|
|
!*■ |
|
|
|
|
|
(13) |
|
|
|
|
|
|
|
|
|
Подставим эту оценку в (12). Получим |
|
|
|
|
||||
J |
(un) — J (иа) > а ^ 1 ----- ~ |
а ) \J n(un)\> ае| J n (un)\ |
|
|||||
при всех |
а, |
а ■< — |
^ ** < 1 . |
Таким образом, |
|
|
||
|
|
|
2М |
|
|
|
|
|
множество тех а = а п, для которых выполнено условие (10), |
непу |
|||||||
сто. Из непрерывности J (и) следует, что множество таких а зам |
||||||||
кнуто и, следовательно, это множество |
содержит |
свою верхнюю |
||||||
грань a „ ^ l . В соответствии с (9) полагаем |
ип+\= |
ыа„. |
|
Покажем, что для получаемой таким образом последователь ности {ип} при любом выборе начального приближения u0^ U верны все утверждения теоремы.
Прежде всего с учетом an^ e i из (10) имеем
J |
{чп) |
J |
(Wn+l) ^ &<ХП|J n (ип) | 68]^ |J п (ип) | |
0, |
п = 0, |
1, . . . |
|
|
|
|
|
|
|
|
(14) |
Следовательно, { J (ип)} |
монотонно убывает и, |
кроме того, |
J (ип) > |
||||
> |
J* = |
inf J |
(ы) > — оо. |
Тогда существует l i mJ (« J |
и |Пш [/(un+I) — |
U |
П—>оо |
П-^оо |
114 |
|
|
М И Н И М И З А Ц И Я Ф У Н К Ц И И |
М Н О ГИ Х |
ПЕРЕМЕННЫ Х |
|
|
|
Гл. 2 |
|||||||||||||||
— У(ц„)] = |
0. |
|
Из |
(14) |
теперь |
|
имеем |
1 |
|
(«„) |— 0, |
а |
из |
(13)— |
|||||||||||
\и |
— ип|— О (п —> оо). |
Следовательно, |
существует |
такой |
|
номер |
||||||||||||||||||
п0 = |
п0(е), |
что |
-----\un-— ия | < 1 — е |
при |
всех |
п>/г0. |
Из |
(11) |
с |
|||||||||||||||
учетом |
|
|
|
н* |
|
|
для |
J" (и) и |
оценки |
(13) |
для |
всех |
а, |
|||||||||||
условия Липшица |
||||||||||||||||||||||||
|
< |
а < 1, |
тогда имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
j |
Ю |
— J («а) > |
|
|
— |
|
а3£ |
|
-т |
|
|
|
|
|
|
|
|
|||
|
|
|
|
а I J a (и„) I------— |
I ип— ипI3 > |
|
|
|
|
|
||||||||||||||
|
|
|
|
> |
IJ,, (М п) |
I |
1 — -^-'1 Й„ — йпI ^ |
> |
ае I J n (й„) | |
|
|
|
|
|||||||||||
при |
всех /г>/г0. Это означает, |
что (10) |
выполнено при |
всех |
а„, |
|||||||||||||||||||
Ч < % < 1 |
и, |
следовательно, |
максимальное |
среди |
таких |
ап |
есть |
|||||||||||||||||
an = |
1 |
при всех |
п > |
п0. |
А тогда |
согласно |
(9) |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
Un+i = |
un, |
J n (un+1) = |
J n (ип) = |
min>„ (и), |
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u £ U |
■ |
|
|
|
|
|
|
|
|
т. |
e. |
начиная |
с |
номера п = |
п0, |
рассматриваемый метод |
превращается |
|||||||||||||||||
в |
метод |
Ньютона |
с |
начальным |
|
приближением |
и„0, |
таким, |
что |
|||||||||||||||
q = |
— |
|и„0+1— w„01< 1. |
Поэтому |
оценка |
(2) |
будет |
верна |
|
при всех |
|||||||||||||||
п > п0. А |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Существуют и другие способы выбора |
|
а п в |
(9), |
например, в |
||||||||||||||||||
работах [81], [82] ап предлагается |
искать |
|
из |
условия |
минимума |
|||||||||||||||||||
функции J {ип+ а (и п— ы„)) |
переменной а при 0 - ^ а ^ 1 . |
О методе |
||||||||||||||||||||||
Ньютона см. также в работах [4, 19, 27, |
35, |
46, 75, |
81, 82, |
97, |
130, |
|||||||||||||||||||
152, |
155, 170, |
1.93, 235] и др. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3. На каждом шаге метода Ньютона и его модификации пр ходится решать достаточно трудоемкую задачу минимизации квад ратичной части J n(u) приращения I{и ) —/(«„) на множестве U. В частности, метод Ньютона для минимизации сильно выпуклой функции J (и) на всем пространстве приводит к итерационному процессу
Un+1 = Un — (J" (мл))-> J' (и„), |
п = 0, 1, . . . , |
|
на каждом шаге которого требуется |
обращать |
матрицу J"(u n). |
Возникает вопрос, нельзя ли построить методы |
минимизации, |
|
обладающие высокой скоростью сходимости, как |
метод Ньютона, |
и в то же время требующие меньшего объема вычислений на каж дой итерации?
В настоящее время такие методы известны. Они приспособле
§ 8] Метод Ньютона 115
ны для поиска минимума функции на всем пространстве и в общих чертах сводятся к итерационному процессу:
|
un+i = ип— а пДГ1J' (и„), |
п = |
0, |
, |
(15) |
||
где а пфО |
скалярный |
|
множитель, |
Ап — |
квадратная |
матрица |
|
m-ного порядка, такая, что \\Ап— J"(u n) ||-й) (п-+ оо). |
|
|
|||||
Следуя (86], опишем один из способов выбора матрицы Ап и |
|||||||
величины |
а п в процессе |
(15). Зафиксируем какую-либо |
последо |
||||
вательность векторов |
Го, |
гь ..., гп, ... ,' обладающую |
свойствами: |
||||
1) |г'тг| — |
при п-*-оо; |
2) |
существует |
число у > 0 , такое, |
что опре |
делители Ап матриц, столбцами которых являются нормирован ные векторы
|
|
|
|
|
rn |
|
гп—1 |
|
|
rn—m+1 |
|
|
|
|
|
|||
удовлетворяют |
неравенству |
Ап^ у |
при |
|
всех |
п = т — 1, |
т ,... |
|||||||||||
В остальном |
последовательность {r„} |
произвольна. |
|
Например, |
||||||||||||||
можно взять |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
r0 = |
^o®i> |
■••, гт—1 = |
A.m_i ет, |
гт— Хте1л . . . , г2т—i = |
|
||||||||||||
|
|
: |
^ 2 т—1 £т , |
Г2 т = |
^2те1> ■■■ I |
rn = |
|
e i+l> |
••• , |
|
|
|
||||||
где 6 j= |
(0, |
. . . , |
0, 1, |
0, . . . , |
0 ) — единичный |
вектор |
по |
|
оси |
Ои}, |
||||||||
i —‘ остаток |
от |
деления |
целого |
числа |
п |
на |
целое |
число |
||||||||||
т, О ^ г^ / п — 1, |
последовательность Хп->0 |
|
при п-*-оо, |
Хп> 0 при |
||||||||||||||
всех п— 0, |
1, .. . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Пусть последовательность {г„} с указанными свойствами уже |
|||||||||||||||||
выбрана. Тогда матрица Ап в соотношении |
(15) при каждом фик |
|||||||||||||||||
сированном п ^ т — 1 |
определяется из системы линейных алгебраи |
|||||||||||||||||
ческих уравнений |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
; |
- J' (Un—i ~Ь Гп—/) |
|
J' (Un—j), |
/ = |
0, 1, . . . |
, |
т — |
1. |
|||||||||
|
|
|
|
|
|
|
|
|
матрица Ап невырождена, |
|
( 16) |
|||||||
|
Если полученная |
при этом |
то нахо |
|||||||||||||||
дят ДГ1 и при выполнении условия |
(ДГ‘ J' (ип), J' |
(«п) ) > 0 |
присту |
|||||||||||||||
п аю т^ |
выбору |
величины |
ап в |
(15). |
Для |
этого |
вначале полагают |
|||||||||||
ап = |
“ я. где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
аП= min |
|
|
( У ( и п ) , Un |
U g ) “| ^ |
• и„ — и„ |
|
An |
|
J' (Цп)> |
||||||||
|
|
|
\ип—Й„|3 J |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
= |
const > 0 , |
и проверяют справедливость |
неравенства |
|
|
|
|
|||||||||||
|
J(u n+1) — J(Un)<C еа„ (Д (ы„), |
ип — ип), |
0 < е < - ^ - |
(17) |
116 |
М И Н И М И З А Ц И Я Ф У Н К Ц И И М НОГИ Х ПЕРЕМЕННЫ Х |
[Гл. 2 |
|||||
(постоянные R, е являются параметрами алгоритма). Если нера |
|||||||
венство |
(17) |
выполняется, |
то останавливаются |
на |
выборе |
а п= а п, |
|
находят |
un+1 |
по формуле |
(15) |
и переходят к |
следующей |
итера |
|
ции. Если же |
неравенство |
(17) |
не выполняется |
пр_и а„ = а„, то |
производят дробление ап (например, последовательным делением пополам) до тех пор, пока (17) не окажется справедливым, и полученную в результате дробления величину принимают в каче стве ап в (15).
Если при каком-либо |
п ^ т — 1 |
матрица Л„, определенная из |
||||||||||||
системы |
(16), |
окажется |
вырожденной |
или |
же |
(ДГ1 |
J' |
(ип), |
||||||
/ ' ( и , ) ) а |
то |
либо |
изменяют вектор |
гп |
и |
-заново |
строят |
|||||||
матрицу Ап, либо полагают Ап= Е |
(Е — единичная матрица) и |
|||||||||||||
ап в (15) |
выбирают, пользуясь каким-либо |
вариантом |
'градиент |
|||||||||||
ного мет.ода; п-й шаг метода |
при |
всех п ^ т — 1 |
|
описан. |
Если |
|||||||||
0 -^ / г ^ т —2, то |
в |
(15) |
можно |
принять |
Ап= Е |
и |
а,г |
при |
||||||
/г=0,1, . . . , |
т— 2 выбирать, как в градиентном методе. |
векторы гп, |
||||||||||||
Пусть Rn— матрица, столбцами |
которой являются |
|||||||||||||
гп-\, ■•- , |
гп—т+\, a |
Qn— матрица, |
составленная |
|
из |
|
столбцов |
|||||||
•7 fan 'l- ^n)i |
J fan)t • • • |
i |
>7 fan—m+1 Д ?n—n»+l) |
J' fan—in-\-l)- |
|
ТогдаТсистема -(16) для определения An может быть записана в виде следующего матричного уравнения: AnRn — Qn. Отсюда видно, что если Rn, Qn невырождены, то матрица Ап определяется однозначно,
Ап1 существует и ДГ1= RnQnl. Заметим, что матрицы Rn, Qn отли чаются от Rn+1 и соответственно Q„+1 лишь одним столбцом. Это обстоятельство позволяет получить достаточно простые и удобные
рекуррентные соотношения, связывающие матрицы ДГ+i и ДГ1 [86]. Благодаря этим рекуррентным соотношениям существенно уменьша ется трудоемкость обращения матрицы Ап, и метод (15) — (17) ока зывается более экономичным по сравнению с описанными выше ме тодом Ньютона и его модификацией.
|
Отдельно остановимся на случае, |
когда векторы гп в (16) |
вы |
||||
бираются по закону: rn— Xnei+1, |
где i — остаток |
от деления |
п |
на |
|||
т, |
О ^ г^ / п — 1, числа Л „>0 и Д п->-0 |
при |
оо, |
е ^=( 0, ..., |
0, |
1, |
|
0, |
. . . , 0) — единичный вектор |
по |
оси |
Ou\ |
i— 1, 2, . . . , |
т. |
Тогда система (16) |
решается в явном виде и, как нетрудно видеть, |
|||
матрица Ап будет состоять из столбцов |
|
|||
7 ' (“п -г + |
К —I ei) — 7 ' (un—j) |
7* (un—._j_| Н- 7n_ i+ |gg) — J' Kt-t-|-i) |
||
|
K -i |
|
’ |
V - w |
J ’ (“n + |
— |
J ’ (un) |
J '(u„_m + |+ |
e [+2) — J ' (un_ m + l) |
X |
' |
x m+1 |
’ |
§ 9] Метод штрафных функций 117
|
|
|
(ип—i—1 ~t~^n—t—1e”») |
J |
(un—i—l) |
||
|
|
|
. |
h - l - l |
|
|
|
Для |
сравнения |
вспомним, что матрица J" (и) |
состоит из столбцов |
||||
|
|
" дЧ (и ) - |
|
|
|
“ ’дЧ (и ) ~ |
|
|
|
|
дихди1 |
|
|
|
5u15um |
|
д ]' (и) |
_ |
• |
|
dJ' |
(и) |
|
|
ди1 |
|
|
’ " ’ ’ |
дит |
^ |
|
|
|
|
дЧ (и) |
|
|
|
дЧ (и) |
|
|
|
ди"‘ди1 |
|
|
|
дитдит |
Отсюда видно, что столбцы матрицы Ап представляют собой |
|||||||
разностную аппроксимацию |
соответствующих столбцов матрицы |
||||||
Г (и) |
в специально |
выбираемых точках, |
и метод (15) — (17) пре |
вращается в разностный вариант метода Ньютона. Поэтому мож но ожидать, что метод (15) — (17) будет обладать высокой ско ростью сходимости. Строгое доказательство этого факта для силь но выпуклых функций J(u ) ^ C 2(Em) проведено в работе [86]. Та
ким |
образом, метод (15) — (17) имеет |
скорость |
сходимости, |
близ |
кую |
к скорости сходимости метода |
Ньютона |
и в то же |
время |
является более экономичным по сравнению с методом Ньютона с точки зрения количества вычислений производных минимизируе мой функции и трудоемкости обращения матрицы Ап на каждом
шаге. |
Для |
квадратичной |
функции, |
определяемой |
равенством |
||
(7.7), |
метод |
(15) — (17) |
сходится за |
конечное |
число |
шагов [86]. |
|
Различные варианты метода |
(15)— (17), обзор |
близких |
методов и |
||||
библиографию см. в [84], |
[86], |
[258]. |
|
|
|
Отправляясь от соотношений (15) — (17), в работе [87] постро ен быстросходящийся метод минимизации, не требующий вычисле ния производных минимизируемой функции. В этом методе выра жения градиента, встречающиеся в соотношениях (15) — (17), за меняются разностными отношениями функции в подходящим обра зом выбранных точках. Другие методы минимизации функций, не требующие вычисления производных минимизируемой функции, описаны в работах [235], [262], [265]; библиографию и обзор см. в [87], [265]. Эти методы удобно применять в тех случаях, когда вы числение производных минимизируемой функции связано со зна чительными трудностями.
§ 9. МЕТОД ШТРАФНЫХ ФУНКЦИИ
Пусть функция /(и) определена на всем пространстве Ет и требуется минимизировать I (и) на множестве 1!ф Е т. Идея мето да штрафных функций заключается в замене исходной задачи