Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 249

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 8)

 

 

Метод Ньютона

 

 

113

Обозначим иа= и п+'а(ипип),

0 < ;« ^ 1 . Из выпуклости функ­

ции J n (и)

следует, что

 

 

 

 

 

 

 

J n («а) < a J n (ип) + (1 — а) J n (ип) = a J n (ип) < О,

 

Тогда из формулы

 

 

 

 

 

 

J (Иа) — J (и„) =

J n («а) +

((J" (иа +

(ип — Un))

 

 

 

— Г ( и п))(ип — ип) , й п — ип),

0 < а < 1

(11)

будем иметь

 

 

 

 

 

 

 

j («„) — J Ы

> — J n («а) — — (M — ll)\un — Un \2> 0.\Jn (un)\ —

 

 

- \ ^ М \ й п- и п\\

 

0 < а < 1 .

 

(12)

Так как /п {и)

сильно выпуклая функция и достигает своего мини­

мума на U в точке ип, то согласно теореме 1.6

 

 

\чп — «„12 <

Un(4n) — J n(u„)] =

|/„(“*) I»

n = 0, 1 , . . .

 

 

!*■

 

 

 

 

 

(13)

 

 

 

 

 

 

 

 

Подставим эту оценку в (12). Получим

 

 

 

 

J

(un) — J (иа) > а ^ 1 ----- ~

а ) \J n(un)\> ае| J n (un)\

 

при всех

а,

а ■< —

^ ** < 1 .

Таким образом,

 

 

 

 

 

2М

 

 

 

 

 

множество тех а = а п, для которых выполнено условие (10),

непу­

сто. Из непрерывности J (и) следует, что множество таких а зам­

кнуто и, следовательно, это множество

содержит

свою верхнюю

грань a „ ^ l . В соответствии с (9) полагаем

ип+\=

ыа„.

 

Покажем, что для получаемой таким образом последователь­ ности {ип} при любом выборе начального приближения u0^ U верны все утверждения теоремы.

Прежде всего с учетом an^ e i из (10) имеем

J

{чп)

J

(Wn+l) ^ &<ХП|J n (ип) | 68]^ |J п (ип) |

0,

п = 0,

1, . . .

 

 

 

 

 

 

 

(14)

Следовательно, { J (ип)}

монотонно убывает и,

кроме того,

J (ип) >

>

J* =

inf J

(ы) > — оо.

Тогда существует l i mJ (« J

и |Пш [/(un+I) —

U

П—>оо

П-^оо


114

 

 

М И Н И М И З А Ц И Я Ф У Н К Ц И И

М Н О ГИ Х

ПЕРЕМЕННЫ Х

 

 

 

Гл. 2

— У(ц„)] =

0.

 

Из

(14)

теперь

 

имеем

1

 

(«„) |— 0,

а

из

(13)—

ип|— О (п —> оо).

Следовательно,

существует

такой

 

номер

п0 =

п0(е),

что

-----\un-ия | < 1 — е

при

всех

п>/г0.

Из

(11)

с

учетом

 

 

 

н*

 

 

для

J" (и) и

оценки

(13)

для

всех

а,

условия Липшица

 

<

а < 1,

тогда имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j

Ю

— J («а) >

 

 

 

а3£

 

 

 

 

 

 

 

 

 

 

 

 

 

а I J a (и„) I------—

I ипипI3 >

 

 

 

 

 

 

 

 

 

>

IJ,, (М п)

I

1 — -^-'1 Й„ — йпI ^

>

ае I J n (й„) |

 

 

 

 

при

всех /г>/г0. Это означает,

что (10)

выполнено при

всех

а„,

Ч < % < 1

и,

следовательно,

максимальное

среди

таких

ап

есть

an =

1

при всех

п >

п0.

А тогда

согласно

(9)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Un+i =

un,

J n (un+1) =

J n (ип) =

min>„ (и),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u £ U

 

 

 

 

 

 

 

т.

e.

начиная

с

номера п =

п0,

рассматриваемый метод

превращается

в

метод

Ньютона

с

начальным

 

приближением

и„0,

таким,

что

q =

|и„0+1— w„01< 1.

Поэтому

оценка

(2)

будет

верна

 

при всех

п > п0. А

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Существуют и другие способы выбора

 

а п в

(9),

например, в

работах [81], [82] ап предлагается

искать

 

из

условия

минимума

функции J {ип+ а (и п— ы„))

переменной а при 0 - ^ а ^ 1 .

О методе

Ньютона см. также в работах [4, 19, 27,

35,

46, 75,

81, 82,

97,

130,

152,

155, 170,

1.93, 235] и др.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3. На каждом шаге метода Ньютона и его модификации пр ходится решать достаточно трудоемкую задачу минимизации квад­ ратичной части J n(u) приращения I{и ) —/(«„) на множестве U. В частности, метод Ньютона для минимизации сильно выпуклой функции J (и) на всем пространстве приводит к итерационному процессу

Un+1 = Un — (J" (мл))-> J' (и„),

п = 0, 1, . . . ,

на каждом шаге которого требуется

обращать

матрицу J"(u n).

Возникает вопрос, нельзя ли построить методы

минимизации,

обладающие высокой скоростью сходимости, как

метод Ньютона,

и в то же время требующие меньшего объема вычислений на каж ­ дой итерации?

В настоящее время такие методы известны. Они приспособле­


§ 8] Метод Ньютона 115

ны для поиска минимума функции на всем пространстве и в общих чертах сводятся к итерационному процессу:

 

un+i = ипа пДГ1J' (и„),

п =

0,

,

(15)

где а пфО

скалярный

 

множитель,

Ап

квадратная

матрица

m-ного порядка, такая, что \\АпJ"(u n) ||-й) (п-+ оо).

 

 

Следуя (86], опишем один из способов выбора матрицы Ап и

величины

а п в процессе

(15). Зафиксируем какую-либо

последо­

вательность векторов

Го,

гь ..., гп, ... ,' обладающую

свойствами:

1) |г'тг| —

при п-*-оо;

2)

существует

число у > 0 , такое,

что опре­

делители Ап матриц, столбцами которых являются нормирован­ ные векторы

 

 

 

 

 

rn

 

гп—1

 

 

rn—m+1

 

 

 

 

 

удовлетворяют

неравенству

Ап^ у

при

 

всех

п = т — 1,

т ,...

В остальном

последовательность {r„}

произвольна.

 

Например,

можно взять

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r0 =

^o®i>

■••, гт—1 =

A.m_i ет,

гт— Хте1л . . . , г2т—i =

 

 

 

:

^ 2 т—1 £т ,

Г2 т =

^2те1> ■■■ I

rn =

 

e i+l>

••• ,

 

 

 

где 6 j=

(0,

. . . ,

0, 1,

0, . . . ,

0 ) — единичный

вектор

по

 

оси

Ои},

i —‘ остаток

от

деления

целого

числа

п

на

целое

число

т, О ^ г^ / п — 1,

последовательность Хп->0

 

при п-*-оо,

Хп> 0 при

всех п— 0,

1, .. .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть последовательность {г„} с указанными свойствами уже

выбрана. Тогда матрица Ап в соотношении

(15) при каждом фик­

сированном п ^ т — 1

определяется из системы линейных алгебраи­

ческих уравнений

 

 

 

 

 

 

 

 

 

 

 

 

 

 

;

- J' (Un—i ~Ь Гп—/)

 

J' (Un—j),

/ =

0, 1, . . .

,

т

1.

 

 

 

 

 

 

 

 

 

матрица Ап невырождена,

 

( 16)

 

Если полученная

при этом

то нахо­

дят ДГ1 и при выполнении условия

(ДГ‘ J' (ип), J'

(«п) ) > 0

присту­

п аю т^

выбору

величины

ап в

(15).

Для

этого

вначале полагают

ап =

“ я. где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аП= min

 

 

( У ( и п ) , Un

U g ) “| ^

• и„ — и„

 

An

 

J' (Цп)>

 

 

 

\ип—Й„|3 J

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

const > 0 ,

и проверяют справедливость

неравенства

 

 

 

 

 

J(u n+1) — J(Un)<C еа„ (Д (ы„),

ип — ип),

0 < е < - ^ -

(17)


116

М И Н И М И З А Ц И Я Ф У Н К Ц И И М НОГИ Х ПЕРЕМЕННЫ Х

[Гл. 2

(постоянные R, е являются параметрами алгоритма). Если нера­

венство

(17)

выполняется,

то останавливаются

на

выборе

а п= а п,

находят

un+1

по формуле

(15)

и переходят к

следующей

итера­

ции. Если же

неравенство

(17)

не выполняется

пр_и а„ = а„, то

производят дробление ап (например, последовательным делением пополам) до тех пор, пока (17) не окажется справедливым, и полученную в результате дробления величину принимают в каче­ стве ап в (15).

Если при каком-либо

п ^ т — 1

матрица Л„, определенная из

системы

(16),

окажется

вырожденной

или

же

(ДГ1

J'

(ип),

/ ' ( и , ) ) а

то

либо

изменяют вектор

гп

и

-заново

строят

матрицу Ап, либо полагают Ап= Е

(Е — единичная матрица) и

ап в (15)

выбирают, пользуясь каким-либо

вариантом

'градиент­

ного мет.ода; п-й шаг метода

при

всех п ^ т — 1

 

описан.

Если

0 -^ / г ^ т —2, то

в

(15)

можно

принять

Ап= Е

и

а,г

при

/г=0,1, . . . ,

т— 2 выбирать, как в градиентном методе.

векторы гп,

Пусть Rn— матрица, столбцами

которой являются

гп-\, ■•- ,

гп—т+\, a

Qn— матрица,

составленная

 

из

 

столбцов

•7 fan 'l- ^n)i

J fan)t • • •

i

>7 fan—m+1 Д ?n—n»+l)

J' fan—in-\-l)-

 

ТогдаТсистема -(16) для определения An может быть записана в виде следующего матричного уравнения: AnRn — Qn. Отсюда видно, что если Rn, Qn невырождены, то матрица Ап определяется однозначно,

Ап1 существует и ДГ1= RnQnl. Заметим, что матрицы Rn, Qn отли­ чаются от Rn+1 и соответственно Q„+1 лишь одним столбцом. Это обстоятельство позволяет получить достаточно простые и удобные

рекуррентные соотношения, связывающие матрицы ДГ+i и ДГ1 [86]. Благодаря этим рекуррентным соотношениям существенно уменьша­ ется трудоемкость обращения матрицы Ап, и метод (15) — (17) ока­ зывается более экономичным по сравнению с описанными выше ме­ тодом Ньютона и его модификацией.

 

Отдельно остановимся на случае,

когда векторы гп в (16)

вы­

бираются по закону: rn— Xnei+1,

где i — остаток

от деления

п

на

т,

О ^ г^ / п — 1, числа Л „>0 и Д п->-0

при

оо,

е ^=( 0, ...,

0,

1,

0,

. . . , 0) — единичный вектор

по

оси

Ou\

i— 1, 2, . . . ,

т.

Тогда система (16)

решается в явном виде и, как нетрудно видеть,

матрица Ап будет состоять из столбцов

 

7 ' (“п -г +

К —I ei) — 7 ' (un—j)

7* (un—._j_| Н- 7n_ i+ |gg) — J' Kt-t-|-i)

 

K -i

 

V - w

J ’ (“n +

J ’ (un)

J '(u„_m + |+

e [+2) — J ' (un_ m + l)

X

'

x m+1


§ 9] Метод штрафных функций 117

 

 

 

(ипi—1 ~t~^n—t—1e”»)

J

(un—i—l)

 

 

 

.

h - l - l

 

 

 

Для

сравнения

вспомним, что матрица J" (и)

состоит из столбцов

 

 

" дЧ (и ) -

 

 

 

’дЧ (и ) ~

 

 

 

дихди1

 

 

 

5u15um

 

д ]' (и)

_

 

dJ'

(и)

 

 

ди1

 

 

" ’ ’

дит

^

 

 

 

дЧ (и)

 

 

 

дЧ (и)

 

 

 

ди"‘ди1

 

 

 

дитдит

Отсюда видно, что столбцы матрицы Ап представляют собой

разностную аппроксимацию

соответствующих столбцов матрицы

Г (и)

в специально

выбираемых точках,

и метод (15) — (17) пре­

вращается в разностный вариант метода Ньютона. Поэтому мож­ но ожидать, что метод (15) — (17) будет обладать высокой ско­ ростью сходимости. Строгое доказательство этого факта для силь­ но выпуклых функций J(u ) ^ C 2(Em) проведено в работе [86]. Та­

ким

образом, метод (15) — (17) имеет

скорость

сходимости,

близ­

кую

к скорости сходимости метода

Ньютона

и в то же

время

является более экономичным по сравнению с методом Ньютона с точки зрения количества вычислений производных минимизируе­ мой функции и трудоемкости обращения матрицы Ап на каждом

шаге.

Для

квадратичной

функции,

определяемой

равенством

(7.7),

метод

(15) — (17)

сходится за

конечное

число

шагов [86].

Различные варианты метода

(15)— (17), обзор

близких

методов и

библиографию см. в [84],

[86],

[258].

 

 

 

Отправляясь от соотношений (15) — (17), в работе [87] постро­ ен быстросходящийся метод минимизации, не требующий вычисле­ ния производных минимизируемой функции. В этом методе выра­ жения градиента, встречающиеся в соотношениях (15) — (17), за ­ меняются разностными отношениями функции в подходящим обра­ зом выбранных точках. Другие методы минимизации функций, не требующие вычисления производных минимизируемой функции, описаны в работах [235], [262], [265]; библиографию и обзор см. в [87], [265]. Эти методы удобно применять в тех случаях, когда вы­ числение производных минимизируемой функции связано со зна­ чительными трудностями.

§ 9. МЕТОД ШТРАФНЫХ ФУНКЦИИ

Пусть функция /(и) определена на всем пространстве Ет и требуется минимизировать I (и) на множестве 1!ф Е т. Идея мето­ да штрафных функций заключается в замене исходной задачи