Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 201

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

s n Постановка задачи. Обозначения. Вспомогательные сведения 53

рианты излагаемых методов, чтобы ознакомить читателя с основа­ ми этих методов, полагая, что знание основ методов облегчит читателю изучение литературы по данному вопросу, позволит ему без особого труда самостоятельно разобрать тот или иной алго­ ритм и выбрать подходящую модификацию метода или самому придумать новую его модификацию, исходя из особенностей кон­ кретной задачи.

Чем руководствоваться при выборе метода, каковы критерии, по которым можно'сравнивать различные методы? Довольно рас­ пространенный критерий оценки метода — скорость сходимости, и при этом считают, что чем выше скорость сходимости, тем лучше метод. Конечно, чем быстрее сходится метод, тем меньшее число итераций необходимо для получения решения с заданной точ­ ностью. Однако при оценке метода важное значение имеет не столько скорость сходимости метода, сколько общий объем вычис­ лений, требуемый для получения решения с заданной точностью. А общий объем вычислений зависит не только от числа итераций, но и от трудоемкости вычислений на каждой итерации. Нередко бывает, что при решении конкретной задачи выгоднее применять метод, который хотя и сходится медленнее и, следовательно, тре­ бует большого числа итераций, но расчет каждого шага итерации этого метода осуществляется просто и требует небольшого числа машинных операций, и суммарный объем вычислений для решения задачи с нужной точностью оказывается меньше, чем при приме­ нении другого, более быстро сходящегося метода, если каждый шаг итерации последнего связан с трудоемкими' вычислениями.

В том случае, когда свойства минимизируемой функции из­ вестны мало, то, видимо, сначала полезно применять грубые и простые методы минимизации (быть может, даже метод простого перебора значений функции на сетке с небольшим числом узлов), а затем на основе накопленной при этом информации о функции перейти к более точным методам. Например, при минимизации достаточно гладких функций сначала можно применить какой либо вариант градиентного метода, который вблизи точки мини-

•мума обычно начинает сходиться очень медленно, а затем на основе полученного приближения точки минимума перейти к ме­ тоду Ньютона, каждый шаг которого хотя и более трудоемок, но общий объем вычислений может оказаться небольшим из-за быстрой сходимости метода Ньютона вблизи точки минимума.

При выборе метода минимизации наряду с общим объемом вычислений следует принимать во внимание также и устойчивость метода по отношению к погрешностям, область сходимости мето­ да, степень гладкости и другие свойства минимизируемой функ­ ции, сложность вычислений значений функции и ее производных, используемых в методе, требуемый объем памяти, удобство реа­ лизации на ЭВМ и т. д.


— гра-

54

 

 

М И Н И М И З А Ц И Я Ф У Н К Ц И И

МНОГИХ ПЕРЕМЕННЫ Х

 

[ Л , 2

 

2.

Для

описания и изучения -методов минимизации нам пон

бятся отдельные формулы и факты

из классического анализа. При­

мем

следующие

обозначения: Е т— евклидово

пространство

размер­

ности т\ и =

а

х

I — вектор-столбец или

точка

пространства Ет с

(

:

 

 

 

 

\umJ

 

 

 

 

 

 

 

 

 

 

 

координатами

u£,

i — 1 ,

2 , . . . , т;

иТ = (и1, ■■■, ит) вектор-строка;

А =

{

а

— матрица порядка п х

т с элементами

acj(i = 1 ,2 , . . . ,п\

у = 1,

2,

. ••, т)\

матрицу,

полученную транспонированием

А,

будем

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

обозначать через АТ или

А*\

агb =

(а, Ь)еп =

а ‘Ь‘ — скалярное про-

 

 

 

 

 

 

 

 

 

 

 

 

i=i

 

_______

 

 

изведение двух

векторов

а

и b

из Е ,п; |а \Ет =

] / (а, а)Ет~

евклидова

норма вектора

а 6

Ет\ Аи = и — произведение матрицы

А на

вектор-

столбец

и, представляющее

собой

вектор-столбец v 6

Еп с

координа-

 

 

 

т

 

 

 

 

 

т

 

 

 

 

 

 

 

тами

 

v‘ = £

йци‘ \ (Ah,, t,) =

^

dijVV — квадратичная форма с сим-

 

 

 

Уг=1

 

 

 

 

 

£,/=1

 

 

 

 

 

 

 

метрической матрицей Л

порядка т х /гг,

||А ||„jm =

sup\Аи\Е — норма

матрицы А порядка п х т .

Там,

 

 

 

 

|<1

 

 

 

где не могут возникнуть недоразуме­

ния, индексы пространств в обозначениях скалярных произведений, норм векторов и матриц, знак транспонирования в обозначении век-

/•М «) X

тор-строки мы будем опускать. Пусть далее J' (и) :

W n (и) J

диент функции J (и) в точке и,

J ихихУ

Г ( и ) =

матрица вторых производных функции J (и) в точке и; здесь

 

J

dj (иу

д Ч ( и )

 

 

 

 

ди1

д и £дик

 

 

 

 

 

 

 

Qp (U). — множество

всех

функций,

обладающих

на U

непрерывными

частными производными до порядка

р включительно;

о (а) — величи­

на, бесконечно малая относительно а при а -» -0 , т. е. limo (а) -а- 1 .=

0 .

 

 

 

 

 

а -»0

 

Как

известно, для любых а, b 6 Ет имеет место неравенство Ко­

ши — Буняковского:

|(а,

Ъ) |< |а \■|Ь\, причем

знак

равенства при

а , Ь Ф 0

возможен

тогда

и только

тогда, когда

a =

ab, а = const.

Далее, \Аи\Еа < IIA ||„,m |и |£|п для любых матриц А порядка п х т

и

любых и 6 Ет.

 

 

 

 

 

 


§ п

 

Постановка

задачи. Обозначения. Вспомогательные сведения

55

 

Если J (и) £С р (U),

и +

ah £ U при 0 < а <

1,

то

 

 

 

 

 

J (u +

h) J

(и) =

(/' (и), h) + о ( \h\)

при р =

1 ,

(2 )

J(u + h) — J(u)

=

( J ' ( u ) , h ) + - j ( J "(u)h,h) + o{\h\2)

при р = 2.

(3)

 

Рассмотрим функцию g (а) — / + аК) одной переменной а,

0 <

< С а < ;1 , при фиксированных и, h, предполагая,

что u + a h ^ U

при

всех

а,

0 <

а <

1.

Если J (и) 6

Ср (U),

то g (а) 6

Ср [0,

1],

причем

ё' (а) =

( J ’ (« +

ah),

Щ,

(р >

1),

g" (а) = (/" +

ah) h,

h)

(р > 2).

(4)

В самом деле, если,

например,

J

(и) £ С2 ([/), то, заменив в формуле

(3)

и на и + ah, h

на Дah, получим

 

 

 

 

 

 

 

 

 

 

g (а

+

Да) — g (а) =

Да (/' (и -f- ah), h) +

 

 

 

 

 

 

 

+

 

 

Да2 (/" +

ah) h, h) + о ( |Да |2).

 

 

 

Отсюда

следует, что g (а) в С2 [0,

1] и верны формулы (4).

 

 

Выпишем следующие формулы классического

анализа для функ­

ции g (а):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а

 

 

 

 

 

 

 

 

 

 

g(a) — g (0 ) =

g ’ (0 ха) а = | g' (t) dt =

g r (0 ) а +

- y g " (0 2а) а2,

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

 

g' (а) — g' (0 ) = аg" (0 3а), 0 < в£< 1 .

 

 

 

 

Полагая в

этих

формулах

а = 1

и

пользуясь равенствами

(4),

получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J

+

h) J

 

(и) = g (1) — g (0) =

(J'(u +

Bjh), h) =

 

 

 

 

 

 

 

 

 

= ^ (J'(u + th),h)dt,

 

 

 

 

(5)

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

 

 

 

 

 

J

(u +

h) — J

(u) =

(J' {u),h) +

-1- (/" 4 - e2/i) h, h),

(6 )

 

{J’ (u + h) -

J' (u), h) = g' (1) — g' (0) = (J" (u +

Q3h) h, h).

(7)

3.В настоящее время наиболее полно исследованы зада

минимизации выпуклых функций на выпуклых множествах. Р аз­ дел экстремальных задач, рассматривающий такие задачи, часто называют выпуклым программированием. Приведем определения выпуклых множеств и функций, докажем некоторые их свойства. По поводу выпуклых множеств и функций см. работы [39, 46, 73,

8 8 , 97, 114, 116, 127, 128, 133, 134, 199, 229, 260, 269] и др.


56

М И Н И М И З А Ц И Я Ф У Н К Ц И И

М НОГИ Х ПЕРЕМЕННЫХ

 

[ Г л . 2

 

 

 

iPTu--'

°

’ ••• « -

 

выпуклым,

О п р е д е л е н и е

1 .

Множество

 

£/ называется

если а и + ( 1— а ) в е (/

при любых

u,

n et/ и любых а, Ог^агсН,

т. е. отрезок £ ^ -а (у — и),

где О ^ а ^ Л ,

соединяющий

любые две

точки и, v множества, также принадлежит множеству.

 

 

Таким

образом,

формулы

 

(2— 7)

справедливы

при

всех

и, u+h^ .U ,

если

U — выпуклое множество, а функция J (и)

доста­

точно гладкая.

 

 

Функция J (и ), определенная

 

 

О п р е д е л е н и е

2.

на выпук­

лом множестве U, называется выпуклой, если

 

 

 

 

J (аи + (1 — a) v) •< a J (и) + (1 — a) J (у) f t v

(8 )

при всех и,

v ^ U

и всех

а, O ^ assri.

Если в (8 ) равенство

воз­

можно только при а = 0 и а = 1, то /(и)

называется

строго выпук­

лой функцией.

 

 

J (и) выпуклая функция

 

 

 

Т е о р е м а

1. Если

на

выпуклом

множестве

U, то

всякая

точка

локального минимума

J (и)

одно­

временно является точкой ее абсолютного минимума на 0 . Мно­

жество U* всех точек минимума J (и) на U выпукло

(если

оно не

пусто). Если

J (и) строго выпуклая

функция на U, то она может

достигать своего

минимума

на U не более, чем в одной точке.

Д о к а з а т е л ь с т в о .

Пусть

 

н* — точка локального

мини­

мума /(«), т. е.

существует

такая

окрестность О точки и*, что

J ( u * ) ^ J ( u )

при всех н е О

и « e U .

Пусть

вопреки утверждению

существует

такая точка

 

ие1/,

 

что

/(и*) > / ( у ) .

Так

как

и — и* + a ( v — u*)eO f)£/ при всех достаточно малых а,

0 < а < 1, то

с учетом выпуклости функции J (и)

будем иметь

 

 

 

 

J (и*) <

/ (и* -Ь а (у — и*)) < a J

(у) + (1 — a) J («*) <

J

(и*).

 

Противоречие. Следовательно,

ы* — точка

абсолютного

минимума

J {и) на U.

 

 

 

 

 

 

 

 

 

 

 

Далее, если выпуклая функция достигает своего минимума в

двух различных точках и*,

v*^ U ,

то она достигает минимума

во

всех точка отрезка, соединяющего эти две точки. Это следует из соотношений

J («*) = J (у*) <

J (<ш* + (1 — а) у*) <

a J (и*) + (1 — a) J

(у’) =

J (и*),

превращающихся в равенства при всех a,

O ^ a^ C l. Однако в слу­

чае строго выпуклой функции такое равенство невозможно

при

0 < а < 1 . А

2. Если выпуклая

функция

J ( u ) ^ C l (U)

на

вы­

Т е о р е м а

пуклом множестве U, то

 

 

 

 

 

 

 

(J'(y ), и — у )< Т (« ) —

(и), и — у)

при всех и, у U.

 

 

 

 

 

 

 

 

(9)

Д о к а з а т е л ь с т в о .

Перепишем

неравенство

(8 )

в

виде

J(v-\-a(u—у) ) J ( v ) ^ . a [ J ( u ) —/(у)]. К левой

части

этого

нера­


§ П

Постановка задачи. Обозначения. Вспомогательные

сведения

 

57

венства

применим

формулу

(5):

J(v-{-a(u —v ) ) J(v) = a(J'(v-\ -

+ 0 a(u — a )), иv),

O ^ G ^ l, и получим (//(u + ’0 a (« — v)), иv) ^

^ / ( u ) — 7 (d) при

всех a,

0 < a ^ l . Отсюда

при a -*-+ 0 вытекает

левое неравенство (9). Поменяв в полученном неравенстве

роля­

ми и и v, получим правое неравенство

(9).

А

 

 

 

C 1 (U)

Т е о р е м а

3.

Для того чтобы выпуклая функция J (и) g

достигла

своего

минимума

 

на выпуклом

множестве

U в

точке

«*е£/ , необходимо и достаточно, чтобы

 

 

 

 

 

 

 

 

 

(/'(«*),

и — ы‘) > 0

при всех

 

и £ и .

 

 

 

( 1 0 )

Если и* — внутренняя

точка

множества

U,

то условие

(10)

экви­

валентно равенству / '(«*) = 0 .

 

 

 

 

 

u *^ U — точка

Д о к а з а т е л ь с т в о .

 

Необходимость. Пусть

минимума /(и) на U. Тогда при любом u^U , и а,

0 < а < 1 ,

с по­

мощью формулы (2 ) имеем

 

 

 

 

 

 

 

 

 

 

 

0 <

J

(и* +

а — «*)) — J (и*) = а (J ' (и*),

и и*) +

о (а),

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

< (/ '(« *). « - « * ) +

а

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда при а-Я ) сразу получим условие (10). Заметим, что

условием выпуклости J (и)

мы здесь не воспользовались, так

что

условие

минимума

(10) необходимо

для всех J(u )^ .C l (U),

если

U — выпуклое множество.

 

 

 

 

 

 

 

 

 

 

 

Если и* — внутренняя

точка

множества

U и h — произволь­

ный вектор из Ет, то

u — u* + ah^.U

при всех достаточно

малых

a, |a|^ao.

Полагая в (10)

u=u*-\-ah,

получим a (/ '(«*),

h) ^ 0

при всех a,

|a|^ao,

что

возможно

только

при

(Г (и *),

h ) —0.

В силу произвола h отсюда имеем / '(«*) = 0 .

 

 

 

 

 

 

Д о с т а т о ч н о с т ь .

Пусть /(«)

— выпуклая

функция,

пусть

для некоторой точки и* выполнено условие (10). Тогда из левого

неравенства

(9)

при

 

v = u*

получим

0 ^

(/ '(«*), ии *)^ .

(и)— /’(и*)

при всех

и е 1/,

т. е.

и * — точка

минимума.^,

Заметим, что условие минимума

(10) является обобщением

условия ( 1 ) на случай,

когда 11фЕт и точка минимума и*

может

лежать на границе множества.

 

 

 

 

 

Так как при и =ы *

(10) превращается в равенство, то условие

( 1 0 ) может

 

быть

 

переписано

 

в эквивалентном

виде

min (J'(u *)t и— и*) = 0 .

 

 

 

 

 

 

 

uBU

 

 

3.

Функция J(u ),

определенная на выпук­

О п р е д е л е н и е

лом множестве U, называется сильно выпуклой, если существует

такая постоянная к > 0 ,

что

 

 

 

 

 

J (аи + (1 — a) v) <

a J (и) -j- (1 a)J(v ) — а (1 — а) и|и — у |2 (11)

при всех u ,v £ U

и всех

а, 0 <С а •< 1 .