Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 147

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

80

ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУ,МА

 

 

г)

образ множества X Ж U при отображении

 

 

 

, u) - >Fx {xt, u,)x +

 

F(x„ и)

 

 

 

содержит окрестность нуля

в

Y

 

и

существует

точка

(х, и) такая, что

 

 

 

 

 

 

 

 

 

 

 

Fх (х„, ut) x +

F (х„

и) =

0,

 

 

 

 

 

(.fix {xt> Ц,)>

Xs)

fi (xt,

и) < О

 

 

 

при всех i, при которых fi(x*, и*) =

0,

то Яо ф

0

и мож­

но считать,

что Яо = 1.

 

 

 

 

 

 

 

 

 

Соотношения (18) и (19) мы будем называть соот­

ветственно

уравнением

Эйлера Лагранжа

и

усло­

вием

Куна Таккера, а

равенства

(20)

суть

не что

иное,

как условия дополняющей

нежесткости.

Уравне­

ние Эйлера — Лагранжа, как

и

в

случае

гладких за­

дач, означает, что в точке х* функция Лагранжа удов­ летворяет необходимым условиям минимума по х, а ус­ ловие Куна — Таккера, как и в случае выпуклых задач, означает, что функция Лагранжа достигает минимума по и в точке «*. Таким образом, согласно теореме 3, принцип Лагранжа применим к гладко-выпуклым за­ дачам, т. е. необходимые условия минимума в задаче (14) — (17) совпадают с необходимыми условиями ми­ нимума функции Лагранжа при единственном не вклю­

ченном в эту функцию ограничении « е U.

 

 

 

да

Условие в) теоремы 3 выполняется, в частности, ког­

отображение

F

распадается

на

отображение

Л : X Ж TJ -+

Yi

(где

Yi — некоторое

банахово

прост­

ранство)

и

отображение

в

R™ так,

что

отображение

х -> Fi (х, «*)

регулярно.

Таким

образом,

справедливо

утверждение:

 

Предположим,

что в задаче

(14) —

 

С л е д с т в и е .

(17) условие F ( x , u ) = 0

записывается следующим

об­

разом:

 

 

 

 

 

F, (х, и) = 0,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

h, (х, и) = 0 ,

. . . ,

hm (х, и) = 0 ,

 

 

 

где

Ft: X Ж U -* Уи

Yt — банахово

пространство

и

hi,

. . . ,

hmдействительные

функции

на

X Ж U-

Предположим далее,

что

условие

в)

в формулировке

теоремы заменяется следующим:

 

 

 

 

 


 

§

1.1. ПОСТАНОВКИ

ЗАДАЧ

 

 

81

в') отображение х —*•Fl (x, «*)

регулярно

в точке х*.

Тогда, если выполнены остальные условия теоремы,

то ее утверждение остается в силе.

Каждая

из трех

1.1.4.

Замечания и обсуждения.

сформулированных

теорем распадается

на

две

части:

первую — общую и

вторую — содержащую

условия ре­

гулярности,

выполнение которых

обеспечивает неравен­

ство коэффициента Я0 нулю. Случай Яо — 0, вообще го­ воря, неинтересен, поскольку при этом необходимые условия никак не связаны с минимизируемым функцио­ налом и определяют только некоторую экстремальную структуру ограничений. Тем не менее применять тео­ ремы удобнее в общей форме. Во-первых, зачастую Яо ф 0, даже если не выполнены условия регулярности. Во-вторых, что особенно важно, прямая проверка не­ равенства Яо Ф 0 во многих случаях проще проверки соответствующих условий регулярности.

Равенство или неравенство коэффициента Яо нулю зависит, в частности, от того, какие ограничения вклю­ чены в функцию Лагранжа, а какие оставлены за ее пределами. Это лучше всего проследить на примере за­ дачи выпуклого программирования. В функцию Ла­ гранжа этой задачи мы не включили ограничение хеЛ . Выше отмечалось, что это ограничение можно задать функционально, например, так: А = {x |/„+i (x ) jC 0}. Однако здесь возможна такая ситуация, когда не су­

ществует

ни

одной

точки х

такой,

что / , ( х ) < 0

для

всех i =

1,

. . . , п 4-

1.

Если

бы

в

этом случае

мы

включили

ограничение

fn + i(x )^ 0

в функцию Лагран­

жа, то условие Слейтера было бы нарушено и нельзя было бы гарантировать неравенство коэффициента Яо нулю. Итак, стремление обеспечить неравенство коэф­ фициента Яо нулю побуждает отбирать ограничения, включаемые в функцию Лагранжа, так, чтобы условия регулярности не нарушались. Однако, с другой стороны, чем больше ограничений включено в функцию Ла­ гранжа, тем эффективней соответствующее необходимое условие минимума.

Заметим, кстати, что из теоремы 2 следует простое правило определения знаков множителей ’ Лагранжа, соответствующих ограничениям типа неравенства. В за­ даче на минимум их следует выбирать так, чтобы


82 ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

функция Лагранжа стала выпуклой по х. (Это замеча­ ние надо иметь в виду, поскольку в выпуклых задачах часто встречаются ограничения вида g(x) ^z О, где g — вогнутая функция.) Конечно, в задачах на максимум знаки множителей Лагранжа должны быть такими, что­ бы функция Лагранжа была вогнутой. В невыпуклых задачах знаки надо выбирать такими, как будто зада­ ча — выпуклая, и т. д.

Нетрудно видеть, что классы задач, охватываемых теоремами 1 и 2, не пересекаются и, наоборот, теорема 3, по существу, содержит в себе теоремы 1 и 2, хотя и не охватывает их целиком. В самом деле, если в усло­ виях теоремы 3 множество U состоит из единственного элемента, а ограничения f i (х, и) ^ 0, .. ., /„ (х, и) s j О отсутствуют, то мы получаем утверждение, аналогичное теореме 1, но с дополнительным требованием конечной коразмерности. Наоборот, если отсутствует ограничение F(x,u) — О, U есть выпуклое подмножество линейного пространства и функции f0, . . ., /„ не зависят от х и выпуклы по и, то из теоремы 3 следуют все утвержде­ ния теоремы 2, за исключением, конечно, достаточности.

С помощью теоремы 3 можно получить и некоторые

обобщения теорем 1

и 2. Рассмотрим

такую задачу:

 

 

 

 

 

 

 

 

 

(21)

 

 

 

 

F(x) =

О,

 

 

 

(22)

 

 

М х ) < 0,

м * ) < о ,

 

(23)

 

 

 

 

х е Д ,

 

 

 

 

(24)

где, как обычно, F: X -> У, f0,

.

fn — функции на X,

А сг X и У — банахово пространство.

пространство и

Т е о р е м а 4.

Пусть X банахово

А — X. Предположим, что отображение F

и функции

fa, . . . .

fn

непрерывны и дифференцируемы по Фреше в

некоторой окрестности точки х „

удовлетворяющей усло~

виям (22) — (24), причем производная F'(x)

отображе­

ния F непрерывна в точке х*.

Допустим, наконец, что

образ

пространства

X при отображении

х ►/г'(х*)х

замкнут.

Тогда,

если

х* — точка локального минимума

в задаче

(21) — (24), то существуют

не равные

одно­

временно

нулю

множители

 

Лагранжа

Яо

0, .. ,


 

 

 

§

1.1.

ПОСТАНОВКИ

ЗАДАЧ

 

 

83

. .. ,

Кп >

0 и у* e F ’

такие,

что

 

 

 

 

 

2

х (х ,

V . . . , Л„,

у') =

£

KJ'. (х ) +

Z7'* (х ) у ’ = 0,

 

 

 

hfi (*.) =

0,

 

/ =

1..........я.

 

 

£сл« же, кроме того, отображение F регулярно в точке

х , «

существует такой вектор к е Х , что

 

 

 

 

 

 

Т7' (xj х =

0,

 

/' (xj х < 0

 

 

для тех индексов i =

1,

. . . ,

п, при которых ^ ( х « ) = 0,

то Ко ¥= 0

и можно без

ограничения общности считать,

что Ко = 1.

 

 

 

 

 

 

 

 

 

 

 

Точно так же с помощью теоремы 3 можно получить

следующее обобщение теоремы 2.

 

(21) — (24)« X ли­

Те о р е м а 5. Пусть

в задаче

нейное пространство, fo, . . . ,

/„ — выпуклые функции на

X, F аффинное

отображение

(т. е.

F (х) = уо +

Лх,

где

уо е

У, а Л: X -> Yлинейный оператор)

и

А

выпуклое множество. Тогда,

если х* — решение

задачи

(21) — (24), то существуют

не

равные одновременно

нулю

множители

Лагранжа

Х0

^ 0......... Кп ^

0

и

у* е

Y* такие, что

 

 

 

 

 

 

 

 

 

 

 

2 (х.,

К0,

. . . . К ,

у *) =

2

h fi (х.) +

( у\

F(xt)) =

 

 

 

 

 

 

 

 

i=i

 

 

 

 

 

 

 

 

 

 

 

 

=

rnin 2

(х,

Я0, . . . . Кп, у*)\

 

 

 

 

 

АчМх.) =

0,

 

/ =

1,

. . . ,

п.

 

 

Если же, кроме того, образ множества А при отображе­ нии x - * F ( x ) содержит окрестность нуля пространства Y и существует такой вектор х е 4 , что

F (х) = 0,

(х) < 0, i = l .........

п,

то Ко Ф 0 и можно считать, что Ко — 1. В последнем слу­ чае написанные выше соотношения достаточны для того, чтобы точка х», удовлетворяющая условиям (22) — (24), была решением задачи (21) — (24).

При формулировке теорем 1—3 мы всякий раз обращали вни­ мание на то, что основные соотношения в этих теоремах находятся в соответствии с принципом Лагранжа. Согласно этому принципу


84

ГЛ. 1. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА

при

подходящем выборе множителей Лагранжа решение задачи

с ограничениями удовлетворяет условиям стационарности (или ми­ нимальности при наличии выпуклой структуры) в задаче

2? -» inf;

без ограничений или при ограничениях, не включенных в функцию Лагранжа. Однако в теоремах фигурируют и другие условия, ха­ рактеризующие множители Лагранжа. Это — условия неотрицатель­ ности множителей Лагранжа, соответствующих ограничениям типа неравенства, и условия дополняющей нежесткости. На самом деле и эти условия, как и условия, которые выводились из принципа Лагранжа, носят экстремальный характер и могут быть получены

из другого, более общего экстремального принципа.

Пусть

X и

Для иллюстрации рассмотрим следующую задачу.

У— банаховы

пространства,

/о — функция на X, дифференцируемая

в окрестности

точки

х., Ф:

X -*■ У — отображение, тоже

дифферен­

цируемое по

Фреше

в окрестности точки х», и U — выпуклое

под­

множество пространства Y. Тогда можно сформулировать такую

задачу;

 

 

/„ (* )-> inf;

 

(25)

 

 

 

 

 

 

 

Ф (х) <= U.

 

(26)

Эту задачу можно рассматривать как некоторое обобщение гладкой задачи из п. 1.1.1. С другой стороны, она легко сводится к гладко­ выпуклой задаче, если положить

F (х, и) = Ф (х) — и,

а условие Ф (х )е U переписать в виде

 

F (х, и) = 0,

(27)

u e U .

(28)

Допустим, что в получившейся гладко-выпуклой задаче выполнены все условия теоремы 3 (в точке х„). Введем функцию

§ (х, г / * ) = 0 / оя М

+У\ (ф ( * ) > (у- ' I U)s .

где s(-\U) — опорная функция множества U, определенная в § 0.3. Покажем, что утверждения теоремы 3 для получившейся задачи

равносильны следующей теореме.

Т е о р е м а о с е д л о в о й т о ч к е . Для того чтобы х„ была точкой локального минимума в задаче (25), (26), необходимо су­ ществование таких не равных одновременно нулю числа 7,о 5= 0 и вектора у* е У*, что

(*,. у ) = У о (*,) +

Ф'* (*.) у = °-

(29)

Z (х9, у") = max

& (х,, г*).

(30)

2 * £ = У *

 

 

Выведем из сформулированной теоремы результат теоремы 3 для задачи (25), (27), (28) (обратный вывод совсем прост). Соот­