Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 117

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

14

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

Такие постановки характерны для оптимального управления. Отме­ тим еще разные модификации в пределах некоторых из указанных постановок. Например, можно, следуя Эйлеру, в (2) поменять ме­ стами х и у и рассмотреть такую простейшую задачу классического вариационного исчисления:

 

 

 

dy -> inf;

 

 

х (0) = х0,

x((/!)=Xi.

 

Можно вместо

уравнения

х2 + уг = 2gy в (4)

рассмотреть вклю­

чение:

 

 

 

 

 

(х,

(/)e=B (0,

V2gy),

 

где В(0,г) есть

круг с центром в

нуле радиуса

г. Допустимо еще

вместо последнего включения рассмотреть систему уравнений с управлениями:

£ =

и Y2gy .

у — v У 2gy ,

и2 + V2 1.

Получилось

довольно

большое число

формализаций, и каждая

из них обладает и своими преимуществами и своими недостатками. Но нам хочется подчеркнуть, что сама проблема формализации ре­ шается неоднозначно, и выбор наиболее естественной формы записи задачи является искусством, которое постигается при решении боль­ шого числа задач. Следует отметить, однако, что с математической точки зрения ни одна из задач (2) — (5) еще не поставлена полностью,

ибо нигде не очерчен точно

класс допустимых элементов. Этот

класс также

может выбираться по-разному. Скажем, задачи типа

(2) рассматривают обычно в

классе непрерывно

дифференцируемых

функций. Но

в этом классе

решения задачи

(2) не существует.

Действительно, решением задачи о брахистохроне является, как из­ вестно, циклоида, которая имеет в начальной точке бесконечную производную. Если же рассмотреть класс функций, являющихся не­ прерывными и непрерывно дифференцируемыми на отрезке |д'о, Xi] всюду, кроме, может быть, точки хо, то к этому классу циклоида будет принадлежать. Обычно рассматривают менее специальные классы: класс кусочно дифференцируемых функций, класс абсолют­ но непрерывных функций и др.

Ограничения в экстремальных проблемах стараются записать в виде равенств и неравенств. Такие ограниче­ ния называются функциональными. Помимо функцио­ нальных ограничений, встречаются ограничения типа включений: х е /1 , нефункционального характера. В ре­ зультате экстремальная задача (1) приобретает такую


0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

15

форму:

 

/о (*)->inf;

 

 

 

 

 

 

F (х) -

у0,

 

 

 

ft(х) < 0 ,

i s I,

 

 

 

х е

А.

 

Здесь У

и

/ — некоторые

множества, F\

X —*Y,

ft'. X -> R ,

i e

/ и Л с 1 , Отметим, что различие между

функциональными и нефункциональными ограничения­

ми, вообще

говоря, условно

(ибо каждое

включение

х ^ А

можно

записать

функционально),

но

часто оно

оказывается полезным.

 

 

 

 

Перейдем теперь к обсуждению общих принципов

теории

экстремальных

задач.

Предметом

этой теории

является точно поставленная экстремальная проблема. В связи с каждой такой проблемой естественно возни­ кают три вопроса. Во-первых, существует ли решение задачи? Если можно предполагать, что решение суще­ ствует, то надо выяснить, каким условиям оно должно удовлетворять. Наконец, в-третьих, как фактически най­ ти решение задачи или минимизирующую последова­ тельность для нее? Поставленные вопросы соответствуют разделам теории экстремальных задач, где изучаются существование решений, необходимые и достаточные условия экстремума и вычислительные методы нахож­ дения решений. Эти разделы связаны между собою, но вместе с тем каждый из них обладает достаточно боль­

шой самостоятельностью.

о н е о б х о д и м ы х

у с л о ­

Расскажем сначала

в и я х э к с т р е м у м а .

Первый общий принцип

полу­

чения необходимых условий в экстремальных задачах без ограничений был найден Ферма. Идея Ферма, выра­ женная современным языком, состоит в том, что реше­ ния гладкой задачи fo(*)—*■inf следует искать среди стационарных точек функционала fo(x), т. е. среди ре­

шений уравнения

(6)

Г0(х) = 0.

Этот результат называют иногда теоремой Ферма. Для задач с ограничениями общий принцип получения необ­ ходимых условий экстремума был выдвинут Лагранжем.


16 0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

Замысел Лагранжа можно распространить далеко за пределы тех задач, которые он сам рассматривал. Мы раскроем его на примере той общей постановки, с которой постоянно будем иметь дело в этой книге. Пусть

X и

У— линейные

пространства,

F: X —> У, fp. X R,

i — l,

... , т, A cz X. Рассмотрим задачу:

 

 

fo W —> inf;

F(x) = 0,

 

 

 

 

fi (x) ^ 0 ,

i =

1, . . . , m,

x e A.

 

Следующую функцию:

 

 

 

 

m

 

 

S£ (x, у', Я.0.........l m) =

 

 

 

 

 

(y*,

F (x)) +

2 hfi (x),

 

 

 

 

 

 

 

 

i= о

 

где у* — линейный

функционал

на

У,

а А*— числа,

на­

зовем

функцией Лагранжа задачи

(I')- Функционал у*

и числа Я*, 0 ^ i ^ т,

называются множителями

Ла­

гранжа. (Отметим,

что

функция Лагранжа составлена

с учетом только функциональных ограничений.) Прин­ цип Лагранжа состоит в следующем:

Пусть точка х* есть точка локального минимума в

задаче (Г ).

Тогда найдутся такие множители Лагранжа

у* u K i^ O

(С К Л '^ т ), не равные одновременно нулю,

что х* удовлетворяет необходимому условию локального минимума в задаче

3? (х, •) —> inf; л е ф

и при этом

 

hifi(xt) — 0, г'= 1 , . . . . пг.

(7)

Иными словами, необходимые условия минимума в исходной задаче совпадают с необходимыми условиями минимума функции Лагранжа (при выборе некоторых множителей Лагранжа) по множеству я е Л , состоя­ щему из ограничений, не включенных в функцию Ла­ гранжа. Соотношения (7) называются условиями до­ полняющей нежесткости. Они означают, что отличные от нуля множители Лагранжа надо приписывать только тем ограничениям типа неравенства, которые суще­ ственны в данной точке, т. е. тем, где /,(л:*) = 0.

Проиллюстрируем принцип Лангранжа на конечно­ мерных задачах. Пусть в (1') X = А — Rn, т. е. X — д-мер-


0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

17

ное евклидово пространство, и неравенства отсутствуют. Равенства задаются конечным числом соотношений вида

f 1(*) = 0.

•••,

fm (X) = 0.

 

Таким образом, F — (fu

. .. ,

fm)

есть

отображение из

R71 в Rm. Все функции fo(x),

... ,

fm(x)

предполагаются

гладкими. В соответствии с принципом Лагранжа над­ лежит составить функцию Лагранжа

пг]

2 = Я Ш х )

/=о

и написать необходимое условие в задаче без ограни­ чений 2.? —►inf. Но такое необходимое условие дается теоремой Ферма (см. (6 )): З ’х — О. В итоге получается система уравнений:

т

^ = 2 У ' W = o.

Полученный результат широко известен под названием

правила множителей Лагранжа.

В гл. 1 мы выделим три класса задач, для которых верен принцип Лагранжа. Это — гладкие задачи, задачи выпуклого программирования, а также задачи со сме­ шанной гладко-выпуклой структурой. Классическое ва­ риационное исчисление относится к числу гладких за­ дач, задачи оптимального управления могут быть реду­ цированы к гладко-выпуклым задачам. Эти вопросы освещаются в первых двух главах книги и в пятой главе.

Принцип Лагранжа верен для многих важных за­ дач, но всякий раз его необходимо обосновывать. Ка­ ковы же методы доказательства принципа Лагранжа и других необходимых условий? В основе большинства подобных доказательств лежит метод вариаций. Объ­

ясним

существо

этого метода. Рассмотрим общую за­

д а ч у '(1), где X — топологическое пространство. Вариа­

цией

точки х*

называется непрерывное отображение

Я->х(Я) отрезка

[0, е] в X такое, что х(0) = х*. Вариа­

ция называется допустимой, если для достаточно малых

Я все точки кривой

х(Я) принадлежат

С. Пусть теперь

вариация х (Я)

такова, что функция

ф(Я) = /о(*(Я))

]

'0«rpjf >.

 

СССР


18 0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

является дифференцируемой в нуле. Тогда, если а, есть точка локального минимума в задаче (1), то функция Ф должна иметь минимум в точке нуль и, значит, дол­ жно выполняться неравенство ф '(0 )^ 0 , являющееся необходимым условием минимума функции одного пере­ менного, заданной на отрезке [0, е]. Метод вариаций со­ стоит в том, что ищется достаточно широкий класс до­ пустимых вариаций и затем извлекаются следствия из соотношений ф/ (0 )^ 0 , написанных для каждой вариа­ ции из заданного класса.

На первом этапе развития теории применялись про­ стейшие вариации — вариации по направлениям. Так были получены необходимые условия в задачах конеч­ номерного анализа и в классическом вариационном ис­ числении. Вывод необходимых условий экстремума в классическом вариационном исчислении непосредствен­ ным применением метода вариаций проводится у нас в § 2.2. Помимо вариаций по направлениям, в вариа­ ционном исчислении применялись вариации иной при­ роды. Для вывода необходимых условий сильного мини­ мума Вейерштрасс применял вариации, получившие название «игольчатых». При помощи таких вариаций можно вывести простейшие варианты принципа макси­ мума (см. § 2.4).

Как правило, множество допустимых вариаций ста­ раются выбрать так, чтобы оно оказалось локально устроено, как выпуклое. Выпуклые задачи обладают многими замечательными особенностями. В них всякий локальный минимум является абсолютным, кроме того, с каждой выпуклой задачей можно сопоставить другую, называемую двойственной к ней; при этом решения лю­ бой из них являются множителями Лагранжа для дру­ гой. Часто двойственная задача проще устроена, чемисходная.

Вернемся снова к принципу Лагранжа. Если для по­ ставленной задачи (или для задачи, полученной из нее применением метода вариаций) этот принцип оказы­ вается применимым, то он приводит к некоторым урав­ нениям (алгебраическим, дифференциальным и т. п.). Решения этих уравнений называются экстремалями. Обычно найти экстремали удается лишь при помощи очень трудоемких вычислений. И все-таки случается, что

0. ВВЕДЕНИЕ. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ

19

уравнения, полученные из необходимых условий экстре­ мума, удается разрешить в общем виде.

Зададимся вопросом, какие свойства задачи могут облегчить решение этих уравнений. Отметим несколько таких обстоятельств. Во-первых, это — линейная струк­ тура задачи. Задачи с линейной структурой наиболее полно изучены. Сюда относятся задачи линейного про­ граммирования (ему посвящен § 6.1), квадратичные за­ дачи в гильбертовом пространстве (см. §§ 6.2 и 6.3) —

здесь линейными оказываются те уравнения, которые выражают необходимые условия, — и линейные задачи оптимального управления (см. § 9.3). В качестве вто­ рого обстоятельства отметим выпуклую структуру за­ дачи. Об одном замечательном свойстве выпуклых за­ дач— о возможности двойственного описания их — уже говорилось. Особенно плодотворны методы, связанные с выпуклостью, когда эта выпуклость сочетается с ко­ нечномерностью. Этим последним обстоятельством объ­ ясняется обилие решенных задач об аппроксимации в пространствах с метрикой С. В заключение отметим также, что если задача обладает какой-то инвариантной структурой, то это, как правило, влечет за собой много важной информации относительно решений задачи — теорема Нётер в вариационном исчислении и т. п. На этом мы закончим обсуждение вопросов, связанных с необходимыми условиями экстремума, и перейдем к до­ статочным условиям.

("Раздел книги, посвященный д о с т а т о ч н ы м

у с л о ­

в и я м (гл. 7), занимает в ней скромное место.

Дело в

том, что если часть теории экстремальных задач, посвя­ щенная необходимым условиям экстремума, имеет ныне устойчивые очертания — там выработан свой язык, своя методология и получены общие и содержательные теоре­ мы, то этого нельзя еще сказать про принципы получе­ ния достаточных условий. Здесь нам хочется обсудить возможные перспективы теории и примерный план ее построения. Суть дела видится нам в следующем. Полу­ чение достаточных условий связано с глобальным под­ ходом, когда индивидуальная задача включается в со­ вокупность подобных ей задач, зависящих от некоторых параметров. (Эту процедуру называют методом возму­ щения.) Минимум в полученных задачах становится