Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 15.10.2024
Просмотров: 213
Скачиваний: 0
|
§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ |
243 |
||||
Далее, |
коль скоро 0 е |
int В, как |
и |
в |
§ |
1.4, можно |
выбрать |
векторы х х<= X |
и у х, . . . , |
yt |
из |
сот F (xt, U) |
таким образом, чтобы линейная оболочка множества L0\){yx.........Vi) совпадала с У и
|
|
|
Fx(*., и.) х, + ух+ . . . |
+ г/, = 0. |
|
|
|||||||||
Тогда для каждого |
номера |
s = l , |
. . . . |
I найдутся числа |
|||||||||||
ysI > |
0, . . . . |
ysms > |
0, |
в сумме |
равные единице, и точки |
||||||||||
us.......... usms |
из и |
такие, что |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
ms |
|
|
|
|
|
|
|
|
|
|
|
|
iJs='%i VsiF(x., |
us]). |
|
|
|
||||||
Поэтому линейная |
оболочка множества |
|
|
||||||||||||
|
|
Д) U iF (*.. |
usj) l-s = 0, |
. . . . |
|
/; |
/ = |
1.........ms) |
|
||||||
совпадает |
с |
У и |
|
|
|
I |
m s |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Fx (*.. «.) ^ 1 + 2 |
2 YsjF (х„ |
usj) = 0. |
(25) |
||||||||||
|
|
|
|
|
|
|
|
S=1 |
/= 1 |
|
|
|
|
|
|
Наконец, воспользовавшись соотношением (24) и |
не |
||||||||||||||
прерывностью функций х -* -/'(х >( |
м ; х), можно выбрать |
||||||||||||||
такое |
число е > |
0, |
что |
при |
всех |
/ = 0, 1, . . . , |
k |
|
|||||||
|
|
|
|
|
|
|
т 0 |
|
|
|
|
|
|
|
|
f'i (*.> |
h |
+ ex,) + |
2 |
То/ (fi (*.> |
ti0j) — fi (*„ «.)) + |
|
|||||||||
|
|
|
|
|
|
|
l |
m s |
|
|
|
|
|
|
|
|
|
|
|
|
+ |
e 2 |
2 |
Уsi (fi (*„> «*/) — fi (*,- |
«.)) < |
o. |
|||||
|
|
|
|
|
|
S=1 |
/= 1 |
|
|
|
|
|
|
|
|
При этом |
в силу (23) и (25) |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
т о |
|
|
|
|
|
|
|
|
Fx (х,, |
и,) (х0+ ех,) + |
2 |
Уо1 (F (х., |
u0J) — F (х„ «,)) + |
|
||||||||||
|
|
|
|
|
|
|
г |
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
е 2 |
2 ySi( F( x„ Usj) — F(x„ |
и . )) = |
0. |
||||||
|
|
|
|
|
|
s=l |
/=1 |
|
|
|
|
|
|
|
|
Таким |
|
образом, |
набор, |
образованный |
вектором |
||||||||||
Xo + |
exi, точками |
«оь •••, Щт, |
из |
U и числами у01, . . . |
|||||||||||
•••> |
Yom9' |
еУц’ •••> |
8Y/OT/i |
Обладает |
требуемыми свой |
||||||||||
ствами (5) — (7). |
Теорема полностью доказана. |
|
|
244 |
ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ |
§ 5.2. Задачи оптимального управления с фазовыми ограничениями
Этот параграф содержит формулировку и обсужде ние принципа максимума Понтрягина для задач опти мального управления с фазовыми ограничениями. Дока зательство приводится в следующем параграфе.
5.2.1. Формулировка принципа максимума. Рассмот рим сначала задачу оптимального управления с закреп ленным временем:
|
|
ч |
|
|
|
3 |
(х (•), и (•)) = |
J / (t, х, |
и) dt - » inf; |
(1) |
|
|
х = ф(/, |
х, и), |
|
(2) |
|
|
и е |
U, |
|
(3) |
|
|
М *('о)) = |
М *(М ) = |
0, |
(4) |
|
gi(t, |
x(t))*^ 0, / е |
[/„,/,], |
fe. |
(5) |
На протяжении этого и следующего параграфов, за ис ключением специально оговариваемых случаев, пред полагается, что функции
/: R X R" X Rr —> R, |
gr R X R " - > R |
и отображения |
|
Ф: R X R rtX R r - > R n, hp |
R“ -*R*i ( / = 1 , 2) |
непрерывны и непрерывно дифференцируемы по х. (Как обычно, U cz Rr.) Подчеркнем, что, в отличие от § 2.4, дифференцируемости функций и отображений по t не требуется. В качестве допустимых управлений, как и в § 2.4, рассматриваются произвольные измеримые огра ниченные вектор-функции, принимающие значения из
множества U. |
2, |
|
сформулируем |
принцип |
максимума |
|||
Как и в |
гл. |
|
||||||
Понтрягина |
в двух |
эквивалентных |
формах — гамильто |
|||||
новой и лагранжевой. Введем снова функцию |
Понтря |
|||||||
гина |
|
|
|
|
|
|
|
|
H(t, х, и, р, |
А,0) = (р|ф(*, |
*. u))— k0f(t, |
X, |
и) |
||||
и гамильтониан |
|
|
|
|
|
|
|
|
2#(/, |
х, |
р, |
А,0) = sup |
H(t, |
х, и, р, ко). |
|
||
|
|
|
|
u^U |
|
|
|
|
|
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
|
|
245 |
||||||||||
Т е о р е м а |
1 |
(принцип |
максимума |
в |
гамильтоновой |
|||||||||
форме). Пусть (**(•). |
«*(•))— оптимальный управляе |
|||||||||||||
мый процесс |
в задаче |
(1) |
— (5). |
Тогда |
существуют не |
|||||||||
равные |
одновременно |
|
нулю |
число |
К0 ^ |
0, |
векторы |
|||||||
10«= Rs\ U е |
|
вектор-функция |
р( - ): [/<,, /i]-* |
Rn |
и |
|||||||||
неотрицательные регулярные меры р{, |
i = |
1, |
|
k, на |
||||||||||
[f0, ti], сосредоточенные |
|
соответственно |
на |
множествах |
||||||||||
|
Ti |
[*0| f,] |gi (t, xt (/)) = |
0}, |
|
|
|
|
|||||||
такие, что |
|
|
р(-) |
является |
решением |
инте |
||||||||
а) вектор-функция |
||||||||||||||
грального уравнения |
|
|
|
|
|
|
|
|
|
|
|
|||
p(t) = - h i ' ( x j t l))h + |
|
|
|
ft |
*i |
|
|
|
|
|
|
|||
11 |
|
|
|
|
|
|
|
|
|
|
|
|
||
+ [ Пх(х, x,{x),u,(x),p{x),‘k0)dx~ |
J |
gix (t, xt (т)) й?рг (6) |
||||||||||||
t |
|
|
|
|
|
|
<=i t |
|
|
|
|
|
|
|
и |
|
|
|
|
|
|
|
|
|
|
|
|
|
(7) |
|
|
|
p{to) = |
h ? (x ,№ lo , |
|
|
|
|
|
|||||
б) почти при |
всех |
t |
из [/0, ^i] |
выполняется |
равен |
|||||||||
ство |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
H (t, |
х, (*), и, (t), р (0, Л„) = |
Ж (t, |
{t), р (t), |
А0). |
(8) |
|||||||||
Уравнение |
(6), как и в задаче без фазовых ограниче |
ний, называется сопряженным. Нетрудно видеть, что в случае, когда все меры щ — нулевые, т. е., в частности, при отсутствии ограничений на фазовые координаты, это уравнение сводится к дифференциальному уравне нию, полученному в гл. 2. В задачах без фазовых огра ничений функция /?(•)— абсолютно непрерывная функ ция. При наличии фазовых ограничений из-за присут ствия в уравнении (6) интегралов по мерам р* функция р(-) может иметь разрывы. Однако она всегда является функцией ограниченной вариации, непрерывной слева (из-за регулярности мер рг).
В формулировке теоремы не исключается случай, когда одна или обе концевые точки оптимальной траек тории лежат на фазовых ограничениях. Поэтому меры Pi могут содержать ненулевые массы, сосредоточенные
246 ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ
в точках t0 и ti. В этом случае, как следует из соотно
шений (6) |
и (7), |
|
|
|
|
|
|
|
|
|
|
||||
|
lim |
p (t) |
= |
- |
hi* (х, (/,)) h + |
S gix (tu x, (/,)) ji, ({*,]); |
(9) |
||||||||
|
t < t \ |
|
|
|
|
|
|
i = 1 |
|
|
|
|
|
|
|
|
lim |
P (0 = |
Л6* (x, (t0)) to + |
2 |
|
(/o, |
*. (*o)) M’i ({^o))i |
|
(Ю ) |
||||||
|
t - * t „ |
|
|
|
|
i = |
i |
|
|
|
|
|
|
|
|
т. e. p(0 может |
иметь |
разрыв в |
точке |
t0. |
Если |
же |
|||||||||
gi(ti, |
x,(ti)) < |
0 |
и |
gi (t0, х, (tQ)) < |
0, |
то точки |
t0 и |
tx не |
|||||||
принадлежат |
ни |
одному из множеств Tt, рЛ{^о)) = |
|||||||||||||
= Hr((М) = 0, p(t) |
непрерывна в точках |
/0. |
U и выпол |
||||||||||||
нено |
условие |
трансверсальности |
р (to) = |
ho (х, (to)) to, |
|||||||||||
p{ti) = — hi(x,(U)) l\. |
|
|
представляет |
собой |
|||||||||||
|
Сформулированная теорема |
||||||||||||||
еще одну реализацию принципа Лагранжа. |
Если запи |
||||||||||||||
сать функцию Лагранжа |
задачи |
(1) — |
(5) |
в виде |
|
|
|||||||||
2 |
= do I ho (X(to))) + |
(/, 1A, (x (*,))) + |
|
|
|
|
|
|
|
||||||
|
fL |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
j |
[(p (t) I * (0 — Ф (*, * (0. u № + hfi {t, X (t), и (/))] dt + |
|||||||||||||
|
и |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
t x |
|
|
|
|
|
|
|
|
|
|
|
|
|
+ У) |
J gi(t, X (t)) dpt, |
i=1/,
то окажется, что соотношения (6), (7) эквивалентны условию стационарности функции Лагранжа как функ ции переменного *(•) в точке **(•), а равенство (8) есть, очевидно, необходимое и достаточное условие то го, чтобы функция Лагранжа достигала минимума по и(-) в точке «*(•)■ Читатель сможет убедиться в этом,
анализируя |
доказательство |
теоремы |
1 |
в |
следующем |
||
параграфе. |
Поэтому теорема |
1 допускает такую эквива |
|||||
лентную формулировку. |
максимума |
в |
лагранжевой |
||||
Т е о р е м а |
1' (принцип |
||||||
форме). |
Пусть |
(дс,(•),«*(•)) — оптимальный управляе |
|||||
мый процесс в задаче (1) — |
(5). Тогда существуют та |
||||||
кие не равные |
одновременно нулю число Ко ^ 0, векто |
||||||
ры /0 е |
Rso, |
Zie=Rs‘, вектор-функция |
ограниченной ва |
|
§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
247 |
|||
риации p(t) и неотрицательные |
регулярные |
меры щ, |
|||
i = 1, |
|
к, сосредоточенные на множествах |
Ti соот |
||
ветственно, |
что |
|
|
|
|
а) |
при |
ы(-) = « * ( • ) |
вектор-функция х*(-) |
является |
|
стационарной точкой функции Лагранжа как |
функции |
||||
переменного х( •); |
|
|
|
||
б) |
при х { - ) — х*(-) |
функция |
Лагранжа |
достигает |
|
абсолютного минимума по и(-) |
в точке н*(-). |
||||
5.2.2. Задачи с незакрепленным временем. Мы уже обращали |
|||||
внимание читателя на то обстоятельство, |
что теорема 1 (в отличие от |
результатов гл. 2) справедлива без предположения о дифференцируе мости по времени функций и отображений, участвующих в формули ровке задачи. В определенной степени это связано с тем, что предла гаемое в следующем параграфе доказательство использует иную тех нику. Существует, однако, и причина принципиального характера. Дело в том, что задачи с закрепленным временем естественно фор мулируются как задачи в некотором банаховом пространстве, имен но, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по-видимому, нельзя сформулировать подобным образом без какого-либо ее преоб разования, связанного, в частности, с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным.
В гл. 2 для этой цели использовалась замена времени. Однако там она несла значительно большую нагрузку и с этим были связаны многие технические сложности в доказательстве. Если же принцип максимума для задач с закрепленным временем доказан, то замену времени можно использовать только для сведения общей задачи к задаче с закрепленным временем. Тогда она оказывается совер шенно естественным приемом, применение которого не связано с ка кими-либо трудностями.
Покажем, как с помощью теоремы 1 можно (исполь зуя замену времени) получить принцип максимума для общей задачи оптимального управления: __
(10
(20
( 3 0
( 4 0
( 5 0
В отличие от задачи (1) — (5) моменты времени to и h здесь уже не предполагаются фиксированными, и^ все