Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 15.10.2024
Просмотров: 174
Скачиваний: 0
144 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
Предполагается, что все входящие в условие задачи функции и множества удовлетворяют условиям, указан ным в п. 2.1.2. В качестве допустимых управлений, как уже отмечалось, рассматриваются ограниченные изме
римые вектор-функции |
u{t), |
принимающие значения в |
||||||
U, а в понятие «локальный экстремум» или «оптималь |
||||||||
ный процесс» вкладывается |
тот |
же |
смысл, |
что и в |
||||
п. 2.1.4. |
|
|
|
|
|
|
|
|
Мы сформулируем принцип максимума в двух экви |
||||||||
валентных |
формах — «гамильтоновой» и «лагранже- |
|||||||
вой». Начнем с гамильтоновой формы. |
|
|
||||||
Рассмотрим функцию |
|
|
|
|
||||
H(t, |
х, |
и, р, |
Л0) = |
(р|ф(/, д;, |
u)) — Xaf(t, |
х, и) |
||
(где р ^ |
R", |
/.о е |
R+), |
которую |
мы |
будем |
называть |
функцией Понтрягина. Переменные, обозначаемые бук вой р, обычно называются импульсами. Наряду с функ цией Понтрягина введем функцию
Ж (t, ,v, р, l 0) = sup Я (t, |
и, |
р, |
10), |
|
|
ue=U |
|
|
|
называемую гамильтонианом. |
|
в |
гамильтоновой |
|
Т е о р е м а |
1 (принцип максимума |
|||
форме). Пусть |
(x*(t), u*(t)) — оптимальный управляе |
|||
мый процесс в задаче (1) — (4), |
определенный на от |
резке [/о*, tu]. Тогда существуют не равные одновремен
но нулю число Яо ^ 0, векторы /0 е |
RSo, |
/i е RS| и век |
||||
тор-функция p(t) такие, что |
|
|
|
|
|
|
а) вектор-функция p(t) удовлетворяет сопряженному |
||||||
уравнению |
|
|
|
|
|
|
р = — н х— — ф; (t, х, (t), U t (t)) p + K0fx (t, |
x, ((), «. (/)) |
(5) |
||||
и условиям трансверсальности |
|
|
|
|
|
|
p {to*) = |
hox(to„ xt (to*)) lo, |
1 |
|
|
|
|
p(ti*)= |
h\x {tu, xt (t\,))l\', |
J |
|
|
|
|
б) почти при всех t из [/о., Л*] |
|
|
|
|
|
|
H{t, xt (t), u,{t), p(t), |
X0) = max H (t, |
xt (t), |
u, |
p(t), |
Я0) = |
|
|
«ell |
|
|
|
|
|
|
= ЖЦ, X,(t), |
p(t), |
КУ, |
(7) |
|
§ |
2.4. |
ПРИНЦИП |
МАКСИМУМА ПОНТРЯГИНА |
|
145 |
|
|||||||||
в) |
гамильтониан Mtt, |
xt (t), |
p(t), |
Я,,) непрерывен |
на |
|||||||||||
отрезке [to,, |
/1*] |
и на концах |
его |
удовлетворяет |
соотно |
|
||||||||||
шениям |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ж {to,, |
xt (to*), |
р (to*), |
Яо) = |
— (hot (to,., |
xt (t0,)) |
I/0), |
} |
|
||||||||
M(t\„ |
xt (tu), |
p(ti*), |
ho) = |
(hu(tu, |
x* (ti,)) I/ 1). |
j |
|
|||||||||
Отметим выражение для гамильтониана |
|
|
|
|||||||||||||
Ж (t, х. (t), р (t), Я0) = (hu (tu, x. (/,.)) I /,) |
+ |
|
|
|
|
|
||||||||||
|
|
|
|
|
f, |
|
|
|
|
|
|
|
|
|
(8a) |
|
|
|
|
|
+ J Ht (l, x,(l), ut (l), |
p(l), |
K)dl, |
|
|||||||||
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
|
|
получающееся в процессе доказательства, а также еди |
|
|||||||||||||||
нообразную |
гамильтонову |
запись |
х — Нр, |
р = —Нх |
|
|||||||||||
уравнений (2) и (5). |
|
|
|
|
|
|
|
|
|
|
|
|||||
Перейдем к описанию лагранжевой формы принци |
|
|||||||||||||||
па максимума. Напишем функцию Лагранжа задачи |
|
|||||||||||||||
(1) — (4), такую же, как и в § 2.3: |
|
|
|
|
Jп Ldt, |
|
||||||||||
& = |
(/„I ^ |
(tQ, х (to))) + (/, I h, (tu |
x (/,))) + |
|
||||||||||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
u |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
L (t, x, |
x, |
и, |
p, |
Я0) = |
(p \x — qp (t, x, u)) + |
Xaf (t, x, u) |
|
|||||||||
•— лагранжиан задачи |
(1) — (4). |
|
|
|
в |
лагранжевой |
|
|||||||||
Т е о р е м а |
|
Г |
(принцип |
максимума |
|
|||||||||||
форме). |
Пусть |
(х*(/),«*(/)) — оптимальный |
управляе |
|
||||||||||||
мый процесс |
в задаче |
(1) |
— |
(4), |
определенный |
на от |
|
|||||||||
резке [/о*, /i*]. |
Тогда существуют не равные одновремен |
|
||||||||||||||
но нулю |
число Яо ^ 0, |
векторы |
/0 е |
Rs°, |
/, s |
R*' |
и не |
|
||||||||
прерывная п-мерная вектор-функция p(t), |
при которых |
L |
||||||||||||||
а) |
почти |
всюду |
на |
отрезке |
[То*, ^1*] лагранжиан |
|||||||||||
удовлетворяет уравнению Эйлера по х: |
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
------ |
О |
|
|
|
(50 |
|
|
|
|
|
|
|
|
|
*=*. (11 |
|
|
|
|
|
|
u = u , { t )
икраевым условиям
==(A)*j х* (A),)) lo,
/г* |
L>x |
== |
x* |
l\‘, |
( 6 0 |
|
146 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ
б) |
почти при всех t из [/0„ |
Л*] |
лагранжиан L |
дост |
||||||||||||||
гает минимума по и при и = |
и. (t)\ |
|
|
|
|
|
|
|
||||||||||
L(t, x.(t), |
x.(t), |
u.(t), |
p(t), |
A0) = |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
= min L (0 |
(О, X . |
(0, |
U , |
P |
(t), A0); |
(7') |
|||||||||
|
|
|
|
U |
E ( j |
|
|
|
|
|
|
|
|
|
|
|
|
|
в) |
функция |
Лагранжа |
3 |
дифференцируема |
no t |
|||||||||||||
справа в точке to,, |
по t\ |
слева в точке t\* и |
|
|
|
|||||||||||||
|
|
OS’ |
|
|
= |
0, |
дзе |
|
|
|
= 0, |
|
|
( 8' ) |
||||
|
|
dt$ Ч- 0 |
|
|
с)t, |
— О |
|
|
|
|
||||||||
где через |
|
д |
0 |
соответственно |
dt ^о) ооозначены пра- |
|||||||||||||
|
dt + |
|||||||||||||||||
вая (левая) производные. |
|
|
|
|
|
|
|
|
|
|
|
|||||||
Проверка |
эквивалентности |
обеих |
|
формулировок |
||||||||||||||
принципа максимума не представляет труда. Действи |
||||||||||||||||||
тельно, |
|
|
|
|
|
L = (p\x) — Н. |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Поэтому |
соотношения |
(5) |
и |
(50, |
(6) |
|
и |
(60 |
и |
(7) |
н |
|||||||
(70 попарно эквивалентны. Осталось проверить эквива |
||||||||||||||||||
лентность соотношений |
(8) и |
(80Отметим, что непре |
||||||||||||||||
рывность гамильтониана не является независимым ус |
||||||||||||||||||
ловием. Она вытекает из (5) |
и (7) |
(это |
будет видно из |
|||||||||||||||
доказательства) и, следовательно, из (50 |
и (70- |
Далее, |
||||||||||||||||
в силу (70 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
& Vo, U, X. (•), ... ) = |
(/о Ih0 do, X. (/„))) + |
(/, |/г, (/„ -V. (0 )))+ |
||||||||||||||||
|
|
|
+ Jt, {(p (t)\ x .(t))-M (t, |
x.(t), P(t), |
K)\dt. |
|||||||||||||
|
|
|
|
*0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Поэтому |
при e > |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
3? (to, + e, |
t\, . . 0 |
— 3 |
(to*, |
t\, . . .) = |
|
|
|
|
|
|
|
|
||||||
— (to |
| ho (to, + |
e, |
x, (to, |
-f- e)) — ho |
(to*, |
x* (to,))) |
— |
1 |
|
|||||||||
*o* +e |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
- |
j |
[(P (t) |
IX, (t)) |
- |
m (t, X, |
(t), |
p ( t ) , |
A0)] d t |
= |
|
||||||||
*a* |
|
= |
e ( / 0 I/го.» (to,, |
x, (to,))) |
+ |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
( |
* 0 * + 8 |
\ |
/ |
|
lo\hoc(to„ x,(t0*)) |
||||
|
||||
|
+ 6 2@(to., x* (to,), |
p (to*), |
Ao) |
J
-j-
^0*+E
\
x,*(t) dt I— (p(/o*)
+
о (e) =
|
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА |
147 |
||
(в |
силу первого |
равенства в |
(6)) |
|
= |
£ [(/о Ihot {to-, |
Хь^О:))) + Ж (to.-., .V, (/,),), р (ф*)> А,о)] + о(е). |
||
Полученное равенство влечет |
эквивалентность |
первых |
соотношений в (8) и (8'). Аналогично проверяется и эквивалентность вторых соотношений.
Теорема Г и, следовательно, принцип максимума Понтрягина, является еще одной реализацией сформу лированного во введении принципа Лагранжа, соглас но которому необходимые условия экстремума в задаче с ограничениями совпадают с необходимыми усло виями экстремума функции Лагранжа при ограниче ниях, не включенных в эту функцию. В самом деле, если множители Лагранжа Яо, /о, h, p(t) фиксированы, то функция Лагранжа 3? зависит от трех групп перемен ных: фазовых траекторий x(t), управлений u(t) и мо ментов времени to, А- Если теперь отрезок [4, Б] и уп равление u(t) зафиксировать, то задача о минимуме функции Лагранжа по x (t ) имеет вид классической за
дачи |
Больца, а утверждение а) |
теоремы Г означает, |
|
что x*(t) удовлетворяет необходимому |
условию мини |
||
мума |
функции Лагранжа по x(t) |
при |
фиксированных |
u(t) = |
u#(t) и to = to*, ti — Б*- |
|
|
Точно так же, утверждение б) теоремы V необходи мо и достаточно для того, чтобы функция Лагранжа до стигала минимума по всем допустимым управлениям
(это единственное ограничение, не включенное в функ цию Лагранжа, поскольку оно не носит функциональ
ного характера!) при фиксированном отрезке |
[ф*, Б*] « |
траектории x*(t) в точке u (t)— u*(t). (Это |
утвержде |
ние следует из интуитивно очевидной формулы |
|
и |
t, |
inf Г g(t, и (t)) dt = |
f inf g(t, u) dt, |
U(t)fEU f |
U<S(J |
строго доказанной в гл. 9 при значительно более общих предположениях.)
Отметим |
далее, что вектор-функции |
x*(0> и*(0 и |
p (t) можно |
продолжить левее точки ф* |
и правее точки |
Б* так, чтобы функция Лагранжа стала дифференци руемой по to и tx в точках ф* и Б* соответственно. Для
148 |
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
этого нужно, чтобы х*(/) и p{t) оставались непрерыв ными, а «*(0 удовлетворяла соотношениям
lim Hit, x,{t), и* {(), p(t), Я0) = Ж (to,, х» (/0«), р (к,), Я0),
о* |
|
lim Н (/, х*(/), «,(/)> р(0. Я0) = |
(/ft*, х. (<1«), р(!ч*), Я0). |
<46* |
|
В этом случае из приведенной выше выкладки следует,
что |
в |
силу (8') |
производные функции Лагранжа |
по ta |
и |
в |
точках ^о* |
и liif соответственно равны нулю. |
Дру |
гими словами, утверждение в) теоремы 1 ' означает, что моменты времени /0* « удовлетворяют необходимым условиям минимума функции Лагранжа по /0 и ti.
Выше мы отметили, что единственным ограничением, не включенным в функцию Лагранжа в теореме 1', было условие (3). Однако в конкретных случаях в функ цию Лагранжа можно не включать и некоторые другие ограничения, главным образом граничные условия тина закрепленных концов и закрепленного времени. При этом соответствующие условия трансверсальности ис чезают и (снова в подтверждение принципа Лагранжа) оставшиеся соотношения совпадают с необходимыми условияхми минимума функции Лагранжа при ограниче ниях, которые в эту функцию не были включены. Дей ствительно, если, например, h0 — х — х0 (закрепленный левый конец), то первое условие в (6) означает, что р (/„)== /о; если ho = t — а (закрепленный левый момент времени), то первое условие в (8) принимает вид
Ш= — /0 и т. д. Таким образом, множители Ла
гранжа, соответствующие закрепленным концам, сов падают со значениями p(t), а множители Лагранжа, соответствующие закрепленным моментам времени, — со значениями гамильтониана в соответствующих точ
ках и |
не |
несут |
более никакой |
информации. |
Если |
|
р(/) = |
0, |
то |
и все |
эти множители |
равны нулю. |
Мы не |
коснулись |
условий, |
гарантирующих |
неравенство |
Яо Ф 0. |
Они очень громоздки и обычно проще непосредственно проверить, что Яо Ф 0.
До сих пор мы говорили о задаче с интегральным функционалом. В задаче с терминальным функционалом