Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 216
Скачиваний: 1
264 МЕТОДЫ М И Н И М И З А Ц И И В ФУНКЦ И ОНАЛЬНЫ Х ПРОСТРАНСТВАХ [Гл. 6
фазовые ограничения Ai ^ .x i (t, и ) ^ В {, Л{, В и t = l , . 2 , |
— |
||||
известные константы, то штрафом |
может служить функционал |
||||
|
Т m |
|
|
|
|
Я* (и) = |
- j L ' J ^ exp {£(**(*, |
u) — Bt)(x!(t, и) — Л;)} dt |
|||
|
fo 1=1 |
|
|
|
|
Если функции f, f°, Ф удовлетворяют условиям теоремы 1 |
и P ft(u) |
||||
дифференцируем при условиях (2 ), (3), |
то функционал |
Д (ц ) = |
|||
= / (ы )+ Р й(ы) |
также дифференцируем при условиях (2), (3), и |
||||
для получения |
выражения для градиента |
Л ( “) |
можно |
восполь |
|
зоваться рецептами теоремы 1 . |
|
|
|
|
|
Следует сказать, что дифференцируемость |
функционала (1) |
||||
при условиях |
(2 ), (3) в теореме |
1 доказана при довольно жест |
ких ограничениях на данные задачи. Очевидно, теорема 1 остает
ся справедливой, |
если |
в правых |
частях |
«неравенств |
(5) — (9) |
|||
вместо |Дх| взять |
о(1), |
вместо |
|Ди| |
взять |
|Ды|т, 0 < y = c o n s t^ l. |
|||
В этом случае для остаточного члена R формулы (18) нетрудно |
||||||||
получить оценку |
R = о(||Л|| (г>). |
В практических задачах |
такую |
|||||
оценку для R вачастую удается получить и при меньших ограни |
||||||||
чениях на исходные данные. |
|
|
|
|
|
|||
3. |
Приведем достаточные условия для того, чтобы |
гради |
||||||
функционала ( 1) |
при условиях |
(2 ), (3) |
удовлетворял |
условию |
Липшица, которое фигурирует во многих теоремах различных ме
тодов минимизации. |
|
|
|
|
|
|
|
|
|
||
Т е о р е м а |
2. |
Пусть |
выполнены |
все |
условия |
теоремы |
1, и |
||||
пусть, кроме того, |
|
|
|
|
|
|
|
|
|
|
|
|/(*. и, |
0 I < A |
+ A I * I , |
|
Л , |
Л = const > |
0 , |
|
(31) |
|||
а множество U (3) имеет вид |
|
|
|
|
|
|
|
||||
|
U = { u = u ( t ) e L p [ t 0, |
|
T ]:u (t)e V (t) |
|
|
|
|
||||
почти всюду при |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(32) |
где V(t) — заданное множество из Ег, такое, что V0 = |
U |
V(t) |
|
||||||||
|
|
|
|
|
|
|
|
и<t<T |
при |
||
замкнуто и ограничено в Ег. Тогда градиент функционала |
(1) |
||||||||||
ограничениях |
(2) |
удовлетворяет условию |
Липшица на множест |
||||||||
ве (32). |
|
|
|
|
|
|
|
|
|
|
|
Д о к а з а т ел ь с т в о.. |
Распишем формулу ( 1 0 ) |
для градиента |
|||||||||
с учетом определения |
( 1 1 ) |
функции Н(х, ф, |
и, t): |
|
|
|
|
||||
|
д/°(*(<, |
и), u{t), t) |
^ |
^ |
. df (x (t, |
u), |
u(t), |
t) |
|
||
|
|
|
du■ |
|
|
' |
|
du |
|
|
|
u = u {t)£ U .
Задача оптимального управления со свободным правым концом |
265 |
Пользуясь условиями (8 ), (9), отсюда имеем |
|
||||||
|j' (и + h) - |
J ’ (и) |< L ( 1 + 1|ф(t, |
и) Iс) ( I Л* (О I + |
I h (t) |) + |
||||
df(x(t, |
u + h), u (t )+ h ( t ), t) J |
|^ |
+ |
u)(> |
|||
+ |
|
du |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
u(t), |
u(t) + |
h(t)£ U. |
|
|
|
Так как (a + |
b)2< 2 (a2 + b2), |
to |
|
|
|
|
|
||Г (u + |
h ) - |
J ' (и)Цг) < |4L2 (1 |
+ |
«Ц (t, |
и )H 2£ ( |b x (t) |2 + |
||
|
|
|
|
|
|
<0 , |
|
+ \h(t) \2) d t + 2 ^ 1
^0
d/(x(*’ u + ®' u + h ' t] |2 1Ife (t, u + h) —ij# , и) \Ч^'Ш
|
|
(33) |
Из этого неравенства видно, что |
для доказательства |
теоремы |
достаточно получить оценки |
|
|
\\x(t, и )В о < С „ |
\№(t, и)\\с<С3, |
(34) |
|ЧК<, u + h ) - y ( t , |
и )|Ь<С 4 ||/г(01^, |
(35) |
|
*0 |
|
где С2, С3, С4 — положительные константы,-независящие от выбо
ра и, u + h ^ U . В |
самом деле, тогда множество |
G = {(x , и, t) i |
|
]л:|^ С 2, ищ У 0, |
to^t^LT} |
ограничено и замкнуто |
в E nX E TXEi. |
Поэтому |
|
|
|
|
sup d f( х, |
и, t) < М < + оо, |
|
вда
иподставляя оценки (27), (34), (35) в неравенство (33), получим условие Липшица для градиента.
Приступим к доказательству оценок (34), (35). Из условий
(2), (31) имеем
|
t ■- |
|
|
|
|x(t, и)\ = |
\х0 + § f(x (x , |
и), и(х), |
т) dr К | 1 + |
|
|
to |
|
|
|
|
|
|
t |
|
+ |
A1( T - t 0) + |
A2 |
$\x(x, |
u)\dx. |
|
|
|
10 |
|
Полагая в (22), (23) cp(?)=s|;e(*, и)|, a = .|л:0 14 -Л 1 (Т— /0), Ь = А 2,
266 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. 5
сразу придем к первой из оценок (34) с С2 = ( |л:01+ A i(T — ^0))ехр (А2(Т— 10)) независимо от выбора u = u ( t ) e U .
Далее, из (12), (13) имеем
И?(*. « )1 |
= |
|
дФ (х (Т , и)) |
i f f |
д/° (х (т , и), и (г), т) |
|
||||
|
дх |
+ J [ |
|
дх |
|
|
||||
|
|
|
|
|
|
|
||||
|
|
— 1|з(т, и) |
Гд/(х(т, и), и (т), х) |
йт\ |
|
|
||||
|
|
|
дх |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
Так как |
непрерывные функции |
дФ I |
1 d f0 1 |
IIJ L |
ограниче- |
|||||
|
|
|
|
|
|
дх |* |
1 дх Г |
II дх |
|
|
следует |
|
|
|
|
|
|
|
|
|
|
|
IФ {t, |
|
|
|
|
т |
u)\dx. |
|
|
|
|
ы )| < М (1 |
+ Т - д + М | | ф ( т , |
|
|
||||||
|
|
|
|
|
|
|
t |
|
|
|
Полагая в (24), |
(25) |
<р(0 = |
|ф(^, и)\, а = М ( \ + Т — t0) , b = M , полу |
|||||||
чим вторую оценку (34). Наконец, полагая Дф (£)=ф (£, |
u + h ) — |
|||||||||
— ф(£, и) |
из |
(12), |
(13) с |
учетом |
неравенств |
(5)— (7) |
и |
ограни- |
||
ченности |
^ |
^•< М на G, будем иметь |
|
|
|
|
||||
|
дх |
|
|
|
|
|
|
|
|
|
|AiKOI<L|Ax(T)| + L (l + | Ж t, и)Цс). J ( I Ajc(0 I + IА (О I) ^ -h
м ||А Ф(*)| dr.
Подставляя сюда оценки (26), (34), придем к неравенству
| Аф ( 01 < С 6 j \ h { t ) \ d t + M J /Aife(x) |dr.
Для получения оценки (35)' остается принять в (24), (25)
ф(0 = |Дф(0|, |
a = C5 $\h(t)\dt, Ь = М . А |
|
*0 |
4. Воспользуемся некоторыми формулами, полученными при |
|
доказательстве теоремы |
1, и дадим простое доказательство прин |
ципа максимума Понтрягина для задачи (1) — (3), (32).
§ 3] |
Задача оптимального управления со |
свободным правым концом |
267 |
|
Т е о р е м а 3. Пусть функции f°, |
f, Ф непрерывны по совокуп |
ности своих аргументов вместе со своими частными производными
по переменной х и удовлетворяют условиям |
(4) — (7), |
и пусть |
|||||||||||
множество V(t) |
из (32) |
не зависит от t : V(t) = V, |
t0^ .t^ .T . Пусть |
||||||||||
управление u ( t ) e U |
и соответствующая траектория x ( t ) ^ x ( t , и), |
||||||||||||
t o ^ t ^ T , образуют |
оптимальное |
решение задачи |
|
(1)»— (3), |
(32). |
||||||||
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
H (x{t); |
ф(*), |
u(t), |
t) = |
max H{x{t), |
ф(*), |
и, |
f), |
|
(36) |
||||
|
|
|
|
|
|
|
uSV |
|
|
|
|
|
|
где H(x, ф, u, t ) = —f°(x, u, |
t) + |
(ty, f(x, u, t)), а ф(^) является ре |
|||||||||||
шением задачи |
(12)— (13). |
|
|
|
|
|
|
|
|
|
|
||
Д о к а з а т е л ь с т в о . |
Подставим в формулу |
(17) |
разложение |
||||||||||
щ х + Ах, ф, u + h , t) — H (х, ф, u + h, t) + |
|
|
|
||||||||||
+ ^дН(х + B bx.J. u + h , |
t) > Axy |
o < |
0 < |
1. |
|
|
|||||||
Получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|
|
|
ф (t), |
|
|
|
|
|
|
|
|
AJ (u) = |
— ^[H (x(t), |
U(t) + h(t), t) — |
|
|
|
|
|||||||
|
to |
|
|
|
|
|
|
|
|
|
|
|
|
—H{x(t), |
ф(£), u(t), t)]dt + R, |
|
|
|
|
|
(37) |
||||||
где R = R i + R 2, R i в з я т о |
и з |
|
(16), |
R2 определяется |
формулой вида |
||||||||
(19). Справедлива оценка |
|
|
|
|
|
|
|
|
|
|
|||
|R |< L |Ах (Г) |2 + |
(1 + |
|ф||с)L J ( |Ах (t) |2 + |Ах (t) |\h{t)\)dt, |
|||||||||||
|
|
|
|
|
|
|
to |
|
|
|
|
|
|
получаемая так же, как и оценка |
(2 1 ). Используя |
оценку. |
(26), |
||||||||||
имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
т |
|
t j , |
|
св = |
LC\ + (1 +IIФlb) [с? (Г- g |
+ |
l . |
||||||
IR I< Сву |h it)Id |
|
||||||||||||
to |
|
|
|
|
|
|
|
|
|
|
|
|
(38) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Доказательство |
равенства |
(36) |
проведем в |
предположении,, |
что |
||||||||
u(t) — кусочно-непрерывна на [ д |
Г] (для определенности можно |
||||||||||||
считать |
|
|
|
|
|
|
|
|
|
|
|
|
|
и(*о) = и(*о + |
0), |
|
u ( t ) = u ( t — 0), |
t0< t * £ T ) . |
|
|
|||||||
Пусть равенство (36) не имеет |
места при некотором т е [ д |
Г ]. |
|||||||||||
Тогда существуют такие »e |
F и |
а = const> 0 , что |
|
|
|
|
|
Н (х (т), ф (т), v, т)— 2а > Н (х (т), ф (т), и (т), т).
268 |
МЕТОДЫ |
М И Н И М И З А Ц И И В Ф У НКЦ И О Н АЛ ЬН Ы Х ПРОСТРАНСТВАХ |
[Гл. 6 |
Так |
как u(t) |
кусочно-непрерывна, a x(t), гр(^), Н(х, гр, и, |
t) не |
прерывные функции своих аргументов, то |
|
g(t)&=H(x{t), ф(0 , v, t) — H(x(t), т|з(0 , и (0 , t ) > a
на некотором отрезке t i ^ t ^ t 2, содержащем т. Возьмем прира щение h(t) специального «игольчатого» вида h ( t ) = v — u(t) при и h ( t ) = 0 вне [*i, t2]. Тогда из оценки (38) с помощью
неравенства Коши— Буняковского будем иметь
<. |
' |
и |
При этом можно считать t2— ^ > 0 столь малым, что
Св ||/г(0 1 3 ^ < а .
Из (37) тогда получим
А/(и) = — j g(t) dt + / ?< — о ( 4 — У + |Я| < (* * — У X
|
х [ - а |
+ |
Св||Л (012^ ] < 0 , |
|
|
||
что, однако, противоречит |
оптимальности управления u = u (t). |
||||||
Аналогично |
доказывается |
равенство |
(36), |
если |
|||
u = u ( t ) ^ L 2) [to, Г ], |
u (< )eK , |
|
но |
u(t) |
необязательно |
||
кусочно-непрерывно. |
В этом |
случае |
условие |
u (t)^ V |
и равенство |
(36)следует понимать в смысле почти всюду на [То, Т]. Д
5.Остановимся на следующей задаче оптимального управ
ния, связанной с линейными системами: минимизировать функ ционал
|
|
J (и) = |
J /° (X, и, |
t)dt + Ф[(х (Т)) |
(39) |
||
при условиях |
|
|
|
|
|
|
|
|
x = A (f)x + |
B (t)u + - f(t), |
t0 < C t< T , |
x(t0) = x0, |
(40) |
||
|
|
|
u = |
u ( t ) e U ^ L V [ t 0, Т], |
|
(41) |
|
где х = |
(х1, . . . |
, хп), |
и = |
(и1, . . . , |
ur), U — заданное множество |
из |
|
Vp\tо. |
п |
|
|
|
|
|
|
A (t), B(t) — |
заданные |
матрицы |
порядка пХ п |
и п Х г соответст |