Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 217
Скачиваний: 1
260 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. в
Подставляя полученное выражение в |
(15) |
и используя |
функцию |
||||||||||||
Н ( х , ф, и , |
t ) = — f ° ( x , |
и , *) + (Ф. f ( x> и> 0 )> |
получим |
следующее |
|||||||||||
представление для приращения функционала: |
|
|
|
|
|
||||||||||
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A J ( u ) = — ^ [ Я ( х + Ал:, ф, u + |
h , |
t ) — Н ( х , |
ф, и , t ) \ d t + |
|
||||||||||
|
|
*0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
j*( |
дн{х’ 2 * u, |
t) |
’ |
Ax')d t + Rl- |
|
|
(17) |
|||||
|
|
to |
|
|
|
|
|
|
|
|
|
|
|
|
|
Из формулы конечных приращений следует |
|
|
|
|
|
|
|||||||||
|
|
Н(х-\- Ах, ф, |
u + |
h, |
t) = |
H(x, ф, и, |
t)-f- |
|
|
|
|||||
^ d H (x + Q A x , |
ц + |
е/г, t) |
|
|
|
^ дН (х + 6Д х, |
ф , u + Qh, |
t) |
^ |
||||||
О < 0 < 1 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Подставим это равенство в |
(17); будем иметь |
|
|
|
|
|
|
||||||||
|
AJ |
(“) = — ]" ( - |
dH(x(t), |
ф (<), |
ц (0, t) |
, |
hittydt + |
R, |
(18) |
||||||
|
|
|
ди |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где |
R = R 1 + R2 + RS |
|
|
|
|
|
|
|
|
|
|
|
|
||
^ |
_ |
Г / д Н ( х + 8Ах? ф , |
и+ М, t) |
|
дН (х, ф , |
и, t) |
д \ |
^ |
|||||||
|
2 |
J \ |
|
дх |
|
|
|
|
|
|
дх |
’ |
|
J |
|
|
|
^0 |
|
|
|
|
|
|
|
|
|
|
|
|
(19) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
^ |
^ ^ д Н ( х + В Ь х , ф , |
и + №, t) |
, дН (х, ф , |
и, t) ^ ^ |
^ 0 ) |
|||||||||
Оценим остаточный член в формуле (18). Так как |
|
|
|
||||||||||||
|
|
|
|
дх |
|
дх |
|
дх |
’ |
|
|
|
|
|
|
то с учетом условий Липшица (6 ), (7) |
имеем |
|
|
|
|
|
|||||||||
|
|
|Д. I < |
(1 |
+ \ Ш L J |
( I Ах I2 + I Аде IIАI) dt, |
|
|
|
|||||||
|
|
|
|
|
|
to |
|
|
|
|
|
|
|
|
|
где [ф||с= |
sup |ф(£, ы )| < оо |
в |
силу |
непрерывности |
ф(/, |
и) на |
§ |
3] |
Задача |
оптимального |
управления со свободным |
правым |
концом |
261 |
|
|
|
|
|
|
|
|
||
[4 |
, Т] (напоминаем, |
что |
в наших рассуждениях |
u = u ( t ) |
— |
|||
фиксированное управление из UCZL%*[t0, Т]. |
Аналогично, с уче |
|||||||
том условий |
(8 ), (9) из |
(20) |
будем иметь |
|
|
|
|Я3| <( 1 + № b ) A j ( | A * | | A | + |/i|2)<#.
*0
Следовательно,
|Я |<А |Д *(Г)|2 +(1+||ф||с)А j(\Ax(t)\ + \h(t)\)*dt. (2 1 )
to
Для дальнейшей оценки остаточного члена R формулы (18) нам понадобится одна лемма, которая часто приводится в курсах лекций по обыкновенным дифференциальным уравнениям и из вестна как лемма Гронуолла.
Л е м м а |
1. Если |
функция <p(^)^Li[4, |
7] |
и |
удовлетворяет |
||||||
неравенствам |
|
|
|
|
|
|
|
|
|
|
|
0 < |
Ф (t) < |
а + |
b j |
cp (г) dr, |
t0 < t < T , |
a, b — const > 0, |
(22) |
||||
то верна |
оценка |
и |
|
|
|
|
|
|
|
|
|
|
Ф(t) < aeW -U , |
|
|
|
|
|
|
||||
|
|
о < |
*0 < * < 7 ; |
|
|
|
(23) |
||||
если же |
|
|
г |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 < ф ( 0 < а + |
6 j<p(t)dT, ■ / „ < * < 7 a, b = |
const> 0 , |
(24) |
||||||||
то верна оценка |
t |
|
|
|
|
|
|
|
|
||
0 < |
Ф( 0 < а е 6<г-'>, |
t0 < t < T . |
|
|
|
(25) |
|||||
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
t |
|
|
|
|
Д о к а з а т е л ь с т в о . Обозначим R(t) = |
b ^ y (x )d x . |
С учетом |
|||||||||
|
|
|
|
|
|
|
*0 |
|
|
|
|
(22) имеем R = bq>(t) ^ .b ( a + R ( t ) ) , или R— b R ^ a b . |
Умножая обе |
||||||||||
части этого неравенства на е_6(<—<о), |
получил! |
|
|
|
|
||||||
|
|
|
|
(Re~b^i~i^) ■< аЬегьУ—*°). |
|
|
|
|
|||
Интегрирование этого |
неравенства |
от to до |
t с учетом |
R (to)—0 |
|||||||
приводит к оценке |
|
|
|
|
|
|
|
|
|
||
0 < R (t) er-W-M |
а — ае— |
#0)> ИЛИ о < R (t) < аеь^-^ — а . |
3 6 2 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [ Г л . 6
Отсюда |
и-из |
(2 2 ) сразу |
получаем |
(23). |
Оценка (25) |
выводится |
||||||||
из (24) |
аналогично с помощью функции |
|
|
|
|
|
||||||||
|
|
|
|
|
|
г |
|
|
|
|
|
|
|
|
|
|
|
|
R (t) = |
Ь J |
ф (т) dx. А |
|
|
|
|
||||
|
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
Продолжим доказательство теоремы 1. Из соотношений (14) для |
||||||||||||||
Лх (t) с |
учетом условия (4) |
имеем |
|
|
|
|
|
|
|
|
||||
|
|
|
t |
|
|
|
|
|
t) — f(x , |
и, /)]<#!< |
|
|||
|
|Да-(0 |
1= |
[ J |
[/(а- + |
A.v, и + |
А, |
|
|||||||
|
|
|
*0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
<L^ \ & x{t)\ dt + L^\h(t)\dt. |
|
|
|
||||||||
Приняв в (22), |
(23) |
tО |
|
|
|
|
^0 |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
г |
|
|
|
|
|
|
|
Ф (0 = |
|Лл-(0|, |
a = |
L^\h{t)\dt, |
b — L, |
|
|
|||||||
придем к оценке |
|
|
|
|
|
to |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
|
I А *(9 |
К |
Ci §\h(t)\dt, |
C ^ L e ^ |
- ' •>, |
t0 < t < T . |
(26) |
|||||||
Воспользуемся |
неравенством |
Коши — Буняковского |
и |
перепишем |
||||||||||
оценку |
(26) в |
виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
|Дл- (/) ||с = |
шах |
|Дл- (0 |
1< |
Сх V T |
- 101|h (t) |(r). |
(27) |
|||||||
Подставим полученную оценку в |
(21) |
и окончательно получим |
||||||||||||
|Я| < С .2|h ( t ) f L(r). |
Таким образом, |
в формуле (18) для прира |
||||||||||||
щения функционала |
первое |
слагаемое — линейный |
относительно |
|||||||||||
h(t) ограниченный функционал на |
|
|
Т\, |
а второе слагаемое |
||||||||||
имеет порядок ||M9f |
Согласно |
определению 1.1 |
это |
означа- |
||||||||||
|
|
|
|
l 2 |
|
|
|
|
|
|
|
|
|
|
ет, что функционал ( 1) при условиях (2 ), (3) дифференцируем и
его градиент имеет вид ( 1 0 ). А |
|
||||
Итак, для вычисления градиента функционала |
(1) при усло |
||||
виях |
(2 ) в точке |
u = u ( t) ^ U нужно последовательно решить две |
|||
задачи |
Коши: (2) |
и |
(12), (13), и найденные при |
этом x(t) = |
|
= х |
(t, |
и), ф (^)=ф (£, |
и) подставить в (10). При решении упомя |
нутых задач Коши можно использовать различные приближенные методы [2 0 ].
Формулы градиентов функционалов в задачах оптимального управления, связанных с системами обыкновенных дифференци
§ 3] Задача оптимального управления со свободным правым концом 263
альных уравнений, содержащих параметры и запаздывающие ар гументы, можно найти в работе [35].
2. |
Зная формулу |
градиента, |
нетрудно |
расписать |
метод |
|||||||||||||
пп. 1— 5 из § 2 применительно к задаче |
(1) — (3). |
|
|
|
|
|
|
|
||||||||||
Например, |
метод проекции |
градиента |
здесь |
будет иметь вид |
||||||||||||||
|
|
|
|
|
|
дН (х (t, иП), |
т|з(<, ип), |
un (t), |
t) |
> |
|
|
||||||
ип+ 1( 0 = |
Ри ( и п (i) + ап |
|
|
|
ди |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
п = 0, 1, |
.... где а „ > 0 |
выбирается, как в п. 2 § 2. Пусть здесь |
|
|
||||||||||||||
U = |
{u = |
u(t) 6 l£> Ro, |
Т ]: ос; (/) < u£(t) < р; (0, |
tb < |
t <7\ |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(28) |
|
где |
рi(t) — заданные кусочно-непрерывные функции, |
|
|
|
||||||||||||||
^]р,-(/), |
|
|
t'='l, 2,..., |
г. Нетрудно видеть, |
что множество |
U |
||||||||||||
выпукло, замкнуто и ограничено в |
L 2r)[t0,( |
Т] |
и, |
следовательно, |
в |
|||||||||||||
силу теоремы 1.2 слабо компактно |
в 4 г) |
Т\- |
Проектирование |
|||||||||||||||
на множество |
U осуществляется очень просто: если функция |
|
|
|||||||||||||||
|
|
|
z(t) = |
(z4t), . . . , |
2T (t))eL ir)[t0, |
Т], |
|
|
|
|
|
|
||||||
то ее проекция |
Риг = |
{px{t), |
..., |
pr(t)} |
на |
множество |
U |
имеет вид |
||||||||||
|
z£(t), |
если |
щ (^) < 2/(/) < |
Р; (t), |
|
|
|
|
|
|
|
|
|
|||||
Р; (0 = |
a.i{t), |
если |
z£{t)<^ai(t), |
|
|
|
|
|
|
|
|
|
(29) |
|||||
|
М 0 > |
если |
2 *'(0 > P i ( 0 . |
|
|
|
|
i |
= l |
, 2 , . . . , |
г. |
|
||||||
Так же нетрудно выписать для множества (28) явное выражение |
||||||||||||||||||
для un (t) = {и'„(t), . . . |
, urn (t)} |
в методе условного |
градиента |
|
|
|
||||||||||||
|
|
|
- „ i ( 0 = | |
“ ><')• |
если |
|
|
|
|
. |
|
|
|
(30) |
||||
|
|
|
|
I |
Pi (0. |
если |
Ji(if) < |
o |
j |
|
|
|
|
|
|
|||
Л ( |
о |
- |
- |
|
»- )■%«) . о | |
u < t < T ' |
i = |
l |
j 2 .......... r . |
Для решения задачи (1) — (3) при каких-либо дополнительных условиях на фазовые координаты можно использовать метод штрафных функционалов. Например, если правый конец траекто-. рии закреплен, т. е. х(Т)=х\, то в качестве штрафа для такого ограничения часто берут Ph(u) = k\ x(T , u)-^xr| , если же имеются