Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 217

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

260 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. в

Подставляя полученное выражение в

(15)

и используя

функцию

Н ( х , ф, и ,

t ) = f ° ( x ,

и , *) + (Ф. f ( x> и> 0 )>

получим

следующее

представление для приращения функционала:

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A J ( u ) = ^ [ Я ( х + Ал:, ф, u +

h ,

t ) Н ( х ,

ф, и , t ) \ d t +

 

 

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+

j*(

дн{х’ 2 * u,

t)

Ax')d t + Rl-

 

 

(17)

 

 

to

 

 

 

 

 

 

 

 

 

 

 

 

Из формулы конечных приращений следует

 

 

 

 

 

 

 

 

Н(х-\- Ах, ф,

u +

h,

t) =

H(x, ф, и,

t)-f-

 

 

 

^ d H (x + Q A x ,

ц +

е/г, t)

 

 

 

^ дН (х + 6Д х,

ф , u + Qh,

t)

^

О < 0 < 1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставим это равенство в

(17); будем иметь

 

 

 

 

 

 

 

AJ

(“) = — ]" ( -

dH(x(t),

ф (<),

ц (0, t)

,

hittydt +

R,

(18)

 

 

 

ди

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

R = R 1 + R2 + RS

 

 

 

 

 

 

 

 

 

 

 

 

^

_

Г / д Н ( х + 8Ах? ф ,

и+ М, t)

 

дН (х, ф ,

и, t)

д \

^

 

2

J \

 

дх

 

 

 

 

 

 

дх

 

J

 

 

 

^0

 

 

 

 

 

 

 

 

 

 

 

 

(19)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^

^ ^ д Н ( х + В Ь х , ф ,

и + №, t)

, дН (х, ф ,

и, t) ^ ^

^ 0 )

Оценим остаточный член в формуле (18). Так как

 

 

 

 

 

 

 

дх

 

дх

 

дх

 

 

 

 

 

то с учетом условий Липшица (6 ), (7)

имеем

 

 

 

 

 

 

 

|Д. I <

(1

+ \ Ш L J

( I Ах I2 + I Аде IIАI) dt,

 

 

 

 

 

 

 

 

 

to

 

 

 

 

 

 

 

 

 

где [ф||с=

sup |ф(£, ы )| < оо

в

силу

непрерывности

ф(/,

и) на


§

3]

Задача

оптимального

управления со свободным

правым

концом

261

 

 

 

 

 

 

 

[4

, Т] (напоминаем,

что

в наших рассуждениях

u = u ( t )

фиксированное управление из UCZL%*[t0, Т].

Аналогично, с уче­

том условий

(8 ), (9) из

(20)

будем иметь

 

 

 

|Я3| <( 1 + № b ) A j ( | A * | | A | + |/i|2)<#.

*0

Следовательно,

|Я |<А |Д *(Г)|2 +(1+||ф||с)А j(\Ax(t)\ + \h(t)\)*dt. (2 1 )

to

Для дальнейшей оценки остаточного члена R формулы (18) нам понадобится одна лемма, которая часто приводится в курсах лекций по обыкновенным дифференциальным уравнениям и из­ вестна как лемма Гронуолла.

Л е м м а

1. Если

функция <p(^)^Li[4,

7]

и

удовлетворяет

неравенствам

 

 

 

 

 

 

 

 

 

 

0 <

Ф (t) <

а +

b j

cp (г) dr,

t0 < t < T ,

a, b — const > 0,

(22)

то верна

оценка

и

 

 

 

 

 

 

 

 

 

Ф(t) < aeW -U ,

 

 

 

 

 

 

 

 

о <

*0 < * < 7 ;

 

 

 

(23)

если же

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 < ф ( 0 < а +

6 j<p(t)dT, ■ / „ < * < 7 a, b =

const> 0 ,

(24)

то верна оценка

t

 

 

 

 

 

 

 

 

0 <

Ф( 0 < а е 6<г-'>,

t0 < t < T .

 

 

 

(25)

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

Д о к а з а т е л ь с т в о . Обозначим R(t) =

b ^ y (x )d x .

С учетом

 

 

 

 

 

 

 

*0

 

 

 

 

(22) имеем R = bq>(t) ^ .b ( a + R ( t ) ) , или Rb R ^ a b .

Умножая обе

части этого неравенства на е_6(<—<о),

получил!

 

 

 

 

 

 

 

 

(Re~b^i~i^) ■< аЬегьУ—*°).

 

 

 

 

Интегрирование этого

неравенства

от to до

t с учетом

R (to)—0

приводит к оценке

 

 

 

 

 

 

 

 

 

0 < R (t) er-W-M

а — ае—

#0)> ИЛИ о < R (t) < аеь^-^ а .


3 6 2 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [ Г л . 6

Отсюда

и-из

(2 2 ) сразу

получаем

(23).

Оценка (25)

выводится

из (24)

аналогично с помощью функции

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

R (t) =

Ь J

ф (т) dx. А

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

Продолжим доказательство теоремы 1. Из соотношений (14) для

Лх (t) с

учетом условия (4)

имеем

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

t) — f(x ,

и, /)]<#!<

 

 

а-(0

1=

[ J

[/(а- +

A.v, и +

А,

 

 

 

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<L^ \ & x{t)\ dt + L^\h(t)\dt.

 

 

 

Приняв в (22),

(23)

tО

 

 

 

 

^0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

Ф (0 =

л-(0|,

a =

L^\h{t)\dt,

b — L,

 

 

придем к оценке

 

 

 

 

 

to

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

 

I А *(9

К

Ci §\h(t)\dt,

C ^ L e ^

- ' •>,

t0 < t < T .

(26)

Воспользуемся

неравенством

Коши — Буняковского

и

перепишем

оценку

(26) в

виде

 

 

 

 

 

 

 

 

 

 

 

 

|Дл- (/) ||с =

шах

|Дл- (0

1<

Сх V T

- 101|h (t) |(r).

(27)

Подставим полученную оценку в

(21)

и окончательно получим

|Я| < С .2|h ( t ) f L(r).

Таким образом,

в формуле (18) для прира­

щения функционала

первое

слагаемое — линейный

относительно

h(t) ограниченный функционал на

 

 

Т\,

а второе слагаемое

имеет порядок ||M9f

Согласно

определению 1.1

это

означа-

 

 

 

 

l 2

 

 

 

 

 

 

 

 

 

 

ет, что функционал ( 1) при условиях (2 ), (3) дифференцируем и

его градиент имеет вид ( 1 0 ). А

 

Итак, для вычисления градиента функционала

(1) при усло­

виях

(2 ) в точке

u = u ( t) ^ U нужно последовательно решить две

задачи

Коши: (2)

и

(12), (13), и найденные при

этом x(t) =

= х

(t,

и), ф (^)=ф (£,

и) подставить в (10). При решении упомя­

нутых задач Коши можно использовать различные приближенные методы [2 0 ].

Формулы градиентов функционалов в задачах оптимального управления, связанных с системами обыкновенных дифференци­


§ 3] Задача оптимального управления со свободным правым концом 263

альных уравнений, содержащих параметры и запаздывающие ар­ гументы, можно найти в работе [35].

2.

Зная формулу

градиента,

нетрудно

расписать

метод

пп. 1— 5 из § 2 применительно к задаче

(1) — (3).

 

 

 

 

 

 

 

Например,

метод проекции

градиента

здесь

будет иметь вид

 

 

 

 

 

 

дН (х (t, иП),

т|з(<, ип),

un (t),

t)

>

 

 

ип+ 1( 0 =

Ри ( и п (i) + ап

 

 

 

ди

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

п = 0, 1,

.... где а „ > 0

выбирается, как в п. 2 § 2. Пусть здесь

 

 

U =

{u =

u(t) 6 l£> Ro,

Т ]: ос; (/) < u£(t) < р; (0,

tb <

t <7\

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(28)

где

рi(t) — заданные кусочно-непрерывные функции,

 

 

 

^]р,-(/),

 

 

t'='l, 2,...,

г. Нетрудно видеть,

что множество

U

выпукло, замкнуто и ограничено в

L 2r)[t0,(

Т]

и,

следовательно,

в

силу теоремы 1.2 слабо компактно

в 4 г)

Т\-

Проектирование

на множество

U осуществляется очень просто: если функция

 

 

 

 

 

z(t) =

(z4t), . . . ,

2T (t))eL ir)[t0,

Т],

 

 

 

 

 

 

то ее проекция

Риг =

{px{t),

...,

pr(t)}

на

множество

U

имеет вид

 

z£(t),

если

щ (^) < 2/(/) <

Р; (t),

 

 

 

 

 

 

 

 

 

Р; (0 =

a.i{t),

если

z£{t)<^ai(t),

 

 

 

 

 

 

 

 

 

(29)

 

М 0 >

если

2 *'(0 > P i ( 0 .

 

 

 

 

i

= l

, 2 , . . . ,

г.

 

Так же нетрудно выписать для множества (28) явное выражение

для un (t) = {и'„(t), . . .

, urn (t)}

в методе условного

градиента

 

 

 

 

 

 

- „ i ( 0 = |

“ ><')•

если

 

 

 

 

.

 

 

 

(30)

 

 

 

 

I

Pi (0.

если

Ji(if) <

o

j

 

 

 

 

 

 

Л (

о

-

-

 

»- )■%«) . о |

u < t < T '

i =

l

j 2 .......... r .

Для решения задачи (1) — (3) при каких-либо дополнительных условиях на фазовые координаты можно использовать метод штрафных функционалов. Например, если правый конец траекто-. рии закреплен, т. е. х(Т)=х\, то в качестве штрафа для такого ограничения часто берут Ph(u) = k\ x(T , u)-^xr| , если же имеются