Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 216

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

264 МЕТОДЫ М И Н И М И З А Ц И И В ФУНКЦ И ОНАЛЬНЫ Х ПРОСТРАНСТВАХ [Гл. 6

фазовые ограничения Ai ^ .x i (t, и ) ^ В {, Л{, В и t = l , . 2 ,

известные константы, то штрафом

может служить функционал

 

Т m

 

 

 

 

Я* (и) =

- j L ' J ^ exp {£(**(*,

u) — Bt)(x!(t, и) — Л;)} dt

 

fo 1=1

 

 

 

 

Если функции f, f°, Ф удовлетворяют условиям теоремы 1

и P ft(u)

дифференцируем при условиях (2 ), (3),

то функционал

Д (ц ) =

= / (ы )+ Р й(ы)

также дифференцируем при условиях (2), (3), и

для получения

выражения для градиента

Л ( “)

можно

восполь­

зоваться рецептами теоремы 1 .

 

 

 

 

Следует сказать, что дифференцируемость

функционала (1)

при условиях

(2 ), (3) в теореме

1 доказана при довольно жест­

ких ограничениях на данные задачи. Очевидно, теорема 1 остает­

ся справедливой,

если

в правых

частях

«неравенств

(5) — (9)

вместо |Дх| взять

о(1),

вместо

|Ди|

взять

|Ды|т, 0 < y = c o n s t^ l.

В этом случае для остаточного члена R формулы (18) нетрудно

получить оценку

R = о(||Л|| (г>).

В практических задачах

такую

оценку для R вачастую удается получить и при меньших ограни­

чениях на исходные данные.

 

 

 

 

 

3.

Приведем достаточные условия для того, чтобы

гради

функционала ( 1)

при условиях

(2 ), (3)

удовлетворял

условию

Липшица, которое фигурирует во многих теоремах различных ме­

тодов минимизации.

 

 

 

 

 

 

 

 

 

Т е о р е м а

2.

Пусть

выполнены

все

условия

теоремы

1, и

пусть, кроме того,

 

 

 

 

 

 

 

 

 

 

|/(*. и,

0 I < A

+ A I * I ,

 

Л ,

Л = const >

0 ,

 

(31)

а множество U (3) имеет вид

 

 

 

 

 

 

 

 

U = { u = u ( t ) e L p [ t 0,

 

T ]:u (t)e V (t)

 

 

 

 

почти всюду при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(32)

где V(t) — заданное множество из Ег, такое, что V0 =

U

V(t)

 

 

 

 

 

 

 

 

 

и<t<T

при

замкнуто и ограничено в Ег. Тогда градиент функционала

(1)

ограничениях

(2)

удовлетворяет условию

Липшица на множест­

ве (32).

 

 

 

 

 

 

 

 

 

 

 

Д о к а з а т ел ь с т в о..

Распишем формулу ( 1 0 )

для градиента

с учетом определения

( 1 1 )

функции Н(х, ф,

и, t):

 

 

 

 

 

д/°(*(<,

и), u{t), t)

^

^

. df (x (t,

u),

u(t),

t)

 

 

 

 

du■

 

 

'

 

du

 

 

 

u = u {t)£ U .


Задача оптимального управления со свободным правым концом

265

Пользуясь условиями (8 ), (9), отсюда имеем

 

|j' (и + h) -

J ’ (и) |< L ( 1 + 1|ф(t,

и) Iс) ( I Л* (О I +

I h (t) |) +

df(x(t,

u + h), u (t )+ h ( t ), t) J

|^

+

u)(>

+

 

du

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u(t),

u(t) +

h(t)£ U.

 

 

Так как (a +

b)2< 2 (a2 + b2),

to

 

 

 

 

||Г (u +

h ) -

J ' (и)Цг) < |4L2 (1

+

«Ц (t,

и )H 2£ ( |b x (t) |2 +

 

 

 

 

 

 

<0 ,

 

+ \h(t) \2) d t + 2 ^ 1

^0

d/(x(*’ u + ®' u + h ' t] |2 1Ife (t, u + h) —ij# , и) \Ч^'Ш

 

 

(33)

Из этого неравенства видно, что

для доказательства

теоремы

достаточно получить оценки

 

 

\\x(t, и )В о < С „

\№(t, и)\\с<С3,

(34)

|ЧК<, u + h ) - y ( t ,

и )|Ь<С 4 ||/г(01^,

(35)

 

*0

 

где С2, С3, С4 — положительные константы,-независящие от выбо­

ра и, u + h ^ U . В

самом деле, тогда множество

G = {(x , и, t) i

]л:|^ С 2, ищ У 0,

to^t^LT}

ограничено и замкнуто

в E nX E TXEi.

Поэтому

 

 

 

 

sup d f( х,

и, t) < М < + оо,

 

вда

иподставляя оценки (27), (34), (35) в неравенство (33), получим условие Липшица для градиента.

Приступим к доказательству оценок (34), (35). Из условий

(2), (31) имеем

 

t ■-

 

 

 

|x(t, и)\ =

\х0 + § f(x (x ,

и), и(х),

т) dr К | 1 +

 

to

 

 

 

 

 

 

t

 

+

A1( T - t 0) +

A2

$\x(x,

u)\dx.

 

 

 

10

 

Полагая в (22), (23) cp(?)=s|;e(*, и)|, a = .|л:0 14 1 — /0), Ь = А 2,


266 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. 5

сразу придем к первой из оценок (34) с С2 = ( |л:01+ A i(T — ^0))ехр (А2(Т10)) независимо от выбора u = u ( t ) e U .

Далее, из (12), (13) имеем

И?(*. « )1

=

 

дФ (Т , и))

i f f

д/° (т , и), и (г), т)

 

 

дх

+ J [

 

дх

 

 

 

 

 

 

 

 

 

 

 

1|з(т, и)

Гд/(х(т, и), и (т), х)

йт\

 

 

 

 

 

дх

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как

непрерывные функции

дФ I

1 d f0 1

IIJ L

ограниче-

 

 

 

 

 

 

дх |*

1 дх Г

II дх

 

 

следует

 

 

 

 

 

 

 

 

 

 

 

{t,

 

 

 

 

т

u)\dx.

 

 

 

ы )| < М (1

+ Т - д + М | | ф ( т ,

 

 

 

 

 

 

 

 

 

t

 

 

 

Полагая в (24),

(25)

<р(0 =

|ф(^, и)\, а = М ( \ + Т t0) , b = M , полу­

чим вторую оценку (34). Наконец, полагая Дф (£)=ф (£,

u + h )

— ф(£, и)

из

(12),

(13) с

учетом

неравенств

(5)— (7)

и

ограни-

ченности

^

^•< М на G, будем иметь

 

 

 

 

 

дх

 

 

 

 

 

 

 

 

 

|AiKOI<L|Ax(T)| + L (l + | Ж t, и)Цс). J ( I Ajc(0 I + IА (О I) ^ -h

м ||А Ф(*)| dr.

Подставляя сюда оценки (26), (34), придем к неравенству

| Аф ( 01 < С 6 j \ h { t ) \ d t + M J /Aife(x) |dr.

Для получения оценки (35)' остается принять в (24), (25)

ф(0 = |Дф(0|,

a = C5 $\h(t)\dt, Ь = М . А

 

*0

4. Воспользуемся некоторыми формулами, полученными при

доказательстве теоремы

1, и дадим простое доказательство прин­

ципа максимума Понтрягина для задачи (1) — (3), (32).


§ 3]

Задача оптимального управления со

свободным правым концом

267

 

Т е о р е м а 3. Пусть функции f°,

f, Ф непрерывны по совокуп­

ности своих аргументов вместе со своими частными производными

по переменной х и удовлетворяют условиям

(4) — (7),

и пусть

множество V(t)

из (32)

не зависит от t : V(t) = V,

t0^ .t^ .T . Пусть

управление u ( t ) e U

и соответствующая траектория x ( t ) ^ x ( t , и),

t o ^ t ^ T , образуют

оптимальное

решение задачи

 

(1)»— (3),

(32).

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

H (x{t);

ф(*),

u(t),

t) =

max H{x{t),

ф(*),

и,

f),

 

(36)

 

 

 

 

 

 

 

uSV

 

 

 

 

 

 

где H(x, ф, u, t ) = —f°(x, u,

t) +

(ty, f(x, u, t)), а ф(^) является ре­

шением задачи

(12)— (13).

 

 

 

 

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Подставим в формулу

(17)

разложение

щ х + Ах, ф, u + h , t) — H (х, ф, u + h, t) +

 

 

 

+ ^дН(х + B bx.J. u + h ,

t) > Axy

o <

0 <

1.

 

 

Получим

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

ф (t),

 

 

 

 

 

 

 

AJ (u) =

— ^[H (x(t),

U(t) + h(t), t) —

 

 

 

 

 

to

 

 

 

 

 

 

 

 

 

 

 

 

H{x(t),

ф(£), u(t), t)]dt + R,

 

 

 

 

 

(37)

где R = R i + R 2, R i в з я т о

и з

 

(16),

R2 определяется

формулой вида

(19). Справедлива оценка

 

 

 

 

 

 

 

 

 

 

|R |< L |Ах (Г) |2 +

(1 +

|ф||с)L J ( |Ах (t) |2 + |Ах (t) |\h{t)\)dt,

 

 

 

 

 

 

 

to

 

 

 

 

 

 

получаемая так же, как и оценка

(2 1 ). Используя

оценку.

(26),

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

т

 

t j ,

 

св =

LC\ + (1 +IIФlb) [с? (Г- g

+

l .

IR I< Сву |h it)Id

 

to

 

 

 

 

 

 

 

 

 

 

 

 

(38)

 

 

 

 

 

 

 

 

 

 

 

 

 

Доказательство

равенства

(36)

проведем в

предположении,,

что

u(t) — кусочно-непрерывна на [ д

Г] (для определенности можно

считать

 

 

 

 

 

 

 

 

 

 

 

 

 

и(*о) = и(*о +

0),

 

u ( t ) = u ( t — 0),

t0< t * £ T ) .

 

 

Пусть равенство (36) не имеет

места при некотором т е [ д

Г ].

Тогда существуют такие »e

F и

а = const> 0 , что

 

 

 

 

 

Н (х (т), ф (т), v, т)— 2а > Н (х (т), ф (т), и (т), т).


268

МЕТОДЫ

М И Н И М И З А Ц И И В Ф У НКЦ И О Н АЛ ЬН Ы Х ПРОСТРАНСТВАХ

[Гл. 6

Так

как u(t)

кусочно-непрерывна, a x(t), гр(^), Н(х, гр, и,

t) не­

прерывные функции своих аргументов, то

 

g(t)&=H(x{t), ф(0 , v, t) — H(x(t), т|з(0 , и (0 , t ) > a

на некотором отрезке t i ^ t ^ t 2, содержащем т. Возьмем прира­ щение h(t) специального «игольчатого» вида h ( t ) = v u(t) при и h ( t ) = 0 вне [*i, t2]. Тогда из оценки (38) с помощью

неравенства Коши— Буняковского будем иметь

<.

'

и

При этом можно считать t2— ^ > 0 столь малым, что

Св ||/г(0 1 3 ^ < а .

Из (37) тогда получим

А/(и) = — j g(t) dt + / ?< — о ( 4 — У + |Я| < (* * — У X

 

х [ - а

+

Св||Л (012^ ] < 0 ,

 

 

что, однако, противоречит

оптимальности управления u = u (t).

Аналогично

доказывается

равенство

(36),

если

u = u ( t ) ^ L 2) [to, Г ],

u (< )eK ,

 

но

u(t)

необязательно

кусочно-непрерывно.

В этом

случае

условие

u (t)^ V

и равенство

(36)следует понимать в смысле почти всюду на [То, Т]. Д

5.Остановимся на следующей задаче оптимального управ

ния, связанной с линейными системами: минимизировать функ­ ционал

 

 

J (и) =

J /° (X, и,

t)dt + Ф[(х (Т))

(39)

при условиях

 

 

 

 

 

 

 

x = A (f)x +

B (t)u + - f(t),

t0 < C t< T ,

x(t0) = x0,

(40)

 

 

 

u =

u ( t ) e U ^ L V [ t 0, Т],

 

(41)

где х =

(х1, . . .

, хп),

и =

(и1, . . . ,

ur), U — заданное множество

из

Vp\tо.

п

 

 

 

 

 

 

A (t), B(t)

заданные

матрицы

порядка пХ п

и п Х г соответст­