Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 235

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 3] Приближенное решение краевой задачи принципа максимума 173

(2.8— 10),

так

как

функция

Н (и вообще

вся

задача) не зависит

'

 

х°,

 

 

.

-------- — =

0,

т. е. i|)o=const. (Это

от переменной1

поэтому ф0 =

 

 

 

 

 

 

 

дх°

 

 

 

 

 

прежний параметр

из

теоремы

2.1.

Далее,

как

было

замечено

выше,, умножение

вектора ф(£) =

(ф0, ф(£))

на

положительную

скалярную

функцию

ц ( 0 > 0

силу

однородности

функции

 

 

П

 

 

 

 

 

 

 

 

 

 

Н (х , ф, и,

t ) =

фjf> (х , и, t)

по

переменной

ф) не меняет

вида

 

 

/=о

_

 

 

 

 

 

 

 

 

 

управления и— и(х, ф, t), определяемого из условия max Н(х,

ф, и, t),

 

 

 

 

 

 

 

 

 

 

u S V

 

 

а также не влияет на условия трансверсальности. Поэтому вместо вектор-функции ф(/), являющейся решением «неустойчивой» си­

стемы

(13),

можно

попытаться

искать ^другую вектор-функцию

р (0 =

(Ро(0.

р ( 0 ) =

р (0 ф (0 .

ц (0 > ° . которая будет

опреде­

ляться из некоторой «устойчивой» системы уравнений

 

 

 

Pi =

gi (х ,

Р. 0

(/ =

0,

1,

■••,п).

(14)

В результате краевая задача (2.13),

(2.8— 10) будет заменена на

задачу

 

 

 

 

 

 

 

 

 

 

 

 

х£ = f ‘ (х, и, t), t0 < t < C T , i = 1 , 2 , . . . , п;

 

 

Pi = Si (х,

и,

Р, t), f0 < * < 7 \

i =

0, 1, •■■, п,

 

 

 

x(t0) e s 0(t0),

x c n e s A T ) ,

(Л5)

 

р ( g = ( P

i (

g

>pnf g ) j _ s 0 ( g

в точке х ( д ,

 

 

Р (Т) = (Рх (Г),

•■■, р„ (Т)) J_

 

(Т)

в точке х(Т),

 

ро(0 <о, lp(0l2= £pf(0^0,

 

 

 

1=0

где u— u (x ,ty ,t)= u (x ,p ,t)

определяется^из (2.11). В силу построе­

ния системы

(14)

имеет

р(^)='р,(£)Ф’(0> р ('0 > 0 . Поэтому из

краевой задачи

(15)

можно определить те же самые подозритель­

ные на оптимальность управления и траектории, что и из задачи (2.13), (2.8— 10), с той, однако, разницей, что при удачном выборе системы (14) эффект «неустойчивости» будет отсутствовать или значительно снизится.

1Впрочем, систему (1.8) иногда полезно расширить введением переменной х° посредством условий *°=/°(х, и, V), х°(<о)=0. [195].


174

П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА

[ Г л. 3

Таким

образом, требуется построить систему вида

(14), кото­

рая

обладала бы следующими двумя свойствами: 1) любые два

решения тр (t)

и p(i)

соответственно систем

(13),

(14)

(при од­

них

и тех же

x = x ( t ) , u = u ( t ) ) , для

которых

р(^ о)=аф (М »

a = c o n s t> 0 ,

связаны

соотношением

р (

t

)

p ,(Q > 0 ,

 

2) |p(OI=

P? ( 0 ) /s — невозрастающая

функция вре-

i=о

мени.

Следуя работе [243], укажем некоторые приемы построения системы (14) с требуемыми свойствами. Сначала остановимся на линейном случае, когда система (13) для ф имеет вид

ф *= С (0ф , t0 < t < C T .

(16)

Наряду с этой системой рассмотрим^еще систему

 

р = С ( / ) р + е ( М ) Р ,

(17)

где е(р, t) некоторая скалярная функция. Оказывается, при подхо­

дящем выборе функции е(р, t) система (17) будет обладать

нуж­

ными свойствами. Это вытекает из следующих лемм.

 

 

Л е м м а 1.

Если ф (£)— решение

системы

(16) с начальным

условием ф(*0),

а p jf) — решение системы (17)

с начальным усло­

вием р(/о), если р(/о) = аф(^о) фО,

a — co n st> 0 ,

то существует

такая непрерывная функция р (^ )> 0 , что

 

 

 

 

 

Д о к а з а т е л ь с т в о . Обозначим ф0 (0 —

^

, р0 (t) =

,

 

 

 

1Ф«)1

'

IР(ОI

где |г |= V(z, z). Так как ф0 = —%-

 

Ф

Ф

то,

под-

 

Ф

1Ф1 1ФI

1Ф1 ’

 

 

ставляя сюда выражение для ф (t) из

(16),

получим ф0 =

С (t) г]з0 —

— (С(Лф0, ф0) ф0.

Аналогично для р0 (/)

имеем

 

 

 

 

Ро =

- £ f - £ _ = С ( 0 Р о + е ( р , 0 Р о -

 

— (Ср0, Ро) Ро— е (р, t) (Ро, р0) р0 =\С (t) р0 — (Ср0, р0) р0

независимо от выбора функции е (р ,t). Таким образом, ф0(t) и р0 (t) являются решением одной и той же системы дифференциальных

уравнений z = Cz — (Cz, z) z при одном и том же начальном условии


S 3]'

Приближенное решение краевой задачи принципа максимума

175

В силу единственности решения задачи Коши имеем

 

Ъ Ю - Р о (0 . или - У

.р Я__,

М>(*)1

I р (О I

Остается положить р (t) =

д

 

 

И> WI _ _

Л е м м а 2.

Если е(р,

t) >

го решения р (t)

системы

(17) величина

убывающей функцией, а если е(р, t) <•

возрастающей функцией.

Д о к а з а т е л ь с т в о . Так как

т0 для любого непрерывно-

п

|р (7! |=

^

pj

будет не-

 

1=0

 

К С р .р )

,

то |р (t) |будет не-

 

2

(Р 2)

= (Р . Р)

= Ш

р Г р ) + е(р,

t)\р , Р) =

 

at

 

 

 

 

 

 

 

 

= Р2

(С р ,р )

, е (Р, О

 

 

 

 

 

р2

 

 

то "в

первом

случае

будем

иметь

(р2) >

0,

во втором случае—

“■

 

 

 

dt

 

 

j. wi

откуда и следует^справедливость

леммы. А.

—— (Р2)< 0 >

dt

На основе леммы 2 можно предложить различные функции е(р,t), для которых норма |р(01 решения системы (17) не будет возра­

стать. Например, можно взять е ( р Д ) = — ||C(f)||, где НСИ— норма матрицы, соответствующая евклидовой норме вектора. Так как

|(Ср,р")|<||С|||р|2, то е(р, 0 ------ДС(0Ц<— |Ср_,р)|-, и в силу

Р2

леммы 2 |p(f)| не будет возрастать. Однако практическое вычис­ ление |С (t) | часто бывает затруднительным, поэтому, имея в виду . оценку

IIс (О Р <

£

I сц (t)|2,

 

£,/=0

 

можно положить

 

 

е (Р-0 = - (

£

IСг, (О 1а),/г

£./=о


176

П Р И Н Ц И П МАКСИМ УМА

Л. С. ПОНТРЯГИНА

[Т,1. 3

или даже е(р, £)==— Стах, где постоянная

 

 

 

С тах > max ( £

|Су(0 |а)'/а,

 

 

 

£,/=0

 

 

С^СО-

элементы матрицы С (it). Заметим, что приведенные функции

е (р ,t)

от р не зависят, и система

(17) остается

линейной относи­

тельно

р.

 

 

 

В

некоторых случаях выбор

е (р, t) •< — —

*

может при-

 

 

е!

 

 

вести к столь быстрому убыванию |р(0|. что |p(f)| может обра­

титься в машинный нуль.

Во избежании

этого

можно

принять

е (р> 0 = е (Р2). где е(г)

— непрерывная функция одной переменной,

удовлетворяющая условиям

e (r )^ .C max при r < r b е ( г ) ^ — Стах

при г ^ г 2,

|е(г) |^ С тах

при

 

где гх и г2— подходящим

образом выбранные положительные числа,

г\ < г2. Например, мож­

но положить

 

 

 

 

 

 

 

 

 

 

 

 

 

 

е (г)== — 2Стах------ — +

Стах.

 

 

 

 

 

 

 

 

 

 

 

Гогх

 

 

 

 

Из леммы

2

в этом

случае

следует, что если

r i^ p 2(^0) ^ г 2, то

П < р 2(0 < / 2

во

все

моменты

t<=[t0T]\

если

p2(*o )< ri

или

Р2(^о)> £ "2,

то величина_р2(£)

будет стремиться с течением времени

попасть в

полосу ri-^ p 2(0 - ^

r 2 и остаться

в этой полосе в после­

дующие моменты времени. О других способах

выбора

е(р, t)

см.

в работах

[1,

243].

 

 

 

 

 

 

 

 

 

Если

система

(13)

 

нелинейна и неустойчива, то может

ока­

заться полезным рассмотрение системы

 

 

 

 

 

 

 

П

 

 

 

 

 

 

 

 

 

 

 

Pi =

^

С£зР/ + е (Р.

0 Pi (*' = 0, 1, • • • , л),

 

 

 

 

 

/=о

 

 

 

 

 

 

 

 

 

где С,1. = — дх1 и функция е(р, t) выбирается одним из вышеуказан-

ных способов [243].

Об использовании принципа максимума для решения конкрет­ ных прикладных задач, о методах решения возникающих при этом краевых задач см. в работах [1, 2, 27, 34, 44, 75, 130, 141, 144, 146, 147, 152, 171, 243, 246] и др.


§ 4]

Связь

с классическим вариационным исчислением

1 7 7

§ 4. СВЯЗЬ МЕЖДУ ПРИНЦИПОМ МАКСИМУМА И КЛАССИЧЕСКИМ

 

 

 

ВАРИАЦИОННЫМ ИСЧИСЛЕНИЕМ

 

 

Основной

задачей классического вариационного

исчисления,

как

известно

[68,

254], является следующая задача:

среди всех

непрерывных кривых, x = x ( t ) , имеющих кусочно-непре­ рывные производные x(t) и удовлетворяющих условиям х(/0) е 5 0,

x ( T ) e S i,

найти такую, которая доставляет функционалу

 

 

 

 

=

J / °(*(0,

x(t),t).dt

 

 

 

 

 

 

и

 

 

 

минимальное значение.

3p,ecb^x(t) — (xl (t), ..., xn(t)),

S0 и S i — за­

данные

множества

в

Е п.

Будем

предполагать,

что

функция

f°(x,u,t)

непрерывна

и имеет непрерывные производные

/2,/°,/?,

fau /их>fuu при (х, и, t) ^ E ny(Eny(\to,-\-oo\. Далее в этом парагра­ фе для простоты ограничимся случаем закрепленного левого конца

(дг('/о) = X q,

t0 задано),

а

правый

конец

х(Т)

либо

закреплен

(x(T )= X i,

Т задано), либо

свободный

( S ^ E n,

Т задано),

либо

является

подвижным

и . лежит

на

заданной

гладкой

кривой

S i= { ( x ,£ )

: х—-cp (f)= 0},

Т не задано.

 

 

 

 

 

 

 

 

Обозначим

х = и

и запишем

рассматриваемую задачу

в экви­

валентном

виде

как

задачу

оптимального управления: минимизи-

 

 

 

 

 

 

 

т

 

 

 

 

 

 

 

 

 

 

ровать

функционал

J {и) =

j

(х, и, t) dt

при

 

условиях

 

х = и ,

to^ t^ T -,

x{t0) = x Q, х (7’) е 5 1, ° и ( 0 е 1/=Дп.

 

 

 

 

 

 

Для исследования этой задачи воспользуемся принципом мак­

симума Понтрягина. Согласно теоремам

2.1—2

нужно

выписать

функцию Гамильтона — Понтрягина:

 

 

 

 

 

 

 

 

 

 

 

Н = ф0/° (х,

и,

t) + (ф, и) =

Н (х,

ф, и,

t),

 

 

(1)

и сопряженную

систему

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф =

=

 

 

 

и,

t),

ф0 =

const < 0 .

 

 

(2)

Для оптимального решения u(t),

x { t ) = x ( t ,u )

должно выполнять­

ся необходимое условие

 

 

 

 

 

 

 

 

 

 

 

 

 

Н (x(t), ф (0, u(t)- t) =

 

m a x # (x (t),

ф(/), v,

t),

/„ < / < Г ,

(3)

 

 

 

 

 

 

 

v&V

 

 

 

 

 

 

 

 

 

 

где ф(^)

решение системы

(2) при u = u ( t ) ,

x = x ( t ,u ) .

Так как в

данном случае

множество

 

значений

управления V совпадает со

всем пространством Е„,

то условие

(3)

может

соблюдаться

лишь

в стационарной точке, т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

н и=

Фо/° (x{t), u(t),t) +

ф(^) =

0.

 

 

 

(4)