Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 235
Скачиваний: 1
§ 3] Приближенное решение краевой задачи принципа максимума 173
(2.8— 10), |
так |
как |
функция |
Н (и вообще |
вся |
задача) не зависит |
||||||
' |
|
х°, |
|
|
. |
-------- — = |
0, |
т. е. i|)o=const. (Это |
||||
от переменной1 |
поэтому ф0 = |
|||||||||||
|
|
|
|
|
|
|
дх° |
|
|
|
|
|
прежний параметр |
из |
теоремы |
2.1. |
Далее, |
как |
было |
замечено |
|||||
выше,, умножение |
вектора ф(£) = |
(ф0, ф(£)) |
на |
положительную |
||||||||
скалярную |
функцию |
ц ( 0 > 0 |
(в |
силу |
однородности |
функции |
||||||
|
|
П |
|
|
|
|
|
|
|
|
|
|
Н (х , ф, и, |
t ) = |
фjf> (х , и, t) |
по |
переменной |
ф) не меняет |
вида |
||||||
|
|
/=о |
_ |
|
|
|
|
|
|
|
|
|
управления и— и(х, ф, t), определяемого из условия max Н(х, |
ф, и, t), |
|||||||||||
|
|
|
|
|
|
|
|
|
|
u S V |
|
|
а также не влияет на условия трансверсальности. Поэтому вместо вектор-функции ф(/), являющейся решением «неустойчивой» си
стемы |
(13), |
можно |
попытаться |
искать ^другую вектор-функцию |
||||||
р (0 = |
(Ро(0. |
р ( 0 ) = |
р (0 ф (0 . |
ц (0 > ° . которая будет |
опреде |
|||||
ляться из некоторой «устойчивой» системы уравнений |
|
|||||||||
|
|
Pi = |
gi (х , |
Р. 0 |
(/ = |
0, |
1, |
■••,п). |
(14) |
|
В результате краевая задача (2.13), |
(2.8— 10) будет заменена на |
|||||||||
задачу |
|
|
|
|
|
|
|
|
|
|
|
|
х£ = f ‘ (х, и, t), t0 < t < C T , i = 1 , 2 , . . . , п; |
|
|||||||
|
Pi = Si (х, |
и, |
Р, t), f0 < * < 7 \ |
i = |
0, 1, •■■, п, |
|
||||
|
|
x(t0) e s 0(t0), |
x c n e s A T ) , |
(Л5) |
||||||
|
р ( g = ( P |
i ( |
g |
>pnf g ) j _ s 0 ( g |
в точке х ( д , |
|
||||
|
Р (Т) = (Рх (Г), |
•■■, р„ (Т)) J_ |
|
(Т) |
в точке х(Т), |
|
ро(0 <о, lp(0l2= £pf(0^0,
|
|
|
1=0 |
где u— u (x ,ty ,t)= u (x ,p ,t) |
определяется^из (2.11). В силу построе |
||
ния системы |
(14) |
имеет |
р(^)='р,(£)Ф’(0> р ('0 > 0 . Поэтому из |
краевой задачи |
(15) |
можно определить те же самые подозритель |
ные на оптимальность управления и траектории, что и из задачи (2.13), (2.8— 10), с той, однако, разницей, что при удачном выборе системы (14) эффект «неустойчивости» будет отсутствовать или значительно снизится.
1Впрочем, систему (1.8) иногда полезно расширить введением переменной х° посредством условий *°=/°(х, и, V), х°(<о)=0. [195].
174 |
П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА |
[ Г л. 3 |
Таким |
образом, требуется построить систему вида |
(14), кото |
рая |
обладала бы следующими двумя свойствами: 1) любые два |
||||||
решения тр (t) |
и p(i) |
соответственно систем |
(13), |
(14) |
(при од |
||
них |
и тех же |
x = x ( t ) , u = u ( t ) ) , для |
которых |
р(^ о)=аф (М » |
|||
a = c o n s t> 0 , |
связаны |
соотношением |
р ( |
t |
) |
p ,(Q > 0 , |
|
|
2) |p(OI= |
P? ( 0 ) /s — невозрастающая |
функция вре- |
i=о
мени.
Следуя работе [243], укажем некоторые приемы построения системы (14) с требуемыми свойствами. Сначала остановимся на линейном случае, когда система (13) для ф имеет вид
ф *= С (0ф , t0 < t < C T . |
(16) |
Наряду с этой системой рассмотрим^еще систему |
|
р = С ( / ) р + е ( М ) Р , |
(17) |
где е(р, t) некоторая скалярная функция. Оказывается, при подхо
дящем выборе функции е(р, t) система (17) будет обладать |
нуж |
||||||
ными свойствами. Это вытекает из следующих лемм. |
|
|
|||||
Л е м м а 1. |
Если ф (£)— решение |
системы |
(16) с начальным |
||||
условием ф(*0), |
а p jf) — решение системы (17) |
с начальным усло |
|||||
вием р(/о), если р(/о) = аф(^о) фО, |
a — co n st> 0 , |
то существует |
|||||
такая непрерывная функция р (^ )> 0 , что |
|
|
|
|
|
||
Д о к а з а т е л ь с т в о . Обозначим ф0 (0 — |
^ |
, р0 (t) = |
, |
||||
|
|
|
1Ф«)1 |
' |
IР(ОI |
||
где |г |= V(z, z). Так как ф0 = —%- |
|
Ф |
Ф |
то, |
под- |
||
|
Ф |
1Ф1 1ФI |
1Ф1 ’ |
|
|
||
ставляя сюда выражение для ф (t) из |
(16), |
получим ф0 = |
С (t) г]з0 — |
||||
— (С(Лф0, ф0) ф0. |
Аналогично для р0 (/) |
имеем |
|
|
|
|
|
Ро = |
- £ f - £ _ = С ( 0 Р о + е ( р , 0 Р о - |
|
— (Ср0, Ро) Ро— е (р, t) (Ро, р0) р0 =\С (t) р0 — (Ср0, р0) р0
независимо от выбора функции е (р ,t). Таким образом, ф0(t) и р0 (t) являются решением одной и той же системы дифференциальных
уравнений z = Cz — (Cz, z) z при одном и том же начальном условии
S 3]' |
Приближенное решение краевой задачи принципа максимума |
175 |
В силу единственности решения задачи Коши имеем |
|
Ъ Ю - Р о (0 . или - У |
.р Я__, |
М>(*)1 |
I р (О I |
Остается положить р (t) = |
д |
|
|
|
И> WI _ _ |
Л е м м а 2. |
Если е(р, |
t) > |
го решения р (t) |
системы |
(17) величина |
убывающей функцией, а если е(р, t) <•
возрастающей функцией.
Д о к а з а т е л ь с т в о . Так как
т0 для любого непрерывно-
п
|р (7! |= |
^ |
pj |
будет не- |
|
1=0 |
|
|
К С р .р ) |
, |
то |р (t) |будет не- |
|
2 |
(Р 2) |
= (Р . Р) |
= Ш |
р Г р ) + е(р, |
t)\р , Р) = |
|
|
at |
|
|
|
|
|
|
|
|
|
= Р2 |
(С р ,р ) |
, е (Р, О |
|
|
|
|
|
р2 |
|
|
||
то "в |
первом |
случае |
будем |
иметь |
(р2) > |
0, |
во втором случае— |
“■ |
— |
|
|
|
dt |
|
|
j. wi |
откуда и следует^справедливость |
леммы. А. |
|||||
—— (Р2)< 0 > |
dt
На основе леммы 2 можно предложить различные функции е(р,t), для которых норма |р(01 решения системы (17) не будет возра
стать. Например, можно взять е ( р Д ) = — ||C(f)||, где НСИ— норма матрицы, соответствующая евклидовой норме вектора. Так как
|(Ср,р")|<||С|||р|2, то е(р, 0 ------ДС(0Ц<— |Ср_,р)|-, и в силу
Р2
леммы 2 |p(f)| не будет возрастать. Однако практическое вычис ление |С (t) | часто бывает затруднительным, поэтому, имея в виду . оценку
IIс (О Р < |
£ |
I сц (t)|2, |
|
£,/=0 |
|
можно положить |
|
|
е (Р-0 = - ( |
£ |
IСг, (О 1а),/г |
£./=о
176 |
П Р И Н Ц И П МАКСИМ УМА |
Л. С. ПОНТРЯГИНА |
[Т,1. 3 |
|
или даже е(р, £)==— Стах, где постоянная |
|
|
||
|
С тах > max ( £ |
|Су(0 |а)'/а, |
|
|
|
£,/=0 |
|
|
|
С^СО- |
элементы матрицы С (it). Заметим, что приведенные функции |
|||
е (р ,t) |
от р не зависят, и система |
(17) остается |
линейной относи |
|
тельно |
р. |
|
|
|
В |
некоторых случаях выбор |
е (р, t) •< — — |
* |
может при- |
|
|
е! |
|
|
вести к столь быстрому убыванию |р(0|. что |p(f)| может обра
титься в машинный нуль. |
Во избежании |
этого |
можно |
принять |
||||||||
е (р> 0 = е (Р2). где е(г) |
— непрерывная функция одной переменной, |
|||||||||||
удовлетворяющая условиям |
e (r )^ .C max при r < r b е ( г ) ^ — Стах |
|||||||||||
при г ^ г 2, |
|е(г) |^ С тах |
при |
|
где гх и г2— подходящим |
||||||||
образом выбранные положительные числа, |
г\ < г2. Например, мож |
|||||||||||
но положить |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
е (г)== — 2Стах------ — + |
Стах. |
|
|
|
|||||
|
|
|
|
|
|
|
|
Го— гх |
|
|
|
|
Из леммы |
2 |
в этом |
случае |
следует, что если |
r i^ p 2(^0) ^ г 2, то |
|||||||
П < р 2(0 < / 2 |
во |
все |
моменты |
t<=[t0T]\ |
если |
p2(*o )< ri |
или |
|||||
Р2(^о)> £ "2, |
то величина_р2(£) |
будет стремиться с течением времени |
||||||||||
попасть в |
полосу ri-^ p 2(0 - ^ |
r 2 и остаться |
в этой полосе в после |
|||||||||
дующие моменты времени. О других способах |
выбора |
е(р, t) |
см. |
|||||||||
в работах |
[1, |
243]. |
|
|
|
|
|
|
|
|
|
|
Если |
система |
(13) |
|
нелинейна и неустойчива, то может |
ока |
|||||||
заться полезным рассмотрение системы |
|
|
|
|
||||||||
|
|
|
П |
|
|
|
|
|
|
|
|
|
|
|
Pi = |
^ |
С£зР/ + е (Р. |
0 Pi (*' = 0, 1, • • • , л), |
|
|
|||||
|
|
|
/=о |
|
|
|
|
|
|
|
|
|
где С,1. = — дх1 и функция е(р, t) выбирается одним из вышеуказан-
ных способов [243].
Об использовании принципа максимума для решения конкрет ных прикладных задач, о методах решения возникающих при этом краевых задач см. в работах [1, 2, 27, 34, 44, 75, 130, 141, 144, 146, 147, 152, 171, 243, 246] и др.
§ 4] |
Связь |
с классическим вариационным исчислением |
1 7 7 |
|
§ 4. СВЯЗЬ МЕЖДУ ПРИНЦИПОМ МАКСИМУМА И КЛАССИЧЕСКИМ |
||||
|
|
|
ВАРИАЦИОННЫМ ИСЧИСЛЕНИЕМ |
|
|
Основной |
задачей классического вариационного |
исчисления, |
|
как |
известно |
[68, |
254], является следующая задача: |
среди всех |
непрерывных кривых, x = x ( t ) , имеющих кусочно-непре рывные производные x(t) и удовлетворяющих условиям х(/0) е 5 0,
x ( T ) e S i, |
найти такую, которая доставляет функционалу |
|
|||||
|
|
|
= |
J / °(*(0, |
x(t),t).dt |
|
|
|
|
|
|
и |
|
|
|
минимальное значение. |
3p,ecb^x(t) — (xl (t), ..., xn(t)), |
S0 и S i — за |
|||||
данные |
множества |
в |
Е п. |
Будем |
предполагать, |
что |
функция |
f°(x,u,t) |
непрерывна |
и имеет непрерывные производные |
/2,/°,/?, |
fau /их>fuu при (х, и, t) ^ E ny(Eny(\to,-\-oo\. Далее в этом парагра фе для простоты ограничимся случаем закрепленного левого конца
(дг('/о) = X q, |
t0 задано), |
а |
правый |
конец |
х(Т) |
либо |
закреплен |
||||||||||
(x(T )= X i, |
Т задано), либо |
свободный |
( S ^ E n, |
Т задано), |
либо |
||||||||||||
является |
подвижным |
и . лежит |
на |
заданной |
гладкой |
кривой |
|||||||||||
S i= { ( x ,£ ) |
: х—-cp (f)= 0}, |
Т не задано. |
|
|
|
|
|
|
|
|
|||||||
Обозначим |
х = и |
и запишем |
рассматриваемую задачу |
в экви |
|||||||||||||
валентном |
виде |
как |
задачу |
оптимального управления: минимизи- |
|||||||||||||
|
|
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
ровать |
функционал |
J {и) = |
j f° |
(х, и, t) dt |
при |
|
условиях |
|
х = и , |
||||||||
to^ t^ T -, |
x{t0) = x Q, х (7’) е 5 1, ° и ( 0 е 1/=Дп. |
|
|
|
|
|
|
||||||||||
Для исследования этой задачи воспользуемся принципом мак |
|||||||||||||||||
симума Понтрягина. Согласно теоремам |
2.1—2 |
нужно |
выписать |
||||||||||||||
функцию Гамильтона — Понтрягина: |
|
|
|
|
|
|
|
|
|
||||||||
|
|
Н = ф0/° (х, |
и, |
t) + (ф, и) = |
Н (х, |
ф, и, |
t), |
|
|
(1) |
|||||||
и сопряженную |
систему |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
Ф = |
— |
= |
|
|
|
и, |
t), |
ф0 = |
const < 0 . |
|
|
(2) |
|||
Для оптимального решения u(t), |
x { t ) = x ( t ,u ) |
должно выполнять |
|||||||||||||||
ся необходимое условие |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Н (x(t), ф (0, u(t)- t) = |
|
m a x # (x (t), |
ф(/), v, |
t), |
/„ < / < Г , |
(3) |
|||||||||||
|
|
|
|
|
|
|
v&V |
|
|
|
|
|
|
|
|
|
|
где ф(^) |
решение системы |
(2) при u = u ( t ) , |
x = x ( t ,u ) . |
Так как в |
|||||||||||||
данном случае |
множество |
|
значений |
управления V совпадает со |
|||||||||||||
всем пространством Е„, |
то условие |
(3) |
может |
соблюдаться |
лишь |
||||||||||||
в стационарной точке, т. е. |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
н и= |
Фо/° (x{t), u(t),t) + |
ф(^) = |
0. |
|
|
|
(4) |