Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 238
Скачиваний: 1
М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х |
[Га . 2 |
5.В заключение настоящей главы следует сказать, что в да
ной главе мало или даже совсем ие затронуты важные, но пока, к сожалению, малоизученные вопросы устойчивости изложенных методов по отношению к различным погрешностям вычисления и округления, вопросы накопления, анализа и использования инфор мации в процессе счета, критерии точности и окончания счета и другие вопросы, требующие немалого искусства вычислителя при решении задачи минимизации конкретной функции с помощью того или иного метода.
В стороне остались также вопросы, связанные с выбором оп тимальных стратегий поиска минимума на определенных классах функций. Следует сказать, что оптимальные стратегии поиска ми нимума функций многих переменных зачастую имеют довольно' сложное описание, что затрудняет их практическое использование. Заметим, что задача поиска экстремума функций многих перемен ных хорошо укладывается в общую схему исследования операций, разработанную в работе [69]. Это обстоятельство используется
1в работах [215, 216] для построения оптимальных стратегий поис ка экстремума на классе функций, удовлетворяющих обобщенному условию Липшица. Обзор оптимальных методов минимизации на различных классах функций см. в работе [120]. Общий обзор
методов минимизации функций конечного числа переменных и биб
лиографию см. в работах [34, 70, 75, |
79, 81, 82, 84, 86, 87, 96, 97, |
||
109, ПО, 114, 116, 118, |
133, |
135, 138, |
149, 155, 164, 170, 188, 193, |
229, 230, 235, 239, 265] |
и др. |
|
|
Г л а в а 3
Принцип максимума Л. С. Понтрягина
В этой главе рассмотрим задачи оптимального управления процессами, описываемыми системами обыкновенных дифференци альных уравнений. К таким задачам приводят многие прикладные задачи, в частности, задачи механики космического полета ([75, 130, 142, 152, 246] и др.). Выдающуюся роль в развитии теории оптимального управления сыграл академик Л. С. Понтрягин, ко торый сформулировал необходимые условия оптимальности, изве стные под названием принципа максимума [195]. Этот фундамен тальный результат составил математическую основу теории опти мального управления, послужил мощным толчком как в развитии современной теории экстремальных задач, так и в создании чис ленных методов решения таких задач.
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Сначала остановимся на некоторых конкретных задачах. Как известно ([75], стр. 129), при определенных условиях движение центра масс космического аппарата и расход массы описываются следующей системой дифференциальных уравнений:
r = v, |
v = g ~ Ь |
G = — gq, 0 < f < 7 \ |
(1) |
|
О |
|
|
где t — время, |
r= r{t) —(гь г2, |
г3) — радиус-вектор центра |
масс |
аппарата, v = v ( t) = (vь v2, v3) — скорость центра масс, G = G (t) —
текущий |
вес |
аппарата, |
g |
— коэффициент |
пропорциональности |
||||||||
между |
массой |
и весом, |
P —P(t) — (pь |
р2, р3) |
— вектор |
тяги |
дви |
||||||
гателя, |
|
q — q(t) |
— |
массовый |
расход |
рабочего |
вещества, |
||||||
F = F (r , |
t) — (Fu F 2, |
F 3) |
— вектор ускорения |
от гравитационных |
|||||||||
сил. Предположим, что фазовые координаты r(t), v(t), |
G(t) |
ап |
|||||||||||
парата в начальный момент ^ = 0 известны: |
|
|
|
|
|||||||||
|
|
|
г (0) = г0, |
v (0) = |
v0, |
G(0) = |
G0. |
|
(2) |
||||
Величины |
q = q { t ) , |
P — P (t) |
являются управлением, и, задавая их |
||||||||||
по-разному, можно получить различные фазовые траектории |
(ре |
||||||||||||
шения) |
задачи |
(1), |
|
(2). |
Конструктивные |
возможности |
аппарата, |
ограниченность ресурсов рабочего вещества накладывают на уп равления ограничения, например, следующего вида:
< 7 т 1 п < ? (0 <<7тах> Р т\п < I Р ( 0 I < Р т ах. 0 < t < Т . |
(3) |
155
156 П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА [Гл. ■?
Кроме того, на фазовые траектории также могут быть наложены: некоторые ограничения, вытекающие, например, из условий того,, чтобы вес аппарата был не меньше определенной величины, или1 траектория полета проходила вне определенных областей космиче
ского пространства |
(областей повышенной радиации) и др. Здесь, |
|
возникают |
задачи |
выбора управлений q{t), P(t) из условий (3) |
так, чтобы |
траектории системы (1), (2) удовлетворяли наложен |
ным ограничениям и, кроме того, некоторый целевой функционал принимал свое минимальное или максимальное значение. Напри мер, возможны задачи [75]: 1) попасть в заданную точку или об ласть космического пространства за минимальное время; 2) в за данный момент попасть в заданную область пространства с задан ной скоростью и с максимальным весом аппарата или с минималь
ной затратой энергии; 3) |
достичь определенной скорости за мини |
|||||||
мальное время и т. п. |
|
|
|
|
|
|
общей |
задачи |
Эти задачи являются |
частным случаем |
более |
||||||
оптимального управления, |
к |
формулировке |
которой |
мы |
перехо |
|||
дим. |
|
|
|
|
|
|
|
|
Пусть некоторый управляемый процесс описывается системой |
||||||||
обыкновенных дифференциальных уравнений |
|
|
||||||
х‘ = / '> \ х2,, |
, |
хп, |
и1, |
и2.......... ur, |
t), tQ<Ct<CT, |
|
||
|
i |
= |
1, |
2, |
. . . , п, |
|
|
|
или в векторной форме: |
|
|
|
|
|
|
|
|
х ~ |
f [х, и, |
t), |
t0 < t< C T , |
|
(4) |
|||
где х = (х1, . . . , хп) — |
величины, |
характеризующие процесс в каж |
дый момент t и называемые фазовыми координатами управляемо
го объекта, |
« = |
(и1......... ит) — |
параметры управления («положе |
|||
ние |
рулей» |
системы), |
определяющие ход |
процесса; функции |
||
f ‘ (x, |
и, t) |
( i = l , |
2, . . . , |
п), |
описывающие |
внутреннее устройство |
объекта и учитывающие различные внешние факторы, предполага
ются известными. |
|
|
|
|
|
|
|
||
|
Для |
того чтобы ход управляемого |
процесса |
(4) был |
опреде |
||||
лен |
на некотором |
отрезке |
прежде всего необходимо за |
||||||
дать |
параметры управления |
и = ( и и2, . . . , |
иг), |
например, как |
|||||
функции |
времени |
u = u {t) = |
(ul (t) , . . . , |
ur(t)), |
t ^ t s ^ T . |
Будем |
|||
предполагать, что |
параметры |
управления и |
в |
каждый момент t |
принадлежат некоторой области управлений V(t), которая может быть любым множеством некоторого r-мерного евклидова прост
ранства |
Ег (в частности, может быть V (t)= E r). Управление |
|||
u = u(t) |
назовем |
допустимым, если его |
координаты |
uf (<) |
(7 = 1 , 2 |
, . . . , г) явлются кусочно-непрерывными [или ограниченны |
|||
ми измеримыми] |
функциями и u(t)^ .V (t) |
при |
[почти |
§ 1] |
Постановка |
задачи оптимального управления |
|
157 |
|
всюду]. Множество всех допустимых управлений |
обозначим |
че |
|||
рез U. |
|
|
u (t)^ U , |
|
|
Возьмем |
некоторое |
управление |
и в |
(4) |
|
положим u = u {t): |
|
|
|
|
|
|
x = f(x , u{t), t), |
t0 < t < T . |
|
(5> |
Под решением этого уравнения будем понимать непрерывное ре шение интегрального уравнения
|
X(0 = |
| / (х (т), и (т), x)dx + x (/„). |
(6), |
|||
|
|
|
и |
|
|
|
Будем |
предполагать, что |
функции |
р {х , и, t) |
определены и; |
||
непрерывны |
вместе |
со |
своими |
частными |
производными fxi (х, и , t) |
|
(i, j = 1, . . . |
, п), |
где x e £ „ , |
u ( t) e V ( t) , t0^ t ^ T . |
При этих ус |
ловиях может быть доказано существование и единственность ре
шения уравнения |
(5) с |
заданными начальными условиями |
x (t0) t |
||||||
определенное на |
некотором |
отрезке |
|
to < T i^ T |
[194, |
||||
254]. В дальнейшем будем рассматривать только те |
допустимые |
||||||||
управления |
u(t), |
для которых решение уравнения |
(5)’ существует |
||||||
на всем отрезке |
|
|
|
|
|
|
|
|
|
Построенное в определенном выше смысле решение уравне |
|||||||||
ния (5) с начальным условием |
х(£0) будем называть решением, |
||||||||
или траекторией, |
уравнения |
(5), соответствующим |
допустимому |
||||||
управлению |
u = u (t )^ U |
и начальному |
условию |
x(t0) и будем |
|||||
обозначать |
через x ( t) = x ( t, и) |
t o ^ t^ T . |
Точку x(tQ) |
будем назы |
|||||
вать левым концом траектории, |
точку х(Т) — правым концом |
тра |
|||||||
ектории x (t,u ). |
|
|
|
|
|
|
|
|
Теперь перейдем к непосредственной формулировке задачи оп тимального управления. Пусть в пространстве Е п заданы многооб разия S0(t), Si(t) и некоторое множество G (t), и пусть задан функционал
. J ( u ) = jf* ( x ,u ,t ) d t + 0 (x (T )), 1О
где функция /° (х, и, t) определена и непрерывна вместе с частными производными /°у (]' = 1,2, . . . ,п) при (х, u,t)£.G (t) х V (t) X [^0, Т],
Ф (х) — определена и непрерывна при х 6 G (Т) f| S/ (Т ).
Задача оптимального управления заключается в том, чтобы найти такое допустимое управление и = и * (t)^ U , чтобы соответ ствующая ему траектории x — x * (t) — x(d,u*) удовлетворяла усло виям х* (t0)^ S o (t0), x*(T )e= Si(T ), х* (t)^ G (t), и функ ционал J (и) достигал своей точной нижней грани: J (и*) = inf 1(и) —
158 ПРИНЦИП МАКСИМУМА Л. С. ПОНТРЯГИНА [ Гл. 3
= /*; здесь нижняя грань берется по всем u (t)^ U , для которых соот
ветствующая траектория x (t,u ) |
определена при |
и удов |
|
летворяет условиям |
x(t0,u.)<=S0(to), x (T ,u )^ S i(T ), 'x(t,u)<^G(t), |
||
Т. |
|
|
|
Такое управление u*(t) будем |
называть оптимальным управлени |
||
ем, x * ( t ) — x (t,u *), |
t o ^ t ^ T — оптимальной траекторией, |
а пару, |
(и* (t), х* (t)), t o ^ t ^ T |
— оптимальным решением рассматриваемой |
|||||
задачи. Заметим, что задача отыскания максимума J (и) легко сво |
||||||
дится к сформулированной задаче, |
если заметить, что |
sup/(u) = |
||||
= — inf (— / («)). |
|
|
|
|
|
|
Мы часто будем пользоваться следующей более краткой фор |
||||||
мулировкой задачи оптимального |
управления: |
найти |
минимум |
|||
-функционала |
|
|
|
|
|
|
|
J(u ) = j f 0(x ,u ,t)d t + O (x(T )) |
|
(7) |
|||
лри условиях |
|
|
|
|
|
|
|
x — f{x,u,t), |
t0<t<CT, |
|
(8) |
||
* ( g |
6 S0 (tQ), |
X (Т) 6 S , (T), |
X (t) е G (0, |
|
(9) |
|
u = u(t)eusz{u{t):u{t)ev(t), |
t0< t < T ) |
( 10) |
||||
(подразумевая, конечно,'что u(t) |
берется |
из класса |
кусочно-не- |
|||
лрерывных или ограниченных измеримых функций). |
|
|||||
Множество G (t) называют ограничением на фазовые коорди |
||||||
наты х = ( а-1, |
...,хп) или просто фазовым ограничением. Может слу |
|||||
читься, что |
G ( t ) = E n |
при всех £е[/0, Л. тогда |
задача (7) — (10) |
•называется задачей оптимального управления без ограничений на
■фазовые координаты и |
вэтом случае условие х (t) е G (t), |
в (9) не пишется. Если |
же G (t)s £ E n, то задачу (7) — (10) называ |
ют задачей оптимального управления с ограничениями на фазовые координаты.
Далее, многообразие S0(t) [или |
Si(Q ] может |
не зависеть от |
|||||||
времени и состоять из одной точки, |
тогда говорят, что в задаче |
||||||||
(7) — (10) левый |
[или |
соответственно |
правый] |
конец закреплен; |
|||||
•если же S0(t) [или |
|
|
совпадает со всем простран |
||||||
ством |
Е п, то говорят, |
что левый [или соответственно правый] ко |
|||||||
нец свободный и в этом |
случае условие A(^0) e 5 0(^o)[^(7’) e S x ( r ) ] |
||||||||
в (9) |
не пишут; наконец, |
если S 0(f)[Si(f)], |
|
|
представляют |
||||
■собой |
некоторую |
гиперповерхность |
или |
кривую |
в |
Еп, то |
левый |
||
[правый] конец называется подвижным. |
t0 и Т в |
|
|
||||||
В |
задаче (7) — (10) |
моменты времени |
общем |
случае |
могут быть неизвестны, тогда они зависят от управления и подле ж ат определению. В частности, если /°=1, Ф (а) = 0 , т о / ( « ) =
S 2) |
Формулировка принципа максимума |
Л. |
С. |
Понтрягина |
153= |
||||||
= Т— 10, |
и задачу (7) — (10) |
в этом |
случае называют задачей бы |
||||||||
стродействия. Если же в |
задаче (7) — (10) |
моменты t0, Т извест |
|||||||||
ны, то задачу |
(7) — (10) |
называют |
задачей |
оптимального управ |
|||||||
ления с закрепленным временем. |
|
|
|
|
|
|
|||||
Если |
p {x ,u ',t)= fi(x ,u ) |
(j— 0, |
1, |
п) |
и |
множества |
S 0(O>- |
||||
Si(t), G(t) |
не |
зависят от |
t, |
то задачу |
(7) — (10) |
называют |
авто |
||||
номной. |
|
|
|
|
|
|
|
|
|
|
|
Наряду |
со |
сформулированной |
выше задачей |
в теории |
опти |
мального управления рассматриваются задачи с запаздыванием, с
параметрами, с |
изопериметрическими |
условиями, |
с |
дискретным: |
||||||||||
временем и т. д. |
([5, |
8, 21, 24, 26, 27, 34, 48, |
59— 61, 75, |
80, 100, |
101, |
|||||||||
115, |
123, |
139— 142, |
157, |
160, |
161, |
171, |
195, |
205, |
206, |
228, |
232, |
234,. |
||
236, 238, |
259] и др.; обзор работ см. в [60], [140]). |
|
|
|
|
|
||||||||
|
Упражнения. |
1. |
Если u = u (t) |
— кусочно-непрерывно, |
то непре |
|||||||||
рывное решение уравнения |
(6) кусочно-дифференцируемо и в точ |
|||||||||||||
ках |
непрерывности |
x(t) |
удовлетворяет |
уравнению |
(5). |
Доказать- |
||||||||
|
2. |
Доказать, что в случае ограниченного измеримого управ |
ния непрерывное решение уравнения (6) абсолютно непрерывно и почти всюду удовлетворяет уравнению (5). -
§2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА Л. С. ПОНТРЯГИНА
Рассмотрим |
задачу |
оптимального |
управления |
(1.7— 10) |
при |
|||||
V{t) — V, G ( t ) = E n, t o ^ t ^ T . |
Будем |
предполагать, |
что |
либо |
||||||
S j( t ) = E n, либо |
Sx(0 = |
{C M ) |
:h i( x ,t ) = Q ,' i= l, |
2, |
..., |
п ^ п } , |
где- |
|||
функции hi(x,t) |
непрерывно дифференцируемы |
по |
(x ,t)^ E n'X |
|||||||
Х[*о, Т] и система векторов |
|
|
|
|
|
|
|
|||
Г dht |
|
dhi |
’ |
dh[ |
dll; ) ( j = 1, 2, . . . |
,rtj) |
|
|
||
\И х*’ |
a F ’ |
дхП ’ ~аГ/ |
|
|
|
|
|
|||
линейно независима |
при всех |
(х, t) 6 Si. (t), причем |
в |
случае закреп |
||||||
ленного правого |
конца /г; (х, |
t) = х ‘ — х\ ( £ = 1 , 2 , . . . |
, пх = и). |
|
||||||
Аналогично, пусть либо S0 (£) = £„, либо |
|
|
|
|
||||||
S0{t)= {(x ,t):g i(x ,t) |
= 0, £ = |
1, 2, . . . ,/?0 < п }, |
|
где функции gi (х, t) непрерывно-дифференцируемы по (х, t) £ ЕпX [£0, 7]
и система векторов Х - ^ - , •. •, J ! ii- |
dt |
(£ = 1 2 , . . . ,п 0) линей- |
|
1. ох1 |
дхп |
J |
|
но независима при всех (х, £) 6 S0(£), причем в случае закрепленного, |
|||
левого конца g t (х, t) ==хг'— х‘, |
£ = |
1, 2, |
. . . , п0 = п. |
Сначала рассмотрим случай, когда моменты £0. Т закреплены. ДЛЯ формулировки принципа максимума наряду с системой (1.8) рассмотрим следующую систему линейных дифференциаль ных уравнений относительно вспомогательных (дополнительно
вводимых) переменных ф(£) = (Ф1 (£). •••>фп ( 0 ) :