Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 238

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

М И Н И М И З А Ц И Я Ф У Н К Ц И И М Н О ГИ Х ПЕРЕМЕННЫ Х

а . 2

5.В заключение настоящей главы следует сказать, что в да

ной главе мало или даже совсем ие затронуты важные, но пока, к сожалению, малоизученные вопросы устойчивости изложенных методов по отношению к различным погрешностям вычисления и округления, вопросы накопления, анализа и использования инфор­ мации в процессе счета, критерии точности и окончания счета и другие вопросы, требующие немалого искусства вычислителя при решении задачи минимизации конкретной функции с помощью того или иного метода.

В стороне остались также вопросы, связанные с выбором оп­ тимальных стратегий поиска минимума на определенных классах функций. Следует сказать, что оптимальные стратегии поиска ми­ нимума функций многих переменных зачастую имеют довольно' сложное описание, что затрудняет их практическое использование. Заметим, что задача поиска экстремума функций многих перемен­ ных хорошо укладывается в общую схему исследования операций, разработанную в работе [69]. Это обстоятельство используется

1в работах [215, 216] для построения оптимальных стратегий поис­ ка экстремума на классе функций, удовлетворяющих обобщенному условию Липшица. Обзор оптимальных методов минимизации на различных классах функций см. в работе [120]. Общий обзор

методов минимизации функций конечного числа переменных и биб­

лиографию см. в работах [34, 70, 75,

79, 81, 82, 84, 86, 87, 96, 97,

109, ПО, 114, 116, 118,

133,

135, 138,

149, 155, 164, 170, 188, 193,

229, 230, 235, 239, 265]

и др.

 

 

Г л а в а 3

Принцип максимума Л. С. Понтрягина

В этой главе рассмотрим задачи оптимального управления процессами, описываемыми системами обыкновенных дифференци­ альных уравнений. К таким задачам приводят многие прикладные задачи, в частности, задачи механики космического полета ([75, 130, 142, 152, 246] и др.). Выдающуюся роль в развитии теории оптимального управления сыграл академик Л. С. Понтрягин, ко­ торый сформулировал необходимые условия оптимальности, изве­ стные под названием принципа максимума [195]. Этот фундамен­ тальный результат составил математическую основу теории опти­ мального управления, послужил мощным толчком как в развитии современной теории экстремальных задач, так и в создании чис­ ленных методов решения таких задач.

§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

Сначала остановимся на некоторых конкретных задачах. Как известно ([75], стр. 129), при определенных условиях движение центра масс космического аппарата и расход массы описываются следующей системой дифференциальных уравнений:

r = v,

v = g ~ Ь

G = — gq, 0 < f < 7 \

(1)

 

О

 

 

где t — время,

r= r{t) —(гь г2,

г3) — радиус-вектор центра

масс

аппарата, v = v ( t) = (vь v2, v3) — скорость центра масс, G = G (t)

текущий

вес

аппарата,

g

— коэффициент

пропорциональности

между

массой

и весом,

P —P(t) — (pь

р2, р3)

— вектор

тяги

дви­

гателя,

 

q — q(t)

массовый

расход

рабочего

вещества,

F = F (r ,

t) — (Fu F 2,

F 3)

— вектор ускорения

от гравитационных

сил. Предположим, что фазовые координаты r(t), v(t),

G(t)

ап­

парата в начальный момент ^ = 0 известны:

 

 

 

 

 

 

 

г (0) = г0,

v (0) =

v0,

G(0) =

G0.

 

(2)

Величины

q = q { t ) ,

P — P (t)

являются управлением, и, задавая их

по-разному, можно получить различные фазовые траектории

(ре­

шения)

задачи

(1),

 

(2).

Конструктивные

возможности

аппарата,

ограниченность ресурсов рабочего вещества накладывают на уп­ равления ограничения, например, следующего вида:

< 7 т 1 п < ? (0 <<7тах> Р т\п < I Р ( 0 I < Р т ах. 0 < t < Т .

(3)

155


156 П Р И Н Ц И П МАКСИМУМА Л. С. ПОНТРЯГИНА [Гл. ■?

Кроме того, на фазовые траектории также могут быть наложены: некоторые ограничения, вытекающие, например, из условий того,, чтобы вес аппарата был не меньше определенной величины, или1 траектория полета проходила вне определенных областей космиче­

ского пространства

(областей повышенной радиации) и др. Здесь,

возникают

задачи

выбора управлений q{t), P(t) из условий (3)

так, чтобы

траектории системы (1), (2) удовлетворяли наложен­

ным ограничениям и, кроме того, некоторый целевой функционал принимал свое минимальное или максимальное значение. Напри­ мер, возможны задачи [75]: 1) попасть в заданную точку или об­ ласть космического пространства за минимальное время; 2) в за ­ данный момент попасть в заданную область пространства с задан­ ной скоростью и с максимальным весом аппарата или с минималь­

ной затратой энергии; 3)

достичь определенной скорости за мини­

мальное время и т. п.

 

 

 

 

 

 

общей

задачи

Эти задачи являются

частным случаем

более

оптимального управления,

к

формулировке

которой

мы

перехо­

дим.

 

 

 

 

 

 

 

 

Пусть некоторый управляемый процесс описывается системой

обыкновенных дифференциальных уравнений

 

 

х‘ = / '> \ х2,,

,

хп,

и1,

и2.......... ur,

t), tQ<Ct<CT,

 

 

i

=

1,

2,

. . . , п,

 

 

 

или в векторной форме:

 

 

 

 

 

 

 

 

х ~

f [х, и,

t),

t0 < t< C T ,

 

(4)

где х = (х1, . . . , хп)

величины,

характеризующие процесс в каж­

дый момент t и называемые фазовыми координатами управляемо­

го объекта,

« =

(и1......... ит)

параметры управления («положе­

ние

рулей»

системы),

определяющие ход

процесса; функции

f ‘ (x,

и, t)

( i = l ,

2, . . . ,

п),

описывающие

внутреннее устройство

объекта и учитывающие различные внешние факторы, предполага­

ются известными.

 

 

 

 

 

 

 

 

Для

того чтобы ход управляемого

процесса

(4) был

опреде­

лен

на некотором

отрезке

прежде всего необходимо за­

дать

параметры управления

и = ( и и2, . . . ,

иг),

например, как

функции

времени

u = u {t) =

(ul (t) , . . . ,

ur(t)),

t ^ t s ^ T .

Будем

предполагать, что

параметры

управления и

в

каждый момент t

принадлежат некоторой области управлений V(t), которая может быть любым множеством некоторого r-мерного евклидова прост­

ранства

Ег (в частности, может быть V (t)= E r). Управление

u = u(t)

назовем

допустимым, если его

координаты

uf (<)

(7 = 1 , 2

, . . . , г) явлются кусочно-непрерывными [или ограниченны­

ми измеримыми]

функциями и u(t)^ .V (t)

при

[почти


§ 1]

Постановка

задачи оптимального управления

 

157

всюду]. Множество всех допустимых управлений

обозначим

че­

рез U.

 

 

u (t)^ U ,

 

 

Возьмем

некоторое

управление

и в

(4)

положим u = u {t):

 

 

 

 

 

x = f(x , u{t), t),

t0 < t < T .

 

(5>

Под решением этого уравнения будем понимать непрерывное ре­ шение интегрального уравнения

 

X(0 =

| / (т), и (т), x)dx + x (/„).

(6),

 

 

 

и

 

 

 

Будем

предполагать, что

функции

р {х , и, t)

определены и;

непрерывны

вместе

со

своими

частными

производными fxi (х, и , t)

(i, j = 1, . . .

, п),

где x e £ „ ,

u ( t) e V ( t) , t0^ t ^ T .

При этих ус­

ловиях может быть доказано существование и единственность ре­

шения уравнения

(5) с

заданными начальными условиями

x (t0) t

определенное на

некотором

отрезке

 

to < T i^ T

[194,

254]. В дальнейшем будем рассматривать только те

допустимые

управления

u(t),

для которых решение уравнения

(5)’ существует

на всем отрезке

 

 

 

 

 

 

 

 

Построенное в определенном выше смысле решение уравне­

ния (5) с начальным условием

х(£0) будем называть решением,

или траекторией,

уравнения

(5), соответствующим

допустимому

управлению

u = u (t )^ U

и начальному

условию

x(t0) и будем

обозначать

через x ( t) = x ( t, и)

t o ^ t^ T .

Точку x(tQ)

будем назы­

вать левым концом траектории,

точку х(Т) — правым концом

тра­

ектории x (t,u ).

 

 

 

 

 

 

 

 

Теперь перейдем к непосредственной формулировке задачи оп­ тимального управления. Пусть в пространстве Е п заданы многооб­ разия S0(t), Si(t) и некоторое множество G (t), и пусть задан функционал

. J ( u ) = jf* ( x ,u ,t ) d t + 0 (x (T )), 1О

где функция /° (х, и, t) определена и непрерывна вместе с частными производными /°у (]' = 1,2, . . . ,п) при (х, u,t)£.G (t) х V (t) X [^0, Т],

Ф (х) — определена и непрерывна при х 6 G (Т) f| S/ (Т ).

Задача оптимального управления заключается в том, чтобы найти такое допустимое управление и = и * (t)^ U , чтобы соответ­ ствующая ему траектории x — x * (t) — x(d,u*) удовлетворяла усло­ виям х* (t0)^ S o (t0), x*(T )e= Si(T ), х* (t)^ G (t), и функ­ ционал J (и) достигал своей точной нижней грани: J (и*) = inf 1(и) —


158 ПРИНЦИП МАКСИМУМА Л. С. ПОНТРЯГИНА [ Гл. 3

= /*; здесь нижняя грань берется по всем u (t)^ U , для которых соот­

ветствующая траектория x (t,u )

определена при

и удов­

летворяет условиям

x(t0,u.)<=S0(to), x (T ,u )^ S i(T ), 'x(t,u)<^G(t),

Т.

 

 

 

Такое управление u*(t) будем

называть оптимальным управлени­

ем, x * ( t ) — x (t,u *),

t o ^ t ^ T оптимальной траекторией,

а пару,

(и* (t), х* (t)), t o ^ t ^ T

оптимальным решением рассматриваемой

задачи. Заметим, что задача отыскания максимума J (и) легко сво­

дится к сформулированной задаче,

если заметить, что

sup/(u) =

= — inf (— / («)).

 

 

 

 

 

Мы часто будем пользоваться следующей более краткой фор­

мулировкой задачи оптимального

управления:

найти

минимум

-функционала

 

 

 

 

 

 

 

J(u ) = j f 0(x ,u ,t)d t + O (x(T ))

 

(7)

лри условиях

 

 

 

 

 

 

 

x — f{x,u,t),

t0<t<CT,

 

(8)

* ( g

6 S0 (tQ),

X (Т) 6 S , (T),

X (t) е G (0,

 

(9)

u = u(t)eusz{u{t):u{t)ev(t),

t0< t < T )

( 10)

(подразумевая, конечно,'что u(t)

берется

из класса

кусочно-не-

лрерывных или ограниченных измеримых функций).

 

Множество G (t) называют ограничением на фазовые коорди­

наты х = ( а-1,

...,хп) или просто фазовым ограничением. Может слу­

читься, что

G ( t ) = E n

при всех £е[/0, Л. тогда

задача (7) — (10)

•называется задачей оптимального управления без ограничений на

■фазовые координаты и

вэтом случае условие х (t) е G (t),

в (9) не пишется. Если

же G (t)s £ E n, то задачу (7) — (10) называ­

ют задачей оптимального управления с ограничениями на фазовые координаты.

Далее, многообразие S0(t) [или

Si(Q ] может

не зависеть от

времени и состоять из одной точки,

тогда говорят, что в задаче

(7) — (10) левый

[или

соответственно

правый]

конец закреплен;

•если же S0(t) [или

 

 

совпадает со всем простран­

ством

Е п, то говорят,

что левый [или соответственно правый] ко­

нец свободный и в этом

случае условие A(^0) e 5 0(^o)[^(7’) e S x ( r ) ]

в (9)

не пишут; наконец,

если S 0(f)[Si(f)],

 

 

представляют

■собой

некоторую

гиперповерхность

или

кривую

в

Еп, то

левый

[правый] конец называется подвижным.

t0 и Т в

 

 

В

задаче (7) — (10)

моменты времени

общем

случае

могут быть неизвестны, тогда они зависят от управления и подле­ ж ат определению. В частности, если /°=1, Ф (а) = 0 , т о / ( « ) =


S 2)

Формулировка принципа максимума

Л.

С.

Понтрягина

153=

= Т10,

и задачу (7) — (10)

в этом

случае называют задачей бы ­

стродействия. Если же в

задаче (7) — (10)

моменты t0, Т извест­

ны, то задачу

(7) — (10)

называют

задачей

оптимального управ­

ления с закрепленным временем.

 

 

 

 

 

 

Если

p {x ,u ',t)= fi(x ,u )

(j— 0,

1,

п)

и

множества

S 0(O>-

Si(t), G(t)

не

зависят от

t,

то задачу

(7) — (10)

называют

авто­

номной.

 

 

 

 

 

 

 

 

 

 

 

Наряду

со

сформулированной

выше задачей

в теории

опти­

мального управления рассматриваются задачи с запаздыванием, с

параметрами, с

изопериметрическими

условиями,

с

дискретным:

временем и т. д.

([5,

8, 21, 24, 26, 27, 34, 48,

59— 61, 75,

80, 100,

101,

115,

123,

139— 142,

157,

160,

161,

171,

195,

205,

206,

228,

232,

234,.

236, 238,

259] и др.; обзор работ см. в [60], [140]).

 

 

 

 

 

 

Упражнения.

1.

Если u = u (t)

— кусочно-непрерывно,

то непре­

рывное решение уравнения

(6) кусочно-дифференцируемо и в точ­

ках

непрерывности

x(t)

удовлетворяет

уравнению

(5).

Доказать-

 

2.

Доказать, что в случае ограниченного измеримого управ

ния непрерывное решение уравнения (6) абсолютно непрерывно и почти всюду удовлетворяет уравнению (5). -

§2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА Л. С. ПОНТРЯГИНА

Рассмотрим

задачу

оптимального

управления

(1.7— 10)

при

V{t) — V, G ( t ) = E n, t o ^ t ^ T .

Будем

предполагать,

что

либо

S j( t ) = E n, либо

Sx(0 =

{C M )

:h i( x ,t ) = Q ,' i= l,

2,

...,

п ^ п } ,

где-

функции hi(x,t)

непрерывно дифференцируемы

по

(x ,t)^ E n'X

Х[*о, Т] и система векторов

 

 

 

 

 

 

 

Г dht

 

dhi

dh[

dll; ) ( j = 1, 2, . . .

,rtj)

 

 

\И х*’

a F ’

дхП ’ ~аГ/

 

 

 

 

 

линейно независима

при всех

(х, t) 6 Si. (t), причем

в

случае закреп­

ленного правого

конца /г; (х,

t) = х ‘ х\ ( £ = 1 , 2 , . . .

, пх = и).

 

Аналогично, пусть либо S0 (£) = £„, либо

 

 

 

 

S0{t)= {(x ,t):g i(x ,t)

= 0, £ =

1, 2, . . . ,/?0 < п },

 

где функции gi (х, t) непрерывно-дифференцируемы по (х, t) £ ЕпX [£0, 7]

и система векторов Х - ^ - , •. •, J ! ii-

dt

(£ = 1 2 , . . . ,п 0) линей-

1. ох1

дхп

J

но независима при всех (х, £) 6 S0(£), причем в случае закрепленного,

левого конца g t (х, t) ==хг'— х‘,

£ =

1, 2,

. . . , п0 = п.

Сначала рассмотрим случай, когда моменты £0. Т закреплены. ДЛЯ формулировки принципа максимума наряду с системой (1.8) рассмотрим следующую систему линейных дифференциаль­ ных уравнений относительно вспомогательных (дополнительно

вводимых) переменных ф(£) = (Ф1 (£). •••>фп ( 0 ) :