Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 15.10.2024
Просмотров: 178
Скачиваний: 0
|
|
|
§ 2.4 |
ПРИ Н иИ П МАКСИМУМА ПОШРЯГИНА |
153 |
||||||||
Вычислим |
этот предел. |
Он, |
очевидно, равен |
|
|||||||||
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
Пт л 1 |
[[/(/, |
xk{t), v ) — f(t, |
x,{t), ut (t)) ] dt -f- |
|
|||||||||
A\K> |
|
* |
|
|
|
|
|
|
|
|
|
|
|
|
t—К |
U |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
||
+ lim A,-1 |
|
xk(t), |
|
|
|
|
x,(t), |
u,{t))]dt = |
|||||
|
|
= |
/( T, X, (t ), |
v )— f( T, X, (t), Ы. (t )) + |
|
||||||||
|
|
|
|
|
|
|
+ |
J |
ifx (t, |
X, (/), |
и. (/)) I у (t)) dt. |
||
|
|
|
|
|
|
|
|
T |
|
|
|
|
|
Отсюда, используя равенство |
(19), получаем |
|
|||||||||||
(р(т)|<р(т, |
х. (т), |
u,(x)))— f(x, |
х. (т), |
и. (т ))> |
|
||||||||
|
|
|
|
|
>(р (т)| ф (т, |
х. (т), |
v))— f( т, х+(т), и). |
||||||
Но |
|
т — произвольная |
точка |
непрерывности |
управ |
||||||||
ления |
м*(/) и |
v — произвольный |
элемент |
множества U. |
|||||||||
Отсюда |
следует, |
что |
соотношение |
(15) |
выполняется |
||||||||
во всех точках непрерывности управления и*(/), чт0 и |
|||||||||||||
требовалось. |
|
|
максимума |
и |
вариационное |
исчисле |
|||||||
2.4.3. |
Принцип |
||||||||||||
ние. Принцип максимума Понтрягина содержит необхо |
|||||||||||||
димые |
условия (первого порядка) |
в классическом ва |
|||||||||||
риационном исчислении. Мы покажем сейчас, как из |
|||||||||||||
принципа максимума можно получить уравнение Эй |
|||||||||||||
лера |
и |
условия Вейерштрасса, а также |
канонические |
||||||||||
уравнения |
и |
условия |
Вейерштрасса — Эрдмана, |
о ко |
торых мы ранее не упоминали. Ограничимся простейшей вариационной задачей. Читатель при желании может проделать соответствующие выкладки для задач более общего вида.
Итак, рассмотрим простейшую задачу
и предположим, что функция х*(/) (непрерывно диффе ренцируемая) доставляет сильный минимум в этой за даче. Можно переписать задачу в форме задачи
154 |
|
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
|
||||
оптимального |
управления следующим образом: |
||||||
|
|
и |
|
|
|
|
|
|
|
) А (/, |
х, и) dt-+ inf; |
|
|||
|
|
*0 |
|
|
|
|
|
|
х — и, u e R , |
x(t[j) = |
x0, |
x(t[) = |
x |
||
Тогда, |
если |
положить |
ut (t) = |
xt (t), то |
управляемый |
||
процесс |
(**(•),»*(•)) |
оптимален |
в |
последней задаче. |
|||
Имеем |
|
// = ри — l 0L (/, |
.т, |
и). |
|
||
|
|
|
Сопряженное уравнение имеет вид
Р = А0Аа. (/, xt {t), X' (/)),
а из принципа максимума следует (поскольку ограни чения на и отсутствуют), что
Hu = P - h L |
i {x^ Ut(tt) = |
0 |
(20) |
почти везде. Но поскольку |
управление |
ut (t) |
непрерыв |
но, написанное соотношение должно выполняться при
всех t. Если бы >„0 равнялось нулю, то |
в силу (20) |
и |
|||
p(t) равнялась бы тождественно нулю, |
что невозможно. |
||||
Поэтому можно считать, |
что ).0 = |
1, и |
мы |
приходим |
к |
уравнению Эйлера |
|
|
|
|
|
P(() = - ^ Lx(t, x,(t), |
u,(t)) = |
Lx (t, |
x,(t), |
xjt)). |
|
Далее, из принципа максимума следует, что почти при всех t
т а x(p (t)u — L(t, xjt), и)) = р (t) ujt) — L (t, x jt), ujt)). U
Это равенство, очевидно, выполняется во всех точках непрерывности функции н*(0> т. е. при всех t. Прини мая во внимание формулу (20), получаем
L(t, xjt), u) — L(t, xjt), xjt)) —
— (и — i (t)) Lx (t, x. (t), x, (0) > 0
при всех t и и. Мы пришли к условию Вейерштрасса. Эти рассуждения позволяют, в частности, сделать
вывод о том, что обычно используемое в вариационном
§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА |
155 |
исчислении требование непрерывной дифференцируемо сти экстремальной функции является излишним. Те же соотношения выполняются (но уже не при всех, а только почти при всех t), когда экстремальная функция абсо лютно непрерывна, а ее производная ограничена.
В частности, с помощью условия принципа максиму ма легко получаются необходимые условия Вейерштрасса — Эрдмана для так называемых ломаных экс тремалей. Действительно, если сильная минималь х*(/) имеет кусочно-непрерывную производную, то уравнение
Эйлера и |
условие |
Вейерштрасса должны |
выполняться |
|
в каждой |
точке |
ее непрерывности. |
Пусть при t — т |
|
функция |
x*(t) не дифференцируема |
(т. е. |
ее производ |
ная терпит разрыв первого рода). Во всех точках не прерывности i* (0 верна формула
x,{t)L k(t, х:,(/), x J t))— L(t, xt (t), x,(t)) = |
|
= |
x,(t), P(t)). |
Согласно принципу максимума, гамильтониан непреры вен, отсюда следует, что
i . (т — 0) Lk(т, х, (т), х, (т — 0)) — L (т, х, (т), х, (т — 0)) =
= X, (т + 0) L* (т, X, (т), X, (т + 0)) — L (т, |
х„ (т), |
х, (т + 0)). |
Точно так же, поскольку функция/?( / ) = |
Lk(t, |
(/),i*(/)), |
будучи решением сопряженного уравнения, непрерывна,
U (т, лг. (т), X, (т — 0)) = Lk (т, х, (т), X, (т + 0)).
Эти два соотношения называются условиями Вейер штрасса — Эрдмана. Они характеризуют возможные значения разрывов производных у ломаных экстрема* лей. Для простейшей векторной задачи условия Вейер штрасса— Эрдмана пишутся совершенно аналогично.
В заключение скажем несколько слов о канониче ских уравнениях. Мы уже отмечали, что в задаче опти мального управления фазовая траектория и решение сопряженного уравнения удовлетворяют системе урав нений
х |
дИ |
|
дН |
|
др |
Р = |
дх • |
||
|
156 |
ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ |
|
Предположим теперь, что лагранжиан L простейшей задачи вариационного исчисления дважды непрерывно дифференцируем и удовлетворяет усиленному условию Лежандра: Lkk > 0, т. е., в частности, — это выпуклая функция по последнему аргументу. Тогда по теореме о неявной функции в окрестности каждой точки
(/, x*(t), i * ( / ) ) уравнение
p = Li(t, х, и)
однозначно разрешимо относительно и, т. е. суще ствует такая непрерывно дифференцируемая функция u(t, х, р), что
p = Lk {t, х, u(t, х, р)),
где |
u(t,xt (t),p{t)) = |
i* (0 . P(t) = Lt{t,x,(t),x*(t)). |
|||
В |
точке |
и — u(t,x,p) |
производная |
функции |
и->ри — |
— L(t, х, и) — Н (t, х, и, р) равна нулю. Коль |
скоро эта |
||||
функция |
вогнута, она |
достигает |
максимума |
в точке |
|
u(t, х, р), |
т. е. |
|
|
|
II {t, х, a(t, х, р), р) =
= ри (I, х, р) — L (t, х, и (t, х, р)) = Ж (t, х, р).
Последнее соотношение определяет так называемое
преобразование Лежандра функции L по последнему ар
гументу. |
Обобщение |
этого |
преобразования — преобра |
||||||
зование |
Юнга — Фенхеля — мы |
будем |
подробно изу |
||||||
чать в следующей главе. Имеем |
|
|
____ |
||||||
|
дЖ_ _ д И _ |
|
дН_ди_ _ |
дН_ , ( |
г \ ди |
||||
|
дх |
их |
' |
ди |
дх |
дх |
' у |
|
х’ дх |
Но на экстремали p = |
Lk {t, |
xt (/), |
*,(/)). |
Поэтому |
|||||
|
дЖ (t, xt {t), |
p (t)) |
dH (t, х„ (t), xt (Q, |
p (Q) |
|||||
|
|
дх |
|
|
|
|
dx |
|
|
Аналогично |
|
|
|
и из |
(21) |
следует, |
что **(•) и |
р(-) являются решениями такой системы уравнений:
дЖ . дЖ
Х==Т ^ ' Р = - ~ д 7 -
Полученная система уравнений первого порядка, оче видно, эквивалентная уравнению Эйлера, называется
§ 2,4 ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА |
157 |
||
канонической формой уравнения |
Эйлера |
или |
просто — |
канонической системой. |
|
в классическом |
|
2.4.4. Некоторые иллюстрации. Как и |
|||
вариационном исчислении, при |
решении |
задач опти |
мального управления с помощью принципа максимума можно встретиться с самыми различными ситуациями. Для линейных задач с ограниченным множеством управлений типична ситуация, когда существует един ственный допустимый управляемый процесс, удовлет воряющий принципу максимума, и этот процесс
оптимален. |
1. |
В задаче |
|
|
|
|
|||
П р и м е р |
|
|
|
|
|||||
|
|
I |
|
|
|
|
|
|
|
|
J х dt - > |
in f; |
х = |
и, | и \^ |
1, |
х (0) = |
0, |
||
|
о |
|
|
|
|
|
|
|
|
принципу |
максимума |
удовлетворяет |
только процесс |
||||||
(x(t) = |
— t, u(i) = — 1 ) , |
очевидно, являющийся опти |
|||||||
мальным. |
В самом деле, в этой задаче |
|
|||||||
|
|
|
|
|
Н = |
ри — х, |
|
|
|
сопряженное уравнение имеет вид |
|
|
|
||||||
|
|
|
|
|
|
Р = 1> |
|
|
|
откуда |
(так |
как |
мы |
рассматриваем задачу со свобод |
|||||
ным правым |
концом |
н, |
значит, |
/7(1) = 0) |
(/) = / — I |
и максимум функции Н достигается при ц = — 1. Вообще же, в задачах оптимального управления
можно столкнуться с теми же ситуациями, что и в вариационном исчислении: отсутствие решения, суще ствование множества допустимых процессов, удовлетво ряющих принципу максимума и являющихся или не являющихся оптимальными и т. д. Тот факт, что в за дачах оптимального управления часто рассматривают ог раниченные множества допустимых управлений, может породить (и порой порождает) иллюзию, будто реше ния в таких задачах непременно существуют и всегда могут быть найдены с помощью принципа максимума. Эго, конечно, неверно. Для иллюстрации рассмотрим пример, который позволит нам заодно обратить внима ние на весьма важное явление — скользящие режимы.