Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 174

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

144 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

Предполагается, что все входящие в условие задачи функции и множества удовлетворяют условиям, указан­ ным в п. 2.1.2. В качестве допустимых управлений, как уже отмечалось, рассматриваются ограниченные изме­

римые вектор-функции

u{t),

принимающие значения в

U, а в понятие «локальный экстремум» или «оптималь­

ный процесс» вкладывается

тот

же

смысл,

что и в

п. 2.1.4.

 

 

 

 

 

 

 

 

Мы сформулируем принцип максимума в двух экви­

валентных

формах — «гамильтоновой» и «лагранже-

вой». Начнем с гамильтоновой формы.

 

 

Рассмотрим функцию

 

 

 

 

H(t,

х,

и, р,

Л0) =

(р|ф(/, д;,

u)) — Xaf(t,

х, и)

(где р ^

R",

/.о е

R+),

которую

мы

будем

называть

функцией Понтрягина. Переменные, обозначаемые бук­ вой р, обычно называются импульсами. Наряду с функ­ цией Понтрягина введем функцию

Ж (t, ,v, р, l 0) = sup Я (t,

и,

р,

10),

 

ue=U

 

 

 

называемую гамильтонианом.

 

в

гамильтоновой

Т е о р е м а

1 (принцип максимума

форме). Пусть

(x*(t), u*(t)) — оптимальный управляе­

мый процесс в задаче (1) — (4),

определенный на от­

резке [/о*, tu]. Тогда существуют не равные одновремен­

но нулю число Яо ^ 0, векторы /0 е

RSo,

/i е RS| и век­

тор-функция p(t) такие, что

 

 

 

 

 

а) вектор-функция p(t) удовлетворяет сопряженному

уравнению

 

 

 

 

 

 

р = — н х— — ф; (t, х, (t), U t (t)) p + K0fx (t,

x, ((), «. (/))

(5)

и условиям трансверсальности

 

 

 

 

 

p {to*) =

hox(to„ xt (to*)) lo,

1

 

 

 

p(ti*)=

h\x {tu, xt (t\,))l\',

J

 

 

 

б) почти при всех t из [/о., Л*]

 

 

 

 

 

H{t, xt (t), u,{t), p(t),

X0) = max H (t,

xt (t),

u,

p(t),

Я0) =

 

 

«ell

 

 

 

 

 

 

= ЖЦ, X,(t),

p(t),

КУ,

(7)


 

§

2.4.

ПРИНЦИП

МАКСИМУМА ПОНТРЯГИНА

 

145

 

в)

гамильтониан Mtt,

xt (t),

p(t),

Я,,) непрерывен

на

отрезке [to,,

/1*]

и на концах

его

удовлетворяет

соотно­

 

шениям

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ж {to,,

xt (to*),

р (to*),

Яо) =

(hot (to,.,

xt (t0,))

I/0),

}

 

M(t\„

xt (tu),

p(ti*),

ho) =

(hu(tu,

x* (ti,)) I/ 1).

j

 

Отметим выражение для гамильтониана

 

 

 

Ж (t, х. (t), р (t), Я0) = (hu (tu, x. (/,.)) I /,)

+

 

 

 

 

 

 

 

 

 

 

f,

 

 

 

 

 

 

 

 

 

(8a)

 

 

 

 

 

+ J Ht (l, x,(l), ut (l),

p(l),

K)dl,

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

получающееся в процессе доказательства, а также еди­

 

нообразную

гамильтонову

запись

х — Нр,

р = Нх

 

уравнений (2) и (5).

 

 

 

 

 

 

 

 

 

 

 

Перейдем к описанию лагранжевой формы принци­

 

па максимума. Напишем функцию Лагранжа задачи

 

(1) — (4), такую же, как и в § 2.3:

 

 

 

 

Jп Ldt,

 

& =

(/„I ^

(tQ, х (to))) + (/, I h, (tu

x (/,))) +

 

где

 

 

 

 

 

 

 

 

 

 

 

 

u

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L (t, x,

x,

и,

p,

Я0) =

(p \x — qp (t, x, u)) +

Xaf (t, x, u)

 

•— лагранжиан задачи

(1) — (4).

 

 

 

в

лагранжевой

 

Т е о р е м а

 

Г

(принцип

максимума

 

форме).

Пусть

*(/),«*(/)) — оптимальный

управляе­

 

мый процесс

в задаче

(1)

(4),

определенный

на от­

 

резке [/о*, /i*].

Тогда существуют не равные одновремен­

 

но нулю

число Яо ^ 0,

векторы

/0 е

Rs°,

/, s

R*'

и не­

 

прерывная п-мерная вектор-функция p(t),

при которых

L

а)

почти

всюду

на

отрезке

[То*, ^1*] лагранжиан

удовлетворяет уравнению Эйлера по х:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

------

О

 

 

 

(50

 

 

 

 

 

 

 

 

 

*=*. (11

 

 

 

 

 

 

u = u , { t )

икраевым условиям

==(A)*j х* (A),)) lo,

/г*

L>x

==

x*

l\‘,

( 6 0

 


146 ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

б)

почти при всех t из [/0„

Л*]

лагранжиан L

дост

гает минимума по и при и =

и. (t)\

 

 

 

 

 

 

 

L(t, x.(t),

x.(t),

u.(t),

p(t),

A0) =

 

 

 

 

 

 

 

 

 

 

 

 

= min L (0

(О, X .

(0,

U ,

P

(t), A0);

(7')

 

 

 

 

U

E ( j

 

 

 

 

 

 

 

 

 

 

 

 

 

в)

функция

Лагранжа

3

дифференцируема

no t

справа в точке to,,

по t\

слева в точке t\* и

 

 

 

 

 

OS’

 

 

=

0,

дзе

 

 

 

= 0,

 

 

( 8' )

 

 

dt$ Ч- 0

 

 

с)t,

— О

 

 

 

 

где через

 

д

0

соответственно

dt ^о) ооозначены пра-

 

dt +

вая (левая) производные.

 

 

 

 

 

 

 

 

 

 

 

Проверка

эквивалентности

обеих

 

формулировок

принципа максимума не представляет труда. Действи­

тельно,

 

 

 

 

 

L = (p\x) Н.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому

соотношения

(5)

и

(50,

(6)

 

и

(60

и

(7)

н

(70 попарно эквивалентны. Осталось проверить эквива­

лентность соотношений

(8) и

(80Отметим, что непре­

рывность гамильтониана не является независимым ус­

ловием. Она вытекает из (5)

и (7)

(это

будет видно из

доказательства) и, следовательно, из (50

и (70-

Далее,

в силу (70

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

& Vo, U, X. (•), ... ) =

(/о Ih0 do, X. (/„))) +

(/, |/г, (/„ -V. (0 )))+

 

 

 

+ Jt, {(p (t)\ x .(t))-M (t,

x.(t), P(t),

K)\dt.

 

 

 

 

*0

 

 

 

 

 

 

 

 

 

 

 

 

 

Поэтому

при e >

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3? (to, + e,

t\, . . 0

— 3

(to*,

t\, . . .) =

 

 

 

 

 

 

 

 

(to

| ho (to, +

e,

x, (to,

-f- e)) — ho

(to*,

x* (to,)))

1

 

*o* +e

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

j

[(P (t)

IX, (t))

-

m (t, X,

(t),

p ( t ) ,

A0)] d t

=

 

*a*

 

=

e ( / 0 I/го.» (to,,

x, (to,)))

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

* 0 * + 8

\

/

lo\hoc(to„ x,(t0*))

 

 

+ 6 2@(to., x* (to,),

p (to*),

Ao)

J

-j-

^0*+E

\

x,*(t) dt I— (p(/o*)

+

о (e) =


 

§ 2.4. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА

147

силу первого

равенства в

(6))

 

=

£ [(/о Ihot {to-,

Хь^О:))) + Ж (to.-., .V, (/,),), р (ф*)> А,о)] + о(е).

Полученное равенство влечет

эквивалентность

первых

соотношений в (8) и (8'). Аналогично проверяется и эквивалентность вторых соотношений.

Теорема Г и, следовательно, принцип максимума Понтрягина, является еще одной реализацией сформу­ лированного во введении принципа Лагранжа, соглас­ но которому необходимые условия экстремума в задаче с ограничениями совпадают с необходимыми усло­ виями экстремума функции Лагранжа при ограниче­ ниях, не включенных в эту функцию. В самом деле, если множители Лагранжа Яо, /о, h, p(t) фиксированы, то функция Лагранжа 3? зависит от трех групп перемен­ ных: фазовых траекторий x(t), управлений u(t) и мо­ ментов времени to, А- Если теперь отрезок [4, Б] и уп­ равление u(t) зафиксировать, то задача о минимуме функции Лагранжа по x (t ) имеет вид классической за­

дачи

Больца, а утверждение а)

теоремы Г означает,

что x*(t) удовлетворяет необходимому

условию мини­

мума

функции Лагранжа по x(t)

при

фиксированных

u(t) =

u#(t) и to = to*, ti — Б*-

 

 

Точно так же, утверждение б) теоремы V необходи­ мо и достаточно для того, чтобы функция Лагранжа до­ стигала минимума по всем допустимым управлениям

(это единственное ограничение, не включенное в функ­ цию Лагранжа, поскольку оно не носит функциональ­

ного характера!) при фиксированном отрезке

[ф*, Б*] «

траектории x*(t) в точке u (t)— u*(t). (Это

утвержде­

ние следует из интуитивно очевидной формулы

 

и

t,

inf Г g(t, и (t)) dt =

f inf g(t, u) dt,

U(t)fEU f

U<S(J

строго доказанной в гл. 9 при значительно более общих предположениях.)

Отметим

далее, что вектор-функции

x*(0> и*(0 и

p (t) можно

продолжить левее точки ф*

и правее точки

Б* так, чтобы функция Лагранжа стала дифференци­ руемой по to и tx в точках ф* и Б* соответственно. Для


148

ГЛ. 2. НЕОБХОДИМЫЕ УСЛОВИЯ

этого нужно, чтобы х*(/) и p{t) оставались непрерыв­ ными, а «*(0 удовлетворяла соотношениям

lim Hit, x,{t), и* {(), p(t), Я0) = Ж (to,, х» (/0«), р (к,), Я0),

о*

 

lim Н (/, х*(/), «,(/)> р(0. Я0) =

(/ft*, х. (<1«), р(!ч*), Я0).

<46*

 

В этом случае из приведенной выше выкладки следует,

что

в

силу (8')

производные функции Лагранжа

по ta

и

в

точках ^о*

и liif соответственно равны нулю.

Дру­

гими словами, утверждение в) теоремы 1 ' означает, что моменты времени /0* « удовлетворяют необходимым условиям минимума функции Лагранжа по /0 и ti.

Выше мы отметили, что единственным ограничением, не включенным в функцию Лагранжа в теореме 1', было условие (3). Однако в конкретных случаях в функ­ цию Лагранжа можно не включать и некоторые другие ограничения, главным образом граничные условия тина закрепленных концов и закрепленного времени. При этом соответствующие условия трансверсальности ис­ чезают и (снова в подтверждение принципа Лагранжа) оставшиеся соотношения совпадают с необходимыми условияхми минимума функции Лагранжа при ограниче­ ниях, которые в эту функцию не были включены. Дей­ ствительно, если, например, h0 — х — х0 (закрепленный левый конец), то первое условие в (6) означает, что р (/„)== /о; если ho = t а (закрепленный левый момент времени), то первое условие в (8) принимает вид

Ш= — /0 и т. д. Таким образом, множители Ла­

гранжа, соответствующие закрепленным концам, сов­ падают со значениями p(t), а множители Лагранжа, соответствующие закрепленным моментам времени, — со значениями гамильтониана в соответствующих точ­

ках и

не

несут

более никакой

информации.

Если

р(/) =

0,

то

и все

эти множители

равны нулю.

Мы не

коснулись

условий,

гарантирующих

неравенство

Яо Ф 0.

Они очень громоздки и обычно проще непосредственно проверить, что Яо Ф 0.

До сих пор мы говорили о задаче с интегральным функционалом. В задаче с терминальным функционалом