Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 213

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

§ 5.1. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

243

Далее,

коль скоро 0 е

int В, как

и

в

§

1.4, можно

выбрать

векторы х х<= X

и у х, . . . ,

yt

из

сот F (xt, U)

таким образом, чтобы линейная оболочка множества L0\){yx.........Vi) совпадала с У и

 

 

 

Fx(*., и.) х, + ух+ . . .

+ г/, = 0.

 

 

Тогда для каждого

номера

s = l ,

. . . .

I найдутся числа

ysI >

0, . . . .

ysms >

0,

в сумме

равные единице, и точки

us.......... usms

из и

такие, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ms

 

 

 

 

 

 

 

 

 

 

 

 

iJs='%i VsiF(x.,

us]).

 

 

 

Поэтому линейная

оболочка множества

 

 

 

 

Д) U iF (*..

usj) l-s = 0,

. . . .

 

/;

/ =

1.........ms)

 

совпадает

с

У и

 

 

 

I

m s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Fx (*.. «.) ^ 1 + 2

2 YsjF (х„

usj) = 0.

(25)

 

 

 

 

 

 

 

 

S=1

/= 1

 

 

 

 

 

 

Наконец, воспользовавшись соотношением (24) и

не­

прерывностью функций х -* -/'(х >(

м ; х), можно выбрать

такое

число е >

0,

что

при

всех

/ = 0, 1, . . . ,

k

 

 

 

 

 

 

 

 

т 0

 

 

 

 

 

 

 

 

f'i (*.>

h

+ ex,) +

2

То/ (fi (*.>

ti0j) — fi (*„ «.)) +

 

 

 

 

 

 

 

 

l

m s

 

 

 

 

 

 

 

 

 

 

 

 

+

e 2

2

Уsi (fi (*„> «*/) — fi (*,-

«.)) <

o.

 

 

 

 

 

 

S=1

/= 1

 

 

 

 

 

 

 

При этом

в силу (23) и (25)

 

 

 

 

 

 

 

 

 

 

 

 

 

т о

 

 

 

 

 

 

 

 

Fx (х,,

и,) (х0+ ех,) +

2

Уо1 (F (х.,

u0J) F (х„ «,)) +

 

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

 

 

 

 

+

е 2

2 ySi( F( x„ Usj) — F(x„

и . )) =

0.

 

 

 

 

 

 

s=l

/=1

 

 

 

 

 

 

 

Таким

 

образом,

набор,

образованный

вектором

Xo +

exi, точками

«оь •••, Щт,

из

U и числами у01, . . .

•••>

Yom9'

еУц’ •••>

8Y/OT/i

Обладает

требуемыми свой­

ствами (5) — (7).

Теорема полностью доказана.

 

 


244

ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

§ 5.2. Задачи оптимального управления с фазовыми ограничениями

Этот параграф содержит формулировку и обсужде­ ние принципа максимума Понтрягина для задач опти­ мального управления с фазовыми ограничениями. Дока­ зательство приводится в следующем параграфе.

5.2.1. Формулировка принципа максимума. Рассмот рим сначала задачу оптимального управления с закреп­ ленным временем:

 

 

ч

 

 

 

3

(•), и (•)) =

J / (t, х,

и) dt - » inf;

(1)

 

х = ф(/,

х, и),

 

(2)

 

и е

U,

 

(3)

 

М *('о)) =

М *(М ) =

0,

(4)

gi(t,

x(t))*^ 0, / е

[/„,/,],

fe.

(5)

На протяжении этого и следующего параграфов, за ис­ ключением специально оговариваемых случаев, пред­ полагается, что функции

/: R X R" X Rr —> R,

gr R X R " - > R

и отображения

 

Ф: R X R rtX R r - > R n, hp

R“ -*R*i ( / = 1 , 2)

непрерывны и непрерывно дифференцируемы по х. (Как обычно, U cz Rr.) Подчеркнем, что, в отличие от § 2.4, дифференцируемости функций и отображений по t не требуется. В качестве допустимых управлений, как и в § 2.4, рассматриваются произвольные измеримые огра­ ниченные вектор-функции, принимающие значения из

множества U.

2,

 

сформулируем

принцип

максимума

Как и в

гл.

 

Понтрягина

в двух

эквивалентных

формах — гамильто­

новой и лагранжевой. Введем снова функцию

Понтря­

гина

 

 

 

 

 

 

 

 

H(t, х, и, р,

А,0) = (р|ф(*,

*. u))— k0f(t,

X,

и)

и гамильтониан

 

 

 

 

 

 

 

2#(/,

х,

р,

А,0) = sup

H(t,

х, и, р, ко).

 

 

 

 

 

u^U

 

 

 

 


 

§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

 

 

245

Т е о р е м а

1

(принцип

максимума

в

гамильтоновой

форме). Пусть (**(•).

«*(•))— оптимальный управляе­

мый процесс

в задаче

(1)

— (5).

Тогда

существуют не

равные

одновременно

 

нулю

число

К0 ^

0,

векторы

10«= Rs\ U е

 

вектор-функция

р( - ): [/<,, /i]-*

Rn

и

неотрицательные регулярные меры р{,

i =

1,

 

k, на

[f0, ti], сосредоточенные

 

соответственно

на

множествах

 

Ti

[*0| f,] |gi (t, xt (/)) =

0},

 

 

 

 

такие, что

 

 

р(-)

является

решением

инте­

а) вектор-функция

грального уравнения

 

 

 

 

 

 

 

 

 

 

 

p(t) = - h i ' ( x j t l))h +

 

 

 

ft

*i

 

 

 

 

 

 

11

 

 

 

 

 

 

 

 

 

 

 

 

+ [ Пх(х, x,{x),u,(x),p{x),‘k0)dx~

J

gix (t, xt (т)) й?рг (6)

t

 

 

 

 

 

 

<=i t

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

(7)

 

 

 

p{to) =

h ? (x ,№ lo ,

 

 

 

 

 

б) почти при

всех

t

из [/0, ^i]

выполняется

равен­

ство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

H (t,

х, (*), и, (t), р (0, Л„) =

Ж (t,

{t), р (t),

А0).

(8)

Уравнение

(6), как и в задаче без фазовых ограниче­

ний, называется сопряженным. Нетрудно видеть, что в случае, когда все меры щ — нулевые, т. е., в частности, при отсутствии ограничений на фазовые координаты, это уравнение сводится к дифференциальному уравне­ нию, полученному в гл. 2. В задачах без фазовых огра­ ничений функция /?(•)— абсолютно непрерывная функ­ ция. При наличии фазовых ограничений из-за присут­ ствия в уравнении (6) интегралов по мерам р* функция р(-) может иметь разрывы. Однако она всегда является функцией ограниченной вариации, непрерывной слева (из-за регулярности мер рг).

В формулировке теоремы не исключается случай, когда одна или обе концевые точки оптимальной траек­ тории лежат на фазовых ограничениях. Поэтому меры Pi могут содержать ненулевые массы, сосредоточенные


246 ГЛ. 5. ЛОКАЛЬНО ВЫПУКЛЫЕ ЗАДАЧИ

в точках t0 и ti. В этом случае, как следует из соотно­

шений (6)

и (7),

 

 

 

 

 

 

 

 

 

 

 

lim

p (t)

=

-

hi* (х, (/,)) h +

S gix (tu x, (/,)) ji, ({*,]);

(9)

 

t < t \

 

 

 

 

 

 

i = 1

 

 

 

 

 

 

 

 

lim

P (0 =

Л6* (x, (t0)) to +

2

 

(/o,

*. (*o)) M’i ({^o))i

 

(Ю )

 

t - * t „

 

 

 

 

i =

i

 

 

 

 

 

 

 

т. e. p(0 может

иметь

разрыв в

точке

t0.

Если

же

gi(ti,

x,(ti)) <

0

и

gi (t0, х, (tQ)) <

0,

то точки

t0 и

tx не

принадлежат

ни

одному из множеств Tt, рЛ{^о)) =

= Hr((М) = 0, p(t)

непрерывна в точках

/0.

U и выпол­

нено

условие

трансверсальности

р (to) =

ho (х, (to)) to,

p{ti) = — hi(x,(U)) l\.

 

 

представляет

собой

 

Сформулированная теорема

еще одну реализацию принципа Лагранжа.

Если запи­

сать функцию Лагранжа

задачи

(1) —

(5)

в виде

 

 

2

= do I ho (X(to))) +

(/, 1A, (x (*,))) +

 

 

 

 

 

 

 

 

fL

 

 

 

 

 

 

 

 

 

 

 

 

 

+

j

[(p (t) I * (0 Ф (*, * (0. u № + hfi {t, X (t), и (/))] dt +

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

t x

 

 

 

 

 

 

 

 

 

 

 

 

 

+ У)

J gi(t, X (t)) dpt,

i=1/,

то окажется, что соотношения (6), (7) эквивалентны условию стационарности функции Лагранжа как функ­ ции переменного *(•) в точке **(•), а равенство (8) есть, очевидно, необходимое и достаточное условие то­ го, чтобы функция Лагранжа достигала минимума по и(-) в точке «*(•)■ Читатель сможет убедиться в этом,

анализируя

доказательство

теоремы

1

в

следующем

параграфе.

Поэтому теорема

1 допускает такую эквива­

лентную формулировку.

максимума

в

лагранжевой

Т е о р е м а

1' (принцип

форме).

Пусть

(дс,(•),«*(•)) — оптимальный управляе­

мый процесс в задаче (1) —

(5). Тогда существуют та­

кие не равные

одновременно нулю число Ко ^ 0, векто­

ры /0 е

Rso,

Zie=Rs‘, вектор-функция

ограниченной ва­


 

§ 5.2. ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

247

риации p(t) и неотрицательные

регулярные

меры щ,

i = 1,

 

к, сосредоточенные на множествах

Ti соот­

ветственно,

что

 

 

 

а)

при

ы(-) = « * ( • )

вектор-функция х*(-)

является

стационарной точкой функции Лагранжа как

функции

переменного х( •);

 

 

 

б)

при х { - ) — х*(-)

функция

Лагранжа

достигает

абсолютного минимума по и(-)

в точке н*(-).

5.2.2. Задачи с незакрепленным временем. Мы уже обращали

внимание читателя на то обстоятельство,

что теорема 1 (в отличие от

результатов гл. 2) справедлива без предположения о дифференцируе­ мости по времени функций и отображений, участвующих в формули­ ровке задачи. В определенной степени это связано с тем, что предла­ гаемое в следующем параграфе доказательство использует иную тех­ нику. Существует, однако, и причина принципиального характера. Дело в том, что задачи с закрепленным временем естественно фор­ мулируются как задачи в некотором банаховом пространстве, имен­ но, в том или ином пространстве функций на заданном отрезке. Что касается задачи с незакрепленным временем, то ее, по-видимому, нельзя сформулировать подобным образом без какого-либо ее преоб­ разования, связанного, в частности, с тем, что время трактуется как фазовая координата. При этом требование дифференцируемости по времени становится неизбежным.

В гл. 2 для этой цели использовалась замена времени. Однако там она несла значительно большую нагрузку и с этим были связаны многие технические сложности в доказательстве. Если же принцип максимума для задач с закрепленным временем доказан, то замену времени можно использовать только для сведения общей задачи к задаче с закрепленным временем. Тогда она оказывается совер­ шенно естественным приемом, применение которого не связано с ка­ кими-либо трудностями.

Покажем, как с помощью теоремы 1 можно (исполь­ зуя замену времени) получить принцип максимума для общей задачи оптимального управления: __

(10

(20

( 3 0

( 4 0

( 5 0

В отличие от задачи (1) — (5) моменты времени to и h здесь уже не предполагаются фиксированными, и^ все