Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 15.10.2024

Просмотров: 194

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

290 ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ

Из этих формул вытекает, что на отрезке [т, t{\ гамиль­ тониан тождественно равен нулю, ибо на этом отрезке

x*(t) = ы*(0 = 0. В силу того,

что х*(т) — Хо(х) = 0, по­

лучаем:

1) =

Ж (т — 0, х, (т — 0), р ( т — 0),

 

= (т) х0(т) |х0(г)) = у.

Если допустить, что у = 0, то вследствие усиленного условия Лежандра получится равенство нулю производ­

ной

Xo(t) в точке т. Тогда нетривиальное (из-за

на­

шего

выбора) решение уравнения Эйлера — Якоби

(4)

Xo(t)

удовлетворяет начальным данным: Хо(т) = Хо(т) =

= 0. В силу теоремы единственности решения задачи Коши для линейной системы этого не может быть. Про­ тиворечие, к которому мы пришли, означает, что функ­ ция x*(t) не удовлетворяет принципу максимума, ибо Ж имеет разрыв в точке т. Следовательно, найдется до­

пустимая

функция

x(t), у

которой x(t)

ограничена и

измерима

 

значит,

 

 

О

^i])),

причем

 

x(t) е W2 , i ([Ф,

Ж( х ( - ) )< С0 .

Противоречие

с

неотрицательностью

Ж

получено. Теорема доказана.

 

 

 

 

 

З а м е ч а н и е .

Теорему 5 можно было бы доказать,

сославшись

на

то,

что на ломаной экстремали x,*(t)

не

выполнены

условия

Вейерштрасса — Эрдмана

(см.

п. 2.4.3).

 

 

6. Для того чтобы квадратичная форма

Т е о р е м а

Ж ( х ( - ) )

была

неотрицательно

определена в

простран-

О

 

 

^i]),

достаточно,

чтобы выполнялись уси­

стве W2 ,\{[to,

ленные условия Лежандра и Якоби, т. е. чтобы, во-пер­

вых,

матрица A(t)

была

положительно определена для

всех

t

из отрезка

^i]

во-вторых, чтобы на полуин­

тервале (б),Л] не было точек, сопряженных

с точкой t0.

Д о к а з а т е л ь с т в о .

Вследствие усиленного условия

Якоби

фундаментальная

матрица

Ф (/До)

уравнения

Эйлера — Якоби

(4) невырождена

на полуинтервале

(^о, t\\. В силу теоремы о непрерывной зависимости решений дифференциального уравнения от начальных

данных,

примененной к уравнению (4), можно найти та­

кое б >

0, что матрица

Ф(^Д0 — 6)

будет невырожден­

ной на всем отрезке [Y0,

Положим

 

x(t, А,) = Ф (* , — б)Л, A e R " .



 

§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ

 

291

Из определения матрицы Ф вытекает, что

для

всякого

A e R "

вектор-функция t —*x(t,X) является экстремалью

функционала Ж ( х ( - ) ) . Далее, для

любых

т е

[£0Xi] и

^ e R n

существует единственная

кривая

семейства

{x(t,K)}, проходящая через точку (т, |). Действительно, для того чтобы было верно равенство х(т, А,) = £, необ­ ходимо и достаточно, чтобы Х=А,(т, £) = Ф~‘ (тД0 — 6)s. Вектор-функцию x(t,X(т, £)) обозначим x(t; т, £). По­ лучилось, что семейство экстремалей {x(t, ?^)} одно­ кратно покрывает полосу [^о, ^1] X Rn- (Отметим, что все эти экстремали обращаются в нуль в точке /о — б.) Та­ кое семейство называют центральным полем экстрема­ лей функционала Ж ( х ( - ) ) с центром в точке (t0— 6,0). Обозначим через U (т, |) вектор х(х;х, £). Вектор-функ­ цию U(т, £) называют функцией наклона поля x\t,K).

Отметим явное выражение для U:

U(x,

1) = Ф(х, t0 — 6)Ф~1(х, t0 — 6)1.

 

Согласно основной формуле Вейерштрасса имеет ме-

сто следующее тождество в пространстве

О

 

W%, в

 

 

и

 

 

Ж (х ( • ) ) = { 8 (t, х (t), U (t, х (t)),

х (0) dt,

(8)

 

to

 

 

где & {t , x, x ,l )

есть «if-функция Вейерштрасса функ­

ционала Ж, a

U(t,x) — введенная выше

функция

на­

клона поля.

Основная формула Вейерштрасса составляет фунда­ мент вейерштрассовской теории в вариационном исчис­ лении. Ее доказательство содержится в большинстве учебников по этому предмету. В гл. 7 будет приведен независимый от излагаемой здесь теории квадратичных форм вывод основной формулы Вейерштрасса (см. тео-

рему 3 из § 7.4).

Приведем выражение «З’-функции функционала

Ж { х { - ) ) :

&(t, х, X, 6) = ( Л (0 (| - * ) i s - * ) .

10*


2 9 2

ГЛ. 6 СПЕЦИАЛЬНЫЕ ЗАДАЧИ

Если воспользоваться этим выражением, то из (8) по­ лучается тождество (его можно проверить и непосред­ ственно)

# ( * ( • ) ) = t,

= j (А (t) (U (t,x(t))-x(t))\U(t, x(t))-x(t))dt, *(.) s W l и

из которого сразу следует искомая неотрицательная определенность формы Ж. Теорема доказана.

С л е д с т в и е . В условиях теоремы 6 квадратичная форма Ж ( х ( - ) ) является строго положительной в про-

О

е.

для некоторого а > 0

странстве W%, i ( [^о, Л]), т.

имеет место неравенство

 

 

Х ( х ( - ) ) ^ а \ \ х ( - ) \ t n

,

x{ - )c=Wl, {[t o,U\) .

W2, 1

Действительно, выберем а столь малым, что, во-пер­ вых, A ( t ) — а / > О (для всех £e[Yo,^i]), а во-вторых, чтобы на полуинтервале (to, t{\ не было точек, сопряжен­

ных с точкой to, у функционала Ж ( х ( - ) ) , получающегося из Ж ( х ( - ) ) заменой A (t) на A(t) — а/. Применив тео­ рему 6 к функционалу Ж, получаем требуемое.

§6.4. Дискретные задачи оптимального управления

6.4.1.Формулировка задачи. Дискретные задачи оп­ тимального управления (или задачи оптимального управления с дискретным временем) возникают при ис­ следовании таких управляемых объектов, в которых из­ менение управляющего воздействия и изменение теку­ щего состояния может производиться лишь в строго определенные изолированные моменты времени. Такого рода задачи часто возникают в приложениях. Например, многие задачи управления так называемыми импульс­ ными автоматическими системами, многие задачи управ­ ления, возникающие в экономике и т. д., естественно формулируются как дискретные задачи оптимального

управления.

 

§ 6.4. ДИСКРЕТНЫЕ

ЗАДАЧИ

 

 

2 9 3

Задача, которая будет рассматриваться в этом пара­

графе, ставится следующим образом*):

 

 

 

 

 

ЛГ-1

 

 

 

 

 

 

9

{х, ы) =

2 ft (xh

щ) - »

inf;

 

 

(1)

 

 

i=0

 

 

 

 

 

 

Jf/+i = Фг(М> Щ),

i = 0,

!.-••, N

— 1,

(2)

« г €=[/,• с: Rr,

г =

О, 1, ....

N — 1,

 

(3)

 

ho(xo) — Qj

hN{xN) =

0,

 

 

(4)

 

 

t =

1, ... , N — 1.

 

(5)

Допустимые элементы в задаче

(1) — (5)

суть

пары

ко­

нечных последовательностей

х =

(х0,

x t,

...,

xN),

и —

= («о, •••, Илг- i) ,

Xi е Rn,

т (= Rr,

удовлетворяющие

условиям (2)— (5).

Мы получим в этом параграфе необходимое условие экстремума в задаче (1) — (5), известное под названием

дискретного принципа максимума, и опишем метод ди­ намического программирования, дающий удобный вы­ числительный формализм решения таких задач, с одной стороны, и содержащий возможный подход к получению достаточных условий в теории оптимального управле­ ния, с другой.

На

протяжении

всего параграфа

мы

предпола­

гаем,

что

 

 

гладкости:

а) выполнены следующие требования

функции fit i = 0, 1,

. . . , N — 1, и gh i =

1,

. . . , N — \,

и отображения фг: R" X Ur-> RN, h0: Rn-> R S,Jh{: Rn—>-RS|

непрерывны по совокупности переменных и непрерывно дифференцируемы по х;

б) при

всех

г' = 0, 1.........N — 1, ^ g R" функция

u->fi(x, и)

и отображение и —>-ф*(М и)

удовлетворяют

следующему условию выпуклости: если

v ^ U i

и 0<!(х< М , то

найдется такое w ^ U i,

что

ft (х, w) < aft (х, и) + (1 — a) ft (х, v),

ф<(х, w) = аф( (х, и) + (1 — а) <р( (х, v).

*) Подчеркнем аналогию этой задачи с задачей оптимального управления с фазовыми ограничениями (см. задачу (1) — (5) в § 5.2).


294 ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ

Если условия гладкости не содержат в себе ничего не­

естественного, то

второе

условие — условие

выпукло­

сти — по крайней

мере

с первого взгляда

кажется,

наоборот, искусственным. Однако в приложениях оно нередко выполняется. Во-первых, оно автоматически вы­ полняется в тех случаях, когда задача (1)— (5) полу­ чается в результате «дискретизации» обычной непрерыв­ ной задачи (этот факт следует из теоремы Ляпунова, которую мы докажем в гл. 8). С другой стороны, и во многих типично дискретных задачах, например возни­ кающих в экономике, условие выпуклости также оказы­ вается выполненным.

6.4.2. Дискретный принцип максимума. Нетрудно видеть, что благодаря условиям а) и б) задача (1)— (5) удовлетворяет всем требованиям, которые мы предъяв­ ляли к гладко-выпуклым задачам в теореме 3 из § 1.1. Последнее из отмеченных в этой теореме требований, связанное с конечной коразмерностью, в нашем случае выполняется автоматически, поскольку все простран­ ства— конечномерные. Поэтому для вывода необходи­ мых условий экстремума в задаче (1) — (5) можно ис­ пользовать экстремальный принцип в гладко-выпуклых задачах.

Итак, пусть х * = (х*ь . .. , x*N), «* = («*о, •••> «*jv- i) —

точка локального экстремума в задаче (1) — (5). (В по­ нятие локального экстремума вкладывается тот же смысл, что и в п. 1.1.3.) Напишем функцию Лагранжа задачи (1)— (5):

JV-l

fi {Xi, U[)

JV— 1

+i

(X[, U,))

 

SE= Яд

(pi+1

 

i =0

 

1=0

 

 

 

 

 

 

 

JV-l

 

 

+ (lo IК M ) + (h

I hN(% )) + Ъ

Pig; (Xi).

 

 

 

 

i=1

 

В соответствии с экстремальным принципом в гладко­ выпуклых задачах (теорема 3 § 1.1) существуют мно­

жители Лагранжа А0> 0 , /)i e R '1, i = 1, . . . . N, /0е Rs°,

/j е Rs‘, p i^ O ......... pjV_ i ^ 0 , не все равные нулю и такие, что выполняются следующие соотношения: