Файл: Иоффе, А. Д. Теория экстремальных задач [учеб. пособие].pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 15.10.2024
Просмотров: 194
Скачиваний: 0
290 ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Из этих формул вытекает, что на отрезке [т, t{\ гамиль тониан тождественно равен нулю, ибо на этом отрезке
x*(t) = ы*(0 = 0. В силу того, |
что х*(т) — Хо(х) = 0, по |
лучаем: |
1) = |
Ж (т — 0, х, (т — 0), р ( т — 0), |
|
|
= (А (т) х0(т) |х0(г)) = у. |
Если допустить, что у = 0, то вследствие усиленного условия Лежандра получится равенство нулю производ
ной |
Xo(t) в точке т. Тогда нетривиальное (из-за |
на |
шего |
выбора) решение уравнения Эйлера — Якоби |
(4) |
Xo(t) |
удовлетворяет начальным данным: Хо(т) = Хо(т) = |
= 0. В силу теоремы единственности решения задачи Коши для линейной системы этого не может быть. Про тиворечие, к которому мы пришли, означает, что функ ция x*(t) не удовлетворяет принципу максимума, ибо Ж имеет разрыв в точке т. Следовательно, найдется до
пустимая |
функция |
x(t), у |
которой x(t) |
ограничена и |
||||||
измерима |
|
(и |
значит, |
|
|
О |
^i])), |
причем |
||
|
x(t) е W2 , i ([Ф, |
|||||||||
Ж( х ( - ) )< С0 . |
Противоречие |
с |
неотрицательностью |
Ж |
||||||
получено. Теорема доказана. |
|
|
|
|
|
|||||
З а м е ч а н и е . |
Теорему 5 можно было бы доказать, |
|||||||||
сославшись |
на |
то, |
что на ломаной экстремали x,*(t) |
не |
||||||
выполнены |
условия |
Вейерштрасса — Эрдмана |
(см. |
|||||||
п. 2.4.3). |
|
|
6. Для того чтобы квадратичная форма |
|||||||
Т е о р е м а |
||||||||||
Ж ( х ( - ) ) |
была |
неотрицательно |
определена в |
простран- |
||||||
О |
|
|
^i]), |
достаточно, |
чтобы выполнялись уси |
|||||
стве W2 ,\{[to, |
ленные условия Лежандра и Якоби, т. е. чтобы, во-пер
вых, |
матрица A(t) |
была |
положительно определена для |
|||
всех |
t |
из отрезка |
^i] |
во-вторых, чтобы на полуин |
||
тервале (б),Л] не было точек, сопряженных |
с точкой t0. |
|||||
Д о к а з а т е л ь с т в о . |
Вследствие усиленного условия |
|||||
Якоби |
фундаментальная |
матрица |
Ф (/До) |
уравнения |
||
Эйлера — Якоби |
(4) невырождена |
на полуинтервале |
(^о, t\\. В силу теоремы о непрерывной зависимости решений дифференциального уравнения от начальных
данных, |
примененной к уравнению (4), можно найти та |
||
кое б > |
0, что матрица |
Ф(^Д0 — 6) |
будет невырожден |
ной на всем отрезке [Y0, |
Положим |
|
x(t, А,) = Ф (* , — б)Л, A e R " .
|
§ 6.3. ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ |
|
291 |
|
Из определения матрицы Ф вытекает, что |
для |
всякого |
||
A e R " |
вектор-функция t —*x(t,X) является экстремалью |
|||
функционала Ж ( х ( - ) ) . Далее, для |
любых |
т е |
[£0Xi] и |
|
^ e R n |
существует единственная |
кривая |
семейства |
{x(t,K)}, проходящая через точку (т, |). Действительно, для того чтобы было верно равенство х(т, А,) = £, необ ходимо и достаточно, чтобы Х=А,(т, £) = Ф~‘ (тД0 — 6)s. Вектор-функцию x(t,X(т, £)) обозначим x(t; т, £). По лучилось, что семейство экстремалей {x(t, ?^)} одно кратно покрывает полосу [^о, ^1] X Rn- (Отметим, что все эти экстремали обращаются в нуль в точке /о — б.) Та кое семейство называют центральным полем экстрема лей функционала Ж ( х ( - ) ) с центром в точке (t0— 6,0). Обозначим через U (т, |) вектор х(х;х, £). Вектор-функ цию U(т, £) называют функцией наклона поля x\t,K).
Отметим явное выражение для U:
U(x, |
1) = Ф(х, t0 — 6)Ф~1(х, t0 — 6)1. |
|
|
Согласно основной формуле Вейерштрасса имеет ме- |
|||
сто следующее тождество в пространстве |
О |
|
|
W%, в |
|
||
|
и |
|
|
Ж (х ( • ) ) = { 8 (t, х (t), U (t, х (t)), |
х (0) dt, |
(8) |
|
|
to |
|
|
где & {t , x, x ,l ) |
есть «if-функция Вейерштрасса функ |
||
ционала Ж, a |
U(t,x) — введенная выше |
функция |
на |
клона поля.
Основная формула Вейерштрасса составляет фунда мент вейерштрассовской теории в вариационном исчис лении. Ее доказательство содержится в большинстве учебников по этому предмету. В гл. 7 будет приведен независимый от излагаемой здесь теории квадратичных форм вывод основной формулы Вейерштрасса (см. тео-
рему 3 из § 7.4).
Приведем выражение «З’-функции функционала
Ж { х { - ) ) :
&(t, х, X, 6) = ( Л (0 (| - * ) i s - * ) .
10*
2 9 2 |
ГЛ. 6 СПЕЦИАЛЬНЫЕ ЗАДАЧИ |
Если воспользоваться этим выражением, то из (8) по лучается тождество (его можно проверить и непосред ственно)
# ( * ( • ) ) = t,
= j (А (t) (U (t,x(t))-x(t))\U(t, x(t))-x(t))dt, *(.) s W l и
из которого сразу следует искомая неотрицательная определенность формы Ж. Теорема доказана.
С л е д с т в и е . В условиях теоремы 6 квадратичная форма Ж ( х ( - ) ) является строго положительной в про-
О |
е. |
для некоторого а > 0 |
странстве W%, i ( [^о, Л]), т. |
||
имеет место неравенство |
|
|
Х ( х ( - ) ) ^ а \ \ х ( - ) \ t n |
, |
x{ - )c=Wl, {[t o,U\) . |
W2, 1
Действительно, выберем а столь малым, что, во-пер вых, A ( t ) — а / > О (для всех £e[Yo,^i]), а во-вторых, чтобы на полуинтервале (to, t{\ не было точек, сопряжен
ных с точкой to, у функционала Ж ( х ( - ) ) , получающегося из Ж ( х ( - ) ) заменой A (t) на A(t) — а/. Применив тео рему 6 к функционалу Ж, получаем требуемое.
§6.4. Дискретные задачи оптимального управления
6.4.1.Формулировка задачи. Дискретные задачи оп тимального управления (или задачи оптимального управления с дискретным временем) возникают при ис следовании таких управляемых объектов, в которых из менение управляющего воздействия и изменение теку щего состояния может производиться лишь в строго определенные изолированные моменты времени. Такого рода задачи часто возникают в приложениях. Например, многие задачи управления так называемыми импульс ными автоматическими системами, многие задачи управ ления, возникающие в экономике и т. д., естественно формулируются как дискретные задачи оптимального
управления.
|
§ 6.4. ДИСКРЕТНЫЕ |
ЗАДАЧИ |
|
|
2 9 3 |
|||
Задача, которая будет рассматриваться в этом пара |
||||||||
графе, ставится следующим образом*): |
|
|
|
|||||
|
|
ЛГ-1 |
|
|
|
|
|
|
9 |
{х, ы) = |
2 ft (xh |
щ) - » |
inf; |
|
|
(1) |
|
|
|
i=0 |
|
|
|
|
|
|
Jf/+i = Фг(М> Щ), |
i = 0, |
!.-••, N |
— 1, |
(2) |
||||
« г €=[/,• с: Rr, |
г = |
О, 1, .... |
N — 1, |
|
(3) |
|||
|
ho(xo) — Qj |
hN{xN) = |
0, |
|
|
(4) |
||
|
|
t = |
1, ... , N — 1. |
|
(5) |
|||
Допустимые элементы в задаче |
(1) — (5) |
суть |
пары |
ко |
||||
нечных последовательностей |
х = |
(х0, |
x t, |
..., |
xN), |
и — |
||
= («о, •••, Илг- i) , |
Xi е Rn, |
т (= Rr, |
удовлетворяющие |
условиям (2)— (5).
Мы получим в этом параграфе необходимое условие экстремума в задаче (1) — (5), известное под названием
дискретного принципа максимума, и опишем метод ди намического программирования, дающий удобный вы числительный формализм решения таких задач, с одной стороны, и содержащий возможный подход к получению достаточных условий в теории оптимального управле ния, с другой.
На |
протяжении |
всего параграфа |
мы |
предпола |
гаем, |
что |
|
|
гладкости: |
а) выполнены следующие требования |
||||
функции fit i = 0, 1, |
. . . , N — 1, и gh i = |
1, |
. . . , N — \, |
и отображения фг: R" X Ur-> RN, h0: Rn-> R S,Jh{: Rn—>-RS|
непрерывны по совокупности переменных и непрерывно дифференцируемы по х;
б) при |
всех |
г' = 0, 1.........N — 1, ^ g R" функция |
|
u->fi(x, и) |
и отображение и —>-ф*(М и) |
удовлетворяют |
|
следующему условию выпуклости: если |
v ^ U i |
||
и 0<!(х< М , то |
найдется такое w ^ U i, |
что |
ft (х, w) < aft (х, и) + (1 — a) ft (х, v),
ф<(х, w) = аф( (х, и) + (1 — а) <р( (х, v).
*) Подчеркнем аналогию этой задачи с задачей оптимального управления с фазовыми ограничениями (см. задачу (1) — (5) в § 5.2).
294 ГЛ. 6. СПЕЦИАЛЬНЫЕ ЗАДАЧИ
Если условия гладкости не содержат в себе ничего не
естественного, то |
второе |
условие — условие |
выпукло |
сти — по крайней |
мере |
с первого взгляда |
кажется, |
наоборот, искусственным. Однако в приложениях оно нередко выполняется. Во-первых, оно автоматически вы полняется в тех случаях, когда задача (1)— (5) полу чается в результате «дискретизации» обычной непрерыв ной задачи (этот факт следует из теоремы Ляпунова, которую мы докажем в гл. 8). С другой стороны, и во многих типично дискретных задачах, например возни кающих в экономике, условие выпуклости также оказы вается выполненным.
6.4.2. Дискретный принцип максимума. Нетрудно видеть, что благодаря условиям а) и б) задача (1)— (5) удовлетворяет всем требованиям, которые мы предъяв ляли к гладко-выпуклым задачам в теореме 3 из § 1.1. Последнее из отмеченных в этой теореме требований, связанное с конечной коразмерностью, в нашем случае выполняется автоматически, поскольку все простран ства— конечномерные. Поэтому для вывода необходи мых условий экстремума в задаче (1) — (5) можно ис пользовать экстремальный принцип в гладко-выпуклых задачах.
Итак, пусть х * = (х*ь . .. , x*N), «* = («*о, •••> «*jv- i) —
точка локального экстремума в задаче (1) — (5). (В по нятие локального экстремума вкладывается тот же смысл, что и в п. 1.1.3.) Напишем функцию Лагранжа задачи (1)— (5):
JV-l |
fi {Xi, U[) -ф |
JV— 1 |
+i |
(X[, U,)) |
|
SE= Яд |
(pi+1 |
|
|||
i =0 |
|
1=0 |
|
|
|
|
|
|
|
JV-l |
|
|
+ (lo IК M ) + (h |
I hN(% )) + Ъ |
Pig; (Xi). |
||
|
|
|
|
i=1 |
|
В соответствии с экстремальным принципом в гладко выпуклых задачах (теорема 3 § 1.1) существуют мно
жители Лагранжа А0> 0 , /)i e R '1, i = 1, . . . . N, /0е Rs°,
/j е Rs‘, p i^ O ......... pjV_ i ^ 0 , не все равные нулю и такие, что выполняются следующие соотношения: