Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 234

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

178

 

 

П Р И Н Ц И П МАКСИМ УМА Л.

С. ПОНТРЯГИНА

 

 

[Гл. 3

Отсюда ясно,

что фо=7^0, так как в противном случае ф ( 0 = 0

(см.

условие

(2.2)

теоремы

2.1).

Следовательно, можно считать,

что

ф о = — /•

Тогда

соотношения

(1) — (4)

перепишутся

в виде

 

 

 

 

 

 

 

Н (х , -ф, и, t) = — /° (х,

u, t)+

(ф, и),

 

 

 

(5)

 

 

 

 

Ф =

/ 2 (* ,М ) . t0< t < T ,

 

 

 

(6)

Я (t), ф (0 , и (t),

t)=

max Я (t), ф {t), v,t),

 

 

 

(7)

 

 

 

 

Ф (0 =

f°u (X(t), и (t),

о . ^0 <

t< т.

 

 

 

(8)

 

 

 

 

 

 

t

(t), и (/), t)]dt\-\-ф ( д ,

 

 

 

Из уравнения (6) имеем ф (^) = J fx {x

поэтому

с учетом

(8)

получим

 

to

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

'/2 (*(0. и (0,0 =

(

 

 

 

 

 

 

 

 

J (х (t),

U

dt + ф ( g .

 

 

(9)

 

 

 

 

 

 

i.

 

 

 

 

 

 

 

Уравнение

(9)

называется

уравнением Эйлера

в интегральной

форме-, здесь

u ( t ) = x ( t ) . Если (9)

продифференцировать

по

t,

то

получим уравнение Эйлера классического вариационного исчисле­ ния в дифференциальной форме

at

(/° (х (0,

и (t), 0) -

/° (a-' (t), и

=

0, ц (0 = х (I().

(9')

Далее,

необходимым

условием

достижения

функцией

H (x(t), ф( 0 .

«, 0

максимума при

u = u {t )

является

неположи­

тельность квадратичной формы

 

 

 

 

 

 

£ Я «‘У (* (0. Ф (Q. « (0 - 0 Ь£/ <

0

при любых I = (Zi, Si, . . .

, у ,

i,/=l

 

 

 

 

 

 

 

 

 

 

или если учесть выражение

(5) для Я , то

 

 

 

 

 

£

/“д (* ( 0 , « ( 0 . 0

> 0, I е е п, t0 < t < r .

 

(Ю)

 

£./=0

 

 

 

 

 

 

 

 

Условие

(10)

называется

необходимым

 

условием

Лежандра.

В частности,

при n = 1 отсюда имеем

 

 

 

 

fau (x (t),u (t),t)> 0, t0< t < T .


§

Связь с классическим

вариационным исчислением

179

 

Теперь выведем необходимое условие Вейерштрасса. Для это­

го

перепишем

условие (7) с учетом (5),

(8) в следующем

виде:

 

О < Н ( х (t),

ф (t), и (t),t)— H(x (t), г))(t), v, t) =

/° (* (t), v, t) -

 

 

~ f° (x (t), u ( t ) , t ) - ( v - u ( t ) , f°u(x(t),

u[t),t)).

(11)

Это неравенство справедливо

при любых

v ^ V = E n и

 

если u(t), x ( t ) — оптимальное

решение исходной

задачи. Введем

в рассмотрение функцию

 

 

 

 

 

 

Е (£, л:, и,

v ) = f° ( x , v, f)

(х, и, t) и,

f u{x, и, t)),

(12)

называемую функцией Вейерштрасса. Известное в классическом вариационном исчислении необходимое условие Вейерштрасса тогда немедленно следует из (11):

E ( t ,x ( t ) ,u ( t ) ,v ) > 0, t0 < C t< T , v e Еп.

Далее,

из

принципа

максимума

следует

непрерывность

вектор-функции

ф(/)

и

функции

 

H (x{t), ф(/), u(t), t) =

m axH (x(t), ф( 0 . v, i)

по переменной

 

t,

 

 

(см. пред-

ставления (2.15) в теореме 2.2). Поэтому

с учетом

соотношений

(5), (8) имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

[fu{x{t),u{t),t)]t =

0,

 

 

 

(13)

[(и (t) , /°„ (х (t), и (t), t)) -

(х (t), и (t), t)]t =

0,

tb <

t < T,

здесь принято обозначение

[г(^ )]4= г ( 7 + 0 ) — z(t — 0). Поскольку

равенства

(13) выполнены при всех t,

 

 

 

то они сохраняют

силу и в те моменты

t, когда функция x(t) может иметь излом,

т. е. производная x(t)

терпит разрыв.

Таким образом,

если учесть

связь u { t ) = x ( t ) ,

условия

(13)

превращаются в известные из клас­

сического

вариационного исчиления

условия

Эрдмана Вейер­

штрасса в точках излома кривой x(t).

 

 

 

 

 

 

Перейдем к рассмотрению условий на правом конце оптималь­

ной кривой x(t).

Если конец х(Т) свободен,

то в силу теоремы 2.1

ф(7’) = 0 и с учетом выражения (8) имеем

 

 

 

 

 

 

 

 

f u(x(T ),u (T ),T ) =

0.

 

 

 

(14)

Если правый конец х(Т) подвижен, точнее, лежит на заданной кри­ вой Si = {(х, t ) : hj (х, t) = х ! — ф;- (t) = 0, / = 1, 2, . . . , л}, то соглас­ но теоремам 2.1 — 2 существуют такие постоянные аъ а2, ..., ап, что

П

. !Pi(T) = Y 1a/ dhj(i J )— = a" Н (х (Т) ^ ( Т)’ и (Т) ^ =

/=1



П Р И Н Ц И П

МАКСИМ УМА

Л. С. ПОНТРЯГННА

[Гл. 3

л

л

л

 

= - 2 а, дк^ х^ ’П = £ а .ф, (Г) = £ ф,- (Г) ф7 (Л = (ф (Г ), Ф (Т )) •

/= 1

 

/= 1

/= 1

 

 

 

 

Так как #(л;, ф, и,

£) = (ф,

и) f°(x, и,

t) и яр (^)

выражается форму­

лой (8), то последнее равенство можно

переписать так:

 

 

' Г>(х(Т),и(Т),

Т) + ( f u(x (T ),u (T ),T ),

у ( Т ) - и ( Г ) ) =

0.

(15)

Условия

(14), (15)

при учете связи

x ( t ) = u ( t )

выражают

собой

известные

в классическом

вариационном

исчислении

условия

трансверсальности

для свободного и

соответственно подвижного

правого конца.

Таким образом, в случае У = £ п из принципа максимума сле­ дуют все основные необходимые условия, известные в классическом вариационном исчислении [68, 254]. Однако если V — замкнутое множество и У ф Е п, то соотношение (4 ) ,вообще говоря,не выпол­ няется. Более того, имеются примеры, когда и условие Вейерштрасса в этом случае не имеет места ([195], стр. 284). Принцип максимума, являясь естественным обобщением условия Вейерштрасса из классического вариационного исчисления, имеет то су­ щественное преимущество перед условием Вейерштрасса, что он

применим

для любого

частности, и замкнутого)

множества

V ^ E r и для более общих

задач. Заметим, что именно случай

замкнутого

множества

V ^ E r наиболее интересен в

прикладных

вопросах, поскольку значения оптимальных управлений чаще всего лежат на границе V.


Г л а в а 4

Динамическое программирование. Проблема синтеза

В этой главе остановимся на методе динамического програм­ мирования, часто используемом при численном решении задач оп­ тимального управления при наличии фазовых ограничений. Заме­ тим, что принцип максимума может быть сформулирован и для задач с фазовыми ограничениями, однако получающаяся при этом

краевая задача

будет иметь еще более сложный вид ([5, 27, 55, 101

141, 195] и др.),

и трудности при ее численном решении значитель­

но возрастают. Поэтому для численного решения таких задач ча­ сто бывает выгоднее использовать метод динамического програм­

мирования. Изложение этого метода

начнем с

простейшей схемы

Р. Веллмана [6, 14— 18, 27, 34, 54, 206,

234, 259],

затем опишем бо­

лее совершенную и удобную для практики схему Н. Н. Моисеева

[167— 169, 171].

§ 1. СХЕМА Р. ВЕЛЛМАНА. ПРОБЛЕМА СИНТЕЗА ДЛЯ ДИСКРЕТНЫХ СИСТЕМ

1. Рассмотрим следующую задачу оптимального управления: минимизировать функционал

 

 

J(u)

=

j7 ° ( * , и,

t).dt + 0 (x (T )),

 

(1)

 

 

 

 

^0

 

 

 

при условиях

x ' = f ( x , u , t ) ,

< ^ < 7 \

 

(2)

 

 

 

x (t)eG (t),

г0 < ; < 7 >

 

(3)

u —u (t)^ V (t), t0^\t^LT, u(t) кусочно-непрерывна

(4)

(подробное

описание

обозначений

см. в § 3.1;

множества S0(t0)

и Sj(T) из

(3.1.7— 10)

нам здесь удобнее включить в фазовые от-

раничения G(t), to^Lt^T)-, моменты t0, Т будем

считать

извест­

ными.

 

 

 

 

 

 

 

Для приближенного

решения этой задачи

разобьем

отрезок

Т на N частей точками

 

и,

приняв

эти точки в качестве узловых, интеграл в (1) заменим квадратур­ ной формулой прямоугольников, а уравнения (2) — разностными уравнениями с помощью простейшей явной схемы Эйлера [20]. В результате мы придем к следующей дискретной задаче опти­ мального управления: минимизировать функционал