Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 239

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

•160

ПРИНЦИП МАКСИМУМА Л. С. ПОНТРЯГИНА

 

[Гл. 3

 

п

 

 

 

 

 

 

Ф у(0 (1 =

1, 2 ,

(1)

 

дх

 

 

 

тде ф0(£ )= ф 0— некоторая постоянная. Если

взять

какое-либо до­

пустимое управление u = u ( t )

и соответствующую

ему траекторию

x — x(t,u)

и подставить их в

(1), то получим линейную систему, из

которой однозначно определяется вектор ty(t),

при

лю­

бых начальных условиях и любой заданной -ф0- Вектор ф(£) часто

называют импульсом, а

самое систему

( 1 ) — сопряженной систе­

мой.

 

П

 

 

Составим функцию

Н(х, ф, ф0, и, t)

= ^ фг/'(л:, и, t), называе­

мую функцией Гамильтона Понтрягина. Тогда, как легко прове­ рить, системы (1.8) и (1) можно записать в следующем симмет­ ричном виде:

При фиксированных х, ф, ф0, t функция Я (х, ф, ф0, и, t)

стано­

вится

функцией лишь параметра « е У и тогда имеет

смысл

гово­

рить о

sup Н (х, ф, ф0, и, t)=sM (х , ф, ф0, t).

Если точная верхняя

грань значений непрерывной

функции Я достигается

в некоторой

точке и е У , то М(х, ф, ф0, t)

есть максимум

значений

функции Я

при фиксированных (х, ф, ф0, t). Поэтому нижеследующую теорему, дающую необходимое условие оптимальности, называют принципом максимума [195].

Т е о р е м а

1.

Пусть х* (t), u*{t),

^ „ <

£ < 7 — оптимальное реше­

ние задачи (1.7 —

10) при V (t) = V, G(t) = E lt,

^ „ < ^ < 7 ;

пусть мо­

менты tQ, 7

заданы. Тогда необходимо существуют

непрерывная век­

тор-функция ф* (?) и постоянная ф’ , такие, что

 

 

 

1) ^ ;< о ,

 

П

 

t0 < t < r -

 

 

(2)

 

 

 

 

 

2)

ф*(/)

удовлетворяет

системе

(1)

при

х =

х" (t),

и — и* (t),

3)

при любом t £ [f0, 7 ]

функция

H{x*(t),

ф‘ (t), ф*,

и, t) пере­

менного u £ V

достигает в точке и = и* (/)

максимума

 


§ 2}

Формулировка принципа максимума Л. С. Понтрягина

161

4)выполнены условия трансверсальности на левом и право

концах, т. е. вектор

ф *(Г)

ортогонален

к

многообразию

Si(T)

в

точке

х*(Т ),

вектор

-ф* (^0)

ортогонален

к

многообразию

S 0(^o)

в

точке х*(£0),

или короче: ф *(г^о)'—L*S0(^0) ,

ф *(7 ) _LSi(T).

 

 

Подробнее расшифруем условие трансверсальности для случая

различных режимов на правом конце траектории:

 

 

 

а)

если правый конец свободен, то условие ty* (Т) Jl Si (T) = Е П

означает •ф*(7’)= 0 ;.

 

 

 

 

 

 

 

 

б)

если правый конец подвижен, то

это

условие гарантирует

существование таких постоянных а и а2, ...,

dnI,

что

 

 

 

 

 

 

ni

д/Ч (х* (Г), Т)

 

 

 

 

 

 

 

 

Г , СП =

2 “/

i =

1,

п;

 

(4)

 

 

дх>

 

 

 

 

/=1

 

 

 

 

 

 

 

в)

если правый конец закреплен,

то условие ф*(7’)

± 5 i ( 7 ') =

.тривиально — оно всегда выполнено.

Аналогично условие трансверсальности на левом конце траек­

тории означает, что:

 

 

 

 

а)

если x(t0) свободен, то ф *(^ о)=0;

 

б)

если x(t0)

подвижен, то

существуют такие

постоянные

Ь\, ь г>

6по. что

 

 

 

 

 

&) =

£

Ь,

(£= 1, 2,--- л);

(5)

 

 

/=о

 

 

 

в)

если x(t0)

закреплен,

то условие трансверсальности всег

выполнено.

Теорему 1 мы сформулировали для случая, когда допустимое управление u(t) является кусочно-непрерывным. В случае же ог­ раниченных измеримых управлений ее формулировка полностью со­ храняется, только соотношение (3) следует понимать в смысле почти всюду на

Доказательство теоремы 1 можно найти в работе, [195]. Один случай этой теоремы будет доказан ниже в § 6.3.

Обсудим вопрос о возможностях применения теоремы 1 к ре­ шению задачи оптимального управления (1.7— 10) при К (0 — G(t)==En с заданными (о, Т. Как следует из теоремы 1, оптималь­ ным может быть лишь то управление u (t)^ U и соответствующая

ему траектория

x ( t ) — x{t,u),

которые удовлетворяют

следующим

условиям:

 

 

 

 

х‘ =

F (х, и,t), t0

< t < Т,

i = 1, 2, . . . , n,

(6)

Ф;

dfJ (x,

u , t )

дЯ(*,Ф,Фо,» ,0

( 7 )

dxl

dxl

 

 

/= 0

6 Ф. П. Васильев


162

ПРИНЦИП МАКСИМУМА Л. С. ЛОНТРЯГИНА

 

[Г ,, 3

 

t0 < t < T , г =

1, 2, •••, л,

 

 

 

 

*(*o )e S 0 & ). * ( T ) £ S t (T),

 

 

(8)

Ф (^о) - 1 S0 (/„) в точке x(t0), ф (7) ± S 1(T)

в точке х(Т),

(9)

Фо =

const < 0 ,

|-фо la + 2

|Ф;(^)|а^ 0 ,

^ < ^ < 7 ,

(10)

 

 

i=l

 

 

 

 

Н(х, -ф, т|?о, u(t), t) = su.pH.(x, ф, ф0, u, t),

t0 < t < T .

(11)

 

 

u 6V

 

 

 

 

Здесь фо, ф (0

также являются неизвестными и подлежат опреде­

лению. Таким

образом, , из условий (6) — (11)

нужно

определить

2 л + г функций **'(*),

.(t= 1, 2,

л), л*(/)

( i = l , 2,

г)

и по­

стоянную фо<;0. Сразу возникает вопрос: достаточно ли информа­

ции, содержащейся в (6) — (11),

чтобы определить указанные ве­

личины?

 

 

 

 

Рассмотрим прехсде всего соотношение (11), из которого, во­

обще говоря, можно найти функцию

 

 

u =

u{x, ф, ф0, Г).

 

(12)

Задача отыскания функции (12) нам уже знакома

(см. гл. 2): здесь

надо максимизировать функцию

Н (х, ф, ф0, у., t)

конечного

числа

переменных (л1, ..., цг)е 1 /

при фиксированных

(х, ф, ф0,

0 - Во

многих практических задачах удается получить явное аналитиче­ ское выражение для функции (12).

Предположим,

что функция

(12) уже известна, и подставим ее

в ( 6 ) - ( 7 ) :

 

 

 

x = f(x, u(x, ф,

ф0, t),t), ф =

д Н ( х , ф, Фо, и { х , ф, Фо, t), 0

(13)

 

дх

В результате получили систему 2л дифференциальных уравнений первого порядка с 2л неизвестными функциями x(t), ф(£). Как известно, общее решение этой системы зависит от 2л произволь­ ных числовых параметров (таковыми, например,, могут быть на­ чальные условия x(t0), ф(*0)) . Напоминаем, что постоянная фо в

(13)пока тоже неизвестна. Можно ли выбрать эти. 2л параметров

ивеличину фо так, чтобы можно было удовлетворить условиям

(8)— (Ю)?

Заметим, что функция Н(х, ф, ф0, и, t) является линейной од­

нородной функцией переменных

фо,

фь ..., ф„,

поэтому

и(х, аф, афо, 0 = л(х, ф, ф0,

t) для

любой

функции

a = a ( t ) > 0,

Следовательно,

система

(13),

а также и условия транс­

версальности (9) сохранят свой вид, если все величины фо, фь-»^фп умножить на один и тот же произвольный множитель а > 0 . Иначе говоря, условия (6) — (11) определяют величины фо, фь ..., фп лишь


Формулировка принципа максимума

Л. С. Понтрягина

163

с трчностью до множителя а > 0 , и этим

множителем мы можем

распорядиться по нашему усмотрению. На практике чаще всего полагают

Ы 2 + £ 1 'М *)1 2= 1, i=l

где 7 — некоторый подходящим образом выбранный момент вре­ мени. Если заранее ясно, что -фо<;0, то можно принять i|)0= — 1. В наших рассуждениях для определенности будем считать

Ы а + £ 1 ^ < > )1 2= 1. 4>о<0/

(14)

1=1

 

. Теперь нетрудно убедиться, что имеющимися 2п параметрами системы (13) и величиной -фо можно, вообще говоря, распорядиться так, чтобы удовлетворить условиям (8), (9), (14). В самом деле, если левый и правый концы траектории х(^) закреплены: x(t0) — x0,

x ( T ) — xi, то получаем 2п условий (условия трансверсальности

(9)

в этом случае выполняются автоматически), которые вместе с

(14)

можно, вообще говоря,, удовлетворить за счет выбора упомянутых 2п параметров и величины фоЕсли левый конец закреплен, а пра­

вый— свободный, то

x(t0) = x о, ф (Г) = 0 , и опять

имеем

2п усло­

вий. Если левый конец закреплен, а правый — подвижный, то

"i

 

 

 

* (Q = * „ ,< № =

dhj(xd{p ,T}, -Л, (х(Т), Т) = 0

(/ = 1

,2 ,...,« ,) ,

;'= 1

т. е. всего 2n + «i условий, которые вместе с условием (14) можно, во,- обще говоря, удовлетворить соответствующим выбором 2л пара­ метров системы (13) и величин.-фо, a-и а 2,~-,аП1. Аналогично можно

проверить, что число параметров совпадает с числом условий для выбора этих параметров во всех остальных возможных случаях граничных режимов (8), (9).

Таким образом, принцип максимума дает «достаточную» ин­ формацию для решения поставленной задачи оптимального управ­ ления, и можно ожидать, что имеются лишь отдельные, изолиро­ ванные траектории системы (13), удовлетворяющие условиям

(6) — (11). Лишь эти отдельные изолированные траектории и могут оказаться оптимальными, причем их оптимальность, конечно, нужно отдельно проверить ибо теорема 1 дает, вообще говоря, не­ обходимое условие оптимальности.

Как видим, принцип максимума дает изящно и просто выпи­ сываемые необходимые условия оптимальности и приводит к спе­ циального вида краевой задаче (13), (8 )— (10), которую естест-

6*