Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 83

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1S8

Для всех моментов времени, кроме моментов разрыва управления,

функция Н дифференцируема по £.

,

прячем

ее

полная

производная

по ~£

равна

частной. Действительно, для

Н

(У (U

*)j^(^/г)

Но из

условий

С16.Ъ), записанных

в

векторной

форме

( ^ а - ^ j j —

следует, что сумма двух первых слагаемых в этом выражении равна нулю, так что полная производная

для любого допустимого управления при выполнении ^16.5). Иначе,

Pwc. /6. /

-in-

t

Но на оптимальном управлении U. (4) при выполнении условий выбора

Правая же часть этого равенства равна нулю, так как значение функционала I при оптимальном выборе Т= / больше или равно зна­ чению этого функционала при Т = Т *" - S0 с гt~ И t - t + S t , откуда следует, что С = 0,' а

т

Т

(?=/

, S9

Если, в частности, функции Jo и не зависят явно о* ~£ (система автономна), то на оптимальной траектории функция Гамиль­ тона тождественно равна нулю. Естественно, что для всех остальных допустимых управлений она неположительна.

16.2. Другие постановки задачи Д. Значение аргумента Т и состояния в конце процесса связаны

друг с другой.

 

 

В остальном

задача совпадает с п. 1 6 . I . Уравнение

связи имеет '

вид

 

 

.

FfjCCrJ, Г) 'О

Ц 6 . Ю )

Функция F предполагается непрерывной и непрерывно дифференцируе­ мой по совокупности своих аргументов.Запишем функцию & с учетом (16,10), пользуясь табл. 15.I , 15.2 •

+

JSrf-

т;гм

( 1 б Л 1 )

Здесь

- ( Л + I )

- мерный вектор. Условия ее

экстремума noJ^

С учетом

того, что при

-t

>

Т ^

уравнения

в пределах

o i

^

s

Т_до

условиям

 

 

 

 

 

 

у,(Т>)

= Л Ъ

У р

 

( ^ « О , ннтегрироввниз этого * Т.,. приводи к краевым

(16.12)

 

 

 

р =1,2, ..

 

Геометрически эти условия

означают, что вектор W

ъ момент Т

ноллинеарвй

градиенту функции F

.Вектор же градиента нормален к

поверхности

уровня (16.10)

функции

Z 7 .

 

Таким образом, PfTj$вжзв нормалей к поверхности

=0. Условия

(16,12) называют условиями

трансверсальности. Остановимся на



i60

 

нескольких

вариантах

такой задачи.

 

 

 

 

 

 

Л р

Если какая-то

из разовых

координат К

или время

^Х^+/

не

входят в функцию

 

, т . е . может принимать произвольное значе­

ние,

то

соответствующая

частная

производная, а

значит

я £££ СТ)

или

 

+ / к1)

равны .нулю,

.что совпадает

с условием (16.7;.

Условия,

оптимальности,

относящиеся

к внутренним

точкам

отрезка

\ 0,Т ;( "не

изменяются, так как последнее слагаемое

в

И ? отлично

от нуля лишь

при

6 - Т.

 

 

 

 

 

 

 

 

 

 

 

•Еункция

в

(16.10)

может быть

векторной

 

 

 

 

и )

+=а о;

 

 

/Ja)

= о,

.

. . / Х ^ > > =

о

 

в этом случав в X? добавится не одно слагаемое, а сумма вида

ГУ!

условия трансверсальности запишутся, как

и означают, что вектор

У

(,Т) может

быть

представлен как сумма

градиентов .функций

. Например, для

J

-

1,2

^ ^ / ^ л е ж и т в той

же плоскости, в которой лежат градиенты

 

и / - 7 - .

Ад. Вместо или наряду

с равенствами

(16.10)

в задачу могут вой­

ти и неравенства

 

 

 

 

 

 

В этом случае, как об этом говорилось в п.15. 3, каждому такому нера­

венству в

соответствует слагаемое

 

причем

Q/У ^

0.

 

А 4 . Частным

случаем условия (16.10)

является условие, наложен­

ное на одну из координат (п+1)-мерного

вектора У (Т), его можно за ­

писать, как

 

 

 

 

/-J

Су =0

U 6 . I 5 )


|Для простоты

считаем,

что

смешанных условии

в форме

(16.10),

(16.14) на J^(T ) не наложено. Тогда условие трансверсальности при­

мет форму

 

 

 

 

 

 

 

 

 

 

 

{;

j

 

fyCTJ

 

= *s£-

 

 

 

 

(16.16)

Таким образом,

если

время

или фазовая

координата

фиксированы, то

Ьоответотвупцая

составляющая

вектора

^ ? ^ / ' о т л и ч я а

от нуля. В

маетности/ для задач

с фиксированным Т и функцией Н,

не зависящей

гот

явно,

на оптимальном

решении Н (. XCU^Jj ^С^У

) равна

некоторой константе,

так как

С^,,, (Т) = ^У^^

.

 

 

Условие

общности положения

распространяется,

конечно, и на

связи

i(I6.I0)."

 

\.Т) и

Т

не

должны быть

"исключительными" точками»

 

Б. Оптимизируемый

функционал зависит от конечного

состояния

[перепишем I в форме

й составим функцию

|оторая отличается от (16 . II) лишь отсутствием множителя в оследнем слагаемом. Таким образом, условия оптимальности совпа­ дет с таковыми для предыдущей задачи с той разницей, что

1?= 1,2» ...v O+I частности, функционал (16.17) может вообще не содержать оервого

аемого ^ э

о

Широкий класс

задач

управления

сводится к

рстижению максимального

значения

одной

из переменных состояния

(Т)

при произвольных значениях

остальных переменных .в момент Т.

этом

случае

 

 

 

в соответствии с

(16.18)

С £ (Т) =+1, а

остальные

составляющие вектора^Т)

равны нулю.


16,3. Условия оптимальности классического вариационного исчисления

Проследим связь между принципом максимума Понтрягина и класси­ ческими вариационными методами на примере задачи о

JSOC/O ./Л(-*<

U; ^Je/J

(16.19)

являющейся основным объектом изучения в вариационном исчислении, функция £ для этой задачи.

Кроме дифференциуемости no «X,

потребуем дифференцируемости

d0 по I*- и сформулируем

условие

оптимальности

как условие

стационарности /S ,

а значит

и &

по У

и ^

. Множество

сравненияйри этом,

конечно,

уже^чем

при использовании

прин­

ципа максимума.- Из условия стационарности следует

 

Э

£<_

Искдючая из этой

оистемы ( / * & ) и учитывая, что ti = У, получим

вдоль оптимальной

траектории

 

Уравнение (16.21)

называется

уравнением Эйлера. Его решенья, удов­

летворяющие граничным условиям vI6 . I9), являются возможными опти­ мальными траекториями.

функцию можно исключить не только после дифференцирования второго из уравнений /16.20/, но и интегрируя первое из них.

 

f6i

Получим

^

так что

/£ц непрерывна по ^ .

Это условие называют условием Эрдмана - ВейерштрассоМножество претендентов на решение в задаче (16.19) можно

сузить, потребовав, чтобы в точке, стационарной по U , функ-»

ция Н достигала

максимума.

Запишем разность между значением

Н на оптимальном

управлении

некотором допустимом U.

и учтем, что в силу условия стационарности £^*можно опреде­ лить из (.16-20).

Получим

Функция Е называется функцией Вейерштрасса. Условие (16.22) должно выполняться для всех И. и Ь .

16.4.Условия, наложенные на промежуточные значения фазовых координат

Условия, аналогичные (16.10), могут быть наложены на на­ чальные или промежуточные значения переменных состояний. В первом случае, поступая совершенно так же, как в п . 16 . 3, мы

получим условия трансверсальности при \_ = 0 . Остановимся