Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 83
Скачиваний: 0
1S8
Для всех моментов времени, кроме моментов разрыва управления,
функция Н дифференцируема по £. |
, |
прячем |
ее |
полная |
производная |
||
по ~£ |
равна |
частной. Действительно, для |
Н |
(У (U |
*)j^(^/г) |
||
Но из |
условий |
С16.Ъ), записанных |
в |
векторной |
форме |
( ^ а - ^ j j — |
следует, что сумма двух первых слагаемых в этом выражении равна нулю, так что полная производная
для любого допустимого управления при выполнении ^16.5). Иначе,
Pwc. /6. / |
-in- |
t |
Но на оптимальном управлении U. (4) при выполнении условий выбора
Правая же часть этого равенства равна нулю, так как значение функционала I при оптимальном выборе Т= / больше или равно зна чению этого функционала при Т = Т *" - S0 с гt~ И t - t + S t , откуда следует, что С = 0,' а
т
Т |
(?=/ |
, S9
Если, в частности, функции Jo и не зависят явно о* ~£ (система автономна), то на оптимальной траектории функция Гамиль тона тождественно равна нулю. Естественно, что для всех остальных допустимых управлений она неположительна.
16.2. Другие постановки задачи Д. Значение аргумента Т и состояния в конце процесса связаны
друг с другой. |
|
|
В остальном |
задача совпадает с п. 1 6 . I . Уравнение |
связи имеет ' |
вид |
|
|
. |
FfjCCrJ, Г) 'О |
Ц 6 . Ю ) |
Функция F предполагается непрерывной и непрерывно дифференцируе мой по совокупности своих аргументов.Запишем функцию & с учетом (16,10), пользуясь табл. 15.I , 15.2 •
+ |
JSrf- |
т;гм |
( 1 б Л 1 ) |
Здесь |
- ( Л + I ) |
- мерный вектор. Условия ее |
экстремума noJ^ |
С учетом |
того, что при |
-t |
> |
Т ^ |
|
уравнения |
в пределах |
o i |
^ |
s |
Т_до |
условиям |
|
|
|
|
|
|
у,(Т>) |
= Л Ъ |
У р |
|
( ^ « О , ннтегрироввниз этого * Т.,. приводи к краевым
(16.12)
|
|
|
р =1,2, .. |
|
Геометрически эти условия |
означают, что вектор W |
ъ момент Т |
||
ноллинеарвй |
градиенту функции F |
.Вектор же градиента нормален к |
||
поверхности |
уровня (16.10) |
функции |
Z 7 . |
|
Таким образом, PfTj$вжзв нормалей к поверхности |
=0. Условия |
|||
(16,12) называют условиями |
трансверсальности. Остановимся на |
i60
|
нескольких |
вариантах |
такой задачи. |
|
|
|
|
|
||||
|
Л р |
Если какая-то |
из разовых |
координат >УК |
или время |
^Х^+/ |
||||||
не |
входят в функцию |
|
, т . е . может принимать произвольное значе |
|||||||||
ние, |
то |
соответствующая |
частная |
производная, а |
значит |
я £££ СТ) |
||||||
или |
|
+ / к1) |
равны .нулю, |
.что совпадает |
с условием (16.7;. |
Условия, |
||||||
оптимальности, |
относящиеся |
к внутренним |
точкам |
отрезка |
\ 0,Т ;( "не |
|||||||
изменяются, так как последнее слагаемое |
в |
И ? отлично |
от нуля лишь |
|||||||||
при |
6 - Т. |
|
|
|
|
|
|
|
|
|
|
|
|
• |
•Еункция |
в |
(16.10) |
может быть |
векторной |
|
|
||||
|
|
и ) |
+=а о; |
|
|
/Ja) |
= о, |
. |
. . / Х ^ > > = |
о |
|
в этом случав в X? добавится не одно слагаемое, а сумма вида
ГУ!
условия трансверсальности запишутся, как
и означают, что вектор |
У |
(,Т) может |
быть |
представлен как сумма |
||
градиентов .функций |
. Например, для |
J |
- |
1,2 |
^ ^ / ^ л е ж и т в той |
|
же плоскости, в которой лежат градиенты |
|
и / - 7 - . |
||||
Ад. Вместо или наряду |
с равенствами |
(16.10) |
в задачу могут вой |
|||
ти и неравенства |
|
|
|
|
|
|
В этом случае, как об этом говорилось в п.15. 3, каждому такому нера
венству в |
соответствует слагаемое |
|
|
причем |
Q/У ^ |
0. |
|
А 4 . Частным |
случаем условия (16.10) |
является условие, наложен |
|
ное на одну из координат (п+1)-мерного |
вектора У (Т), его можно за |
||
писать, как |
|
|
|
|
/-J |
Су =0 |
U 6 . I 5 ) |
|Для простоты |
считаем, |
что |
смешанных условии |
в форме |
(16.10), |
||||||||
(16.14) на J^(T ) не наложено. Тогда условие трансверсальности при |
|||||||||||||
мет форму |
|
|
|
|
|
|
|
|
|
|
|
||
{; |
j |
|
fyCTJ |
|
= *s£- |
|
|
|
|
(16.16) |
|||
Таким образом, |
если |
время |
или фазовая |
координата |
фиксированы, то |
||||||||
Ьоответотвупцая |
составляющая |
вектора |
^ ? ^ / ' о т л и ч я а |
от нуля. В |
|||||||||
маетности/ для задач |
с фиксированным Т и функцией Н, |
не зависящей |
|||||||||||
гот |
~£ |
явно, |
на оптимальном |
решении Н (. XCU^Jj ^С^У |
) равна |
||||||||
некоторой константе, |
так как |
С^,,, (Т) = ^У^^ |
. |
|
|
||||||||
Условие |
общности положения |
распространяется, |
конечно, и на |
связи |
|||||||||
i(I6.I0)." |
|
\.Т) и |
Т |
не |
должны быть |
"исключительными" точками» |
|||||||
|
Б. Оптимизируемый |
функционал зависит от конечного |
состояния |
[перепишем I в форме
й составим функцию
|оторая отличается от (16 . II) лишь отсутствием множителя ^У в оследнем слагаемом. Таким образом, условия оптимальности совпа дет с таковыми для предыдущей задачи с той разницей, что
1?= 1,2» ...v O+I частности, функционал (16.17) может вообще не содержать оервого
аемого ^ э |
о |
Широкий класс |
задач |
управления |
сводится к |
||
рстижению максимального |
значения |
одной |
из переменных состояния |
||||
(Т) |
при произвольных значениях |
остальных переменных .в момент Т. |
|||||
этом |
случае |
|
|
|
в соответствии с |
(16.18) |
|
С £ (Т) =+1, а |
остальные |
составляющие вектора^Т) |
равны нулю. |
16,3. Условия оптимальности классического вариационного исчисления
Проследим связь между принципом максимума Понтрягина и класси ческими вариационными методами на примере задачи о
JSOC/O ./Л(-*< |
U; ^Je/J |
(16.19) |
являющейся основным объектом изучения в вариационном исчислении, функция £ для этой задачи.
Кроме дифференциуемости no «X, |
потребуем дифференцируемости |
|||||
d0 по I*- и сформулируем |
условие |
оптимальности |
как условие |
|||
стационарности /S , |
а значит |
и & |
по У |
и ^ |
. Множество |
|
сравненияйри этом, |
конечно, |
уже^чем |
при использовании |
прин |
ципа максимума.- Из условия стационарности следует
|
Э |
£<_ |
Искдючая из этой |
оистемы ( / * & ) и учитывая, что ti = У, получим |
|
вдоль оптимальной |
траектории |
|
Уравнение (16.21) |
называется |
уравнением Эйлера. Его решенья, удов |
летворяющие граничным условиям vI6 . I9), являются возможными опти мальными траекториями.
функцию ^Р можно исключить не только после дифференцирования второго из уравнений /16.20/, но и интегрируя первое из них.
|
f6i |
Получим |
^ |
так что |
/£ц непрерывна по ^ . |
Это условие называют условием Эрдмана - ВейерштрассоМножество претендентов на решение в задаче (16.19) можно
сузить, потребовав, чтобы в точке, стационарной по U , функ-»
ция Н достигала |
максимума. |
Запишем разность между значением |
Н на оптимальном |
управлении |
некотором допустимом U. |
и учтем, что в силу условия стационарности £^*можно опреде лить из (.16-20).
Получим
Функция Е называется функцией Вейерштрасса. Условие (16.22) должно выполняться для всех И. и Ь .
16.4.Условия, наложенные на промежуточные значения фазовых координат
Условия, аналогичные (16.10), могут быть наложены на на чальные или промежуточные значения переменных состояний. В первом случае, поступая совершенно так же, как в п . 16 . 3, мы
получим условия трансверсальности при \_ = 0 . Остановимся