648 ГЛ . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я О П ТИ М А ЛЬН О ГО У П Р А В Л Е Н И Я
Эти разности бесконечно малы и являются начальными значения ми вариаций переменных на интервале (т, tK). В силу этого пере менные Уі (t) будут бесконечно мало отличаться от оптимальных у* (t) в интервале времени (т, tK). Положив в уравнениях (16.1.1)
Уі (0 = |
У* (0 + буі (0. и (0 = |
(0 пРи |
t > т, |
получим |
dyf |
döyi |
fi (У* + буі, . . ., |
Уп + &Уп, Ul, |
|
(16.1.22) |
dt |
dt |
|
|
|
|
|
Раскладывая правые части в ряд Тейлора в окрестности у* (t), . . .
• ■ч Уп (t) |
и отбрасывая члены второго порядка малости, |
получим |
dy*i |
döyi |
Ш , |
. , y l , u * u . . . , u?, «) + |
|
|
|
dt |
dt |
|
|
|
|
|
|
n+1 |
|
|
|
|
|
|
|
+ 2 |
d f i ( y f , . . . , |
i A , u f , . . . , и |
t) |
8yp. |
|
|
|
|
dy*p |
|
|
|
|
p= i |
|
|
|
|
Вычитая отсюда соответствующие уравнения (16.1.1), получим уравнения в вариациях
n-f-l |
|
|
|
-^ Г = 2 |
а/г(^ |
- ° бУр |
(і = 1..........ге + 1). |
(16.1.23) |
р = |
і |
р |
|
|
Эти уравнения следует интегрировать при начальных условиях
(16.1.21) в момент т.
Теперь вычислим вариацию функционала л. Так как опти мальное управление и* (t) должно обеспечивать минимальное значение л, то при замене и* (t) любым другим управлением и (t) значение л может лишь увеличиваться. Следовательно, необхо димым условием минимума л будет бл = бг/п+1 (іИ) ^ 0. Вариацию 8уп+1 (tK) можно вычислить, не интегрируя уравнения (16.1.23).
Действительно, |
вычислим |
производную по времени от суммы |
п+1 |
|
|
|
* 1 |
п+1 |
п+1 |
п+1 |
|
4 2 |
= 2 ^ бг / і + 2 У М - |
|
і=1 |
i=l |
i=l |
Подставляя сюда выражения ф«, бyt из (16.1.14) и (16.1.23), получим
п+1 п+1 п+1
* 3 ч > А « = - 3 4 ^ « * + 3
і=1 |
і, ;=1 |
t, i=l |
|
Отсюда следует, |
что на интервале |
т ^ t ^ |
tK |
|
п+1 |
|
|
2 Фі (0 fy/i (f) = const.
§ 16.2. П РИ М Е Н Е Н И Е П Р И Н Ц И П А МАКСИМУМА |
649 |
Отсюда, учитывая |
(16.1.20), находим |
|
п+1 |
п-)-1 |
|
2 Ф;(т)8 У і (х)= 2 Фг (U Ь у і ( t K) = - б у п + і |
|
|
І= 1 |
|
Таким образом, |
n-f 1 |
|
бя = |
|
— 6yn+l (tK) = — S Opf (T) бУі (т). |
|
|
i=l |
|
Подставив сюда выражение бyt (т) из (16.1.21), получим |
n-fl |
|
|
б я = - е É 1Фг(х)/г(У (т), м(т), т) — фг (т)/г(г/* (т), |
(х)> Х)Ь |
1-1 |
|
(1C.1.24) |
Так как в качестве момента т можно выбрать любой текущий момент времени t в интервале (t0, tK), то равенство (16.1.24) спра ведливо для любого момента времени t. Следовательно, учитывая (16.1.13), равенство (16.1.24) можно записать в виде
бя= — г [ Н ( у , и , ф, t) — H (у*, и*, ф, *)]• (16.1.25)
Отсюда следует, что бл ^ 0 при допустимой вариации Ьи только при
Н (у*, и*, ф, t) Н (у, и, ф, t).
Таким образом, доказано, что для минимума функционала я необ ходимо, чтобы функция Гамильтона Н имела максимальное значе ние относительно управления и на всем интервале управления.
В частном случае, когда ограничений на управления нет, оптимальное управление является стационарной точкой функции Гамильтона при любом t, т. е. доставляет ей максимум. В этом случае оптимальные управления определяются пз уравнений
= 0 |
(і = 1......... |
г). |
(16.1.26) |
Доказательство принципа максимума для общей задачи опти мального управления, а также его достаточности для линейного объекта более сложно. Его можно найти в [48, 93].
§ 16.2. Применение принципа максимума для решения типовых задач
Пусть движение объекта управления описывается уравнениями
Уі = <Ѵі (Уи • • •, Уп, t) + ut (г = 1, ... ,« ) . (16.2.1)
Требуется определить оптимальные управления ы,-, обеспечиваю
щие |
перевод объекта |
из заданного начального состояния у*0 — |
= у і |
(t0) в заданное |
конечное состояние г / ; t K( ) за минимальное |
650 гл. 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я
время tK — t0с учетом ограничений | и* | ^ Ri. Добавим к (16.2.1) уравнение (16.1.8) и, учитывая, что конечное состояние объекта
задано, получим для функционала |
я |
формулу |
|
|
П |
|
|
|
|
|
п ~ У п + і ( ^ к) + 2 |
|
|
к)- |
|
( 1 6 . 2 . 2 ) |
|
і= 1 |
|
|
|
|
|
Функция Гамильтона имеет в данном |
случае |
вид |
|
П |
|
|
|
|
|
|
Н = 2 ФДфі(У) 0 + |
иг] + Фп+1- |
(16.2.3) |
г= 1 |
|
|
|
|
|
|
Это выражение достигает максимума при |
|
|
ui = /JjSgnoJij |
(i |
= |
|
1, . . ., |
п). |
(16.2.4) |
Таким образом, оптимальное управление является релейным, причем переключения определяются знаками функций фг.
Для определения вспомогательных переменных ф* составим уравнения (16.1.14) и конечные условия (16.1.15):
Ф г= — 2 |
^ 5 т > 'М * к) = - ^ |
3=1 |
1 |
(16.2.5) |
|
|
|
|
(і = 1, ... , п), |
Фп+1 = 0, |
Фим (^к) = |
1 • |
Решая уравнения (16.2.1), (16.2.5), определим окончательно закон управления. Однако в общем случае это удается сделать только численными методами, применяя метод проб, так как заданы начальные условия для координат y t и конечные условия для вспомогательных функций ф*.
В частном случае линейного стационарного объекта уравнения
(16.2.1) имеют вид |
|
|
У і = 2 а і і У і + Щ , |
У і ( і 0) = У і 0 |
( і =1, ... , л). (16.2.6) |
3= 1 |
|
|
Уравнения (16.2.5) для функций ф* при этом принимают форму
п
Фг= — 2 «г/Фь ФЛ^к)=—h (г'= 1, . . п). (16.2.7)
3= 1
Решение уравнений (16.2.7) имеет вид
Ф ( 0 = 2 сц е4!*,
і= 1
где Vj — корни характеристического уравнения. Эта сумма пере ходит через пуль не более чем п — 1 раз и имеет, следовательно,
§ 16.2. П Р И М Е Н Е Н И Е П РИ Н Ц И П А МАКСИМУМА |
651 |
не более п интервалов постоянства знака. Поэтому каждое из управлений ut имеет в общем случае п — 1 переключение, т. е. п интервалов постоянства знака, на которых ui — ±Ri.
П р и м е р 16.2.1. Рассмотрим процесс управления объектом, поведе ние которого описывается уравнениями
|
|
|
|
2/і = 2/2> |
2/2 = |
—2ау2 — b2yt+Ui |
|
|
при начальных и конечных условиях у, (<0) = |
уі0, |
уг (t0) — у20, |
Уі (<к) = О, |
Уг (гк) = |
0- Требуется определить управление |
щ (t), |
ограниченное по моду |
лю, I щ I |
R, и обеспечивающее минимальное время перевода |
объекта из |
начального в конечное состояние. |
|
|
|
уравнение для |
у3: |
|
Добавим |
к |
написанным |
уравнениям |
|
|
|
|
|
|
|
2/з = |
1. |
|
y 3 (to) = t 0 - |
|
|
|
|
|
Минимизируемый |
функционал |
|
для |
этого |
случая |
имеет |
вид |
|
|
|
|
И = |
2/з Рк) |
”Ь |
^т2/і Рк) |
“Ь |
^ 22/2 |
(1ц) > |
|
|
а функция |
Гамильтона |
выражается |
формулой |
|
|
|
|
|
|
|
Н = |
фіу2 + Фг (—2ау2 — Ъ2уі + |
щ) + ф3. |
|
|
Отсюда |
следует, |
что |
функция |
Гамильтона |
имеет |
|
максимум при |
|
|
|
|
|
|
|
Ui = R sgn ф2. |
|
|
|
|
|
|
Вспомогательная |
переменная |
ф2 |
определяется |
из |
уравнений ф, = ЬҢ-2, |
ф2 = 2 аф2 — фі, |
ф3 = |
0 |
при |
конечных |
условиях |
фд (fK) = — |
ф2 (tK) = |
= —Х2, |
ф3 (<к) = —1. |
Исключая |
фі, |
получим |
|
|
|
|
|
|
|
|
|
|
|
ф2 — 2 аф2 |
|
Ь2ф2 = 0 . |
|
|
|
|
|
Решение |
этого уравнения |
при |
а2 — Ь2 < 0 имеет |
вид |
|
|
|
|
|
ф2 («) = |
Аіво-і sin (УЬ2 — а2 2 -f |
А 2), |
|
|
где А 1 и А 2 |
определяются из конечных условий. |
Оптимальное управление |
определяется |
формулой |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
щ = |
R |
sgn [Аіваі sin (У ь 2 — а2 1 + |
А 2)]. |
|
|
Для определения постоянных А , и Л2 необходимо подставить найденное управление в уравнения для yt и у2 и проинтегрировать их при заданных начальных условиях. Тогда A s, А 2, Х4, Х2 и момент окончания управления определяется пз заданных конечных условий для yt, у2, фд и ф2. Эту часть задачи можно решить только численно.
Рассмотрим задачу управления конечным состоянием объекта, описываемого уравнениями (16.2.1), при заданном начальном состоянии у (t0) = у0. Требуется определить оптимальные управ ления Ui, ограниченные по модулю, | u; | ^ Ri, обеспечивающие минимум заданной функции конечного состояния:
I ( ^ к ) = F ІУі ( ^ к ) . • • • . Уп ( ^ к ) ) - |
( 1 6 . 2 . 8 ) |