§ 16.1. П Р И Н Ц И П МАКСИМУМА |
643 |
Предположим, что поведение объекта управления описывается дифференциальными уравнениями и начальными условиями вида
Уі = Іі(Уи ■■ |
. . . , u r,t), yi(t0) = yio |
( і = 1 , . . . , п ) , |
(16.1.1)
где fi — в общем случае нелинейные функции, Уі0 — начальные
значения переменных yh Считая производные уі и функции /*
координатами соответствующих векторов у, /, можно переписать уравнения (16.1.1) в более компактном векторном виде:
У = / {у, U, О, У (<о) = Уо■ |
(16.1.2) |
Практически управления и* не могут быть любыми вследствие физических свойств объекта или ограниченной мощности органов управления. Они должны удовлетворять определенным ограниче ниям, которые часто имеют вид
I Ui I < Ri |
(i = 1, . . ., п). |
(16.1.3) |
В общем случае эти ограничения характеризуют область R допусти мых управлений, т. е. область R, которой должен принадлежать вектор управления гг.
Кроме того, ограничения могут быть наложены и на координаты объекта. Учет ограничений на управления чрезвычайно важен при проектировании управляющих устройств, так как во многих случаях приходится искать оптимальное управление при ограни ченных ресурсах.
Цель управления можно рассматривать как достижение экстре мума критерия качества I за счет выбора оптимального вектора допустимого управления и. Применяемые при определении опти мального управления критерии качества можно свести к следую щим трем основным:
1) Критерий минимума времени перехода объекта из заданного
начального состояния |
у 0в заданное конечное состояние у к (кри |
терий максимального |
быстродействия): |
|
|
/ ц к) = j ^ = *K-* o , |
(16.1.5) |
|
ІО |
|
где tK — момент времени окончания управления.
644 |
ГЛ . 16. М ЕТО ДЫ О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я |
та |
2) Критерий минимума функции от конечного состояния объек |
при заданном времени управления tK — t0 = |
Т *): |
|
I (*к) = F (У (**)), |
(16.1.6) |
где F — некоторая дифференцируемая функция. |
|
|
3) Критерий минимума интеграла от функции состояния объек |
та и управления при заданном времени управления tK— t0: |
|
I(tK) = ^ F ( y , u , t ) d t . |
(16.1.7) |
|
to |
|
В тех случаях, когда некоторые параметры системы и действую щие на нее возмущения случайны, применяют статистический критерий оптимальности — математическое ожидание некоторого функционала качества.
Рассмотренные три типовые задачи сводятся к одной обобщен ной задаче. Для этого достаточно рассматривать функционал качества не только в конечный момент времени tK, но и в любой момент времени t и принять его текущее значение за дополнитель ную координату уп+і (t). Тогда задача сведется к обеспечению минимума величины уп+1 (tK). Так, приняв время t за дополни
тельную координату Уп+і, определяемую уравнением
Уп+і= 1) Уп+і, 0 —Уп+і {to) —toi |
(16.1.8) |
сведем задачу минимизации времени управления (16.1.5) к мини мизации уп+і (tK). Приняв текущее значение функционала (16.1.6) за новую переменную уп+1 = F (у), получим в силу (16.1.1) дополнительное уравнение
П
Уп+і= 2 |
•••> Ut' *). |
(16.1.9) |
/1=1
и задача сведется к нахождению минимума yn+l (tK). Наконец, приняв текущее значение функционала (16.1.7) за новую пере
менную Уп+і,
t
Уп+і {t)=\j F{y, и , t)dt,
to
получим для этой переменной уравнение
Уп+і = F {Уіі • • • 1 Упі Ul, . . ., U r , t), yn+i {tg) = 0, (16.1.10)
и задача снова сведется к нахождению минимума yn+t (tH).
*) В дальнейшем везде будем рассматривать минимум соответствующего критерия, так как переменой знака максимум приводится к минимуму.
§ 16.1. П Р И Н Ц И П МАКСИМУМА |
645 |
Следовательно, задача отыскания минимума критерия каче ства / любого из рассмотренных трех типов сводится к отысканию минимума координаты уп+j в момент времени tK по отношению к управлению и. При этом на конечное положение объекта управ ления в некоторых случаях могут накладываться ограничения.
В |
первой |
из рассмотренных задач такое |
ограничение состоит |
в |
задании |
конечных значений координат |
объекта управления. |
В остальных двух задачах ограничения на конечное состояние могут иметь вид
Яр ІУі (<к), • • •, Уп (У ) = 0 (р = 1, • • т), (16.1.11)
где qp — некоторые дифференцируемые функции. Тогда, согласно известному методу нахождения условного экстремума, задача сведется к отысканию экстремума функционала вида
ГЛ
я = у„+і(*„) + |
S ѴяЛг/і(У, |
■ ■ • , У п ( і к ) ) , |
(16.1.12) |
|
І = 1 |
|
|
где Kj — неопределенные |
множители |
Лагранжа, |
определяемые |
из условий (16.1.11). |
|
|
|
В общей постановке задача оптимального управления объектом, поведение которого описывается уравнениями (16.1.1) и одним из уравнений (16.1.8), (16.1.9), (16.1.10), состоит в определении управления и, удовлетворяющего ограничениям (16.1.4) и достав ляющего минимум функционалу л.
Простое и изящное решение задачи отыскания оптимального управления и минимизации функционала л впервые было получе но Л. С. Понтрягиным и его учениками [79] благодаря открытому ими принципу максимума, связавшему оптимизируемый функцио нал состояния л с динамикой процесса. Эта связь была установ лена через функцию Гамильтона вида
тЦ-1
н (у , М, ф, 0 = 2 I Ф«/>, |
(16.1.13) |
г = 1 |
|
где функции /; — правые части уравнений (16.1.1) и одного из уравнений (16.1.8), (16.1.9), (16.1.10), а функции фг удовлетво ряют уравнениям
п + 1 |
|
|
|
Фі = — |
(*= 1......... |
л -h 1) |
(16.1.14) |
;= i
при конечных условиях
|
дп |
т |
|
Фі ('к) = |
|
(z — 1, • . . , zz), |
дуі |
|
|
і=і |
(16.1.15) |
|
|
|
646 г л . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я
Принцип максимума состоит в том, что для оптимального управления и и соответствующих координат у и для которых функ
ционал я имеет минимальное значение, функция Гамильтона Я имеет максимум или в общем случае свое наибольшее значение (supremum) по отношению к управлениям на всем интервале (t0, tK). Принцип максимума был обоснован как необходимое условие оптимальности для нелинейных объектов и необходимое и достаточное условие оптимальности для линейных объектов
[48, 79, 93].
Из сформулированного утверждения вытекает, что необходимым условием для того, чтобы управление и обеспечивало минимум функционалу я, является выполнение условия максимума функ ции Гамильтона по отношению к управлению в течение всего времени управления. Следовательно, определение оптимального управления и состоит в нахождении максимума функции Н (у, и , ф, t) относительно управления и для любого момента времени в интервале ^ i ^ tK.
Используя выражение (16.1.13) для функции Я, можно пере писать уравнения объекта управления (16.1.1) для координат г/; и уравнения (16.1.14) для вспомогательных функций фг в другой форме. Для этого продифференцируем выражение (16.1.13) по фг:
|р 7 = М У ,« ,< ) |
(і = 1, |
... ,/ г - И ) . |
(16.1.16) |
Дифференцируя (16.1.13) по г/г, получим |
|
71—J—1 |
|
|
|
-Зй "= 2 |
(г-1 , |
. . . . п + |
(ів.1.17) |
3 = і
При помощи (16.1.16) и (16.1.17) уравнения (16.1.1) и (16.1.14)
приводятся к следующей канонической форме уравнений Гамиль тона:
dH |
/• |
* |
. ., п -f- 1), |
(16.1.18) |
lJl 9ф; |
|
1,1 |
; |
дН /■ |
л |
П+ 1). |
(16.1.19) |
ЧХ= |
<‘ = 1 ' • |
|
|
Процедура определения оптимального управления заключает ся в нахождении из условия максимума функции Я вектора управ ления и (ф) как функции вектора ф, подстановке и (ф) в уравне ния (16.1.1) и (16.1.14) и в решении этих уравнений относительно у (t), ф (t). Как следует из изложенного, при отыскании оптималь ного управления необходимо решать систему дифференциальных уравнений (16.1.1) при начальных условиях и (16.1.14) при конеч ных условиях (так называемую «двухточечную» задачу). Это обстоятельство существенно осложняет достаточно ясный алгоритм решения и приводит к тому, что практические сложные задачи
§ 16.1. П РИ Н Ц И П МАКСИМУМА |
647 |
должны решаться численно при подборе подходящих начальных условий в уравнениях (16.1.14) методом проб.
Докажем необходимость максимума функции Н для оптималь ности управления, ограничиваясь случаем, когда конечное состоя ние объекта не подчинено никаким условиям, а время управления tк — t0 = Т задано. В этом случае конечные условия (16.1.15) имеют вид
Фг (tK) = 0 (і = 1, . . ., п), фп+1 (tK) = —1. |
(16.1.20) |
Л. С. Понтрягин предложил эффективный путь решения задачи с помощью понятия игольчатой вариации управления. Это понятие
|
|
|
|
|
|
|
является центральным в доказатель |
Ujltl |
стве принципа максимума. При этом |
допустимыми |
управлениями |
Uj (t) |
^ |
будем считать все кусочно-непрерыв- |
ные функции времени t, удовлетворя |
|
ющие ограничениям (16.1.4). |
|
|
Пусть |
и* (і) — допустимое опти |
|
мальное управление, |
а у* (t) — соот |
|
ветствующая |
фазовая |
траектория. |
|
Оптимальное управление и* (t) явля |
|
ется вектором, координаты которого |
|
и* (t) — кусочно-непрерывные |
функ |
|
ции на |
отрезке |
(t0, <к). |
Следуя |
О |
Л. С. Понтрягину [79], рассмотрим |
бесконечно малый промежуток вре |
|
мени т — е < г < г |
и |
проварьируем |
|
управление и* (і), |
заменив |
его на |
|
этом малом интервале величиной u(t), оставив его неизменным вне этого интервала. Такое варьирование называется игольчатым (рис. 16.1.1). Отметим, что мы не требуем, чтобы вариации buj (t) = = Uj (t) — uf (t) были бесконечно малыми величинами. Важно только, чтобы они удовлетворяли ограничению (16.1.4). При этом, несмотря на конечную величину разности и} (t) — и* (t), импульс приращения управления 6и}ъ и влияние этой вариации на последующее поведение объекта бесконечно малы. Для доказа тельства вычислим вызываемое вариацией управления изменение поведения объекта. В соответствии с уравнениями (16.1.1) и (16.1.8)
(или (16.1.9), |
или (16.1.10)) вариация бyt (t) = yt {t) |
— yf {t) |
B момент t = г |
равна с точностью до малых высшего |
порядка |
Разности скоростей изменения координат, умноженной на про межуток времени е:
(т ), и (т), т) — f t ( у * (т), ге *(т ), т)] е * |
(і=-= 1, . . . , r a - f l ) . |
|
( 1 6 . 1 . 2 1 ) |