Файл: Основы автоматического управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 319

Скачиваний: 15

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 16.1. П Р И Н Ц И П МАКСИМУМА

643

Предположим, что поведение объекта управления описывается дифференциальными уравнениями и начальными условиями вида

Уі = Іі(Уи ■■

. . . , u r,t), yi(t0) = yio

( і = 1 , . . . , п ) ,

(16.1.1)

где fi — в общем случае нелинейные функции, Уі0 — начальные

значения переменных yh Считая производные уі и функции /*

координатами соответствующих векторов у, /, можно переписать уравнения (16.1.1) в более компактном векторном виде:

У = / {у, U, О, У (<о) = Уо■

(16.1.2)

Практически управления и* не могут быть любыми вследствие физических свойств объекта или ограниченной мощности органов управления. Они должны удовлетворять определенным ограниче­ ниям, которые часто имеют вид

I Ui I < Ri

(i = 1, . . ., п).

(16.1.3)

В общем случае эти ограничения характеризуют область R допусти­ мых управлений, т. е. область R, которой должен принадлежать вектор управления гг.

и в R-

(16.1.4)

Кроме того, ограничения могут быть наложены и на координаты объекта. Учет ограничений на управления чрезвычайно важен при проектировании управляющих устройств, так как во многих случаях приходится искать оптимальное управление при ограни­ ченных ресурсах.

Цель управления можно рассматривать как достижение экстре­ мума критерия качества I за счет выбора оптимального вектора допустимого управления и. Применяемые при определении опти­ мального управления критерии качества можно свести к следую­ щим трем основным:

1) Критерий минимума времени перехода объекта из заданного

начального состояния

у 0в заданное конечное состояние у к (кри­

терий максимального

быстродействия):

 

 

/ ц к) = j ^ = *K-* o ,

(16.1.5)

 

ІО

 

где tK — момент времени окончания управления.

41*


644

ГЛ . 16. М ЕТО ДЫ О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

та

2) Критерий минимума функции от конечного состояния объек­

при заданном времени управления tK t0 =

Т *):

 

I (*к) = F (У (**)),

(16.1.6)

где F — некоторая дифференцируемая функция.

 

 

3) Критерий минимума интеграла от функции состояния объек­

та и управления при заданном времени управления tKt0:

 

I(tK) = ^ F ( y , u , t ) d t .

(16.1.7)

 

to

 

В тех случаях, когда некоторые параметры системы и действую­ щие на нее возмущения случайны, применяют статистический критерий оптимальности — математическое ожидание некоторого функционала качества.

Рассмотренные три типовые задачи сводятся к одной обобщен­ ной задаче. Для этого достаточно рассматривать функционал качества не только в конечный момент времени tK, но и в любой момент времени t и принять его текущее значение за дополнитель­ ную координату уп+і (t). Тогда задача сведется к обеспечению минимума величины уп+1 (tK). Так, приняв время t за дополни­

тельную координату Уп+і, определяемую уравнением

Уп+і= 1) Уп+і, 0 —Уп+і {to) —toi

(16.1.8)

сведем задачу минимизации времени управления (16.1.5) к мини­ мизации уп+і (tK). Приняв текущее значение функционала (16.1.6) за новую переменную уп+1 = F (у), получим в силу (16.1.1) дополнительное уравнение

П

Уп+і= 2

•••> Ut' *).

(16.1.9)

/1=1

и задача сведется к нахождению минимума yn+l (tK). Наконец, приняв текущее значение функционала (16.1.7) за новую пере­

менную Уп+і,

t

Уп+і {t)=\j F{y, и , t)dt,

to

получим для этой переменной уравнение

Уп+і = F {Уіі • • • 1 Упі Ul, . . ., U r , t), yn+i {tg) = 0, (16.1.10)

и задача снова сведется к нахождению минимума yn+t (tH).

*) В дальнейшем везде будем рассматривать минимум соответствующего критерия, так как переменой знака максимум приводится к минимуму.


§ 16.1. П Р И Н Ц И П МАКСИМУМА

645

Следовательно, задача отыскания минимума критерия каче­ ства / любого из рассмотренных трех типов сводится к отысканию минимума координаты уп+j в момент времени tK по отношению к управлению и. При этом на конечное положение объекта управ­ ления в некоторых случаях могут накладываться ограничения.

В

первой

из рассмотренных задач такое

ограничение состоит

в

задании

конечных значений координат

объекта управления.

В остальных двух задачах ограничения на конечное состояние могут иметь вид

Яр ІУі (<к), • • •, Уп (У ) = 0 (р = 1, • • т), (16.1.11)

где qp — некоторые дифференцируемые функции. Тогда, согласно известному методу нахождения условного экстремума, задача сведется к отысканию экстремума функционала вида

ГЛ

я = у„+і(*„) +

S ѴяЛг/і(У,

■ ■ • , У п ( і к ) ) ,

(16.1.12)

 

І = 1

 

 

где Kj — неопределенные

множители

Лагранжа,

определяемые

из условий (16.1.11).

 

 

 

В общей постановке задача оптимального управления объектом, поведение которого описывается уравнениями (16.1.1) и одним из уравнений (16.1.8), (16.1.9), (16.1.10), состоит в определении управления и, удовлетворяющего ограничениям (16.1.4) и достав­ ляющего минимум функционалу л.

Простое и изящное решение задачи отыскания оптимального управления и минимизации функционала л впервые было получе­ но Л. С. Понтрягиным и его учениками [79] благодаря открытому ими принципу максимума, связавшему оптимизируемый функцио­ нал состояния л с динамикой процесса. Эта связь была установ­ лена через функцию Гамильтона вида

тЦ-1

н (у , М, ф, 0 = 2 I Ф«/>,

(16.1.13)

г = 1

 

где функции /; — правые части уравнений (16.1.1) и одного из уравнений (16.1.8), (16.1.9), (16.1.10), а функции фг удовлетво­ ряют уравнениям

п + 1

 

 

 

Фі = —

(*= 1.........

л -h 1)

(16.1.14)

;= i

при конечных условиях

 

дп

т

 

Фі ('к) =

 

(z — 1, • . . , zz),

дуі

 

 

і=і

(16.1.15)

 

 

 

(*н)= — 1 -


646 г л . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

Принцип максимума состоит в том, что для оптимального управления и и соответствующих координат у и для которых функ­

ционал я имеет минимальное значение, функция Гамильтона Я имеет максимум или в общем случае свое наибольшее значение (supremum) по отношению к управлениям на всем интервале (t0, tK). Принцип максимума был обоснован как необходимое условие оптимальности для нелинейных объектов и необходимое и достаточное условие оптимальности для линейных объектов

[48, 79, 93].

Из сформулированного утверждения вытекает, что необходимым условием для того, чтобы управление и обеспечивало минимум функционалу я, является выполнение условия максимума функ­ ции Гамильтона по отношению к управлению в течение всего времени управления. Следовательно, определение оптимального управления и состоит в нахождении максимума функции Н (у, и , ф, t) относительно управления и для любого момента времени в интервале ^ i ^ tK.

Используя выражение (16.1.13) для функции Я, можно пере­ писать уравнения объекта управления (16.1.1) для координат г/; и уравнения (16.1.14) для вспомогательных функций фг в другой форме. Для этого продифференцируем выражение (16.1.13) по фг:

7 = М У ,« ,< )

(і = 1,

... ,/ г - И ) .

(16.1.16)

Дифференцируя (16.1.13) по г/г, получим

 

71—J—1

 

 

 

-Зй "= 2

(г-1 ,

. . . . п +

(ів.1.17)

3 = і

При помощи (16.1.16) и (16.1.17) уравнения (16.1.1) и (16.1.14)

приводятся к следующей канонической форме уравнений Гамиль­ тона:

dH

/•

*

. ., п -f- 1),

(16.1.18)

lJl 9ф;

 

1,1

;

дН /■

л

П+ 1).

(16.1.19)

ЧХ=

<‘ = 1 ' •

 

 

Процедура определения оптимального управления заключает­ ся в нахождении из условия максимума функции Я вектора управ­ ления и (ф) как функции вектора ф, подстановке и (ф) в уравне­ ния (16.1.1) и (16.1.14) и в решении этих уравнений относительно у (t), ф (t). Как следует из изложенного, при отыскании оптималь­ ного управления необходимо решать систему дифференциальных уравнений (16.1.1) при начальных условиях и (16.1.14) при конеч­ ных условиях (так называемую «двухточечную» задачу). Это обстоятельство существенно осложняет достаточно ясный алгоритм решения и приводит к тому, что практические сложные задачи


§ 16.1. П РИ Н Ц И П МАКСИМУМА

647

должны решаться численно при подборе подходящих начальных условий в уравнениях (16.1.14) методом проб.

Докажем необходимость максимума функции Н для оптималь­ ности управления, ограничиваясь случаем, когда конечное состоя­ ние объекта не подчинено никаким условиям, а время управления tк — t0 = Т задано. В этом случае конечные условия (16.1.15) имеют вид

Фг (tK) = 0 = 1, . . ., п), фп+1 (tK) = —1.

(16.1.20)

Л. С. Понтрягин предложил эффективный путь решения задачи с помощью понятия игольчатой вариации управления. Это понятие

является центральным в доказатель­

Ujltl

стве принципа максимума. При этом

допустимыми

управлениями

Uj (t)

^

будем считать все кусочно-непрерыв-

ные функции времени t, удовлетворя­

 

ющие ограничениям (16.1.4).

 

 

Пусть

и* (і) — допустимое опти­

 

мальное управление,

а у* (t) — соот­

 

ветствующая

фазовая

траектория.

 

Оптимальное управление и* (t) явля­

 

ется вектором, координаты которого

 

и* (t) — кусочно-непрерывные

функ­

 

ции на

отрезке

(t0, <к).

Следуя

О

Л. С. Понтрягину [79], рассмотрим

бесконечно малый промежуток вре­

 

мени т — е < г < г

и

проварьируем

 

управление и* (і),

заменив

его на

 

этом малом интервале величиной u(t), оставив его неизменным вне этого интервала. Такое варьирование называется игольчатым (рис. 16.1.1). Отметим, что мы не требуем, чтобы вариации buj (t) = = Uj (t) — uf (t) были бесконечно малыми величинами. Важно только, чтобы они удовлетворяли ограничению (16.1.4). При этом, несмотря на конечную величину разности и} (t) и* (t), импульс приращения управления 6и}ъ и влияние этой вариации на последующее поведение объекта бесконечно малы. Для доказа­ тельства вычислим вызываемое вариацией управления изменение поведения объекта. В соответствии с уравнениями (16.1.1) и (16.1.8)

(или (16.1.9),

или (16.1.10)) вариация бyt (t) = yt {t)

— yf {t)

B момент t = г

равна с точностью до малых высшего

порядка

Разности скоростей изменения координат, умноженной на про­ межуток времени е:

(т ), и (т), т) — f t ( у * (т), ге *(т ), т)] е *

(і=-= 1, . . . , r a - f l ) .

 

( 1 6 . 1 . 2 1 )