ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 314
Скачиваний: 15
652 ГЛ . 16. М ЕТО ДЫ О П Р Е Д Е Л Е Н И Я ОПТИМ А ЛЬН О ГО У П Р А В Л Е Н И Я
Добавим к (16.2.1) уравнение (16.1.9), которое в данном случае имеет вид
П
|
»n+i = |
S |
0 + “Л» |
Уп+і(іо) = Р(У (to))- |
(16.2.9) |
||
|
|
3=1 |
|
|
|
|
|
Так |
как никаких |
ограничений |
на |
конечное |
состояние |
объекта |
|
не |
наложено, |
то |
л = уп+і (<„). |
Учитывая |
(16.2.1) и |
(16.2.9), |
находим функцию Гамильтона (16.1.13);
П п
Н = У_ |
(фі + фп+і|^) фі (ff, І )+ У , (фі + фп+l^ -) Ui- |
i=l |
i=l |
Отсюда видно, что H будет иметь наибольшее возможное значение в любой момент t, если
ui = RiSgn (фг + фп+і!^) (і =1, (16.2.10)
Таким образом, управления и в этом случае имеют релейный характер с функциями переключения фі + фп+і дF • Для опре
деления этих функций переключения необходимо проинтегриро вать уравнения (16.1.14), которые в данном случае имеют вид
V |
, |
9F \ да: |
, |
Г d*F |
/ |
, |
|
3=1 |
|
|
|
|
|
|
I (16.2.11) |
|
|
|
|
|
|
|
|
Фп+і = 0 |
|
|
|
|
= 1, . . ., п), фп+і (tK) = —1. |
||
с конечными условиями фі (*K) = |
0 |
(і |
|||||
Из этих уравнений |
следует, |
что |
фп+1 (t) = |
—1. |
Присоединяя |
к уравнениям (16.2.11) систему (16.2.1) и формулу (16.2.10), полу чим полную систему уравнений, определяющих фі и Уі. Численное их решение дает возможность найти функции фі и уі и оконча тельно определить оптимальные управления Ui. Отметим, что только в случае линейного объекта (функции фі линейно зависят от уі) уравнения (16.2.11) интегрируются отдельно.
П р и м е р |
16.2.2. Объект управления |
описывается линейными урав |
||||||
нениями |
|
|
|
|
|
|
|
|
Уі — ° н (0 Уі + |
а 12 (0 У2 + |
ui> |
Уг — а2і(1) УI -Г а 22 (0 Уг |
|
||||
при начальных |
условиях |
уі ( 0 ) = |
у )0, |
Уі ( 0 |
) = у го. |
Требуется |
определить |
|
оптимальное управление, ограниченное по |
модулю, |
| щ | < R, |
минимизи |
|||||
рующее модуль |
координаты |
у, в момент времени tK: I (tK) = F (уі (tK)) = |
||||||
= I Уі U h ) I - Дополнительное |
уравнение для |
у 3 в данном случае |
имеет вид |
|||||
|
|
Уз= |
| ѴіІ. |
0з(О) = |
|у ю |. |
|
|
§ 16.2. П РИ М Е Н Е Н И Е П РИ Н Ц И П А МАКСИМУМА |
053 |
Всоответствии с (16.2.10) оптимальное управление определяется формулой
щ= R sgn (ф4 — sgn yi).
Для определения фі служат уравнения
фі = |
— <Чі (t) фі — azl (г) ф2 + аи sgn Уl. |
Фі (6<)=0> |
ф2 = |
—ai2 (0 фі — a 22 (0 фг + а 12 (0 sgn Уi> |
фг (*к)— 0 . |
Численное решение этих уравнений совместно с уравнениями для yt, у2 при учете формулы для щ дает возможность определить оптимальное управ ление Ui (t).
Рассмотрим третью типовую задачу определения оптимального управления для объекта, поведение которого описывается теми же
уравнениями (16.2.1), |
при |
заданном начальном состоянии |
у0 = |
= у (t0). Требуется определить оптимальные управления и,-, |
огра |
||
ниченные по модулю, |
I ui I |
Ri, и переводящие объект из началь |
ного состояния Уі (t0) в заданное конечное состояние yt (tK) за задан ное время tK— tQ при минимизации интеграла (16.1.7).
Добавляя к уравнениям (16.2.1) уравнение (16.1.10) и учиты вая, что конечное состояние объекта задано, запишем минимизи руемый функционал в виде
П
я = г/п+і (<к) + 2 |
ЬіУі Ѵк). |
(16.2.12) |
2= |
1 |
|
Используя уравнения (16.2.1) и (16.1.10), находим функцию Гамильтона (16.1.13):
П |
|
н = 2 фі [фг (г/. 0 + иі1 + фп+іГ(у, ад, t). |
(16.2.13) |
Условие максимума этого выражения с учетом ограничений | и,- | ^ ^ Ri определяет оптимальное управление ад как функцию величин Фг/фп+ь У и t. Для определения вспомогательных переменных Фг> Фп-и составим уравнения (16.1.14) при конечных условиях
(16.1.15):
ф; = - 2 |
д<Рj |
|
dF |
ф< (tK) = О |
Ф> дУі |
■Фп+l дУі |
|||
2 = 1 |
|
|
|
(16.2.14) |
|
|
|
|
(І — 1 , • • •, п), |
Фп+І -- 0 , |
фп+1 (^к) -- |
!• |
J |
Из последнего уравнения следует, что фп+1 (t) == —1. Объединяя уравнения (16.2.1), (16.2.14) и формулу для и, полученную из усло вия максимума Н, и учитывая начальные и конечные условия, получаем полную систему уравнений, численное решение которой дает возможность определить все переменные и вычислить опти мальные управления Ui (t).
654 |
ГЛ . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я |
|||||||
П р и м е р |
16.2.3. Рассмотрим систему, |
поведение которой описывается |
||||||
уравнениями |
•* |
|
|
|
|
|
||
|
|
|
Уі = У2, |
У2 = —<1Уі+иі |
|
(в > 0). |
|
|
Требуется |
найти оптимальное управление |
щ, |
ограниченное |
по |
модулю, |
|||
I щ I |
Я, |
переводящее объект из начального |
состояния уі0, |
у2о |
в состоя |
|||
ние |
у1к, у2к за |
заданное |
время tK и минимизирующее интеграл |
|
гк
I(tK) = j I «i (О I
О
Дополнительное уравнение (16.1.10) в данном случае имеет вид
і/з==І “ 1 1. г/з(0)= о .
С учетом заданного конечного положения объекта минимизируемый функцио нал принимает вид (16.2.12). Функция Гамильтона определяется формулой
|
Н = |
фіу2 + Фг {— ауг + щ) + Фз I «і I- |
Уравнения (16.2.14), определяющие функции ф( и ф2, имеют вид |
||
Фі = 0, |
ф2= |
—фг+ афг, фі(*к)= —^l, Ф2 (<к)= —Х2, |
а фз (<) = —1. |
Оптимальное управление, доставляющее максимум функ |
|
ции Я , имеет вид щ = |
0 при | ф2 (<) | < 1, щ = R sgn ф2 (t) при | ф2 (t) | ;> 1. |
Оптимальный процесс и оптимальное управление іц (t) определяются путем численного решения уравнений для уі, у2, фі, ф2 при учете полученной форму
лы для mj, а |
также |
начальных |
н конечных |
условий. |
|
П р и м е р |
16.2.4. Объект |
управления |
описывается уравнением |
||
|
У = |
—о,бу + и, |
у (t0) = 0, |
у (tK) = |
10. |
Требуется определить оптимальное управление и, ограниченное по модулю,
I и I |
25, |
при котором объект за заданное время tK — t0 = 1 с переводится |
|||
из начального состояния у0 = |
0 |
в конечное ук = 10 |
и при этом функционал |
||
|
|
|
«к |
|
|
|
|
/( 'к ) = |
{ |
[у2 (0 + 1-25^2 (О] dt |
|
|
|
|
to |
|
|
принимает |
минимальное значение. |
вид |
|||
Минимизируемый функционал (16.2.12) имеет |
|||||
|
|
я = Уг Uk) + ^іУі ({к)< |
|
||
где у2 |
= УІ + l,252;t2, yi = у. Функция Гамильтона в данном случае имеет вид |
Н = ф (— 0,6yt + M) — уі — l,252u2.
Оптимальное управление, минимизирующее функцию Я, имеет вид
|
§ 16.3. |
Д И Н А М И Ч ЕС К О Е П РО ГРА М М И РО ВА Н И Е |
655 |
где |
к = 1,25, R = |
25. Для определения функции ф составим |
уравне |
ние |
(16.2.14): |
|
|
Ф = 0 ,6ф + 2уі, ф (tK) = 0 .
Далее решение задачи можно получить путем совместного численного инте грирования уравнений для yt и ф при учете найденного вида управления и.
§ 16.3. Динамическое программирование
Метод динамического программирования был разработан прак тически одновременно с принципом максимума и представляет собой другой способ решения тех же вариационных задач с огра ничениями на управления и на фазовые координаты объекта. Этот метод достаточно полно обоснован для оптимизации дискрет ных систем, в области которых лежит основная сфера его приме нения. При этом вариационная задача рассматривается как много этапный процесс решения более простых задач, а оптимальное управление отыскивается последовательно шаг за шагом.
При применении динамического программирования к вариаци онным задачам теории управления снимается трудность решения граничной двухточечной задачи, к которой приводит применение принципа максимума. Однако возникают свои вычислительные трудности, связанные с возрастанием размерности решаемых задач.
Метод динамического программирования обладает большой общностью и применим для решения широкого круга задач, в которых связи между координатами, управлениями и сами критерии могут быть заданы в виде уравнений произвольного вида, графиков или таблиц.
При некоторых допущениях метод динамического программи рования применим непосредственно и к непрерывным системам, описываемым дифференциальными уравнениями. В этом случае вариационная задача также сводится к некоторой граничной зада че дифференциальных уравнений в частных производных, решение которой, однако, связано с вычислительными трудностями.
В основе метода динамического программирования лежит принцип оптимальности, доказанный Р. Веллманом, как общее необходимое условие оптимального процесса, справедливое как для дискретных, так и для непрерывных систем. Этот принцип формулируется следующим образом: оптимальное управление обладает тем свойством, что, каково бы ни было начальное состоя ние и управление до данного момента, последующее управление должно быть оптимальным при том состоянии, в которое пришла система в результате первого этапа управления [77, 78]. Из прин ципа оптимальности следует, что оптимальное управление опре деляется лишь состоянием системы в каждый данный момент