Файл: Основы автоматического управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.04.2024

Просмотров: 314

Скачиваний: 15

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

652 ГЛ . 16. М ЕТО ДЫ О П Р Е Д Е Л Е Н И Я ОПТИМ А ЛЬН О ГО У П Р А В Л Е Н И Я

Добавим к (16.2.1) уравнение (16.1.9), которое в данном случае имеет вид

П

 

»n+i =

S

0 + “Л»

Уп+і(іо) = Р(У (to))-

(16.2.9)

 

 

3=1

 

 

 

 

 

Так

как никаких

ограничений

на

конечное

состояние

объекта

не

наложено,

то

л = уп+і (<„).

Учитывая

(16.2.1) и

(16.2.9),

находим функцию Гамильтона (16.1.13);

П п

Н = У_

(фі + фп+і|^) фі (ff, І )+ У , (фі + фп+l^ -) Ui-

i=l

i=l

Отсюда видно, что H будет иметь наибольшее возможное значение в любой момент t, если

ui = RiSgn (фг + фп+і!^) (і =1, (16.2.10)

Таким образом, управления и в этом случае имеют релейный характер с функциями переключения фі + фп+і дF • Для опре­

деления этих функций переключения необходимо проинтегриро­ вать уравнения (16.1.14), которые в данном случае имеют вид

V

,

9F \ да:

,

Г d*F

/

,

3=1

 

 

 

 

 

 

I (16.2.11)

 

 

 

 

 

 

 

Фп+і = 0

 

 

 

 

= 1, . . ., п), фп+і (tK) = —1.

с конечными условиями фі (*K) =

0

Из этих уравнений

следует,

что

фп+1 (t) =

—1.

Присоединяя

к уравнениям (16.2.11) систему (16.2.1) и формулу (16.2.10), полу­ чим полную систему уравнений, определяющих фі и Уі. Численное их решение дает возможность найти функции фі и уі и оконча­ тельно определить оптимальные управления Ui. Отметим, что только в случае линейного объекта (функции фі линейно зависят от уі) уравнения (16.2.11) интегрируются отдельно.

П р и м е р

16.2.2. Объект управления

описывается линейными урав­

нениями

 

 

 

 

 

 

 

 

Уі — ° н (0 Уі +

а 12 (0 У2 +

ui>

Уг — а2і(1) УI а 22 (0 Уг

 

при начальных

условиях

уі ( 0 ) =

у )0,

Уі ( 0

) = у го.

Требуется

определить

оптимальное управление, ограниченное по

модулю,

| щ | < R,

минимизи­

рующее модуль

координаты

у, в момент времени tK: I (tK) = F (уі (tK)) =

= I Уі U h ) I - Дополнительное

уравнение для

у 3 в данном случае

имеет вид

 

 

Уз=

| ѴіІ.

0з(О) =

|у ю |.

 

 


§ 16.2. П РИ М Е Н Е Н И Е П РИ Н Ц И П А МАКСИМУМА

053

Всоответствии с (16.2.10) оптимальное управление определяется формулой

щ= R sgn (ф4 — sgn yi).

Для определения фі служат уравнения

фі =

<Чі (t) фі — azl (г) ф2 + аи sgn Уl.

Фі (6<)=0>

ф2 =

ai2 (0 фі — a 22 (0 фг + а 12 (0 sgn Уi>

фг (*к)— 0 .

Численное решение этих уравнений совместно с уравнениями для yt, у2 при учете формулы для щ дает возможность определить оптимальное управ­ ление Ui (t).

Рассмотрим третью типовую задачу определения оптимального управления для объекта, поведение которого описывается теми же

уравнениями (16.2.1),

при

заданном начальном состоянии

у0 =

= у (t0). Требуется определить оптимальные управления и,-,

огра­

ниченные по модулю,

I ui I

Ri, и переводящие объект из началь­

ного состояния Уі (t0) в заданное конечное состояние yt (tK) за задан­ ное время tKtQ при минимизации интеграла (16.1.7).

Добавляя к уравнениям (16.2.1) уравнение (16.1.10) и учиты­ вая, что конечное состояние объекта задано, запишем минимизи­ руемый функционал в виде

П

я = г/п+і (<к) + 2

ЬіУі Ѵк).

(16.2.12)

2=

1

 

Используя уравнения (16.2.1) и (16.1.10), находим функцию Гамильтона (16.1.13):

П

 

н = 2 фі [фг (г/. 0 + иі1 + фп+іГ(у, ад, t).

(16.2.13)

Условие максимума этого выражения с учетом ограничений | и,- | ^ ^ Ri определяет оптимальное управление ад как функцию величин Фг/фп+ь У и t. Для определения вспомогательных переменных Фг> Фп-и составим уравнения (16.1.14) при конечных условиях

(16.1.15):

ф; = - 2

д<Рj

 

dF

ф< (tK) = О

Ф> дУі

■Фп+l дУі

2 = 1

 

 

 

(16.2.14)

 

 

 

 

(І — 1 , • • •, п),

Фп+І -- 0 ,

фп+1 (^к) --

!•

J

Из последнего уравнения следует, что фп+1 (t) == —1. Объединяя уравнения (16.2.1), (16.2.14) и формулу для и, полученную из усло­ вия максимума Н, и учитывая начальные и конечные условия, получаем полную систему уравнений, численное решение которой дает возможность определить все переменные и вычислить опти­ мальные управления Ui (t).


654

ГЛ . 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

П р и м е р

16.2.3. Рассмотрим систему,

поведение которой описывается

уравнениями

•*

 

 

 

 

 

 

 

 

Уі = У2,

У2 = —<1Уі+иі

 

(в > 0).

 

 

Требуется

найти оптимальное управление

щ,

ограниченное

по

модулю,

I щ I

Я,

переводящее объект из начального

состояния уі0,

у

в состоя­

ние

у1к, у2к за

заданное

время tK и минимизирующее интеграл

 

гк

I(tK) = j I «i (О I

О

Дополнительное уравнение (16.1.10) в данном случае имеет вид

і/з==І “ 1 1. г/з(0)= о .

С учетом заданного конечного положения объекта минимизируемый функцио­ нал принимает вид (16.2.12). Функция Гамильтона определяется формулой

 

Н =

фіу2 + Фг {— ауг + щ) + Фз I «і I-

Уравнения (16.2.14), определяющие функции ф( и ф2, имеют вид

Фі = 0,

ф2=

—фг+ афг, фі(*к)= —^l, Ф2 (<к)= —Х2,

а фз (<) = —1.

Оптимальное управление, доставляющее максимум функ­

ции Я , имеет вид щ =

0 при | ф2 (<) | < 1, щ = R sgn ф2 (t) при | ф2 (t) | ;> 1.

Оптимальный процесс и оптимальное управление іц (t) определяются путем численного решения уравнений для уі, у2, фі, ф2 при учете полученной форму­

лы для mj, а

также

начальных

н конечных

условий.

 

П р и м е р

16.2.4. Объект

управления

описывается уравнением

 

У =

—о,бу + и,

у (t0) = 0,

у (tK) =

10.

Требуется определить оптимальное управление и, ограниченное по модулю,

I и I

25,

при котором объект за заданное время tK t0 = 1 с переводится

из начального состояния у0 =

0

в конечное ук = 10

и при этом функционал

 

 

 

«к

 

 

 

 

/( 'к ) =

{

2 (0 + 1-25^2 (О] dt

 

 

 

to

 

 

принимает

минимальное значение.

вид

Минимизируемый функционал (16.2.12) имеет

 

 

я = Уг Uk) + ^іУі ({к)<

 

где у2

= УІ + l,252;t2, yi = у. Функция Гамильтона в данном случае имеет вид

Н = ф (— 0,6yt + M) — уі — l,252u2.

Оптимальное управление, минимизирующее функцию Я, имеет вид


 

§ 16.3.

Д И Н А М И Ч ЕС К О Е П РО ГРА М М И РО ВА Н И Е

655

где

к = 1,25, R =

25. Для определения функции ф составим

уравне­

ние

(16.2.14):

 

 

Ф = 0 ,6ф + 2уі, ф (tK) = 0 .

Далее решение задачи можно получить путем совместного численного инте­ грирования уравнений для yt и ф при учете найденного вида управления и.

§ 16.3. Динамическое программирование

Метод динамического программирования был разработан прак­ тически одновременно с принципом максимума и представляет собой другой способ решения тех же вариационных задач с огра­ ничениями на управления и на фазовые координаты объекта. Этот метод достаточно полно обоснован для оптимизации дискрет­ ных систем, в области которых лежит основная сфера его приме­ нения. При этом вариационная задача рассматривается как много­ этапный процесс решения более простых задач, а оптимальное управление отыскивается последовательно шаг за шагом.

При применении динамического программирования к вариаци­ онным задачам теории управления снимается трудность решения граничной двухточечной задачи, к которой приводит применение принципа максимума. Однако возникают свои вычислительные трудности, связанные с возрастанием размерности решаемых задач.

Метод динамического программирования обладает большой общностью и применим для решения широкого круга задач, в которых связи между координатами, управлениями и сами критерии могут быть заданы в виде уравнений произвольного вида, графиков или таблиц.

При некоторых допущениях метод динамического программи­ рования применим непосредственно и к непрерывным системам, описываемым дифференциальными уравнениями. В этом случае вариационная задача также сводится к некоторой граничной зада­ че дифференциальных уравнений в частных производных, решение которой, однако, связано с вычислительными трудностями.

В основе метода динамического программирования лежит принцип оптимальности, доказанный Р. Веллманом, как общее необходимое условие оптимального процесса, справедливое как для дискретных, так и для непрерывных систем. Этот принцип формулируется следующим образом: оптимальное управление обладает тем свойством, что, каково бы ни было начальное состоя­ ние и управление до данного момента, последующее управление должно быть оптимальным при том состоянии, в которое пришла система в результате первого этапа управления [77, 78]. Из прин­ ципа оптимальности следует, что оптимальное управление опре­ деляется лишь состоянием системы в каждый данный момент


G5C гл. 16. М ЕТО Д Ы О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я

времени и целью и не зависит от состояний в предыдущие моменты

времени.

Для изложения существа метода и получения рекуррентных расчетных соотношений рассмотрим простейшую одномерную дис­ кретную систему, поведение которой описывается разностным уравнением на заданном интервале tKt0 = Т:

у (к + 1) = у (к) + / (у (к), и (к), к),

(16.3.1)

где у (к) — координата системы, и (к) — управление в момент времени кТп (к = 0, 1, . . ., N), Ти = (£к — t0)/N — интервал дискретности. Пусть начальная координата объекта равна у (£0) = = у0, а управление ограничено, | и | ^ R. Требуется определить последовательность оптимальных управлений и (0), . . ., и (N — 1), минимизирующую сумму

I = % lF(y(k),u{k)) + Q(y(N)),

(16.3.2)

h= 0

 

где F н Q — некоторые известные функции. Задача минимизации

функции (16.3.2) многих переменных и (0), и (1), . . .,

и (N — 1)

сложна. Однако, воспользовавшись принципом оптимальности, можно свести общую операцию минимизации функции многих переменных к последовательной минимизации функций одной

переменной.

Действительно, рассмотрим

последний интервал

(N — 1) Тп ^

t ^ NTa,

предполагая,

что

состояние

у (N — 1)

известно. На

основании

принципа

оптимальности

управление

и (N — 1) на этом интервале зависит от у (N — 1), должно удов­ летворять ограничению и минимизировать на этом интервале сумму, входящую в (16.3.2):

I N-1 = F (у (N - 1),

и (N -

1)) + Q (у (АО).

(16.3.3)

Заменив

у (N) его выражением из

уравнения

(16.3.1),

получим

/ * - . =

F ( y ( N - 1), и (N -

1)) +

Q (у (N -

1) +

/ (у (N - 1),

 

 

и (N — 1), N -

1)).

(16.3.4)

Сумма (16.3.4) зависит от одной неизвестной и (N — 1), которую следует выбрать из условия минимума I N-i при учете ограни­ чения на и. Обозначим это оптимальное значение и* (N — 1), а минимальное значение I N-\, зависящее от у (N — 1), через

S . V - . ( У ( Л Г —

1 ) ) :

 

SN-i (y(N —1))=

min IN-! =

 

 

|u(N—1)|<R

=

min

{F (у (N — 1), u ( N - i ) ) + Q ( y ( N - i ) +

|u(N-l)KR

+ f { y ( N - 1), u ( N — 1), N — 1))). (1 6 . 3 .5 )