ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.04.2024
Просмотров: 316
Скачиваний: 15
658 Г Л . 16. М Е Т О Д Ы О П Р Е Д Е Л Е Н И Я ОПТИ М А ЛЬН О ГО У П Р А В Л Е Н И Я
Весц изложенный алгоритм справедлив и для многомерных систем с любым числом управлений щ, . . ип. Для применения его необходимо заменить скаляры у, и, / в приведенных формулах соответственно векторами у , u , f . В результате потребуется на каж дом этапе минимизировать функцию г переменных щ (N — к), . . .
. . ., |
ит(N — к). |
При этом на каждом этапе вычислений необхо |
|
димо |
определять |
и запоминать две функции |
S N^ (у (N — к)) |
и Sjv-fc+i {у (N — к + 1)) п переменных. Это |
требует большого |
объема памяти при вычислениях на машине. В этом состоят вычислительные трудности метода динамического программи рования.
П р и м е р 16.3.1. Решим задачу, рассмотренную в примере 16.2.4, применив метод динамического программирования. Для этого заменим диффе ренциальное уравнение разностным, а интегральный критерий — суммой. В результате приходим к задаче отыскания оптимального управления в дис кретной системе, описываемой уравнением
Vh+i = Ук+ (“ft — 0,6yk) At |
(к = 0, 1, . . N). |
Допустим, что объект управления имеет 6 дискретных состояний: 0, 2, 4, 6,
8 , 10. Требуется определить оптимальные управления и*, ограниченные по модулю, I Mft I < 25, при которых объект переходит из начального состояния у0 = 0 в состояние yN = 10 за время Т = 1, так, чтобы минимизировать величину
N - |
1 |
/ = 2 |
(yh+ l,252ug)At. |
ft= 0
Для решения задачи методом динамического программирования примем постоянный интервал дискретности At = 0,2 и, значит, N = 5. Определим сначала траектории, ведущие в конечную точку у$ = 10 из любого положе ния 1/4, в котором система может быть к моменту <4, и вычислим для них значения критерия по формуле
h = (yl + 1,252ц!) At.
Вычисленные значения / 4 приведены в таблице 16.3.1. Там же показаны значения соответствующих управлений ц4.
|
|
|
|
|
ТАБЛИЦА |
16.3.1 |
Уі |
0 |
2 |
4 |
6 |
8 |
10 |
h |
782 |
529 |
332 |
177 |
81 |
31 |
“ 4 |
50 |
41,2 |
32,4 |
23,6 |
14,8 |
6 |
На рис. 16.3.1 изображены точки, характеризующие возможные состоя ния объекта. На этом же рисунке прямыми линиями изображены траектории перехода объекта из одного состояния в другое. Над отрезками прямых даны значения критерия / 4 для соответствующих переходов. Из результатов вычис-
660 ГЛ . 16. М ЕТО ДЫ О П Р Е Д Е Л Е Н И Я ОПТИМ АЛЬНОГО У П Р А В Л Е Н И Я
§16.4. Применение динамического программирования
кнепрерывным системам
Метод динамического программирования может быть при некоторых допущениях распространен также на непрерывные системы и приводит к своеобразному дифференциальному уравне нию в частных производных.
Рассмотрим задачу оптимизации управления при интеграль ном критерии и заданном начальном состоянии объекта. Конечное состояние объекта может быть фиксированным или произвольным. Пусть поведение объекта описывается системой уравнений в век
торной форме |
|
У = / (у, и, t), у (t0) = У о, |
(16.4.1) |
где у и и — векторы, размерности п, г соответственно, г ^ п. Предположим, что управление объектом производится на заданном интервале времени (t0, tK) и требуется выбрать вектор управления и, принадлежащий области R, и £ R, минимизирующий функцио нал
I (*к) = j F(y(t), и (t), t)dt + Q (у (*„)), |
(16.4.2) |
to
где F — заданная интегрируемая функция, Q — заданная функция конечного состояния объекта. Обозначим через и* (t) вектор оптимального управления, а через у (t) траекторию объекта при
оптимальном управлении. Для этой оптимальной траектории введем функцию Веллмана
4к
S(y(t), *) = m m [ j F (у (т), и (т), т) т + <? (»/(«„))]\ (16.4.3)
Она в общем случае зависит от координат оптимизируемого интер вала и самого момента времени t.
Выведем уравнение, которому удовлетворяет функция S, применив принцип оптимальности. Для этого возьмем бесконечно малый интервал (t, t + At) и предположим, что оптимальное управ ление для интервала (< + At, tK) найдено. Перепишем формулу
(16.4.3) в виде
t+At
S ( y (<), 0 = min Г ( F( y (т), |
w (t ), |
x ) d x |
+ |
u£R L J |
|
|
|
*H |
|
_ |
|
+ j |
F ( y |
( t), |
u (t ), t) dx + Q i y (* „ ))] |
i+At