Файл: Цирлин, А. М. Основы оптимального управления конспект лекций.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 92
Скачиваний: 0
во
о с |
о с |
Рис. К 4 &
57
Глава П Задачи управления о дискретно изменяющимися переменными.
Оптимизация многостадийных процессов..
§ 9. Задачи с марковской структурой. Линамичэское
программирование. • Выше никак не оговаривалась форма, в которой та или иная
доставляющая решения |
входит в уравнения рвязей. |
Методы нелинейного |
программирования, изложенные, выше, об- |
яадают больной общностью, но столь же больной трудоемкостью. Прячем эта трудоемкость быстро растет.о ростом размерности -У . |ля задач со специфической структурой овяаей эти общие методы юлателъно конкретизировать и упростить.
9 . 1 . Одна из самых распространенных структур изображена на рис.9.1. Здесь стрелками показаны связи, характеризующие влия ние одних переменных на другие. Кружочками обозначены функцио нальные преобразователи. Наконец, все составляющие вектора pe-t
иния |
У |
разбиты |
аа ДЕО группы, |
первая |
из которых обозначе |
на черев |
, а |
вторая-череэ |
Ц. |
обозначения под |
|
черкивают |
различие |
этих составляющих. |
|
||
Как |
видно из рисунка |
|
|
части.Как упоминалось |
, |
каждая из переменных, входящих в |
19.1), может быть векторной. |
Связь в этом случае выражена сис |
|
темой |
|
|
32 .
|
|
|
|
|
|
|
i)= 1,2, |
. . . |
m. |
|
|
||
Здесь важно то, что размерность векторов ,Х£- и |
|
|
суще |
||||||||||
ственно меньше общей |
раамернооти |
1/ . |
|
|
|
|
|
|
|||||
Простейшим примером такого рода овнаей |
является |
цепь, |
сос |
||||||||||
тавленная ив шарнирно соединенных звеньев |
(рис.9.2). Положение |
||||||||||||
каждого из |
парннров |
^ |
зависит |
от |
положения |
предыдущего |
шар |
||||||
нира |
чУ^_| |
и от |
наклон о. |
( I - I ) - r o |
авена |
^ L - i . Меняя |
ная- |
||||||
лон |
i -го |
звена, |
мы изменим положение |
всех последующих |
звень |
||||||||
ев цепи. |
|
|
|
|
|
|
|
' |
|
|
|
|
|
Объекты, |
ооотояние |
которых в момент |
t |
не |
эавиоит |
от |
всех |
||||||
предшествующих состояний,кроме |
({ - 1) - го, |
были изучены |
А.А. |
||||||||||
Марковым. |
|
|
|
|
|
|
|
|
|
|
|
|
Последовательности переменных, связанных друг о другом зави симостями типа (9.1), часто называют марковскими цевяын. Зада чи со связями такого вида еотеотвенво назвать задачами о мар ковской структурой.
9.2. Расчет последовательности химических реакторов приво дит к задаче оптимизации о марковской структурой. Вектор сос
тояния |
I -го |
реактора (обычно вектор концентраций |
на его вы-. |
|||||
ходе) |
вависи* от |
ооотояяия |
(г -1)-го |
реактора |
и от режима |
|||
U t . 4 ' l |
-то |
реактора |
(температура, |
давление |
, |
объем и |
||
т . д . ) . |
|
|
|
|
|
|
|
|
• По аналогии |
о подобными задачами «У; называют |
переменны |
||||||
ми состояниями, |
a |
- |
управляющими |
переменными, ил» |
||||
|
|
|
|
|
|
|
|
• |
оостояниями г управлениями.
Структура целевой функции также не произвольна. Чаще всего
•она новет быть приведена к аддитивной форме
83
Так, для последовательности реакторов функция цехи часто зави сит лишь от оостояния (концентраций) выходного потока батареи, т . е . в выражении (9.2) вое слагаемые, кроне первого, равны нуле.
В марковской форме может быть представлена и задача рас пределения нагрузок между параллельными агрегатами. Исходная постановка этой задачи
may £ 0,YyJ,
(Э.а)
ожет быть заменой переменных
(9.4)
преооразожана к виду
а
причем
9.8. В задачах со связями (9.1) последовательность управ лений ^ 'ТАL j при фиксированных начальных условиях целиком определяет изменение переменных состояния и значение целевой функции. Часто пакую последовательность управлений называют стратегией. Алгоритм динамического программирования основан
84
на сформулированной Р.Беллманом принципе оптимальности. |
|
|
|||||
Оптимальная стратегия обладает тем свойством, что |
какова |
|
|||||
бы но была последовательность управление |
}'U.i |
I , |
г |
• О т 2 |
, . |
||
приводящая к |
состояния ^ |
. дальнейшее |
.управление |
одтимад) |
|||
но по отношению д |
этому оостоянии. |
|
|
|
|
|
|
Этот принцип, |
по существу,не«ребуе* |
доказательства. |
Однако |
|
его стоит обсудить подробнее. Вспомню, как были получены необ ходимые уоловия максимума функций. Предполагалось, что некото рое значение аргумента оптимально, и из уоловия максимума выте кало поведение функции t окреотнооти предполагаемого решения
(на |
множестве оравнения). |
8деоь подход иной. Стоящая перед на |
ми |
задача - ёайти макоимук |
целевой функции |
|
•Л |
~ |
J |
t |
l № . |
4 |
{ ) |
|
(9.2) |
|
при уоломн |
|
|
. , |
4 |
|
|
ч |
|
||
|
Ui |
G |
Vu |
) |
Ус |
£ |
V> |
|
( 9 Л ) |
|
я |
заданном |
начальном |
состоянии |
У0 |
- относится в более общее) |
|||||
клаооу задач об оптимизации целевой функции |
|
|||||||||
со |
связями 4 9 . 1 ) , |
для |
любых |
эначеплй |
V , лежащих между 0 и Л, |
|||||
в |
произвольных |
состояний |
|
|
\у • |
Опрашивается, есть |
ли |
|||
смысл в такой замене? Не является ли |
решение множества |
вспомо |
||||||||
гательных задач более трудным, чем рзшение задачи исходной? |
||||||||||
Подобные сомнения |
не лишены оонований, однако, как это |
доказано |
ниже ', |
яш |
некоторых задач такой подход цблеоообрааен, а |
иногда |
может |
быть использован в комбинации о другими методами. |
9.4. |
Воспользуемся принципом оптимальности для решения прос |
|
тоя задачи о выборе оптимального пути в оотевом графике |
||
(рис.9.3). |
|
|
На рисунке |
показаны возможные варианты проведения некоторой |
многостадийной операции. Кружками отмечены основные этапы, и цифры, проставленные над соединяющими кружки линиями, соответ ствуют затратам на очередном этапа. Требуется найти путь, со
ответствующий минимальный ветра там, при переходе от |
точки Н к |
|||
точке |
К. Перемс-нкой ооотоянин |
в данном охучае |
является |
|
номер |
кружка, в которым мы попали |
после i - |
атавоэ, |
а управ |
лением - выбор направления после |
очередного |
этапа. |
Воспользу |
емся принципом оптимальности и зафиксируем последовательность рассуждений.
1. Для последнего этапа из каждого СОСТОЯНИЯ ведет в К
яивь одна озрглка. Значит, управление единственно, оно же оп тимально. Соответствующие минимальные затраты отметим цифрой гнутрк круяко, а оптимальную траекторию - пунктирной ливней.
Назовем их соответственно уодовно-оптнмальвнми затратами и условно-оптимальным управлением,
2. На следующей этапе для кагдоге ооотояння перебираем
все управления. Находим то из них,для которого суша затрат ва предпоследнем этапе и минимальных затрат, подсчитанных
нами для последнего атапа, минимальна. Эту оуиму, как и ранее,
вносим внутрь кружка, а соответствующую траекторию подчерки ваем пунктиром. Еолн затраты оказались равными для двух управ лений, выбираем любое за них.
3. Так продолжаем до тоади Н. Та условно-оптимальная
|
ЭР |
|
|
|
|
|
траектория, которая |
придет в |
Н, |
и является |
одним us |
решении, |
|
а соответствующие ей |
аатраты |
минимально |
возможными. |
|
||
9.5. Обобщим нопоньаовааную |
процедуру |
на |
задачу |
(9.1), |
(9,,2) и получим формальную запись алгоритма динамического прот. рашировання.
Обозначим |
оптимальное ( для определенности максимальное) |
|||||||||
значение целевой функции, полученной па отрезке |
от |
I -ой |
||||||||
до последней |
отадии |
процесса,череа |
^ |
. Естественно, |
это |
|||||
вначевие |
должно зависеть от |
У(' |
, |
так |
как оно |
получено |
при |
|||
условии, |
что |
в результате предыдущих управлений процесс |
ока |
|||||||
зался в |
ооотоянин |
. Тогда |
принцип |
оптимальности |
позволяет |
|||||
вычислить |
|
( У i - i ) |
и |
оптимальное управление |
|
|||||
OC'-i) ив |
уравнения |
|
|
|
|
|
|
|
|
^ |
(у.,) |
- |
|
Я |
^ |
Ш |
^ |
У |
О |
* |
|
|
|
|
|
|
при |
условии |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
o ^ j f c - i , * - , , ^ - . ; |
|
|
|
|
|
|
|
о . ! ) |
||||||
Заметим, что именно так мы и поступали |
в рассмотренном выше |
||||||||||||||||
примере, записывая внутрь кружков функцию |
|
( ^ t ' - i ) |
и запоми |
||||||||||||||
ная |
оптимальное |
управление |
W j . , («У,- . t |
) |
с |
помощью |
пунктир |
||||||||||
ных |
линий. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Уравнение |
(9.8) |
называют уравнением |
Беллмааа, |
а |
функцию |
||||||||||||
^ - |
функцией Беллмана. Оно позволяет, |
задай |
L |
^ m , |
(V*HI) — О, |
||||||||||||
последовательно |
рассчитать |
оптимальные |
значения |
функции |
цели |
||||||||||||
^ |
|
для всех возможных состояний процесса |
и |
зависимость |
опти |
||||||||||||
мального управления |
от |
номера |
t |
и состояния |
у . |
. Причем |
каждую из полученных функций приходится держать в памяти машиш до самого последнего этапа расчета. Чем больше возможных