Файл: Методы оптимизации в статистических задачах управления..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 92
Скачиваний: 0
Согласно приведенному выше выражению оптимальное управление запи
шется: |
= — J~1B*K2m = |
|
и0 ( t , т ) |
||
= — II 0.1 I |
Ац ^12 |
I |
|
kn k22 |
II m2 |
= — (£12mi + kntn3).
Здесь k12 (t), k22 (t) определяются согласно формулам (436), (437) из реше ния системы обыкновенных дифференциальных уравнений
Au fej2
А21 k22
Ац Аі 2 k2l A22
при условии
"ll |
V12 |
0 |
0 |
Ац &12 |
An A12 |
0 |
1 |
|
V22 |
+ |
|
А21 я(M |
+ |
0 |
0 |
U2l |
1 |
0 |
А21 А22 |
0 |
0 |
An Al2 |
' |
|
Я,ц — к11. ^12 А13 |
|
0 |
1 |
A21 A22 |
"h Q (t> |
t) |
Я21 ■^21 |
|
|
Au (b) |
A12 |
(b) |
Xu |
|
|
|
A2i |
(b) |
k22 |
(b) |
^21 |
^22 |
На рис. 40 показаны результаты моделирования на ЦВМ этой системы урав нений при следующих исходных данных:
|
6 = |
10 с: |
|
|
V = |
0 0 |
> Л = |
1 0 |
|
0 0 |
0 0 |
|||
|
|
На рисунках приводятся серии графиков, соответствующие разным значе ниям а. Параметры [і0 и d0 априорного закона распределения величины Т вы браны такими, что этот закон близок равномерному в интервале [а, Ь]. Выделен
ная кривая соответствует значениям коэффициентов kn (t), k12 (t), k22 (t) при
а = 7.
182
Рис. 41. Результат моделирования kq (t) при различных значениях а
ДЛЯ |
— 0 , 1 , A.J2 — |
А.2 3L — |
^ 2 2 — 0 . |
|
а — графики k tl (t); |
б — графики |
k l2 (/); |
в — графики k 22 (t) |
|
^ Цифрой 1 на рисунках отмечены графики коэффициентов при а = 10, |
т. е. |
|||
j& случае точно известного момента окончания процесса управления Т = |
10 с; |
цифрой 2 — графики коэффициентов при а = 0, когда момент окончания управ ления равновероятен в интервале [0, 10 ] с.
Графики коэффициентов kn (t), k12 (t), k12 (t) при
для тех же условий, при которых построены графики рис. 40, представлены на рис. 41.
Изучение представленных на рис. 42—47 результатов показывает существен ную зависимость оптимального управления от априорных данных о моменте окон чания управления.
7. Оптимальное по быстродействию управление линейным объектом при точном измерении фазовых координат
Рассмотрим управление линейным объектом, который описы вается уравнением (361), с точки зрения оптимально быстрого до стижения некоторой заданной цели. К условиям, наложенным на объект, следует добавить, что вектор управления и принимает значения из некоторой замкнутой области V . В отличие от детер минированной задачи оптимального быстродействия, где конеч ной целью является достижение некоторой заданной области в фазовом пространстве объекта, в стохастической задаче опти мального быстродействия возможны следующие два варианта.
183
Во-первых, можно говорить о минимальном интервале вре мени, за которое априорное математическое ожидание заданной функции фазовых координат объекта достигнет заданной величины. Например, требуется выбрать управление и таким, чтобы за мини мальный интервал времени.
T = t k — t |
(438) |
перевести объект из состояния х, занимаемого в момент t и харак теризуемого неравенством
X* (О А (t) X (t) > Сх ( і ), |
(439) |
в состояние х (tk), которое описывается равенством
" ' |
M t {X * (4) л (4) X (4)} = с, (4), |
(440) |
где Л (t) —■симметричная положительно определенная матрица размерности [п, я]; С (t) — заданная функция времени.
Во вторых, можно говорить о минимуме математического ожи дания времени, за которое фазовые координаты объекта достигнут некоторой заданной области. При этом, если рассматривать ва риант, аналогичный только что описанному, то .необходимо вы брать управление и таким, чтобы априорное математическое ожи дание времени
T = M t {T\, |
(441) |
за которое объект из состояния х, характеризуемого неравенством (439), достигнет состояния х (4), описываемого равенством
|
X * (4) л (4) X (4) - с (4), |
(442) |
было минимальным. |
|
|
: |
В. Н. Новосельцевым 1 было высказано предположение о том, |
|
что |
минимальный интервал, определяемый в первом варианте, и |
минимум математического, ожидания времени, вычисляемый во втором варианте, совпадают. Доказательство этого факта было бы весьма желательно, так как это дает определенные преимущества при решении этих задач. Однако уравнения Веллмана, записанные
для Т и Т, оказываются разными. Рассмотрим этот вопрос более подробно.
Решение задачи, определенной условиями (438)—(440), тесно связано с решением задачи минимизации математического ожида ния от квадратичной формы (440) в фиксированный момент 4>
когда требуется обеспечить |
|
min M t \х* (4) Л (4) X (4)). |
(443) |
«■£ и |
|
1 Новосельцев В. Н. «Оптимальные по быстродействию системы управления при наличии случайных помех». Труды ИФАК, II конгресс, т. 2, М., «Наука», 1965.
184
Введя функцию Веллмана |
|
|
||||
W (х, |
t\ 4) |
= |
min M t \x* (tk) Л (4) X (tk)\Xit\, |
(4 4 4 ) |
||
|
|
|
|
“€ и |
|
|
запишем уравнение (363) в следующем виде: |
|
|||||
а г |
|
— |
fair |
|
, Ви)+ 1 t r rGQG; d2W |
(445) |
|
= min{^ (At- |
д х д х * |
||||
|
|
и £ С/ |
|
|
/ |
с конечным условием: W = х* Л х при 2 = 4-
Очевидно, что время оптимального быстродействия будет
найдено, |
если |
из наименьшего tk, определяемого |
из уравнения |
|||
|
|
W (х, 4 4 ) |
С (4), - |
~ |
(446) |
|
вычесть текущий момент |
4 |
|
|
|
||
|
|
т |
= 4 (X, t) — 4 |
|
(447) |
|
что проиллюстрировано на рис. 42. |
управление |
uk (х, |
4 4)> |
|||
При |
таком |
подходе |
оптимальное |
найденное по критерию (443) при замене параметра 4 на значение, полученное из уравнения (446), дает решение задачи оптималь
ного стохастического |
быстродействия |
первого |
типа: |
и (х, |
t) =-ик[х, 4 |
tk (x, 4]. |
(448) |
Чтобы записать уравнение Веллмана для времени Т, заметим,
что
|
|
|
дТ _ dtk_ |
1. |
дТ __ dtk |
|
|||
|
|
|
dt |
dt |
’ |
дх |
âx |
|
|
Функция |
4 |
задается |
неявным |
образом |
уравнением (446). |
||||
Введем для удобства функцию |
|
|
|
|
|||||
|
|
W4 ( X , 4 4) |
= |
W ( X , |
4 4) - |
С (4) |
|||
и разделим |
уравнение (445) на производную |
dWj, |
|||||||
dtk |
|||||||||
Учитывая, |
что |
|
|
|
|
|
|||
|
|
dW |
|
|
|||||
|
dW |
|
|
|
|
||||
дТ_ |
дх* |
дТ |
|
dt |
|
|
|||
д х |
d W i ’ |
d t + 1 |
|
dWj_’ |
|
||||
|
dtk |
|
|
dtk |
|
|
запишем уравнение |
|
|
|
|||
— 1 |
дТ |
min dT_ |
{Ax -f- Ви) -f- |
|||
|
"dt |
uet; |
д х * |
|
|
|
|
|
|
|
d2W |
|
|
+ ~ t r |
GQG* |
д х д х * |
(449) |
|||
ÖW± |
||||||
|
|
|
|
|||
|
|
|
dtk |
|
||
с граничным |
условием |
Т = 0, если |
||||
X * Л X = С {t). |
|
|
|
|
Рис. 42. Определение ми нимального времени, при котором априорное мате матическое ожидание до стигает заданной величины
185
Соотношение (449) не имеет вид замкнутого уравнения для Т, так как матрица
d2W
дх дх*
^~ dwi
dtk
д2Т
не равна матрице j xdx*- Записью соотношения (449) ограничим
пока разбор задачи первого типа.
Для решения задачи второго типа, определенной условиями
(441), (442), введем величину |
|
Т (х, t) = min Л4, \Т \х, ,}, |
(450) |
ufZM |
|
дающую минимальное среднее время попадания в область (442) из точки X, занимаемой в момент t. Легко показать, что эта ве личина удовлетворяет уравнению
дТ_ |
= mm |
дТ |
(Ах -f- Ви) -(— |
tr GQG* |
д2Т |
(451) |
dt |
и£ С/ |
дх* |
|
|
дх дх* |
|
с граничным условием Т = 0, если х* А х = С (t).
Сравнивая соотношение (449) с уравнением (451), приходится
сделать вывод, что Г и Г не абсолютно идентичны. Однако оба уравнения одинаково определяют управление в» зависимости от
дТ и В. В частности, если допустимая область U задается нера
венствами I 1« 1, то из уравнений следует, что
|
|
|
и — —sign |
В, , |
(452) |
где sign относится к каждой компоненте вектора. |
|
||||
|
Однотипность функциональной |
зависимости управления от |
|||
, |
„ |
дТ |
дает возможность применить одинаковую |
процедуру |
|
функции |
|
получения решений в обоих случаях.
Рассмотрим последовательный процесс нахождения оптималь ного управления.
В том случае, когда управление определяется формулой (452), что представляет наиболее часто встречающийся случай, задача сводится к нахождению гиперплоскости переключения в фазовом пространстве объекта, описываемого уравнением (361). Эту задачу целесообразно решать методом последовательных приближений. За нулевое приближение к оптимальному решению примем гипер поверхность переключения соответствующей задачи оптимального
186