Файл: Методы оптимизации в статистических задачах управления..pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 21.10.2024
Просмотров: 88
Скачиваний: 0
быстродействия в детерминированном варианте (при отсутствии шума £ (t):
< 4 5 3 >
с граничным условием Т = 0, если х* А х = С (t).
Первое приближение к оптимальной гиперповерхности, полу чаемое как геометрическое место точек в фазовом пространстве х, дает решение уравнение
Ш в = ° . <«4>
в котором Т 0 определяется при использовании гиперповерхности переключения, полученной из решения задачи (453). Процесс последовательных приближений заканчивается в том случае, когда при решении уравнения
|
ШВ= О |
(456) |
получается (і + |
1)-ая гиперповерхность, которая совпадает (в пре |
|
делах заданной |
точности) с гиперповерхностью, |
найденной на |
предыдущем і-м шаге.
Определение функций Тt возможно только в отдельных точках фазового пространства х приближенными методами.
Для получения Tt при решении задачи первого типа необхо димо, чтобы математическое ожидание M t {х* А х} было непре рывным во времени. Поэтому целесообразно использовать метод статистической линеаризазции.
Применение метода статистической линеаризации показывает, что первого приближения достаточно для получения практически неразличающихся результатов. При этом решение детерминиро ванной задачи (453) целесообразно проводить аналитически, так как использование метода статистической линеаризации пред полагает задание нелинейностей в аналитической форме. Кроме этого, гиперповерхности переключения стохастической и детерми нированной задач сближаются при удалении от начала фазового пространства и отличаются, по существу, только в окрестности начала, где шумы оказывают значительное влияние. Поэтому при ближения к оптимальному решению сводятся к изменению гипер поверхности переключения детерминированной задачи в окрест ности начала координат.
При решении задачи второго типа необходимо определить математическое ожидание времени попадания в область. Произ водя статистическое моделирование уравнений (361) при законах управления, определяемых по следовательными приближениями, получаем математическое ожидание времени попадания, которое используем для нахождения следующего приближения.
Для иллюстрации предлагаемого метода решения указанных задач оптимального быстродействия рассмотрим пример.
187
\
Пример. Предположим, что объект управления описывается системой диф ференциальных уравнений:
х2 |
-П (0) х± |
Ru + |
(0) |
где I (t) = I l lt l 2 1 вектор белых шумов е известной матрицей интенсивностей
0,5 0,15
Q = 0,15 0,05
Требуется выбрать управление и таким, чтобы математическое ожидание
М+ Ь2
за минимальное время достигло единицы, т. е. С (t) = 1.
Задача второго типа сформулируется следующим образом: требуется выбрать управление и таким, чтобы минимизировать математическое ожидание времени
достижения области, ограниченной |
эллипсоидом: |
|
|||||
|
л-» |
|
л 2 |
L |
|
|
|
|
-^2-+ |
|
|
|
|||
Согласно предлагаемой методике |
решим |
предварительно соответствующую |
|||||
детерминированную задачу: |
|
|
|
|
|
|
|
|
. |
( дТ |
I |
дТ |
Ц ; |
||
= min |
— |
||||||
I и I < 1 I &Х1 Х2 + 'дх. |
|
||||||
Т — 0, |
если |
—5- |
|
Ь2 |
= |
1. |
|
|
|
|
а2 |
|
|
|
|
Управление и находится по формуле |
|
|
|
|
|||
и = |
— sign |
дТ |
|
|
|||
дхг ' |
|
|
|||||
Для решения уравнения Веллмана предварительно фиксируем управление. |
|||||||
Пусть и — — 1. Определим функцию |
Т |
из |
уравнения |
||||
дТ |
Хі' |
дТ |
Я = —1; |
||||
dXl |
дх, |
|
|
|
|
||
Т = 0, |
если |
и |
|
Х<2 |
|
1. |
|
-у - 4- -TJ- = |
|||||||
|
|
|
а2 |
|
о2 |
|
|
Необходимая характеристическая система запишется следующим образом:
dXl _ |
dx%— dT. |
х2 |
R |
Первые интегралы рассматриваемого уравнения следующие:
Xl + l R - Сі:
RT = С2.
188
Рис. 43. Фазовая плоскость с оптимальной линией переключения детерминированной задачи
Если хг и х2 лежат на эллипсе, то Т — 0. Воспользовавшись этим, запишем;
|
|
|
|
|
С2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
Ö3 |
|
|
ИЛИ |
|
|
|
|
|
|
|
|
|
|
|
а2 |
Т Г |
cfi |
/72 |
|
^2 |
2RC1 |
— 2R2 Ьг ± 2 R f |
R * ± . - 2 R ± - C 1 + a* |
|||
|
Подставляя в полученное выражение значения первых интегралов, получим |
||||||
функцию Т: |
|
|
|
|
|
||
Г= |
|
|
2Rxl |
а* |
R V- |
а* |
|
R |
R |
2R‘ |
|
ft2 + b2— 2Rxx• |
|||
на |
Для |
управления и = |
+ 1 находим |
Т по приведенной формуле, заменяя xt |
|||
—хг |
и х2 на |
—до |
определяют |
область |
в фазовом |
пространстве хѵ х2, |
|
|
полученные формулы |
характеризующуюся тем, что из нее без переключения знака управления можно оптимально быстро попасть в область, ограниченную эллипсом. Для а = Ь— = R = 1 эта область показана на рис. 43. Однако функция Т, полученная выше, не будет решением уравнения Веллмана во всей указанной области. Для этого должны выполняться условия:
дхдТ2 |
SaO для х2 0, |
||
дТ |
< |
для л:2^; 0. |
|
дх, |
|||
|
189
З н а к и р авен ств а в эт и х ф о р м у л а х о п р ед е л я ю т л и н и ю п ер ек л ю ч ен и я :
X sign хг; если | хх | |
а; |
0; если \х1 \<^а. |
|
Полученная линия переключения |
для |
конкретных значений параметров, |
показана на рис. 43. |
|
|
Запишем кратко уравнение линии |
переключения как |
|
£о (%. х2) = х2 + |
f (-Н) = 0, |
ауправление и определим формулой
и= — sign l 0 {xlt х2).
После того как детерминированная задача решена, необходимо проанализи |
|
|||||||||
ровать нелинейную систему (для |
дальнейшего |
примем R =* а = b = 1): |
|
|||||||
|
|
Х\ х2 + |
|
|
|
|
, |
* |
||
|
х2 = |
—sign |
(хѵ Х 2) |
+ l 2. |
|
|
||||
Для этого воспользуемся методом статистической линеаризации и запишем |
|
|||||||||
систему уравнений для математических |
ожиданий и дисперсий в виде: |
|
||||||||
|
|
|
т1 ~ |
|
|
|
|
|
|
|
|
тг = |
— М {sign іо |
(xlt х2)}; |
|
|
|||||
|
Du ~ 2D12 + |
Ѳп ; |
|
|
|
|||||
Ь 12 = D 22 + Ѳ12 — M {(xt — тх) sign Іо (хѵ х2)}\ |
|
|||||||||
b 22 = |
Ѳ22 — 2М {(х2 — т2) sign Іо (хг, |
х2)}; |
|
|||||||
|
|
ті (0) = |
х10; |
|
|
|
|
|||
|
|
т2 (0) = |
х20\ |
|
|
|
|
|||
Dn (0) = 0; |
D 12 (0) = |
0; |
D 22 (0) = |
0. |
|
|||||
Написанную систему следует решать до тех пор, пока сумма т\ + Dn + |
|
|||||||||
2 |
равной |
единице. |
Фиксация |
этого момента определяет |
|
|||||
+ m2 + D 22 не станет |
» |
|||||||||
функцию Т для начальных условий и составляет цель решения уравнений. Наи- |
||||||||||
более сложным моментом при решении уравнений является вычисление математи |
|
|||||||||
ческих ожиданий от нелинейных |
функций многих переменных: |
|
||||||||
Ф = |
М {signio |
[(*? + |
mx), |
(*2 + |
m2)]}; |
|
||||
ф = |
M {XJ sign |
jx® + |
tn2 -f- f0 (xj + |
ml)] } • |
|
190
Опустив промежуточные выкладки, запишем выражения для вычисления функций ф и ф:
+ С О
|
V 2л |
|
|
D, |
+ Щ |
|
VD, |
|
|
||
|
|
ѴЩГі |
1”‘а |
|
Ѵ2Щ |
|
|
||||
+ |
1^2 I О I /о ( щ + |
Ѵ ' Ѵ D j i ) | |
exp |
— - t - |
dp; |
|
|||||
|
__ |
-f-a |
|
|
w(n) |
|
|
|
|
|
|
ф: |
Vè i'HF |
|
|
exp — F-. du, |
|
||||||
V |
2 \ D I |
|
|||||||||
где |
|
|
|
D, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F (x) = — |
[ exp — t2 dt-, |
|
|
|
||||||
|
|
|
л |
J |
|
|
|
|
|
|
|
|
(X |
D |
|
|
|
|
|
|
|
|
|
|
V \D \ |
12 |
|
|
|
|
|
|
|
|
|
|
|
Dn |
|
|
|
|
|
|
|
|
|
Известно, что |
|
|
|
|
|
|
|
|
|
|
|
M jx20 sign g0 [(х° + |
^ ) , |
(ж® + |
т г)] |
— D 22 |
+ |
Dn |
1 |
||||
|
|
|
0ф |
|
|
&p |
|
|
|
|
|
|
^ ~ ° 12 dm |
u " ~Ш[- |
|
|
|
||||||
Производную |
дер вычислим |
непосредственно: |
|
|
|
||||||
<3ф |
|
|
|
|
1 |
|
V |
|
|
|
dp., |
д т 2 |
|
ехр7 Т |
|
2Щ |
|
||||||
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
Ѳ „ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
а дер определим по формуле |
|
|
|
|
|
|
|
|
|
||
|
дер |
_ |
1 |
ф - D |
* |
|
|
|
|
||
|
дтх |
Dn |
|
|
|
|
|||||
|
|
12 дтч |
|
|
|
|
|||||
Таким образом, окончательно получим систему уравнений, пригодную для |
|||||||||||
моделирования на цифровой машине: |
|
|
|
|
|
|
|
|
|||
|
|
|
ті ~ т2< |
|
|
|
|
|
|
||
|
|
|
т2 = |
—ф; |
|
|
|
|
|
|
|
|
|
D n |
= 2£)12 + Ѳц ; |
|
|
|
|
||||
|
‘ DX2 ~ |
F)2 2 |
Ф “Ь 012» |
|
|
|
|
||||
|
0 2 2 - 0 2 2 |
|
|
2 ^ D ~ d m t ’ |
|
|
|||||
|
Щ (0) = |
x10; |
|
m2 (0) = |
x20; |
|
|
||||
|
D u (0) = |
0; D ia (0) = 0; |
D 22 (0) = 0. |
|
|
191