включающему уравнения объекта (498) и систему уравнений (501),, при условиях:
z. (0) = х9., |
i = n + |
\, |
n + 2, . . |
2n; |
Zj (T) = |
— 2Ax (tk), |
j = |
1,2, . . |
n. |
При этом
На основании формул (496), (497), получаем уравнения для:
оценки z (і) на основе наблюдения вектора
у = Cj_z + г|,
где
1° С
СіН|о о ’
в виде
= |
dz + |
bu + |
DClFT1 [у (0 — Схг]; |
(503)» |
|
zi (0) = |
х°г |
|
і = п + 1, |
п + 2, |
. . ., 2п\ |
|
|
г, (Т) = —2Ах (Т), / ' = 1 , 2 , . . ., п |
|
|
и |
|
|
|
|
|
|
|
|
= aD + D a — DC\R~lCiD + Qu |
|
|
где |
|
о |
|
|
|
|
|
|
Q i = |
0 |
D = |
|
|
|
|
0 Q |
^xxfixx |
|
|
|
|
|
|
|
|
|
В соответствии с принятыми обозначениями система (503)> |
|
может быть представлена в виде |
|
|
|
|
= _ л*ф + |
|
(// — Сху, |
(504) |
- |
|
|
Ф (Т) = - 2 А х ( Т ) ; |
J |
|
|
|
|
% = А х + |
Bu + |
D ^ R - 1 (у - |
Сху, |
(505) |
» |
|
|
|
X (0) = |
М [je0]. |
|
|
|
|
|
|
|
Прежде всего отметим, что решение задачи в виде |
|
|
ф (t) = —2W* (Г, |
0 Ах (Т), |
|
|
которое удовлетворяет уравнению (501), не может быть непосред ственно использовано для решения задачи, поскольку при этом необходимо в каждый момент времени вычислять конечное значе ние фазовой координаты х (Т) при оптимальном законе управления.
Поэтому нас интересует только физически осуществимое реше ние системы (504). Будем искать его в виде
ф (0 = —S (Т, t) lx (t) + В (01- |
(506) |
Подавляя выражения (506), (502) в формулу (504) и учитывая, что для решения (506)
Пцл SDXX
я используя уравнение (505), получим:
'dS |
+ ЯЛ + A*S [X -+- В] |
dt |
|
+ 5 |
— AB -4- BU sign BAp (t) = 0. |
Для произвольного значения x (t)
~+ SA + A*S = 0.
Конечное значение S (T, T) для этого уравнения определяется из сравнения выражения (506) и уравнения (504):
|
Отсюда |
5 |
(7, |
Т) |
= |
2Л. |
|
|
|
(Т, t) = |
2W* |
(Т, |
t) AW |
(Т , |
t). |
|
5 |
|
Пусть далее |
A t —-интервал |
времени, |
на |
А |
|
котором Б*ф (t) |
не меняет знака. Тогда, приравнивая второе слагаемое в уравне нии для В (t) нулю и решая дифференциальное уравнение относи
тельно В (t) при В (t + |
At) = |
0, получим: |
|
t+At |
|
|
|
В (t) = J |
W (t, |
т) BUdx sign В*ф (t). |
(507) |
Подставляя выражение (507) в формулу (506) и далее в фор мулу (502), получим:
t+At
0*ф (t) = — B*S (T , t) x{f)-\~. j W (t, х) В U dx sign B*ty(t)
( 508)
signß*op(^)=—sign B*S (T, t) X (t) -\~
t+At
-f } W (t, x) BU dx sign В*ф {t)
Отсюда следует, |
что при |
|
|
|
|
|
|
|
|
|
|
|
|
t+_M |
|
|
|
|
|
|
|
|
I B*S (7, t)lc (О I |
> |
|
J B*S (7, |
t) W (t, x) BU dx |
справедливо |
|
|
|
|
|
|
|
|
|
|
|
|
у |
sign В * \ (t) |
= |
—sign B*S |
(7 , |
|
t) x (f), |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
а при |
|
|
|
|
|
t+ht |
|
|
|
|
|
|
|
|
|
|
|
|
|
B*S (7, |
|
|
|
BU dx |
|
I B*S (T, t)x(t) | < |
|
J |
0 |
IT (f, г) |
справедливо |
|
|
|
|
|
|
|
|
|
|
|
|
|
sign B*ty = |
—sign B*S (T , |
t) X |
|
|
|
t+M |
|
|
|
|
|
|
|
|
|
|
|
X |
j |
W (t, |
x) BU dtsign В*ф (0- |
|
Отсюда следует, |
что |
|
|
|
|
|
|
|
|
|
|
п р и |
|
|
|
|
В *\із (0 |
= 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B*Q J |
W (t, |
т) |
BU dx > |
0 |
|
и согласно выражению |
(508) |
|
|
|
|
|
|
|
|
|
|
f+A# |
|
|
|
|
|
|
|
|
|
X (0 + |
j W (t, |
т) Bn |
(x) dx |
= 0. |
|
|
|
|
|
t |
|
|
|
|
|
|
|
|
|
Таким образом получаем, что при |
Af —>0 |
|
|
и (t) |
= — U (t) sign B*S (T, |
t) X (t); |
(509) |
при At = T — t, |
и (t) |
определяется |
выражением |
(509) при |
|
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
B*S (Т , |
t) x ( t ) \ > |
j B*S (7, |
t) W (t, t) |
BU dx |
и удовлетворяет условию
т
X (t) + \ W (t, т) Bu (т) dx = 0
при
ß*S(T, 0 X (0 I < j ß*S (7, t) W {t, X) BU dx
4. Задача оптимизации управления при изопериметрическом ограничении типа неравенства
В п. 1 гл. V были получены условия оптимальности в случае, когда управление и (t) принадлежит замкнутой области.
Рассмотрим некоторое обобщение этой задачи. Предположим, что управление и (t) должно минимизировать функционал
|
|
I = М [F [*(Т)]} |
(510) |
при условиях |
и (0 6 |
U и |
дополнительном изопериметрическом |
ограничении, |
выражаемом |
неравенством |
|
|
М |
J /о (х, |
и, |
t) dt |
< см |
(511) |
или |
|
U |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
J /о (х, |
и, |
t) dt |
< с, |
(512) |
где см и с — заданные постоянные. |
Математическое |
ожидание |
в формуле (511) берется по начальным условиям вектора фазовых координат х°, случайным возмущениям и ошибкам измерений.
Функция / 0 (х, и, t) предполагается дважды |
дифференцируемой |
по аргументам. |
координату |
х 0 (t) |
Вводя, как и в формуле (465), фазовую |
уравнением |
|
|
Хд = /о (X, U, І), Хд (0) = |
0, |
(513) |
преобразуем неравенства (511) и (512) к виду |
|
|
М [х0 (Т) ] < см\ |
|
(514) |
Хд (Т) < с. |
|
(515) |
Для учета этих ограничений в условиях оптимальности при меним метод перехода от замкнутой области изменения коорди наты Хд (Т), определяемой неравенствами (514) или (515), к откры
той области [96]. Для этого введем координату Хд и функцию
X [х0 (71)] такую, что при изменении хд в неограниченной области функция X обеспечивает выполнение условий (514) или (515)
при любых допустимых значениях хд (Т).
В частности, для ограничения (514) функция % определяется
условиями: |
|
|
|
М [Хд (Т)] |
и |
+- 0 при М [Хд(Г)] < см; |
X [х'о (О] = ' |
охп |
( 516) |
|
|
См и дхп |
0 |
при |
М [Хд(Г)] см |
в неограниченной области |
изменения |
х0 (Т). |