имеют размеры пХп, пХр, пХг и тХп соответственно. Все они непрерывны по t. Начальное время /о фиксиро вано, точка обозначает производную по времени.
Случайные процессы {w(t), t^U) и {v(t), t^<t0}
представляют собой гауссовские белые шумы с нулевы ми математическими ожиданиями, причем
E[w(t)w'(x)] |
= |
Q(t)6(i-x); |
|
E[v{t)v'(x)]=*R(t)b(t-x); |
|
E[w(i)v'(x)] |
= 0, |
|
для всех t, x^to, где все обозначения были |
описаны |
ранее. |
|
|
|
Начальное состояние |
считается гауссовский |
случай |
ным вектором с нулевым средним и корреляционной матрицей E[x(t0)x (t0)] = P(t0), как и ранее, независи мым от обоих шумовых процессов.
Критерий качества
Задача заключается в отыскании такого сигнала управления u(*t), t^t 0 , чтобы система (10-1) действова ла некоторым желаемым образом. Иными словами, тре буется определить сигнал управления, минимизирующий критерий качества:
/ = E jx' (t,) Л x(tt) + г | \х' (0 A (t) x ( 0 + « ' (О В (t) и (t)] л | .
(10-3)
В уравнении (10-3) U>t0 является закрепленным конечным временем. Следовательно, как и в дискретном
|
|
|
|
случае, задача представляет |
собой задачу |
оптимизации |
с закрепленным временем. В уравнении |
(10-3) Л и |
A(t)—симметрические |
неотрицательно |
определенные |
матрицы размера пХп; |
B(t)—симметрическая |
положи |
тельно определенная матрица |
размера rXr; Е обозна |
чает операцию математического ожидания. Предпола гается, что матрицы A(t) и B(t) непрерывны для всех
Критерий (10-3) аналогичен критерию (9-3) для ди скретной задачи стохастического линейного регулятора. Он также квадратичный по состоянию и управлению, но место суммы в уравнении (9-3) занимает интеграл. Слагаемое x'(tі)Лх(іл) используется для того, чтобы
ввести в критерии качества в явном виде конечную
ошибку, в |
то |
время как интеграл |
учитывает |
ошиб |
ку системы |
и |
управляющее усилие |
на всем |
интер |
вале времени действия системы. Аналогия между урав нениями (10-3) и (9-3) станет более ясной из § 10-2. Однако сразу следует отметить важное различие между
этими уравнениями. В уравнении |
(9-3) |
требуется, чтобы |
матрица В(і—1); |
і = 1 , 2, |
N |
была |
неотрицательно |
определена, в то |
время |
как матрица |
B(t) |
£o=S^<^i |
в уравнении (10-3) должна быть положительно опреде ленной. Причина заключается в том, что алгоритм опти мального управления для непрерывной задачи требует, чтобы матрица B(t) была несингулярной для всех tŒ [t0, ti]. Это означает, что в непрерывной задаче недо
пустимы такие критерии качества, |
как |
/ = |
£ [ . * ' ( * , ) Л * ( * , ) ] ; |
J=E |
ч, |
|
fx' (t)A{t)x{t) |
dx |
или же любая их линейная комбинация, тогда как реше ние аналогичной дискретной задачи в некоторых слу чаях возможно.
Физически реализуемые |
управления |
Как и в дискретной задаче стохастического линей ного регулятора, здесь требуется, чтобы управления были реализуемы в смысле физической доступности све дений о состоянии системы. Поэтому назовем закон управления физически реализуемым, если он имеет вид:
|
M ( * ) = I I [ Z ( T ) , |
* о < т < г ; x(t0); |
t], |
(10-4) |
где (1 — r-мерная |
вектор-функция |
измерений |
{г(т), |
to^x^t}, |
математического |
ожидания |
начального |
состоя |
ния и текущего времени /. |
|
|
|
|
Теперь можно сформулировать непрерывную задачу |
стохастического линейного |
регулятора. |
|
|
Постановка |
задачи |
|
|
|
|
Определить |
физически |
реализуемый |
закон |
управ |
ления вида (10-4) |
для системы (10-1), |
(10-2) минимизи |
рующей |
критерий |
качества |
(10-3). |
|
|
|
Такое |
управление |
называется оптимальным |
управле |
нием. |
|
|
|
|
|
|
|
10-2. ЭКВИВАЛЕНТНАЯ ДИСКРЕТНАЯ З А Д А Ч А
Модель системы
Включая в модель с дискретным временем, введен ную в § 7-2 для задачи непрерывной оценки, аддитивное управляющее воздействие, получим требуемую модель (см. также § 4-3) :
x{t |
+ M)=0(t |
+ M, |
t)x{>t)+T(t |
|
+ At, t)w(t) + |
где |
|
+ X¥(t + At, t)u(t), |
|
|
(10-5) |
|
|
|
|
|
|
|
|
|
Oit |
+ At, |
t)=I |
+ F(t).te |
+ 0(AP); |
(10-6) |
|
T(t, + At, |
t) = G{t)At |
+ 0(AP); |
(10-7) |
|
W(t+At, |
t)=C(t)At |
+ 0(At2). |
(10-8) |
Здесь |
t обозначает |
дискретное |
время |
{t = to + jAt; |
/ = 0, 1 . . . } и At>0. |
Здесь, как |
и |
в |
гл. 7, |
переменная t |
будет использоваться для обозначения как дискретного, так и непрерывного времени; характер использования t будет ясен из контекста.
Потребуем, чтобы сигнал управления был кусочнопостоянным, и предположим, что интервал [t0, ti] разде
лен на N частей длины |
Ai, где |
N — положительное це |
лое число, |
а Д / = (ti—to)/N. |
|
|
В пределе при At—>-0 потребуем, чтобы |
N удовле |
творяло равенству |
ti—/о=const. |
|
|
NAt = |
|
Сигнал |
управления |
и способ |
разбиения |
интервала |
[h, ti] изображен на рис. 10-1. Заметим, что значения / ограничены числом N.
|
|
N-1 |
N |
\t„+At |
+ 2M |
t0+(N-l)àt |
. 2 |
t0 |
|
|
Рис. 10-1. Кусочно-постоянное управление и разбиение интервала управления.
Рис. 10-2. Представление критерия каче ства, включающего в себя конечную ошиб ку и интеграл от текущей ошибки системы.
Используя разбиение, изображенное на рис. 10-2, можно представить уравнение (10-10) в виде
В = Hm [x' (t0 + NM) Ax {t0 + NM +
дг->о
N |
|
|
+ И |
(t0 + ІМ) A (t0 - f ІМ) x (t0 + ІМ) М]. |
(10-11) |
(=i |
|
|
Теперь рассмотрим случайную величину |
|
|
t, |
|
|
Y = = | V (t)B(t)u(t)dt. |
(10-12) |
|
h |
|
Используя то же разбиение, что и ранее, но опре деляя значения u(t) по левым, а не правым граничным точкам интервалов разбиения (ср. рис. 10-Г и 10-2), пе репишем уравнение (10-12) в виде
|
N |
|
|
|
у = lim S К, + («'— *) Д'] ß ['о + (і |
- |
|
- |
1) Afl a [f0 + |
(« — 1)Д*]Д*. |
(Ю-13) |
Теперь из уравнений (10-3), |
(10-10) — (10-13) |
следует, |
что |
|
|
|
|
У = |
E (ß -f у) = E I lim Le' (t0 -f- NM) Ax (t0 + NAt) -f |
|
+ S JC' (f0 |
-f iAt) A {t0 + |
/Д0 x (t0 4- iM) M |
+ |
|
i=i |
|
|
|
+ |
£ a'[fa + |
( ( - l ) W ] ß [ ^ ( f - l ) A < ] u [ f 0 |
+ |