|
|
a(N-j+l) |
|
= a(N-j4r2)4rE[w' |
|
|
|
(Л/ — / + 1 ) Х |
|
|
Х Г ' ( У Ѵ - / |
+ |
2, |
TV — / + |
І ) І Г ( Л / |
— / + |
2)Г(УѴ— / + 2, |
|
|
|
|
|
|
tf-/+l)t0(W-/-r-l) |
|
|
|
|
— |
|
|
|
|
|
-x' |
(N - |
j+lft |
|
- |
І+\)Ф' |
(N - |
j + |
2, |
Л |
/ _ / + |
і ) Х |
|
|
|
|
Х Г ( Л / - / + 2 ) Ч 7 ( Л / - / + 2, |
І Ѵ - / + 1 ) Х |
|
|
|
|
|
X 5 ( Л А - |
/ |
+ |
|
|
- |
/ + 1|ІѴ |
- |
/ |
+ |
1)1, |
|
( 9 - 7 6 ) |
где |
IF и M — симметрические |
матрицы |
размера |
|
пХп. |
|
|
|
j-шаговая |
|
задача |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В силу принципа оптимальности имеем: |
|
|
|
|
Vi = |
mm |
E[x'(N |
~ |
j+l)A(N |
|
— j+l)x(N |
|
- j + \ ) |
+ |
|
|
u(N-I) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ u ' ( N - |
j) B(N |
— j) и (N |
- |
j) + |
|
ѴІ_Л. |
|
|
|
|
|
Из уравнения |
( 9 - 7 4 ) следует, что |
|
|
|
|
|
|
|
|
|
|
|
|
E(Vj-i) |
= E [x1 (N-j |
+ l)M(N-j |
|
+ 1 ) X |
|
|
|
|
X x (N—j |
+ 1 ) ] + и' (N—j) |
В (N—j) |
и (N—j) |
+ a (N—j |
+ 1 ) . |
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V j = min E[x'(N-j+l)W(N-j+l)x(N-j+\) |
|
|
|
|
|
|
|
|
+ |
|
|
|
u(N-l) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ u ' ( N - |
|
j) B(N |
— j) и (N |
- |
j)] |
+ |
a |
(N |
- |
/ |
+ |
1), |
( 9 - 7 7 ) |
где |
|
№ (N—j +1 ) = M {N—j +l)+A |
(N—j + 1 ) . |
|
|
|
|
|
Согласно уравнению (9-1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x (N-j |
|
+ 1 ) = ф ( # — / + 1, N—j) |
x (N-j) |
+ |
|
|
+ Г ( # — N — j ) w ( N — j ) + 4 R ( N — j + ï , |
|
N—j) |
и |
|
(N—j). |
|
|
Подставляя |
последнее |
выражение |
в ( 9 - 7 7 ) |
и |
опуская |
ради простоты |
аргументы, |
получаем: |
|
|
|
|
|
|
|
|
Ѵ5 |
= min Е [(Фх + |
Yw + |
Щ |
'1Р(Фх + |
ГИУ + |
|
ЧГи) + |
u'ßu] |
+ |
|
|
+ |
a (N - |
j+ |
1) = |
m i n £ [х'Ф'ШФх+ |
|
х'Ф'Ѵ7Тт4- |
|
|
|
|
|
|
|
|
|
|
и |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
х'Ф'Ш Ш + |
ѵоТ'\РФх |
+ |
о»Т' Г Г Й У - fда'B W a |
+ |
|
|
|
4- |
и'ЧРЧРФх + |
ц'ЧГ'ИГГда4- и' (WWW |
+ |
ß) и] -f- а |
= |
|
= |
min £ [х'Ф'ГФх + 2л;'Ф' WYw + 2*'Ф W u - ^ w T ' H P T « |
+ |
|
|
|
\ |
+w'Y'WYw |
|
+ u'(W'WW + |
B)u] + |
a, |
|
|
( 9 , 7 8 ) |
где использована симметричность матрицы W.
За исключением замены А на W, сдвига в значениях аргументов и наличия известной постоянной а, не свя занной с операцией минимизации, уравнение (9-78) со впадает с уравнением (9-56) для одношаговой задачи. Поэтому, чтобы завершить решение, следует просто при менить процедуру, использованную выше.
Так как случайные векторы x(N—/) и w(N—/) ста тистически независимы, и последний имеет нулевое сред нее, второе слагаемое в правой части уравнения (9-78) обращается в нуль.
Управление |
и (N — /) = |
\uN_. [г*(N |
— /), |
х(0)\, |
а |
по |
скольку |
w(N |
— j) статистически |
не зависит |
от z (N— ;'), |
z (N — j — 1), ... , |
z(l), |
то |
четвертое |
слагаемое |
также |
обращается в нуль. В результате получим: |
|
|
|
Vi = |
min Е [х'Ф'ШФх |
+ |
2х' Ф'№Ч7и + |
w'r'Wfw |
+ |
|
|
и |
|
-\-u'(W'WW-\~B)u)^a. |
|
|
|
(9-79) |
|
|
|
|
|
|
Используя |
то |
обстоятельство, |
что |
ß |
(x) |
=Е |
[Е |
(х\у)\, |
имеем: |
|
|
|
|
|
|
|
|
|
|
|
Vô= |
min Е {Е [х'Ф'ЖФх |
+ 2х'Ф'ѴРУи + w'F'WVw |
+ |
|
и |
|
|
|
|
j), |
x (0)]} + а, |
|
|
|
+ и' (WWW + В) u\z* (N - |
|
|
где, как и ранее, можно минимизировать критерий ка чества, определяя управление и, минимизирующее зна чение внутреннего математического ожидания для всех
z*(N—j) |
и |
х(0). |
|
|
|
|
Заметим, что для внутреннего математического ожи |
дания |
|
|
|
|
|
|
E[2x^'WWu\z*(N |
- 1), |
x(0)} = |
2E[x'\z*(N - 1), |
|
|
|
* (0)] O'Wlu; |
|
|
Е[и' |
(WWW |
-\- B)u\z* (N - |
1), x(0)\ |
= |
u'(W'WWA-B)u. |
Следовательно, полагая равным нулю градиент по и от внутреннего математического ожидания, получаем:
2Е [x'\z*(N - j), х(0)) Ф'№97 + 2u'(W'WW - f В) = 0.
Транспонируя это выражение, решая полученное уравнение относительно и и вводя вновь аргументы,
имеем i |
|
|
|
|
|
|
|
|
|
|
|
|
u(N-j) |
= |
~ |
[V'(N |
- / + 1, |
N-j)W(N- |
|
/ + |
І ) Х |
N - |
/) W (N |
- |
/ + |
1 ) Ф (N - |
/ + |
1, N - |
/) E [x (N-j)\z* |
(N-^ |
-j), |
*(0)] = |
- [ < F ( t f - / + l , |
N - |
j)W |
(N |
- |
j+l)X |
ХЩМ-j+l, |
|
N-j)+B(N-j)YlxP'(N-j-Y\, |
|
|
|
|
N-j)X |
XW(N-j+l)<b(N-i+l, |
|
|
N-j)£(N |
- |
j\N |
- |
/)= |
|
|
|
= |
S(N |
— j) x(N |
- |
j\N |
- y); |
|
|
|
(9-80) |
Где |
огіределение |
матрицы |
S(N—/) |
совпадает с |
соответ |
ствующим определением для задачи детерминированно го линейного регулятора. Теперь сформулированный ра нее принцип разделения доказан в общем виде.
Вычисление V J V - J проводится так же, как и Vi. Под ставляя (9-80) в уравнение (9-79), повторяя все дейст вия, приводящие решение одношаговой задачи к урав нению (9-62) и используя обозначение
имеем: |
М = Ф' [W—WW (WWW |
+ |
|
В)~^^]Ф, |
|
|
|
|
|
|
|
|
|
|
— /) x(N- |
|
|
|
|
|
|
|
|
Vj = |
E [x' (N — i)M(N |
/)] |
+ |
|
|
-YE |
|
{x> (N - |
f\N - |
/) Ф' (N - |
j + |
1, |
N — j) W {N |
- |
j+ |
1) X |
X |
w (N- |
j + |
1, |
N - |
/) [W (N-j |
|
+ |
l, |
N- |
j)W(N- |
/ + 1 ) X |
XW(N-j+L |
|
N - |
j)-YB(N |
- |
DYW |
|
(N - |
j +1, |
|
|
N-j)X |
-Y |
XW{N-j+l)<£(N-j+Y |
|
|
|
|
|
|
j -Y |
N-j)x(N~j\N-j)-Y |
W (N - |
j) V {N—i+\, |
N - |
j)W (N - |
1 ) Г (N - |
/ + 1, |
Полагая |
|
N-j)w{N-j)} |
|
|
+ |
|
|
a(N-j+l). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a (N - |
/) = |
a (N ~ |
j + |
\) + |
E {x' (N - |
j\N |
- |
j) |
X |
|
|
|
ХФ'(іѴ-і+1, |
|
N-j)W(N- |
|
|
j - Y 1) W(N |
- |
/ |
+ |
1, |
N-j)[W'(N~ |
|
|
j-Yl, |
|
N-j)W(N |
|
- j-Y\)W(N~ |
|
j + \ t |
N - |
j) + |
B(N - |
j)Y^' |
(N — j ~Y\, |
N — j)W (N — j ~Y |
\)X |
|
X |
Ф (N |
- |
/ + |
1, |
N - |
j) x |
(N |
- |
j\N - |
j) + |
w'(N- |
j) X |
|
|
Xr>{N-j-YY |
|
|
N-j)W(N-j |
|
|
+ |
|
|
ï)T(N-i-YY |
можно записать: |
N-j)w(N-j)}, |
|
|
|
|
|
|
(9-81) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Vi = E [x'(N-j) |
M ( N—j) |
x (N-j) |
] + a (N—j). |
|
(9-82) |
Используя соотношение для S(N—/) |
можно |
преобра* |
зовать уравнение (9-81) |
к более |
простому виду |
|
а ( Л Г - / ) = * ( # - / + |
l)+E[w' |
(N-i) |
r'{N-j |
+ |
- f 1, W - /) W (N - / + 1 ) P (N - j - f 1, N - j) w (N - j) - - x' (N - / I N - j) Ф' (M - / - f - 1 , N - /) W (N - / - f
+ \)V(N-j+l,N~i)S(N-j)x'{N-j |
\N-j)]. |
|
(9-83) |
Проводя здесь такое же преобразование индексов времени, какое использовалось в § 9-2 для детермини рованной задачи, а именно, k = N—/, представим урав нение (9-80) в виде
u{k) = S (k) x {k I k)
для |
k = 0, |
1, |
|
N—1, |
где |
матрица |
S(k) |
определяется |
с использованием |
алгоритма |
теоремы |
9-2 |
или |
следст |
вия |
9-1. Уравнения |
(9-82) |
и (9-83) принимают вид |
|
и |
|
|
|
VN-h=E[x'(k)M(k)x(k)] |
|
|
+ a(k) |
|
(9-84) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a (k) = |
a {k - f 1) - f Е[w' |
(k) V'(k |
+ |
1, k)W(k |
+ |
1) X |
XD(A + |
1. k)w{k)~x'(k |
|
I &)Ф'(Н-1, |
|
|
k)W{k+l)X |
|
|
|
|
XW(k+\, |
k)S(k)x{k |
|
\ k)}, |
|
|
(9-85) |
где k — N—\, |
ІѴ—2, |
. . . , |
0, |
a |
M(k) |
и W (k) |
определяются |
с помощью теоремы 9-2 или следствия 9-1. |
|
|
|
|
Вычисление a(k) |
можно |
провести рекуррентно |
в об |
ратном |
времени, |
используя |
уравнение |
(9-85). |
Полагая |
в этом |
уравнении k = N—1 |
и сравнивая |
результат с урав |
нением (9-68) из одношаговой |
|
задачи, |
получаем, |
что |
граничное условие для этого уравнения |
имеет |
вид |
a(N)=0. |
|
Разумеется, |
вычисление |
a [k) |
необходимо |
только при определении значения критерия |
качества и |
его |
не |
нужно |
проводить |
|
при |
расчете |
оптимального |
управления. |
|
|
|
|
|
|
|
|
|
x(k) |
|
|
|
Оптимальная |
фильтрация |
состояния |
на |
каждом |
шаге |
должна |
учитывать |
тот |
|
факт, |
что |
управление |
S(k—\)x(k—\\k—1) |
|
является |
входным |
сигналом систе |
мы. |
Следовательно, |
формулы |
|
оптимального |
фильтра |
имеют вид: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x(k |
I k) = |
x(k |
I k — \) + |
K{k)[z{k)-H{k)x{k |
|
|
I k - 1)], |
ГДе
x(k I ft- 1) = Ф(к, ft- |
l)x(k- |
1 I ft — І) |
-f- |
+ T ( f t, |
ft-l)u(ft-1). |
(9-86) |
Заметим, что x(N \ N) определять не обязательно, поскольку последнее управление действует в момент
k = N — \. Равенство л;(0 | 0) = £ (0) подразумевает так же, что упрагление и (0) = S (0) .*(0 | 0) равно нулю, если х(0) имеет нулевое математическое ожидание.
Полная замкнутая автоматическая система теперь принимает вид, показанный на рис. 9-1. Подробная структурная схема системы управления показана на рис. 9-4.
Сформулируем результаты, полученные в настоящем параграфе, в виде следующей теоремы.
|
|
|
Оптимальный |
|
Mampuuajiepedanu |
|
|
|
|
обратной |
связи |
|
|
|
|
фильтр |
|
|
системы |
управ |
|
(к) |
^&=ЫК(к)\=&Ъ |
|
£(к\к) |
|
ления |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+4 |
|
|
|
|
|
|
|
|
|
х(к\к-1) |
|
|
|
|
|
|
|
|
|
|
|
|
БЗ |
|
|
|
|
|
|
|
|
|
х(к-і\к-1) |
|
|
|
|
|
к=/,2,...,Ы-> |
|
БЗ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
и(к-1) |
|
|
|
|
|
Рис. |
9-4. Оптимальная система |
управления. |
|
|
|
|
Теорема 9-3. Оптимальная |
система |
управления |
для |
задачи |
стохастического линейного |
регулятора |
состоит из |
оптимального |
линейного |
фильтра, |
соединенного |
последо |
вательно |
с оптимальным |
детерминированным |
|
линейным |
регулятором. |
Параметры |
этих |
двух |
частей |
системы |
управления |
определяются |
раздельно. Критерий |
качества |
полной |
системы управления |
описывается |
уравнениями |
(9-84) и (9-85), причем граничным |
условием |
для |
послед |
него уравнения |
является |
равенство |
a(N) |
= 0. |
|
|
|
Этот важный результат, позволяющий свести рас сматриваемую задачу к двум отдельным задачам опти мизации, решение которых известно, был впервые до-