казан Калманом и Кепке [Л. 9-2] и впоследствии неза висимо получен Джозефом [Л. 9-3] и Гункелем [Л. 9-4].
Его обычно называют |
принципом разделения. |
Стрибел |
[Л. 9-5] распространил |
этот принцип на более |
общий |
класс задач. |
|
|
Наиболее важной особенностью принципа разделе ния является то, что матрица передачи обратной связи системы управления не зависит от всех статистических параметров задачи, в то время как оптимальный фильтр не зависит от вида матриц критерия качества управле ния.
Здесь показано только, что закон управления вида
u(k) — S(k)x(k\k) является необходимым условием ми нимальности критерия качества (9-3). Достаточность следует из рассмотрения частных производных по ком понентам вектора и от выражения
2Е[x'Iz*(N—j), |
x(0)]Q/WW |
+ 2и'(WW4 + B). |
Это исследование |
приводит |
к тем же условиям, что |
и для детерминированной задачи, а именно, к требова
нию, чтобы матрица |
|
|
|
|
[W(k+\, |
k)W(k + l)W(k+\, |
k)+B(k)] |
|
была |
положительно |
определена для |
всех é = 0, |
1, |
...,N-\. |
|
|
|
|
Пример 9-3. Рассмотрим стохастический вариант задачи |
из при |
мера |
9-1, где начальное |
состояние является |
гауссовским |
случай |
ным и-вектором с нулевым средним, возмущение системы отсутст вует и все переменные состояния можно измерить в присутствии
аддитивной |
гауссовской |
белой |
последовательности |
{^(ft-H); k=0, |
1, . . . , |
N—2} с |
нулевым |
средним |
и |
корреляционной матрицей |
R{k+l), |
положительно |
определенной |
для |
всех |
k. |
Тогда |
|
|
|
|
|
Г N |
|
|
|
|
|
|
|
|
|
|
JN |
= |
E |
S x' |
(i) |
A |
(і) |
x |
(О |
|
|
|
|
|
|
|
|
t=\ |
|
|
|
|
|
|
|
|
x (k -f- |
1) = |
Ф (k + |
1, |
k) x (ft) |
+ |
Ф (ft + |
1, ft) a (ft); |
|
|
|
z ( f t + l ) = |
X(ft + |
|
l ) |
+ |
D |
(ft+1). |
Из теоремы 9-3 и примера |
9-1 |
сл^ует, |
что |
|
|
a(fc) = |
S(ft)x(ft|ft) |
= — ф - 1 (k+ |
\,к)Ф(к+ |
|
l,ft)x(ft|ft). |
Подставляя этот результат в уравнение системы, получаем: x(ft + 1) = Ф ( / г + \,k)x{k) — 4>(k+ l,ft) 4F-'"'(ft +
+ 1, k) Ф (k -f- 1,fe)x {k I k) = Ф (k + 1,fe)x (k j k).
Поскольку возмущение системы отсутствует, x{k+l)=Sc(k+\\k),
поэтому ошибка системы в каждый момент времени равна ошибке предсказания на этот момент времени в отличие от детерминирован
ного |
случая, |
когда управление было |
точным |
и x(ft+l)=0 при |
ft=0, |
1, ... , |
—1. Для стохастической |
задачи управление настоль |
ко «хорошо», насколько точно предсказание. |
|
Оптимальный фильтр в системе управления подчиняется соот |
ношению |
|
|
|
х (ft | ft)= |
ф (ft, ft— 1) x(k — 1 \k — I) + Ф (ft, ft— 1) и (ft — 1) -f- |
|
+ |
К (ft) [z (ft) — Ф (ft, ft— 1) x (ft — 1 |
I ft— 1) — |
|
|
— 4/(ft, ft — l)«(ft |
— I)]. |
|
Поскольку и (ft — 1) = — >P-1 (ft, ft —1) Ф (ft, ft — 1) x (ft— 1 I ft—1),
это соотношение |
сводится к равенству |
|
|
|
|
|
x{k\k) |
= |
K{k)z{k). |
|
Структурная |
схема |
полной системы |
управления приведена на |
рис. 9-5. |
|
|
|
|
|
|
|
Из теоремы 5-5 имеем: |
|
|
|
|
|
P(fc|ft—1)=ф(/г, |
ft_l)P(ft_l|ft_i)0'(fti |
k—l); |
|
K(k) =P(k\k—\) |
{P{k\k—\) |
+/?(*)]-«; |
|
|
P(k\k)={I—K{k)\P(k\k—\) |
|
|
для ft=l, |
2, |
N—\, |
причем |
матрица P(0 [0) =E |
[x(0)x'(Q)] пред |
полагается |
известной. |
|
|
|
|
|
>и(к)
Рис. 9-5. Оптимальная система управления из примера 9-3.
Взаключение рассмотрим вычисление критерия качества. Из
примера 9-1 и уравнения |
(9-51) |
имеем |
|
W(k)=À(k) |
и |
|
|
|
|
|
M(k) = |
W(k)—A(k)=0. |
|
|
|
|
Следовательно, уравнение |
(9-84) |
сводится |
к равенству |
|
|
|
|
|
VN-k = a(k). |
|
|
|
|
|
Подставляя |
в уравнение (9-85) выражения |
для W(ft+1) |
и S (ft) |
и учитывая, |
что возмущение |
системы отсутствует, |
для |
k—N—1, |
N—S, ... , 0 имеем: |
|
|
|
|
|
|
|
|
|
a (ft) = |
а (ft + 1) -f Е [&' (ft I ft)Ф> (ft + |
1, ft) A (ft - f 1) |
X |
|
X Ф (ft+ l . f e ) * - ' (ft+ |
1 , £ ) Ф ( 6 + |
1 ,k)x |
[k\k)\ = a ( f t + |
1) |
+ |
|
+ |
E[r'(k+ |
1 I ft)Л (ft+ |
I) x (ft+ |
I [ft)] |
= |
|
|
|
= |
a (ft + 1 ) + Sp [A (ft + |
1 ) P (ft + 1 I *)], |
|
|
для k=N~\, |
N—2, |
О, где x(k+1 \k) =Ф(к+1, |
k)x(k\k) — ошиб- |
ка |
предсказания, а граничное |
условие имеет |
-вид |
a(N)=Q. |
|
|
Последовательно |
применяя последнее |
соотношение, |
приходим |
к |
результату |
|
N |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
«(0) = 2 |
Sp [A (І)Р(І |
I / - 1 ) 1 |
|
и получаем оптимальное значение критерия качества для N шагов |
управления |
|
|
|
|
|
|
ь |
, |
|
|
|
|
|
Ѵ'*=,а(0). |
|
|
|
|
|
Пример 9-4. В качестве |
частного численного |
примера |
рассмот |
рим стохастический вариант примера 9-2, в котором |
|
|
|
x (k + |
1) = |
x (k) -f- w (k) + |
2a (k); |
|
|
|
z(k+l) |
= |
x(k+l)+v{k+l); |
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
J3 |
= E ï ! |
( 3 ) T S « ! ( i - l ) |
|
|
|
|
|
|
|
i=\ |
|
|
|
|
|
Здесь |
рассматривается трехшаговая |
задача стохастического ли |
нейного регулятора по конечной ошибке плюс управляющее усилие.
Предположим, |
что последовательность {w(k), |
k=0, |
1, |
2} — |
гауссовская белая |
с нулевым средним и постоянной |
дисперсией |
Q(k) =E[w2(k)]=25. |
Последовательность {v(k+l), |
k=0, 1, 2} |
также |
является гауссовской белой, с нулевым средним и постоянной дис
|
|
|
|
|
|
|
|
|
|
персией i/?(£-f 1) =Е [v2(k+1)]= |
|
15, причем эти две случайные по |
следовательности |
независимы. |
|
Заметим, что |
хотя |
измерение |
в мо |
мент k=3 |
позволяет |
получить |
оптимальную |
оценку |
конечного со |
стояния, |
ее нельзя использовать для управления системой, посколь |
ку процесс в это время |
заканчивается. |
|
|
|
|
Предположим, |
что х(0) |
является гауссовской |
случайной |
вели |
чиной с нулевым средним и |
дисперсией Р(0) =Е[хг\0)]= |
100, |
неза |
висимой от обеих |
гауссовских |
белых последовательностей. |
|
Используя теорему 9-3, определим отдельно коэффициенты пере дачи оптимального фильтра и обратной связи системы управления. Фильтр в данном случае совпадает с фильтром из примера 5-4 с добавлением входного сигнала управления. Следовательно, урав нение фильтра теперь имеет вид:
|
x (k I k) = x (k — 11 k — 1) + 2a (k — 1) + К (k) [z (k) — |
|
— x(k—\ |
\ k— 1) — 2u{k— 1)], |
где |
|
|
|
u{k—\) = |
S{k—\)x(k—\\k—\) |
для k= |
1,2,3, причем x(0|0 ) = 0, a коэффициенты S (k—1) тре |
буется |
определить. |
|
В соответствие с табл. 6-1 получаем характеристики оптималь ного фильтра, приведенные в табл. 9-2.
|
|
|
|
|
Т а б л и ц а 9-2 |
|
k |
P(k\k — |
l ) |
P(k\k) |
|
|
0 |
|
|
|
100 |
|
|
1 |
|
125 ' |
0,893 |
13,40 |
|
|
2 |
|
38,4 |
0,720 |
10,80 |
|
|
3 |
|
35,8 |
0,704 |
10,57 |
|
|
ЯсноГ что |
фильтр |
нужен |
только для |
определения |
х(1 | 1) и |
х(2 |
I 2), поскольку лГ(0|0) = 0, а х (3 | 3) не используется |
при уп |
равлении. |
|
|
|
|
|
|
Обращаясь |
к вычислению |
коэффициента |
передачи обратной свя |
зи |
системы управления, |
получим задачу из примера 9-2 при ß = 1 /4 |
иN=3. Из табл. 9-1 можно получить табл. 9-3.
Та б л и ц а 9-3
k |
S (к) |
W(k) |
3 |
|
1 |
2 |
—0,400 |
0,200 |
1 |
—0,222 |
0,111 |
0 |
—0,154 |
0,077 |
Оптимальное управление на каждом шаге имеет вид:
и ( 0 ) = — 0,154х(0 I 0) = 0, так как х (0 | 0) = 0;
и(1) = — 0,222х(1 I 1);
и (2) = — 0,400х(2 I 2).
Структурная схема системы управления изображена на рис. 9<6.
S(k) и(к)
« H БЗ
2 u(k-l) БЗ
Рис. 9-6. Оптимальная система управления из примера 9-4.
Теперь получим |
значение |
критерия |
качества. |
Из |
уравнения |
(9-84) для N=3 и k=0 |
имеем: |
|
|
|
|
|
|
|
|
Ѵз = Е[М(0)хЦ0)] |
+ а(0). |
|
|
(9-87) |
Согласно |
уравнению |
(9-51) |
M(0) = W(0)—A(0). |
В |
рассматри |
ваемом примере Л ( 0 ) = 0 |
и из |
табл. 9-3 |
следует, что W(0) =0,077. |
Поскольку £i[xz (0)] = P(0) = 100, получаем: |
|
|
|
|
|
|
|
Уз = 7,7+а(0) . |
|
|
|
|
Заметим, |
что для соответствующей |
детерминированной |
трехша- |
говой задачи |
Ѵз = 0,077 А-2 (0). |
|
|
|
|
|
|
Отметим также, что первое слагаемое в уравнении |
(9-87), зна |
чение которого составляет |
7,7, зависит |
от величины |
М(0), |
появляю |
щейся в критерии качества детерминированной задачи, и дисперсии начального состояния. Поэтому первое слагаемое можно интерпре тировать как составляющую Кз, вызываемую неопределенностью начального состояния. Слагаемое а(0) вызывается наличием воз
мущения системы |
и тем, что текущая оценка |
подвержена влиянию |
ошибок. |
|
|
|
|
|
|
|
|
|
|
|
Теперь |
определим |
а(0), |
последовательно |
применяя |
уравнение |
(9-85). Для рассматриваемого |
примера а(Л') =а(3 ) ==0; |
Г ( я + 1 , k) = |
= 1; |
Ф ( £ + 1 , |
k) = \ |
и Ч'"(£+1, k)=2. |
Поскольку здесь |
рассматрива |
ются |
только |
скаляры, |
уравнение |
(9-85) |
сведется |
к |
соотношению |
|
|
a(k)=a(k+l)+W(k+\)E[w?(k)}—2W(k+\)X |
|
|
|
|
|
XS(k)E[x*(k\k)} |
= a(k+\)+W(â+l) |
[25—2S(k)P(k\k)] |
(9-88) |
для |
k = 2, 1, 0, где использованы равенства |
|
|
|
|
|
|
|
|
£ [ а> 2 (*)] - <Э(й)=25 и |
E[x2(k\k)] = P(k\k). |
|
|
|
Подставляя в это соотношение данные из приведенных выше |
таблиц, получаем |
последовательность вида: а(2) =33,64, |
а(1) =39,83 |
и а(0) =46,02. Тогда Ѵ'з=7,7 + 46,02=53,72. |
|
|
|
|
|
|
Само |
по |
себе |
это |
число |
очень |
мало |
говорит |
о качестве систе |
мы. Разумеется, величина 53,72 является минимальным значением выбранного критерия качества, но что это дает? Ответ на этот во прос будет состоять из двух частей.
Во-первых, из уравнений |
(9-87) и (9-88) |
видно, что Ѵз |
состоит |
из трех слагаемых. Одно из |
них, а именно |
Е[М(0)х2(0)], |
вызвано |
неопределенностью начального состояния; другое связано с возму щением системы, а третье определяется ошибкой фильтрации. По
этому Ѵз можно разложить на слагаемые и определить |
«бюджет» |
качества. Проделав это, получим следующий результат: |
|
Слагаемые Ѵ3, |
вызванные: |
. . . |
7,7 |
неопределенностью начального состояния х(0) |
возмущением |
системы |
32,77 |
ошибкой фильтрации |
13,25 |
|
Итого |
53,72 |
Такой бюджет может иметь большое значение для системного |
анализа. В рассматриваемом случае наибольший |
вклад в Ѵз дает |
27-85 |
|
|
409 |