Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 308

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

казан Калманом и Кепке [Л. 9-2] и впоследствии неза­ висимо получен Джозефом [Л. 9-3] и Гункелем [Л. 9-4].

Его обычно называют

принципом разделения.

Стрибел

[Л. 9-5] распространил

этот принцип на более

общий

класс задач.

 

 

Наиболее важной особенностью принципа разделе­ ния является то, что матрица передачи обратной связи системы управления не зависит от всех статистических параметров задачи, в то время как оптимальный фильтр не зависит от вида матриц критерия качества управле­ ния.

Здесь показано только, что закон управления вида

u(k) S(k)x(k\k) является необходимым условием ми­ нимальности критерия качества (9-3). Достаточность следует из рассмотрения частных производных по ком­ понентам вектора и от выражения

2Е[x'Iz*(N—j),

x(0)]Q/WW

+ 2и'(WW4 + B).

Это исследование

приводит

к тем же условиям, что

и для детерминированной задачи, а именно, к требова­

нию, чтобы матрица

 

 

 

 

[W(k+\,

k)W(k + l)W(k+\,

k)+B(k)]

 

была

положительно

определена для

всех é = 0,

1,

...,N-\.

 

 

 

 

Пример 9-3. Рассмотрим стохастический вариант задачи

из при­

мера

9-1, где начальное

состояние является

гауссовским

случай­

ным и-вектором с нулевым средним, возмущение системы отсутст­ вует и все переменные состояния можно измерить в присутствии

аддитивной

гауссовской

белой

последовательности

{^(ft-H); k=0,

1, . . . ,

N—2} с

нулевым

средним

и

корреляционной матрицей

R{k+l),

положительно

определенной

для

всех

k.

Тогда

 

 

 

 

 

Г N

 

 

 

 

 

 

 

 

 

 

JN

=

E

S x'

(i)

A

(і)

x

 

 

 

 

 

 

 

 

t=\

 

 

 

 

 

 

 

 

x (k -f-

1) =

Ф (k +

1,

k) x (ft)

+

Ф (ft +

1, ft) a (ft);

 

 

 

z ( f t + l ) =

X(ft +

 

l )

+

D

(ft+1).

Из теоремы 9-3 и примера

9-1

сл^ует,

что

 

 

a(fc) =

S(ft)x(ft|ft)

= ф - 1 (k+

\,к)Ф(к+

 

l,ft)x(ft|ft).

Подставляя этот результат в уравнение системы, получаем: x(ft + 1) = Ф ( / г + \,k)x{k) — 4>(k+ l,ft) 4F-'"'(ft +

+ 1, k) Ф (k -f- 1,fe)x {k I k) = Ф (k + 1,fe)x (k j k).

405


Поскольку возмущение системы отсутствует, x{k+l)=Sc(k+\\k),

поэтому ошибка системы в каждый момент времени равна ошибке предсказания на этот момент времени в отличие от детерминирован­

ного

случая,

когда управление было

точным

и x(ft+l)=0 при

ft=0,

1, ... ,

—1. Для стохастической

задачи управление настоль­

ко «хорошо», насколько точно предсказание.

 

Оптимальный фильтр в системе управления подчиняется соот­

ношению

 

 

 

х (ft | ft)=

ф (ft, ft— 1) x(k — 1 \k — I) + Ф (ft, ft— 1) и (ft — 1) -f-

 

+

К (ft) [z (ft) Ф (ft, ft— 1) x (ft — 1

I ft— 1) —

 

 

— 4/(ft, ft l)«(ft

I)].

 

Поскольку и (ft — 1) = — >P-1 (ft, ft —1) Ф (ft, ft — 1) x (ft— 1 I ft—1),

это соотношение

сводится к равенству

 

 

 

 

 

x{k\k)

=

K{k)z{k).

 

Структурная

схема

полной системы

управления приведена на

рис. 9-5.

 

 

 

 

 

 

 

Из теоремы 5-5 имеем:

 

 

 

 

 

P(fc|ft—1)=ф(/г,

ft_l)P(ft_l|ft_i)0'(fti

k—l);

 

K(k) =P(k\k—\)

{P{k\k—\)

+/?(*)]-«;

 

 

P(k\k)={I—K{k)\P(k\k—\)

 

 

для ft=l,

2,

N—\,

причем

матрица P(0 [0) =E

[x(0)x'(Q)] пред­

полагается

известной.

 

 

 

 

 

>и(к)

Рис. 9-5. Оптимальная система управления из примера 9-3.

Взаключение рассмотрим вычисление критерия качества. Из

примера 9-1 и уравнения

(9-51)

имеем

 

W(k)=À(k)

и

 

 

 

 

 

M(k) =

W(k)—A(k)=0.

 

 

 

 

Следовательно, уравнение

(9-84)

сводится

к равенству

 

 

 

 

 

VN-k = a(k).

 

 

 

 

 

Подставляя

в уравнение (9-85) выражения

для W(ft+1)

и S (ft)

и учитывая,

что возмущение

системы отсутствует,

для

k—N—1,

N—S, ... , 0 имеем:

 

 

 

 

 

 

 

 

 

a (ft) =

а (ft + 1) -f Е [&' (ft I ft)Ф> (ft +

1, ft) A (ft - f 1)

X

 

X Ф (ft+ l . f e ) * - ' (ft+

1 , £ ) Ф ( 6 +

1 ,k)x

[k\k)\ = a ( f t +

1)

+

 

+

E[r'(k+

1 I ft)Л (ft+

I) x (ft+

I [ft)]

=

 

 

 

=

a (ft + 1 ) + Sp [A (ft +

1 ) P (ft + 1 I *)],

 

 

406


для k=N~\,

N—2,

О, где x(k+1 \k) =Ф(к+1,

k)x(k\k) — ошиб-

ка

предсказания, а граничное

условие имеет

-вид

a(N)=Q.

 

 

Последовательно

применяя последнее

соотношение,

приходим

к

результату

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

«(0) = 2

Sp [A (І)Р(І

I / - 1 ) 1

 

и получаем оптимальное значение критерия качества для N шагов

управления

 

 

 

 

 

 

ь

,

 

 

 

 

 

Ѵ'*=,а(0).

 

 

 

 

 

Пример 9-4. В качестве

частного численного

примера

рассмот­

рим стохастический вариант примера 9-2, в котором

 

 

 

x (k +

1) =

x (k) -f- w (k) +

2a (k);

 

 

 

z(k+l)

=

x(k+l)+v{k+l);

 

 

 

 

 

 

 

3

 

 

 

 

 

 

J3

= E ï !

( 3 ) T S « ! ( i - l )

 

 

 

 

 

 

 

i=\

 

 

 

 

 

Здесь

рассматривается трехшаговая

задача стохастического ли­

нейного регулятора по конечной ошибке плюс управляющее усилие.

Предположим,

что последовательность {w(k),

k=0,

1,

2} —

гауссовская белая

с нулевым средним и постоянной

дисперсией

Q(k) =E[w2(k)]=25.

Последовательность {v(k+l),

k=0, 1, 2}

также

является гауссовской белой, с нулевым средним и постоянной дис­

персией i/?(£-f 1) =Е [v2(k+1)]=

 

15, причем эти две случайные по­

следовательности

независимы.

 

Заметим, что

хотя

измерение

в мо­

мент k=3

позволяет

получить

оптимальную

оценку

конечного со­

стояния,

ее нельзя использовать для управления системой, посколь­

ку процесс в это время

заканчивается.

 

 

 

 

Предположим,

что х(0)

является гауссовской

случайной

вели­

чиной с нулевым средним и

дисперсией Р(0) =Е[хг\0)]=

100,

неза­

висимой от обеих

гауссовских

белых последовательностей.

 

Используя теорему 9-3, определим отдельно коэффициенты пере­ дачи оптимального фильтра и обратной связи системы управления. Фильтр в данном случае совпадает с фильтром из примера 5-4 с добавлением входного сигнала управления. Следовательно, урав­ нение фильтра теперь имеет вид:

 

x (k I k) = x (k 11 k — 1) + 2a (k — 1) + К (k) [z (k) —

 

— x(k—\

\ k— 1) — 2u{k— 1)],

где

 

 

 

u{k—\) =

S{k—\)x(k—\\k—\)

для k=

1,2,3, причем x(0|0 ) = 0, a коэффициенты S (k—1) тре­

буется

определить.

 

В соответствие с табл. 6-1 получаем характеристики оптималь­ ного фильтра, приведенные в табл. 9-2.

407


 

 

 

 

 

Т а б л и ц а 9-2

 

k

P(k\k

l )

P(k\k)

 

 

0

 

 

 

100

 

 

1

 

125 '

0,893

13,40

 

 

2

 

38,4

0,720

10,80

 

 

3

 

35,8

0,704

10,57

 

 

ЯсноГ что

фильтр

нужен

только для

определения

х(1 | 1) и

х(2

I 2), поскольку лГ(0|0) = 0, а х (3 | 3) не используется

при уп­

равлении.

 

 

 

 

 

 

Обращаясь

к вычислению

коэффициента

передачи обратной свя­

зи

системы управления,

получим задачу из примера 9-2 при ß = 1 /4

иN=3. Из табл. 9-1 можно получить табл. 9-3.

Та б л и ц а 9-3

k

S (к)

W(k)

3

 

1

2

—0,400

0,200

1

—0,222

0,111

0

—0,154

0,077

Оптимальное управление на каждом шаге имеет вид:

и ( 0 ) = — 0,154х(0 I 0) = 0, так как х (0 | 0) = 0;

и(1) = — 0,222х(1 I 1);

и (2) = — 0,400х(2 I 2).

Структурная схема системы управления изображена на рис. 9<6.

S(k) и(к)

« H БЗ

2 u(k-l) БЗ

Рис. 9-6. Оптимальная система управления из примера 9-4.

408


Теперь получим

значение

критерия

качества.

Из

уравнения

(9-84) для N=3 и k=0

имеем:

 

 

 

 

 

 

 

 

Ѵз = Е[М(0)хЦ0)]

+ а(0).

 

 

(9-87)

Согласно

уравнению

(9-51)

M(0) = W(0)—A(0).

В

рассматри­

ваемом примере Л ( 0 ) = 0

и из

табл. 9-3

следует, что W(0) =0,077.

Поскольку £i[xz (0)] = P(0) = 100, получаем:

 

 

 

 

 

 

 

Уз = 7,7+а(0) .

 

 

 

 

Заметим,

что для соответствующей

детерминированной

трехша-

говой задачи

Ѵз = 0,077 А-2 (0).

 

 

 

 

 

 

Отметим также, что первое слагаемое в уравнении

(9-87), зна

чение которого составляет

7,7, зависит

от величины

М(0),

появляю­

щейся в критерии качества детерминированной задачи, и дисперсии начального состояния. Поэтому первое слагаемое можно интерпре­ тировать как составляющую Кз, вызываемую неопределенностью начального состояния. Слагаемое а(0) вызывается наличием воз­

мущения системы

и тем, что текущая оценка

подвержена влиянию

ошибок.

 

 

 

 

 

 

 

 

 

 

 

Теперь

определим

а(0),

последовательно

применяя

уравнение

(9-85). Для рассматриваемого

примера а(Л') =а(3 ) ==0;

Г ( я + 1 , k) =

= 1;

Ф ( £ + 1 ,

k) = \

и Ч'"(£+1, k)=2.

Поскольку здесь

рассматрива­

ются

только

скаляры,

уравнение

(9-85)

сведется

к

соотношению

 

 

a(k)=a(k+l)+W(k+\)E[w?(k)}—2W(k+\)X

 

 

 

 

 

XS(k)E[x*(k\k)}

= a(k+\)+W(â+l)

[25—2S(k)P(k\k)]

(9-88)

для

k = 2, 1, 0, где использованы равенства

 

 

 

 

 

 

 

 

£ [ а> 2 (*)] - <Э(й)=25 и

E[x2(k\k)] = P(k\k).

 

 

 

Подставляя в это соотношение данные из приведенных выше

таблиц, получаем

последовательность вида: а(2) =33,64,

а(1) =39,83

и а(0) =46,02. Тогда Ѵ'з=7,7 + 46,02=53,72.

 

 

 

 

 

 

Само

по

себе

это

число

очень

мало

говорит

о качестве систе­

мы. Разумеется, величина 53,72 является минимальным значением выбранного критерия качества, но что это дает? Ответ на этот во­ прос будет состоять из двух частей.

Во-первых, из уравнений

(9-87) и (9-88)

видно, что Ѵз

состоит

из трех слагаемых. Одно из

них, а именно

Е[М(0)х2(0)],

вызвано

неопределенностью начального состояния; другое связано с возму­ щением системы, а третье определяется ошибкой фильтрации. По­

этому Ѵз можно разложить на слагаемые и определить

«бюджет»

качества. Проделав это, получим следующий результат:

 

Слагаемые Ѵ3,

вызванные:

. . .

7,7

неопределенностью начального состояния х(0)

возмущением

системы

32,77

ошибкой фильтрации

13,25

 

Итого

53,72

Такой бюджет может иметь большое значение для системного

анализа. В рассматриваемом случае наибольший

вклад в Ѵз дает

27-85

 

 

409