Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 161

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

3.3]

НЕИЗВЕСТНЫЕ АПРИОРНЫ Е РАСПРЕДЕЛЕНИЯ

77

 

 

jliw (А + 1 1А/) =

Mw (А| А/),

(3.3.23)

Yw (А +

1 1А/) =

Yw (А |ht) — Г

9«р\х (к j kf), Ус] "1_1' Т

9х (ft |fty)

%(A I kf),

 

 

 

 

 

 

 

 

 

 

 

(3.3.24)

 

Г V w + 1 1kf) Г т = r v w (А |kf) Г т ,

(3.3.25)

Sw (А +

1 1kf) = 5 W(А |kf) -

0,5 [Г\+ (A |k f) Г т ]-Х

 

 

 

ЭМ*- [x(ft| ft,), k]-'~u r

1(A|A4>T(A| kf) X

— 0 ,5 rV w (A |Ay) Г

 

 

 

 

9x (ft |kf)

 

 

 

 

 

dtp [x (ft |kf), ft]

 

 

(3.3.26)

 

 

X

r V w (A: |kf) Г т ,

 

 

9x (ft |kf)

 

 

 

 

 

Цу(A + 1 1kf) =

fiv (A|A;),

(3.3.27)

Yv(A +

1 j kf) =

Yv(A| Ay) +

\уг (к\к{){г{к + 1) — pv(A| kf) —

 

 

— h [x (k'-\- 1 1к/), к -f- 1]},

(3.3.28)

 

 

Vv (A +

l|A,) = Vv (A|A,),

(3.3.29)

Bv (A -j- 1 1kf)

- Bv (A |kf) -)- 0,5Vv (A |kf)

x

 

X {Z(k -f

1) — juiv (A| kf) — h [x(A +

1 ] kf), A +

1]} X

X {Z +

1) — Ду (A |kf) — h [x (A -f 1 1kf), к -j- 1]}т X

 

 

X Yv1(A |kf) -

0,5V;1(A |kf).

(3.3.30)

Для важного случая, когда шумы объекта и наблю­ дений коррелированы между собой, штрафная функция

(3.3.14)

принимает вид

 

 

 

 

 

J = 0,51х (А0) — цх (А0)

+

0,5 J w (А0) — p w (А0) ||y-i((Co)+

 

kr

i

 

 

 

 

 

 

+

0,5 2

{ | У (A) |]y-4ft) +

0,5 In [det Y (A)}},

(3.3.31)

где

k—k0

 

 

 

 

 

 

 

 

Г [w (ft + 1) -

 

(fc + 4)1

 

 

 

У (A) =

 

] ,

(3.3.32)

 

_z (ft -P 1) — h [x (ft + 1), ft +

 

1]

 

 

Y (ft) =

r v w (fc +

i ) r T

r v w v (ft +

i)

(3.3.33)

 

vvw (ft + 1) rT

Vy(ft+ 1)

 

 

 

 


78 ФУНКЦИИ Ш ТРАФА В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ (ХЛ. Й

Эта функция штрафа максимизируется при ограничениях

X + 1) = Ф [х (к), к] + Fw (к),

Pw Д- 1) = M-w {к),

(3.3.34)

1Чу (к +

1) =

fiv (k),

 

Y (* +

!) =

Y (к).

 

Используя теорию оптимизации, теми же методами, что и раньше, можно получить ДТКЗ. В общем случае формулы оказываются слишком громоздкими и поэтому здесь не приводятся. Для любой конкретной задачи фор­ мулировка ДТКЗ оказывается не представляющим прин­ ципиальных трудностей, но, возможно, и очень утомитель­ ным упражнением. Несколько примеров будет приведено в следующих четырех главах, где рассматриваются вы­ числительные методы, использующие эту ДТКЗ.

Пример 3.3.1. Рассмотрим простую систему с извест­ ным гауссовским начальным распределением

х -1- 1) = х {к),

в которой скалярный наблюдаемый сигнал искажен гаус­ совским белым шумом с нулевым средним и неизвестной дисперсией

z (к) = Н (к) х (к) -f- v (к), к = 1, 2, . . ., kf.

Другими словами, в этом примере речь идет о задаче оценки значения постоянного сигнала в присутствии адди­ тивного белого шума с неизвестными средним значением и дисперсией. Мы хотим идентифицировать х и VB, мак­ симизируя плотность

Р [X {kf), Z {к,) |VB] = p [Z {kf) |X {kf), Vv] p [X {к{) |ТД1.

Очевидно, что

<E{z (к) |x (к), Vv} =: H (/г) x (к),

xav{z(k)\x(k), Vv) = VB, var {x (k + 1) |x {k)} = 0,

3.3] НЕИЗВЕСТНЫЕ АПРИОРНЫ Е РАСПРЕДЕЛЕНИЯ 79

так что

 

 

p [X (k f),Z(kf)\Vv] =

 

_

1______

{— 0,51|х(0) ;.ixf - i ! X

~~ (2я)1/г (detVx)1/,:!

6ХР

kS

 

 

X П

-----тг-г - ехР (— ° ’5F^ [z (А) — Н (А) х (А)]2}.

Эквивалентная штрафная функция, подлежащая мини­ мизации, имеет вид

J = 0,51х (0) — цх f - i +

V X

kf

+ 0,5 2 Vv1 [z (к) — H (A) x (A)]2+ 0,5A, hi F„. fe=i

Для удобства допустим, что Vx = оо. Это эквивалентно предположению о полной априорной неопределенности относительно параметра х. Продифференцировав по каж­ дой из неизвестных величин х (к) и Vv и приравняв про­ изводные нулю, получаем

*/

! *1

х (kf I А,) = [ 2

Нт (к) Н (к)

2 н т (A) z (к),

 

kf

 

К (А/1kf) =

4 - 2 [2 (*) — H (A) x (A; I A/)]2.

 

/ J£T=1

 

Для этого чрезвычайно простого примера оценку х уда­

ется определить без знания Vv. Затем

оценка х (kf |kf)

используется для определения оценки

(А/ |Щ).

Желательно получить решение в

последовательной,

или рекуррентной, форме. Для рассматриваемого

простого примера

последовательностный алгоритм иден­

тификации можно

получить по индукции. Прежде всего

в соответствии с

(3.1.22) определим

 

к1

М (kf) = М (kf, 0) = 2 Ит (А) И (А)

К=1


80 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3

и затем отметим, что

k/-i

 

М (к,) = 2 Нт (/с) Н (к) +

R T(kf) Н (kf) =

й=1

 

 

= M(kf — 1) + НТ(А:/) Н (kf).

С помощью леммы об обращении матриц получим

М-1(kf) = М-1(kf - 1) -

М-1(kf - 1) Нт (kf) х

X [1 + Н (kf) М-Цк, - 1) Нт (А/)]-1Н (kt) М-1 (kf - 1).

Объединяя формулы для двух последовательных шагов

оценивания

fc,-i

 

X(kf |kf) = M 1

 

(kf)

2 н т (к) z (к),

 

 

=1

 

х (kf - 1 1kf - 1) = 1УГ1

 

Ч

 

(kf -

1)2

Нт (к) z (к),

 

 

ft=1

 

получим

х (kf |к/) = M 1(kf) M (kf — 1) x (kf 1 1kf — 1) -f-

+ M_1(kf) R r (kf) z (kf).

Снова воспользовавшись леммой об обращении для М'1(kf), окончательно получаем следующее соотношение, в котором опущен индекс / и используется сокращенное обозначение х (к) = х |к):

1 1УГ1 — 1) Нт {к)

х (к) = х — ) -f-

1 + Н (к) М-1 — 1) Нт (к)

X [2 (к) — Н (к) X — 1)].

Точно так же можно получить последовательностную фор­ му записи для оценки Vv (к). Именно,

(к) — Н (к) х — 1)Р 1

К {к ) = - r [ ( ft- 1) ^ ( fc- 1) + 1 + Я (/с) М-1 (/с — 1)НТ (&) J '

Эти два алгоритма идентификации, или оценивания, реа­ лизуются совместно с эффективным в вычислительном



3.3]

НЕИЗВЕСТНЫЕ АПРИОРНЫ Е РАСП РЕДЕЛЕНИ Я

81

отношении алгоритмом для М 1 (А):

 

М-* (А) = М-1 - 1) - М 1- 1) Нт (к) X

X[1 + Н (к) М-1 (А) Нт (А)]'1 Н (к) М"1 — 1).

Ксожалению, для более сложных задач, чем рассмот­ ренная нами, не удается получить решение в последо­ вательностной или даже непоследователыгостной форме

столь простым образом, как в данном случае. Например, если априорная дисперсия х конечна, оценка (непосле­ довательностная), дающая решение задачи сглаживания

для х, имеет

вид

 

 

к1

 

 

 

х (А, |kf) = Г 2

НТ(А) (к, |kf) Н (к)

 

л=1

 

Ч

 

 

 

 

 

X ГVxVx +

2

rT (ft) Vv1(А/1kf) z (A)

 

L

ь._,

 

и не может быть определена без предварительного нахож­

дения оценки V0 (kf |kf), в свою очередь зависящей от х (kf |kf). Возникающие здесь затруднения удается раз­ решить вычислительными методами, излагаемыми в сле­ дующих главах.

из

В заключение примера получим ДТКЗ, возникающую

задачи минимизации

/ . Итак, необходимо минимизи­

ровать

 

J =

0,51 х (0) — fixf _! +

0,5А^ In Vv (к) +

 

vx

 

Ч

+0,5 2 V ;1(ft)[z(A )-H (A )x(A )]*

К= 1

при ограничениях

х (А + 1) = х (к),

Vv(k + 1) = Vv(k).

Канонические уравнения в соответствии с (3.3.21) — (3.3.30) запишутся в виде

£ (А + 1 1kt) = х (к |kf),