Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 169

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

3.2] МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ 61

где и (£) — винеровский процесс. Точно так же соотно­ шения (3.1.9) — (3.1.13) следует, вообще говоря, полу­ чить строгим образом с помощью стохастического анализа (Сейдж и Мелса [127]). Сделанное замечание относится и к другим предельным переходам, встречающимся в дан­ ной главе.

Будем обозначать последовательности х (к0), х(/с1),

. . ., х (kf) и z (kj), z (к2),

. . ., z (kf) соответственно через

X (kf)

и Z (kf). Аналогично непрерывные реализации х (t)

и z (<) на отрезке U0, tf] обозначаются через X

(tf) и Z (tf).

Через

р [X (kf) |Z (kf)]

и р [X (tf) |Z (£/)]

обозначим

условные плотности вероятности X относительно резуль­ татов измерений Z. В дальнейшем предполагается, что плотности р (к0)) и р [х (t0)] известны и являются нор­ мальными со средним рХо и ковариационной матрицей VXo.

Наилучшая оценка обобщенного вектора состояния х на рассматриваемом интервале времени зависит, вообще говоря, от критерия, используемого для определения наи­ лучшей оценки. В данном случае под «наилучшей оценкой» понимается оценка, определяемая путем максимизации по X условной плотности р [X |Z] на всем интервале наблюдений. Получающаяся оценка известна под назва­ нием байесовской максимально правдоподобной или оцен­ ки максимума апостериорной вероятности (Сейдж [116], Сейдж и Мелса [12 7]). В дальнейшем все выкладки будут проводиться для дискретного случая, а для непрерывного случая мы ограничимся лишь формулировкой оконча­

тельных результатов.

Байеса к р [Х(А^) |Z (kf)], по­

Применяя

формулу

лучим

 

р [г (kf) \ x ( k f) ] P [ X ( k l)]

 

Р [X (kf) |Z (&/)]

(3.2.15)

р[Ъ (kf)]

 

 

 

Из (3.2.2)

ясно, что

при известном х (к)

плотность

р [ъ (к) |х(&)]

является гауссовской, поскольку v (к) — га­

уссовская величина. Поэтому при данном X

(к})

p[Z(kf)\X(kf)) =

exp { — §■(* (* )-h [x (к), /с])Т V;1 (k)(z(k) — h[x(k), /с])|

(2л)й/2(let [Vy (*)]V«

(3.2.16)


62 ФУН КЦИ И Ш ТРАФА В ЗАД АЧ АХ ИДЕНТИФИКАЦИИ [ГЛ . 3

Используя определение условной вероятности

р[о,Р1=р[а|Р]р[Р],

(3.2.17)

можно записать

Р[X (&/)] = р [х (&,)' X (kf — 1)] р (kf — 1) |X (kf — 2)]...

•••Р (hi) |х (&0)] р [х (&„)]. (3.2.18)

Так как w (к) — гауссовская марковская последователь­ ность, то последовательность х (к) также является мар­ ковской и

Р[х(& /)|Х(/с,— 1)] = p[x(kf)\x(kf — 1)]. (3.2.19)

Следовательно, р [Х(/с/)1 образована из гауссовских ком­ понент

ft/

Р [X (kf)] = р [х (А0)] П Р (к) (к — 4)1 (3.2.20) /С—

(где р (к) — 1)] — гауссовские плотности) и, со­ гласно (3.2.1), имеет среднее значение <р [х — 1), к — 1] и ковариационную матрицу

Г [х - 1), к — 1] Vw (к - 1) Гт [х — 1), к - 11.

р [Z (&/)] не зависит от х (к), и Z (к/) является известной величиной в процессе максимизации, который мы должны провести. Поэтому р [Z (к/)] можно рассматривать по от­ ношению к этой максимизации как нормировочную кон­ станту. После простых преобразований (3.2.15) в обозна­ чениях (3.2.16) и (3.2.20) можно переписать как

Р [X (kf) |Z (kf)] =

*/

kf

2 l!x (*) — cp [ж(A: — 1),/с— l]||n-i(^D —

ft=fco+l

- 4 - и * 0) + м & о ) г у-х }, (3-2-21)

3.21

 

МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ

63

где

предполагается *),

что А не зависит

от х (к)

и

 

 

 

Q (А) = Г [х (к), к] Vw (к) Гт [х (к), к].

(3.2.22)

Отсюда

ясно, что максимизация (3.2.21) относительно

X (kf)

эквивалентна

минимизации

 

 

 

J = -g -1х (/с°) “ Р* (*о) ty-i +

 

 

 

 

 

 

 

kf-i

 

 

 

 

 

 

+ 4 " S H * + l ) - h [ x ( A + l ) , A + l ] f х

+

 

 

Z

k=/C„

 

 

 

^

y v '(,c+1)

 

 

 

 

 

+ i

2

iw (* )f w

(3.2.23)

 

 

 

 

 

 

fe=/f0

W

 

Аналогично

максимизация

p[X(ify)

|Z (i/)]

эквива­

лентна

минимизации

 

 

 

 

 

/ ' =

4

- l * ( f o ) - | * * (to) fv- x +

 

 

 

 

 

 

4

 

 

VXo

 

 

 

 

 

 

 

 

 

 

 

 

 

+

4 *

5

(1z (*) -

h Iх W. *!1 1 1 ^

+

II (w (t) Ii;-1(0} dt

(3.2.24)

при ограничении, задаваемом дифференциальным урав­ нением (3.2.5). Соотношение (3.2.24) задает штрафную функцию метода наименьших квадратов, которая при правильном выборе априорных дисперсий и выполнении предположений о гауссовости х (к0), v (к) и w (к) эквива­ лентна штрафной функции максимума апостериорной вероятности.

Форма уравнения (3.2.23) такова, что напрашивается применение дискретного принципа максимума или дис­ кретных уравнений Эйлера — Лагранжа (Сейдж [116]). Гамильтониан задается формулой

Н (к), w (к), % (к + 1), А] =

= 4 -| .(A + l ) - S

[*<*), W(A), к + l ] f v- 1(t+1) +

+ ~2~I w (к) f -1 +

+ 1) ср [х (к), А] +

+

№ (k + \)T[x(k),k]w(k), (3.2.25)

*) Это справедливо, если Г не зависит от х и является само по себе полезным результатом.


G4 ФУНКЦИЙ Ш ТРАФА В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3

в которой

д

X [x(ft), w(ft), ft -f 1]

= h {ф [х (к), А:] + Г [х (к), ft] w (к), к + 1} =

= h[x(ft + l), * + 1]. (3.2.26)

Канонические уравнения и граничные условия имеют вид

£(* + 11*,)

ш

 

 

+ 1) x(ft)=x(&\kf)

I (к01ко) =

V - [х (к0) — jlix (к0)],

X|kf) =

дН

, *-(*/1*/) = о,

 

 

дх (к) х(к)=х(к\К1)

 

дН

= 0.

 

дуг (к)

 

,w(ft)=w(fc)

(3.2.27)

(3.2.28)

(3.2.29)

Этими каноническими уравнениями и соответствующими граничными условиями определяется нелинейная двух­ точечная краевая задача (ДТКЗ), решением которой яв­ ляется искомая оценка при фиксированном интервале сглаживания.

Довольно трудоемкие вычисления позволяют получить следующую развернутую запись канонических уравнений:

х + 1 1к,) =

<р [х |kf), к] —

 

 

 

 

— Г [х (ft |ks), к] Vw (ft) Гт [х |kf), ft] Ч^Х (ft [ ft,),

(3.2.30)

jt(ft + i|ft,) =

»F-14ft|ft/) +

 

 

 

 

9hT [x + 1 I kf) ] .

 

 

 

 

+

a; (a . i l , r v ; ( t + 1 ) l z ( 4 + 1 ) -

 

 

 

— h [x(ft ф-1 1ft,), ft -j- 1]],

(3.2.31)

где обозначено:

 

 

 

 

9q>T [x I fc,), ft]

9 [Г [x (* |k}), k] w (fc)]T

 

 

чг =

дх. {к |kf)

9x (fc |kf)

 

 

 

 

 

w (ft) = -

Vw (*)ГТ lx (k |kf), ft] Ч ^Х (ft |kf).

(3.2.32)

 

 

 

 

Слагаемые в формулах для х (ft -(- 1

|ft,) и X (ft

1

|ft,)

содержат квадратичные относительно

X выражения.

При

использовании процедуры инвариантного погружения чле-


3.2]

МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ

65

ны степени выше первой по X исчезают. Поэтому при ре­ шении методом инвариантного погружения можно поль­ зоваться эквивалентным выражением

dq>T |ftp, ft]

(3.2.33)

дх (ft |fty)

Эти уравнения необходимо решить при двухточечных граничных условиях

X(/с01А0) ------

[х (*0) - |хх(/с0)], X(к, |к,) = 0.

(3.2.34)

Двухточечную краевую задачу для непрерывного слу­ чая можно получить, устремляя к бесконечности плот­ ность точек фиксации в уравнениях (3.2.30) и (3.2.31) или применяя непрерывный вариант принципа максимума (Сейдж, [116]) для минимизации функции штрафа (3.2.24) при ограничении, задаваемом дифференциальным урав­ нением (3.2.5). При использовании последнего подхода вводится гамильтониан

H[x(t), w(/), X(t), t] =

= 4 иz (о - ь [x (о, t] rv;X(()+ 4 - иw (o fv-i (0+

4- %T (t) {f [x (t), t] + G [x (t), t] w (t)} (3.2.35)

и выписываются канонические уравнения

х == Д | -,

М*о) = V ~ (0 [x (/o) — Их (*<>)],

Х =

= 0,

дх.

(3.2.36)

ЭЯ = 0.

dvt

Проводя необходимые преобразования, получим двухто­ чечную краевую задачу

X = f [X (f), t] - G [x (t), t] 4!\w (t) GT [x (t), t] X(t),

(3.2.37)

X = - , T.^ (0, t] y - i

щ ^

_

h |x (f), *]} _

 

Эх (t)

 

 

 

 

afT [x (t),

c]

a д т

(t) g

f* (*). 0 Y w (* )& т [x (0 .

4 )

ax (t)

M 0+

 

 

ax (t)

M 0

 

 

(3.2.38)

 

 

 

 

 

3 Э. П. Сейдж, Дж. Л, Мелса