ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 169
Скачиваний: 0
3.2] МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ 61
где и (£) — винеровский процесс. Точно так же соотно шения (3.1.9) — (3.1.13) следует, вообще говоря, полу чить строгим образом с помощью стохастического анализа (Сейдж и Мелса [127]). Сделанное замечание относится и к другим предельным переходам, встречающимся в дан ной главе.
Будем обозначать последовательности х (к0), х(/с1),
. . ., х (kf) и z (kj), z (к2), |
. . ., z (kf) соответственно через |
||
X (kf) |
и Z (kf). Аналогично непрерывные реализации х (t) |
||
и z (<) на отрезке U0, tf] обозначаются через X |
(tf) и Z (tf). |
||
Через |
р [X (kf) |Z (kf)] |
и р [X (tf) |Z (£/)] |
обозначим |
условные плотности вероятности X относительно резуль татов измерений Z. В дальнейшем предполагается, что плотности р [х (к0)) и р [х (t0)] известны и являются нор мальными со средним рХо и ковариационной матрицей VXo.
Наилучшая оценка обобщенного вектора состояния х на рассматриваемом интервале времени зависит, вообще говоря, от критерия, используемого для определения наи лучшей оценки. В данном случае под «наилучшей оценкой» понимается оценка, определяемая путем максимизации по X условной плотности р [X |Z] на всем интервале наблюдений. Получающаяся оценка известна под назва нием байесовской максимально правдоподобной или оцен ки максимума апостериорной вероятности (Сейдж [116], Сейдж и Мелса [12 7]). В дальнейшем все выкладки будут проводиться для дискретного случая, а для непрерывного случая мы ограничимся лишь формулировкой оконча
тельных результатов. |
Байеса к р [Х(А^) |Z (kf)], по |
|||
Применяя |
формулу |
|||
лучим |
|
р [г (kf) \ x ( k f) ] P [ X ( k l)] |
|
|
Р [X (kf) |Z (&/)] |
(3.2.15) |
|||
р[Ъ (kf)] |
||||
|
|
|
||
Из (3.2.2) |
ясно, что |
при известном х (к) |
плотность |
|
р [ъ (к) |х(&)] |
является гауссовской, поскольку v (к) — га |
|||
уссовская величина. Поэтому при данном X |
(к}) |
p[Z(kf)\X(kf)) =
exp { — §■(* (* )-h [x (к), /с])Т V;1 (k)(z(k) — h[x(k), /с])|
(2л)й/2(let [Vy (*)]V«
(3.2.16)
62 ФУН КЦИ И Ш ТРАФА В ЗАД АЧ АХ ИДЕНТИФИКАЦИИ [ГЛ . 3
Используя определение условной вероятности
р[о,Р1=р[а|Р]р[Р], |
(3.2.17) |
можно записать
Р[X (&/)] = р [х (&,)' X (kf — 1)] р [х (kf — 1) |X (kf — 2)]...
•••Р [х (hi) |х (&0)] р [х (&„)]. (3.2.18)
Так как w (к) — гауссовская марковская последователь ность, то последовательность х (к) также является мар ковской и
Р[х(& /)|Х(/с,— 1)] = p[x(kf)\x(kf — 1)]. (3.2.19)
Следовательно, р [Х(/с/)1 образована из гауссовских ком понент
ft/
Р [X (kf)] = р [х (А0)] П Р Iх (к) Iх (к — 4)1 (3.2.20) /С—
(где р [х (к) |х (к — 1)] — гауссовские плотности) и, со гласно (3.2.1), имеет среднее значение <р [х (к — 1), к — 1] и ковариационную матрицу
Г [х (к - 1), к — 1] Vw (к - 1) Гт [х (к — 1), к - 11.
р [Z (&/)] не зависит от х (к), и Z (к/) является известной величиной в процессе максимизации, который мы должны провести. Поэтому р [Z (к/)] можно рассматривать по от ношению к этой максимизации как нормировочную кон станту. После простых преобразований (3.2.15) в обозна чениях (3.2.16) и (3.2.20) можно переписать как
Р [X (kf) |Z (kf)] =
*/
kf
—2 l!x (*) — cp [ж(A: — 1),/с— l]||n-i(^D —
ft=fco+l
- 4 - и * 0) + м & о ) г у-х }, (3-2-21)
3.21 |
|
МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ |
63 |
||||||
где |
предполагается *), |
что А не зависит |
от х (к) |
и |
|||||
|
|
|
Q (А) = Г [х (к), к] Vw (к) Гт [х (к), к]. |
(3.2.22) |
|||||
Отсюда |
ясно, что максимизация (3.2.21) относительно |
||||||||
X (kf) |
эквивалентна |
минимизации |
|
|
|
||||
J = -g -1х (/с°) “ Р* (*о) ty-i + |
|
|
|
|
|||||
|
|
|
kf-i |
|
|
|
|
|
|
+ 4 " S H * + l ) - h [ x ( A + l ) , A + l ] f х |
+ |
||||||||
|
|
Z |
k=/C„ |
|
|
|
^ |
y v '(,c+1) |
|
|
|
|
|
|
+ i |
2 |
iw (* )f w |
(3.2.23) |
|
|
|
|
|
|
|
fe=/f0 |
W |
|
|
Аналогично |
максимизация |
p[X(ify) |
|Z (i/)] |
эквива |
|||||
лентна |
минимизации |
|
|
|
|
|
|||
/ ' = |
4 |
- l * ( f o ) - | * * (to) fv- x + |
|
|
|
|
|||
|
|
4 |
|
|
VXo |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ |
4 * |
5 |
(1z (*) - |
h Iх W. *!1 1 1 ^ |
+ |
II (w (t) Ii;-1(0} dt |
(3.2.24) |
при ограничении, задаваемом дифференциальным урав нением (3.2.5). Соотношение (3.2.24) задает штрафную функцию метода наименьших квадратов, которая при правильном выборе априорных дисперсий и выполнении предположений о гауссовости х (к0), v (к) и w (к) эквива лентна штрафной функции максимума апостериорной вероятности.
Форма уравнения (3.2.23) такова, что напрашивается применение дискретного принципа максимума или дис кретных уравнений Эйлера — Лагранжа (Сейдж [116]). Гамильтониан задается формулой
Н [х (к), w (к), % (к + 1), А] =
= 4 -| .(A + l ) - S |
[*<*), W(A), к + l ] f v- 1(t+1) + |
|
+ ~2~I w (к) f -1 + |
(к + 1) ср [х (к), А] + |
|
+ |
№ (k + \)T[x(k),k]w(k), (3.2.25) |
*) Это справедливо, если Г не зависит от х и является само по себе полезным результатом.
G4 ФУНКЦИЙ Ш ТРАФА В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3
в которой
д
X [x(ft), w(ft), ft -f 1]
= h {ф [х (к), А:] + Г [х (к), ft] w (к), к + 1} =
= h[x(ft + l), * + 1]. (3.2.26)
Канонические уравнения и граничные условия имеют вид
£(* + 11*,) |
ш |
|
|
|
9Х (к + 1) x(ft)=x(&\kf) |
I (к01ко) = |
V - [х (к0) — jlix (к0)], |
|
X(к |kf) = |
дН |
, *-(*/1*/) = о, |
|
||
|
дх (к) х(к)=х(к\К1) |
|
|
дН |
= 0. |
|
дуг (к) |
|
|
,w(ft)=w(fc) |
(3.2.27)
(3.2.28)
(3.2.29)
Этими каноническими уравнениями и соответствующими граничными условиями определяется нелинейная двух точечная краевая задача (ДТКЗ), решением которой яв ляется искомая оценка при фиксированном интервале сглаживания.
Довольно трудоемкие вычисления позволяют получить следующую развернутую запись канонических уравнений:
х (к + 1 1к,) = |
<р [х (к |kf), к] — |
|
|
|
|
— Г [х (ft |ks), к] Vw (ft) Гт [х (к |kf), ft] Ч^Х (ft [ ft,), |
(3.2.30) |
||||
jt(ft + i|ft,) = |
»F-14ft|ft/) + |
|
|
|
|
9hT [x {к + 1 I kf) ] . |
|
|
|
|
|
+ |
a; (a . i l , r v ; ( t + 1 ) l z ( 4 + 1 ) - |
|
|
||
|
— h [x(ft ф-1 1ft,), ft -j- 1]], |
(3.2.31) |
|||
где обозначено: |
|
|
|
|
|
9q>T [x (к I fc,), ft] |
9 [Г [x (* |k}), k] w (fc)]T |
|
|
||
чг = |
дх. {к |kf) |
9x (fc |kf) |
|
|
|
|
|
|
|||
w (ft) = - |
Vw (*)ГТ lx (k |kf), ft] Ч ^Х (ft |kf). |
(3.2.32) |
|||
|
|
|
|
||
Слагаемые в формулах для х (ft -(- 1 |
|ft,) и X (ft |
1 |
|ft,) |
||
содержат квадратичные относительно |
X выражения. |
При |
использовании процедуры инвариантного погружения чле-
3.2] |
МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ |
65 |
ны степени выше первой по X исчезают. Поэтому при ре шении методом инвариантного погружения можно поль зоваться эквивалентным выражением
dq>T [х (к|ftp, ft]
(3.2.33)
дх (ft |fty)
Эти уравнения необходимо решить при двухточечных граничных условиях
X(/с01А0) ------ |
[х (*0) - |хх(/с0)], X(к, |к,) = 0. |
(3.2.34) |
Двухточечную краевую задачу для непрерывного слу чая можно получить, устремляя к бесконечности плот ность точек фиксации в уравнениях (3.2.30) и (3.2.31) или применяя непрерывный вариант принципа максимума (Сейдж, [116]) для минимизации функции штрафа (3.2.24) при ограничении, задаваемом дифференциальным урав нением (3.2.5). При использовании последнего подхода вводится гамильтониан
H[x(t), w(/), X(t), t] =
= 4 иz (о - ь [x (о, t] rv;X(()+ 4 - иw (o fv-i (0+
4- %T (t) {f [x (t), t] + G [x (t), t] w (t)} (3.2.35)
и выписываются канонические уравнения
х == Д | -, |
М*о) = V ~ (0 [x (/o) — Их (*<>)], |
Х = |
= 0, |
дх. |
(3.2.36) |
ЭЯ = 0.
dvt
Проводя необходимые преобразования, получим двухто чечную краевую задачу
X = f [X (f), t] - G [x (t), t] 4!\w (t) GT [x (t), t] X(t), |
(3.2.37) |
||||
X = - , T.^ (0, t] y - i |
щ ^ |
_ |
h |x (f), *]} _ |
|
|
Эх (t) |
|
|
|
|
|
afT [x (t), |
c] |
a д т |
(t) g |
f* (*). 0 Y w (* )& т [x (0 . |
4 ) |
ax (t) |
M 0+ |
|
|
ax (t) |
M 0 |
|
|
(3.2.38) |
|||
|
|
|
|
|
3 Э. П. Сейдж, Дж. Л, Мелса