ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 160
Скачиваний: 0
3.4] |
(КРИ ТЕРИ И МАКСИМУМА ПРАВДОПОДОБИЯ |
91 |
|
и в. |
В результате |
получится |
|
|
х(А + |
1 | М ) = ч>1х(А|е),А]. |
(3.4.43) |
Таким образом, выписана полная система уравнений дискретного нелинейного алгоритма оценивания первого порядка по методу условного среднего. Они сведены в табл. 3.4.1, включающую алгоритмы, необходимые для определения штрафной функции максимального правдо подобия рассмотренным методом первого порядка. Можно пользоваться аппроксимациями более высокого порядка для оценки (Сейдж и Мелса [127]), однако здесь они рас сматриваться не будут.
Отметим, что эти (приближенные) алгоритмы фильтра ции условного среднего по сути являются обобщением алгоритмов фильтра Калмана. Если модели формирова ния и наблюдения сигнала линейны, то эти уравнения превращаются в обычные уравнения линейного фильтра Калмана. Итак, минимизация функции штрафа из табл. 3.4.1 при ограничениях, задаваемых разностными урав нениями из той же таблицы, ведет в итоге к алгоритмам идентификации по методу максимального правдоподобия. Дальнейшему развитию этих результатов посвящены сле дующие четыре главы. Теперь рассмотрим простой при мер, иллюстрирующий наиболее существенные моменты изложенных выше результатов.
Пример 3.4.1. Используем простой пример для демон страции процедуры определения функции штрафа при идентификации по максимуму правдоподобия. Скалярные модели формирования и наблюдения сигнала с постоян ными VD и Vw имеют вид
х {к -]-1) = Фх (к) + ш (к), z (к) = х (к) + v (к)
Для такой или любой линейной модели формирования и наблюдения сигнала алгоритмы табл. 3.4.1 являются точными, а не просто хорошими приближениями. Подле жащая минимизации штрафная функция (3.4.21) прини мает вид
/ = 4 - 2 flndetlF„ + Уг (А|Л-1,Ф)] +
к—К ^
[г (к) — х(к\к — 1, Ф)]2 )
~Г Vv+ Гг (*|А-1,Ф ) /•
92 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФ ИКАЦИИ [ГЛ . 3
|
|
|
|
Т а б л и ц а |
|
3.4.1 |
|||
Алгоритмы первого порядка идентификации |
|
|
|
||||||
по максимуму правдоподобия |
|
|
|
|
|
||||
(штрафная функция) |
|
|
|
|
|
|
|
||
Модель формирования сигнала |
|
|
|
|
|
|
|
||
х (ft + 1) = |
ф [х (ft), к] + Г [х (к), |
к] w (к) |
|
|
|
|
|||
Модель наблюдений |
|
|
|
|
|
|
|
|
|
z (к) = h [х (к), к] + v (к) |
|
|
|
|
|
|
|||
Параметры априорных распределений |
|
|
|
|
|
|
|
||
Ч (w (к)} = 0, cov {W (к), w (/')} = Vw (к) бк (к — /), |
|
|
|
||||||
<$(у (к)} = 0, |
cov {V {к), v (/).} = Vv6K (к — /), |
|
|
|
|
||||
% (х (0)} = рх (0) = |
цХо, var {х (0)} = V~(0) = |
Vx (0) = |
V^, |
|
|||||
cov(w (к), v (к)} = cov {х (к), |
v (к)} = cov{x (к), |
w (/')} — 0, / > |
к |
||||||
Уравнение фильтра условного среднего |
|
|
|
|
|
|
|
||
х (А- + 1 | ;0 )= х > + 1 |к, 0) + |
К (ft + 1) [z(ft + |
l) — |
|
|
|
|
|||
|
|
— h[x(ft + l|ft, |
0, |
|
ft+ |
1]] |
|||
Уравнение одношаговой |
экстраполяции |
|
|
|
|
|
|
|
|
X (ft + |
1 |ft. в) = ф [х (ft |0), |
ft] |
|
|
|
|
|
||
Уравнение для коэффициента усиления |
фильтра |
|
|
|
|
||||
|
ЭЬТ [х (ft + 1 1ft, |
9), ft + 1] |
xr-i |
(ft + 1) |
|||||
K(ft + l ) = V x (ft + l|0) |
dx (ft + 1 |ft, |
0) |
|
Vv |
|
||||
|
|
|
|
|
|
|
Уравнение для априорной дисперсии ошибки фильтрации
V~ (ft + 1|Л, 0) |
дф [ х (ft |0), |
ft] |
дфТ (x |
(ft 10), |
ft] |
||||
ax (ft I 0) |
|
x (k) |
dx (ft |
I 0) |
+ |
||||
|
|
|
|
||||||
|
+ r[i(fc|0), |
ft] Vw (ft)rT[x(ft|0), |
ft] |
|
|
|
|||
Уравнения для дисперсии ошибки фильтрации |
|
|
|||||||
V - (ft + |
1 |0) = |
V~ (ft + 1 |ft, |
0) - |
V5 (ft + |
1 |ft, |
0) X |
|||
ahT [x (ft + |
life. 0). fc + i] |
dhT [x (ft 4-1 |ft, 0), |
ft+ |
1] |
|||||
X |
|
0) |
|
|
dx (ft 4- 1 |ft, |
0) |
|
||
Эх (ft 4 -1 1ft, |
|
|
|
||||||
X V -(ft 4-1 |ft, |
0)! dhT [x (ft 4-1 I ft, B), |
fe + 1] |
+ |
Vv (ft + |
1) |
||||
|
|
dx (ft 4-1 |ft, 0) |
|
|
|
|
|||
dhT [x(ft4-l|fc, |
0), ft + |
1] |
V-(ft + |
1 1ft, 0) |
|
||||
X |
dx (ft + 1 |
|ft, 0) |
|
|
|||||
|
|
|
|
|
|
|
X
X
3.4] |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ |
93 |
||||
|
|
|
Т а б л и ц а 3.4.1 |
(продолжение) |
|
|
Штрафная функция идентификации по максимуму правдо |
|
|||||
подобия |
|
|
|
|
|
|
1 |
*1 |
|
|
|
|
|
J = - 2~ J' |
In dot Vz (к |к — 1, 0 )+ ||z(/c) — h[x(/c|/c — |
|
||||
|
к=к\ |
|
|
|
|
|
|
в). |
V |
|
|
Vv (*) + |
|
|
llv-Vfclfc-i. в). V,(*|A-1. в) = |
|
||||
+ |
dhT[x(k\k — 1, |
9), |
k] |
|
|
|
|
дх(к\к — 1, |
0) |
V - (AJ k — 1, 0) X |
|
||
|
|
|
|
|
||
|
|
X |
dhT[x (k |к — 1, |
0), k\ |
|
|
|
|
dx (k |к — 1, 0) |
|
|||
|
|
|
|
|
||
Начальные условия фильтрации |
|
|
||||
|
|
х(0|0, 0) = Ц2о, |
V- (О I 0, 0) = VXo |
|
|
Алгоритмы одношаговой экстраполяции из табл. 3.4.1, которые снова оказываются точными, поскольку система линейна, выглядят так:
х (к + 1 1к, Ф) = Фх (к |к — 1, Ф) +
|
<DF_ (к\к — 1,Ф) |
|
|
|
||
j |
X |
|
[z (к) — х (к |к — 1, Ф)], |
|||
' |
V-(k\k — 1,Ф) + F |
|||||
|
X |
|
и |
|
|
|
|
|
ФW V- (к\к — 1,Ф) |
I |
Т7 |
||
V~x (k + |
l\k, Ф) |
V X |
' |
|||
V-(k\k — 1 , Ф ) + Vv |
+ |
Vw |
||||
|
|
Для определения оптимального значения оценки Ф, переходной матрицы модели, мы минимизируем функ цию штрафа J относительно Ф при ограничениях, зада ваемых разностными уравнениями для х (к + 1 |к, Ф) и V- (к -j- 1 I /с, Ф). Поскольку имеется всего один настра
иваемый параметр, оценка значений штрафной функции для всех значений Ф, для которых это необходимо, ока зывается сравнительно простой (для вычислительной ма шины) задачей. На рис. 3.4.1 — 3.4.3 показаны изменения J в зависимости от Ф для нескольких различных значений отношения Vv/Vw. Следует отметить, что при конечных размерах выборки (конечное к0 = 0) минимум функции
94 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3
штрафа может, при отдельных последовательностях шума, не всегда достигаться при истинном значении Ф. При «низком» уровне шума объекта и «длинной» последователь ности наблюдений минимум J достигается вблизи от истин ного значения Ф. По мере сокращения длины реализации или усиления шума наблюдений ошибка идентификации
ЛФ) ,, Ю*
I)1
_ . J |
------------ 1---------- |
1------------ |
1------------ |
1_____Lllflt |
I |
. |
, |
|
|
п |
Ц,г |
|
ЦВ |
\ |
/,0 |
|
|
Рис. 3.4.1. |
Зависимость штрафа от Ф при разных значениях Vv/Vw |
|||||||
пример |
3.4.1 |
(хо = |
0, 0; |
Vv/Vw = |
р, к) = 800). |
возрастает. Точно так же можно ожидать, что параметры априорного распределения х (к0) влияют на идентифика цию. Очевидно, что если Vx (к0) равна нулю и отсутствует шум объекта или шум наблюдений, получится простая разновидность задачи идентификации, рассмотренной в главе 2. На рис. 3.4.4 показана зависимость функции штрафа от У Vv при различных размерах выборки.
Эти приближенные алгоритмы нуждаются в незначи тельных изменениях для распространения их на случай, когда шумы объекта и измерений коррелированы. Урав нения (3.4.9) и (3.4.11) для функции штрафа сохраняют силу. Однако в выражениях для входящих в них матема
тических ожиданий появляются |
отличия |
по |
сравнению |
со случаем некоррелированных |
шумов. |
В |
самом деле, |
h[х (к), к |0 |=
=Ш(z (ft) |Z (к - 1), 0} = Ш(h [х (к), k]\Z(k — 1), 0}.
3.41 |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ |
9 5 |
|
|
ЛФ)
Рис. 3.4.2. Зависимость штрафа от Ф при разных значениях I; пример 3.4.1 (L — число наблюдений, Vv = 1,0; Vw = 16,0 хо = = 0,5).
Рис. 3.4.3. Зависимость функции штрафа от kVw при разных Vv/Vw; пример 3.4.1 (р = VJVw, kf = 900 — число наблюдений, х0 =
= 0,0).
96 |
Ф у н к ц и и Шт р а ф а в з а д а ч а х и д е н т и ф и к а ц и и [г л . з |
Применяя разложение в ряд Тейлора к уравнению (3.4.22), мы видим, что появляется необходимость в выражении для h [х (к |к — 1, 0)1, которое, конечно, по-прежнему определяется формулой (3.4.21). Алгоритм одношаговой
J
Рис. 3.4.4. Зависимость функции |
штрафа от Y У» ПРИ |
разных L |
|
(VvIVw = р = |
9,0, L — число наблюдений, х0 = |
0,0). |
|
экстраполяции |
(3.4.43) в данном случае уже не |
годится, |
|
так как |
|
|
|
х (к 1) = ф [х (к), к] -}- Г [х (к), к] w {к), |
|
||
и аппроксимация первого порядка принимает |
вид |
||
х (Л -И | * ,в ) = |
|
|
|
= ф [х (к 10), /с] 4- Г [х (к), |
к] $ {w (к) |Z (к), 9}, (3.4.44) |
||
что можно записать в виде |
|
|
|
х (к + 1 1к, 0) = |
<р [х (к 10), к] + |
Г [х (к), к] х |
(3.4.45) |
X Vwv {к) V^1(к |к — 1, 0) {z (к) — h [х (к \к — 1, 0), к]}, |
применяя теорему об условном математическом ожидании (3.4.28) и соотношение
var (w (к) |Z (к), 0} = Vw (к) - Vwv (ft) V"1 (ft |ft - 1) Vvw (k). (3.4.46)