ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 172
Скачиваний: 0
82 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3
X (к + |
1 1kf) = X{к |kf) -I- НТ(А + |
1) V;1 (к + |
1 1к,) х |
|
|
|
X [г (к + 1) - н (к + 1) i (к + 1 1Щ , |
||
|
V„ (к |
1 1kf) = |
Vv (к |kf), |
|
SB(А + |
1 1akf) = v (к j kt) — |
+ |
|
|
|
+ у; №°+5, , |
IM* + |
») - н (t + |
1) i (t + 1 ц,)|. |
Эти уравнения должны быть решены при двухточечных граничных условиях
X(01kf) = |
У"1 [х (01kf) — цх], X{kt |kf) = О, |
3» (О |к,) = |
О, So(A/ |ft/) = 0. |
Обратимся теперь к формулировке задач идентифика ции с использованием метода максимума правдоподобия.
3.4. ИДЕНТИФИКАЦИЯ ПО КРИТЕРИЮ МАКСИМУМА ПРАВДОПОДОБИЯ
В предыдущем изложении штрафных функций для задач идентификации предполагалось, что необходимо оценить (идентифицировать) параметры и состояние си стемы. Избавимся теперь от формального требования идентифицировать состояние системы. Таким образом, при идентификации по максимуму апостериорной вероят
ности необходимо |
максимизировать р [0 |
|Z (kf)] или |
p [ e \ z ( t f ) ] , где 0 |
обозначает неизвестные |
постоянные |
параметры (не включающие состояние системы), по отно шению к которым осуществляется максимизация. При идентификации по критерию максимума правдоподобия максимизируется p{ Z{ kf ) |0] или p [ Z { t f) |0] относи тельно 0. Если неизвестные параметры распределены рав
номерно или имеется |
значительная неопределенность |
(V0велика) в априорном |
распределении, то, как показа |
но в предыдущем разделе, методы идентификации по максимуму правдоподобия и апостериорной вероятности эквивалентны. В этом разделе будут исследованы только оценки максимального правдоподобия для параметров системы (в том числе и для параметров априорных рас пределений). Если известны априорные значения пара-
a.4j |
КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЙ. |
8 3 |
метров распределений неизвестных параметров системы, их можно включать в штрафные функции, рассматрива емые в данном разделе. Однако подробно этот случай рас сматриваться не будет. Как и прежде, вначале исследуются дискретные системы. Затем результаты формулируются и для непрерывного случая. Для простоты рассмотрим сначала случай, когда помеха наблюдений не зависит от входного шума, а затем снимем это ограничение.
Рассмотрим нелинейную модель формирования и на блюдения сигнала (3.2.1), (3.2.2)
х (к + 1) = |
<р [х (к), к, а] + |
Т[х(к), к, b] w (к), |
(3.4.1) |
z (к) = |
h [х(А), к, с] + |
v (к), |
(3.4.2) |
где а, b и с — векторы неизвестных параметров, которые необходимо идентифицировать. Кроме того, некоррели рованные гауссовские шумы объекта и наблюдений с ну левыми средними значениями могут иметь ковариацион ные матрицы, также подлежащие идентификации. Пусть символ 6обозначает все неизвестные константы, которые должны быть идентифицированы. Мы не будем в явной форме указывать зависимость ф, Г и h от неизвестных па
раметров a, b и с, но должны постоянно помнить, |
что в ф, |
||
Г и Ь содержатся эти |
параметры. |
Необходимо |
макси |
мизировать функцию |
р [Z (kf) |0], которую, используя |
||
определение условных |
вероятностей, |
можно переписать |
|
р [Z (kf) I 0] = |
Ч |
|
|
П Р [z (A) IZ (А — 1), 0]. |
(3.4.3) |
к^кг
Поскольку по предположению в момент к0 наблюдения не производятся, то
Р \г (/ci) | z (А0), 0] = |
Р [ъ (Ai) 10ф |
(3.4.4) |
Определим условные моменты: |
|
|
Ь [х (к), /с|0] = $ {z (к) |Z (А — 1), 0} = |
|
|
= &{h [х (к), k ] \ Z ( k - 1), 0}, |
(3.4.5) |
|
V2(к |А - 1,0) = var {z (А) |Z (A - |
1), 0} = |
|
= V -(A | A -1 ,0 ) + Vv (A), |
(3.4.6) |
|
V ~ (A 1A — 1 , 0 ) = v a r { h [ x ( к), к] | Z (A — 1 ), 0 ) . |
( 3 . 4 . 7 ) |
84 ФУНКЦИЙ Ш ТРАФА В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ.
Плотности распределений в (3.4.3), вообще говоря, не гауссовские. Возможно, однако, получить «псевдобайесовскую» плотность, допуская, что условные плотности в (3.4.3) гауссовские, так что
р [ж (к) IZ (к — 1), 0] = |
------ р--------------------------- -т |
|
|
1 |
V |
(2я)й/а [det \х (к\ к — 1, 0)]'2 |
|
|
X ехр {— 0,5 [г (к) — h [х (к), к |0Ц1 х |
|
|
|
X V;1(к ( к — 1, 0) [г (к) — h [х(А), к |0]]}. |
(3.4.8) |
При подобном псевдобайесовском допущении функция
правдоподобия примет |
вид |
|
||
|
Ч |
|
|
|
p [Z (k f)\Q] |
ГГ ____________ 1____________ X |
|
||
|
,сД (2H)K/2[detVz(/£|A-l,0)]V. |
|
||
X ехр |
- 4—1z (к |к - |
1, 0) II2_ !(к\к — 1, 0)} , (3.4.9) |
||
|
^ |
|
Vz |
> |
где z (к |к — 1, 0) — так |
называемый процесс |
«невязки» |
||
(Сейдж и Мелса [127]), |
|
|
||
z (к |к — 1, 0) = z (к) — h [х (к), к |0] = |
|
|||
|
= г (к) |
— ё {z(k)\Z (к — 1), 0}, |
(3.4.10) |
который представляет новую информацию, вносимую на блюдением z (к). Часто удобнее минимизировать взятый с обратным знаком логарифм выражения (3.4.9), а не
максимизировать саму функцию (3.4.9). |
|
||
Таким |
образом, идентификация по методу максимума |
||
правдоподобия осуществляется минимизацией по |
0функ |
||
ции |
штрафа |
|
|
/ = |
4~ 2 |
ln d e t{V ,(A | A -l,0 )} |
|
|
к=1с, |
+ | z ( A | A - l,0 ) ^ 1(4t_i>e). |
(3.4.11) |
|
|
Используя методы стохастического анализа Ито, можно показать, что по мере сгущения точек фиксации миними-
3.4] |
К р и т е р и й м а к с и м у м а п г Ав д о г г о д о й и й |
НЙ |
зация (3.4.11) или максимизация (3.4.9) становится бес смысленной операцией. Это связано с двумя факторами. Дисперсии шумов объекта и измерений в непрерывном случае бесконечны. Кроме того, плотность (3.4.9) беско нечномерна по переменной Z (tf) в непрерывном случае. При этом отсутствует возможность идентификации Vw или Vv, поскольку они бесконечны. Отказавшись от возможности оценки Vv, задачу идентификации можно переформулировать как задачу максимизации отношения правдоподобия
|
L [Z (kf ) |0] |
Р [Z (ft,) | Жи 0] |
|
(3.4.12) |
||||
|
Р [Z (kf) | Жч\ |
' |
||||||
|
|
|
|
|
|
|||
где Ж\ означает |
гипотезу, согласно |
которой |
|
|||||
|
г (к) = h [х (к), к] -\- v (к), |
|
(3.4.13) |
|||||
и Ж 0 — гипотеза, |
утверждающая, |
что |
|
|
||||
Легко |
показать, |
|
что |
z (к) = у (к). |
|
|
(3.4.14) |
|
|
|
|
|
|
|
|||
р [ г ( к ) \ Ъ { к ~ \ ) , Ж , ] = |
|
|
|
|
|
|||
________ 1_______ |
X exp |
|
|
(3.4.15) |
||||
(2я)К;2 Idet Vy (д-)уА |
|
|
|
|
|
|||
так что отношение правдоподобия принимает |
вид |
|||||||
|
ту |
|
|
|
det [Vv (ft)]1'. |
|
|
|
L [ Z( kf) |0] = i i |
[det v- |
|
i * —i ,e)+ vv д а |
x |
|
|||
|
|
|
|
|
X exp {§ [Z (kf) |0]), |
(3.4.16) |
||
где $ |
есть достаточная |
статистика |
|
|
|
|||
|
|
|
Ч |
|
|
|
|
|
S [ Z ( i , ) | e i - - A - S |
|
i , « ) f l 4 | , N i , - |
||||||
|
|
|
|
|
- ! Z(A) ^V yW(ft) - |
(3-4Л7) |
Если идентификация Vv не предусматривается, максими зация (3.4.16) по 0 эквивалентна максимизации (3.4.11)
80 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИЙ [ГЛ. 3
по 0. Теперь все готово для перехода к пределу при стрем лении к пулю шага фиксации.
Можно показать (Маклендон и Сейдж [95]; Сейдж и Мелса [127]), что по мере сгущения точек фиксации мак симизация (3.4.16) становится эквивалентной миними зации
|
U |
|
J = - |
(0 ^ (t) h [х (0 ,110] + |
|
|
^0 |
|
|
4- ЬТ [x (0, ^] в] 'F-1(0dU (<)} + |
|
|
4 |
|
+ |
- i- ^ hT [X (0 ,110] W ? (t) h [X (t),110] dt, |
(3.4.18) |
где |
dU (t) — z (t) dt |
(3.4.19) |
|
представляет наблюдения, а первый интеграл понимается
в смысле Ито. Как и в |
дискретном случае, |
|
|
h [х (0, t 10] = |
%{h [х (t), t] |Z (t), 0). |
(3.4.20) |
|
К сожалению, мы не в состоянии определить штраф |
|||
ные функции |
(3.4.9) и |
(3.4.11), порождаемые |
членами |
h [х (ft), к (0)] |
и V2(к\к — 1, 0), которые, вообще говоря, |
не удается найти точно. По-видимому, наиболее разумным способом определения этих членов является аппроксима
ция |
h [х (к), |
к] |
отрезком |
ряда |
Тейлора |
в |
окрестности |
х (к) |
= х (к |к — |
1, 0), причем |
оценка — условное ма |
||||
тематическое |
ожидание — определяется |
как |
|
||||
|
х (Л |ft — 1,0) = |
(x(ft)|Z(ft — 1),в). |
(3.4.211 |
||||
Для |
линейного приближения получим |
|
|
||||
Ь [х (к), ft] = h [х (ft |ft — 1, 0), ft] + |
|
|
|
||||
dhT [x (ft] ft —1,0), ft] |
(ft) — X (ft I ft — 1,0)]. |
(3.4.22) |
|||||
+ |
|
|
[X |
Э х ( к | к — 1 , 0 )
Подстановка этого выражения в (3.4.5) — (3.4.7) приводит к следующей линейной аппроксимации рассматриваемых