Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 172

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

82 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3

X (к +

1 1kf) = X{к |kf) -I- НТ(А +

1) V;1 (к +

1 1к,) х

 

 

X [г + 1) - н + 1) i + 1 1Щ ,

 

V„ (к

1 1kf) =

Vv (к |kf),

 

SB(А +

1 1akf) = v (к j kt) —

+

 

 

+ у; №°+5, ,

IM* +

») - н (t +

1) i (t + 1 ц,)|.

Эти уравнения должны быть решены при двухточечных граничных условиях

X(01kf) =

У"1 (01kf) — цх], X{kt |kf) = О,

3» (О |к,) =

О, So(A/ |ft/) = 0.

Обратимся теперь к формулировке задач идентифика­ ции с использованием метода максимума правдоподобия.

3.4. ИДЕНТИФИКАЦИЯ ПО КРИТЕРИЮ МАКСИМУМА ПРАВДОПОДОБИЯ

В предыдущем изложении штрафных функций для задач идентификации предполагалось, что необходимо оценить (идентифицировать) параметры и состояние си­ стемы. Избавимся теперь от формального требования идентифицировать состояние системы. Таким образом, при идентификации по максимуму апостериорной вероят­

ности необходимо

максимизировать р [0

|Z (kf)] или

p [ e \ z ( t f ) ] , где 0

обозначает неизвестные

постоянные

параметры (не включающие состояние системы), по отно­ шению к которым осуществляется максимизация. При идентификации по критерию максимума правдоподобия максимизируется p{ Z{ kf ) |0] или p [ Z { t f) |0] относи­ тельно 0. Если неизвестные параметры распределены рав­

номерно или имеется

значительная неопределенность

(V0велика) в априорном

распределении, то, как показа­

но в предыдущем разделе, методы идентификации по максимуму правдоподобия и апостериорной вероятности эквивалентны. В этом разделе будут исследованы только оценки максимального правдоподобия для параметров системы (в том числе и для параметров априорных рас­ пределений). Если известны априорные значения пара-


a.4j

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЙ.

8 3

метров распределений неизвестных параметров системы, их можно включать в штрафные функции, рассматрива­ емые в данном разделе. Однако подробно этот случай рас­ сматриваться не будет. Как и прежде, вначале исследуются дискретные системы. Затем результаты формулируются и для непрерывного случая. Для простоты рассмотрим сначала случай, когда помеха наблюдений не зависит от входного шума, а затем снимем это ограничение.

Рассмотрим нелинейную модель формирования и на­ блюдения сигнала (3.2.1), (3.2.2)

х + 1) =

<р [х (к), к, а] +

Т[х(к), к, b] w (к),

(3.4.1)

z (к) =

h [х(А), к, с] +

v (к),

(3.4.2)

где а, b и с — векторы неизвестных параметров, которые необходимо идентифицировать. Кроме того, некоррели­ рованные гауссовские шумы объекта и наблюдений с ну­ левыми средними значениями могут иметь ковариацион­ ные матрицы, также подлежащие идентификации. Пусть символ 6обозначает все неизвестные константы, которые должны быть идентифицированы. Мы не будем в явной форме указывать зависимость ф, Г и h от неизвестных па­

раметров a, b и с, но должны постоянно помнить,

что в ф,

Г и Ь содержатся эти

параметры.

Необходимо

макси­

мизировать функцию

р [Z (kf) |0], которую, используя

определение условных

вероятностей,

можно переписать

р [Z (kf) I 0] =

Ч

 

 

П Р [z (A) IZ (А — 1), 0].

(3.4.3)

к^кг

Поскольку по предположению в момент к0 наблюдения не производятся, то

Р (/ci) | z (А0), 0] =

Р (Ai) 1

(3.4.4)

Определим условные моменты:

 

 

Ь [х (к), /с|0] = $ {z (к) |Z (А — 1), 0} =

 

= &{h [х (к), k ] \ Z ( k - 1), 0},

(3.4.5)

V2|А - 1,0) = var {z (А) |Z (A -

1), 0} =

 

= V -(A | A -1 ,0 ) + Vv (A),

(3.4.6)

V ~ (A 1A — 1 , 0 ) = v a r { h [ x ( к), к] | Z (A — 1 ), 0 ) .

( 3 . 4 . 7 )


84 ФУНКЦИЙ Ш ТРАФА В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ.

Плотности распределений в (3.4.3), вообще говоря, не гауссовские. Возможно, однако, получить «псевдобайесовскую» плотность, допуская, что условные плотности в (3.4.3) гауссовские, так что

р (к) IZ (к — 1), 0] =

------ р---------------------------

 

1

V

(2я)й/а [det \х (к\ к — 1, 0)]'2

 

 

X ехр {— 0,5 [г (к) — h [х (к), к |0Ц1 х

 

 

X V;1( к 1, 0) [г (к) — h [х(А), к |0]]}.

(3.4.8)

При подобном псевдобайесовском допущении функция

правдоподобия примет

вид

 

 

Ч

 

 

 

p [Z (k f)\Q]

ГГ ____________ 1____________ X

 

 

,сД (2H)K/2[detVz(/£|A-l,0)]V.

 

X ехр

- 4—1z |к -

1, 0) II2_ !(к\к — 1, 0)} , (3.4.9)

 

^

 

Vz

>

где z |к 1, 0) — так

называемый процесс

«невязки»

(Сейдж и Мелса [127]),

 

 

z |к 1, 0) = z (к) — h [х (к), к |0] =

 

 

= г (к)

ё {z(k)\Z (к 1), 0},

(3.4.10)

который представляет новую информацию, вносимую на­ блюдением z (к). Часто удобнее минимизировать взятый с обратным знаком логарифм выражения (3.4.9), а не

максимизировать саму функцию (3.4.9).

 

Таким

образом, идентификация по методу максимума

правдоподобия осуществляется минимизацией по

0функ­

ции

штрафа

 

/ =

4~ 2

ln d e t{V ,(A | A -l,0 )}

 

 

к=1с,

+ | z ( A | A - l,0 ) ^ 1(4t_i>e).

(3.4.11)

 

 

Используя методы стохастического анализа Ито, можно показать, что по мере сгущения точек фиксации миними-


3.4]

К р и т е р и й м а к с и м у м а п г Ав д о г г о д о й и й

НЙ

зация (3.4.11) или максимизация (3.4.9) становится бес­ смысленной операцией. Это связано с двумя факторами. Дисперсии шумов объекта и измерений в непрерывном случае бесконечны. Кроме того, плотность (3.4.9) беско­ нечномерна по переменной Z (tf) в непрерывном случае. При этом отсутствует возможность идентификации Vw или Vv, поскольку они бесконечны. Отказавшись от возможности оценки Vv, задачу идентификации можно переформулировать как задачу максимизации отношения правдоподобия

 

L [Z (kf ) |0]

Р [Z (ft,) | Жи 0]

 

(3.4.12)

 

Р [Z (kf) | Жч\

'

 

 

 

 

 

 

где Ж\ означает

гипотезу, согласно

которой

 

 

г (к) = h [х (к), к] -\- v (к),

 

(3.4.13)

и Ж 0 — гипотеза,

утверждающая,

что

 

 

Легко

показать,

 

что

z (к) = у (к).

 

 

(3.4.14)

 

 

 

 

 

 

р [ г ( к ) \ Ъ { к ~ \ ) , Ж , ] =

 

 

 

 

 

________ 1_______

X exp

 

 

(3.4.15)

(2я)К;2 Idet Vy (д-)уА

 

 

 

 

 

так что отношение правдоподобия принимает

вид

 

ту

 

 

 

det [Vv (ft)]1'.

 

 

 

L [ Z( kf) |0] = i i

[det v-

 

i * —i ,e)+ vv д а

x

 

 

 

 

 

 

X exp {§ [Z (kf) |0]),

(3.4.16)

где $

есть достаточная

статистика

 

 

 

 

 

 

Ч

 

 

 

 

 

S [ Z ( i , ) | e i - - A - S

 

i , « ) f l 4 | , N i , -

 

 

 

 

 

- ! Z(A) ^V yW(ft) -

(3-4Л7)

Если идентификация Vv не предусматривается, максими­ зация (3.4.16) по 0 эквивалентна максимизации (3.4.11)


80 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИЙ [ГЛ. 3

по 0. Теперь все готово для перехода к пределу при стрем­ лении к пулю шага фиксации.

Можно показать (Маклендон и Сейдж [95]; Сейдж и Мелса [127]), что по мере сгущения точек фиксации мак­ симизация (3.4.16) становится эквивалентной миними­ зации

 

U

 

J = -

(0 ^ (t) h [х (0 ,110] +

 

 

^0

 

 

4- ЬТ [x (0, ^] в] 'F-1(0dU (<)} +

 

 

4

 

+

- i- ^ hT [X (0 ,110] W ? (t) h [X (t),110] dt,

(3.4.18)

где

dU (t) — z (t) dt

(3.4.19)

 

представляет наблюдения, а первый интеграл понимается

в смысле Ито. Как и в

дискретном случае,

 

h [х (0, t 10] =

%{h [х (t), t] |Z (t), 0).

(3.4.20)

К сожалению, мы не в состоянии определить штраф­

ные функции

(3.4.9) и

(3.4.11), порождаемые

членами

h [х (ft), к (0)]

и V2(к\к — 1, 0), которые, вообще говоря,

не удается найти точно. По-видимому, наиболее разумным способом определения этих членов является аппроксима­

ция

h [х (к),

к]

отрезком

ряда

Тейлора

в

окрестности

х (к)

= х |к

1, 0), причем

оценка — условное ма­

тематическое

ожидание — определяется

как

 

 

х (Л |ft — 1,0) =

(x(ft)|Z(ft — 1),в).

(3.4.211

Для

линейного приближения получим

 

 

Ь [х (к), ft] = h [х (ft |ft — 1, 0), ft] +

 

 

 

dhT [x (ft] ft —1,0), ft]

(ft) — X (ft I ft — 1,0)].

(3.4.22)

+

 

 

[X

Э х ( к | к — 1 , 0 )

Подстановка этого выражения в (3.4.5) — (3.4.7) приводит к следующей линейной аппроксимации рассматриваемых