Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 162

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

3.2]

МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ

71

чайные процессы w {t), v {t) и со (t) — некоррелированные между собой гауссовские белые шумы с нулевыми мате­ матическими ожиданиями и известными интенсивностями.

Составные части штрафной функции МАВ (3.2.62) и канонических уравнений (3.2.63) и (3.2.64) в данном случае имеют вид

- X l

(t)~

- X I

( f ) -

-— x\ (1) xi (<)'

 

a

= X 2

(t) , f[x (*),*] =

0

-

e _

- X 3

(«)-

0

G [х (г), t] :

Px {^) =

о

>*, (**)'

^a

_ .

W(t) = w(t), h[x(t),f]: I*i (t) + (0j

о

 

 

[o>Y ie(t)i>

, Twv(o =

» + т „ ( Ч

1

 

0 ^o*

---1 О

 

H

, V- (i0) == Vx (to) =

_____

оо

 

и о

 

 

 

 

 

1

 

 

1

Поучительно выписать канонические уравнения для рас­ сматриваемой конкретной задачи. Они выглядят так:

i

1~

.

* „ «*»<*)

, ,Л ,

*»(*>

t ,Л

 

21

^ 2а W

(() +

(t)

 

(t) + ЧГа (t)

 

4 =

0,

 

 

 

 

 

 

4 =

0,

 

 

 

 

 

 

4

=

-у 1

lix (0 —

(0 — 4. (01 +

*^2(0

(0>

 

4

=

4х(t) Xi (t),

 

 

 

 

 

Граничные условия

запишутся

следующим образом:

 

 

 

(^о) — Vxt {to) [4i {к)

Р*ч {to)],

{tf) == 0)

 

 

 

^2 (£o) — Va [4a (to) Pali

 

^ { t f ) = 0,

 

^3(*o) = Vg [£3 {to) — Pelt

*-3 {tf) = 0.


72 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3

ДТКЗ явно нелинейна, и поэтому трудно надеяться на получение ее аналитического решения. Подробно выписав канонические уравнения, мы смогли понять, каким обра­ зом различные конкретные компоненты задачи, в част­ ности параметры априорного распределения, входят в ДТКЗ. В дальнейшем большое внимание будет уделено способам, которыми характеристики этого априорного рас­ пределения [VXl (t0), Va, Ve, цх, (t0), рд, pe] влияют на доступную для нас точность и быстроту идентификации параметров системы.

3.3. ИДЕНТИФИКАЦИЯ ПО КРИТЕРИЮ МАКСИМУМА АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ ПРИ НЕИЗВЕСТНЫХ ПАРАМЕТРАХ АПРИОРНЫХ РАСПРЕДЕЛЕНИЙ

Если параметры априорных распределений шумов объекта и измерений или каких-либо их составляющих неизвестны, решить сформулированную ДТКЗ для иден­ тификации системы не удается. Нередко неизвестные априори средние значения можно рассматривать как под­ лежащие идентификации неизвестные константы. Эти неизвестные постоянные добавляются к уравнениям объек­ та и наблюдений и к ДТКЗ, получаемой описанным в пре­ дыдущем разделе способом. Альтернативный подход ос­ нован на методах данного раздела. Неизвестные априор­ ные дисперсии, однако, приводят к значительно более существенным затруднениям, так как эти дисперсии вхо­ дят в неэкспоненциальную часть штрафной функции МАВ (3.2.21). Для обеспечения совместимости с иденти­ фикацией по методу МАВ удобно предположить, что апри­ орные параметры не меняются от шага к шагу и таковы, что по формуле Байеса для не зависящих от номера шага параметров априорного распределения можно написать

A[Z (kf) 1X (kf), pw,Vw, щ,, VY]

P [X (kf), fiw, Vw, Pv,Vv|Z(&/)] —

----p [Z(kf)]

X

X P [X ( k f ) |Pw? Vw, Pv> Vw] p [pw] p [Vw] p [Pv] P [VvL (3.3.1)

причем считается, что априорные параметры независимы. Снова совместная плотность р [Z (fy)] не влияет на про­ ц е д у р у оптимизации, поскольку она явным образом не зависит от переменных состояния X (к) и априорных па­

3.3]

НЕИЗВЕСТНЫ Е АПРИОРНЫ Е РАСПРЕДЕЛЕНИЯ

73

раметров juw, Vw, juv, Vv, которые являются существенным переменными при оптимизации апостериорной плотности. Поэтому оценка МАВ может быть определена максимиза­ цией безусловной плотности

Р [X (kf)i Z (Л/)) f^W, Vw, Цу, Vy] —

= p[Z (kf) |X (kf), p,w, Vw, p.v, V y]p[X (kf) |fiw, Vw, цу, Vv] X

X p [fiw] P [Vw] p [f*v] P [Vv].

(3.3.2)

Часто бывает удобно предположить, что априорные значе­ ния параметров распределены равномерно (Сейдж и Хьюза [122]), так что априорное распределение каждой компо­ ненты имеет вид

1

Р [Pioil — |

max

l

0

1 Рш max ^ Ри>

Piu mini

min

(3.3.3)

в противном случае.

Предполагается, что все остальные априорные параметры распределены аналогичным образом. Допуская, что оцен­ ки априорных параметров таковы, что ограничения в вы­ ражениях равномерной плотности не нарушаются, оценки состояния, параметров системы и параметров априорных распределений определяются максимизацией выражения

Р [Z ( k f ) |X ( k f ) , jiw, Vw, fxv, Vvl p [X ( k f ) ] fiwj Vw, Цу, Vw]- (3.3.4)

При некоррелированных шумах объекта и измерений это выражение в точности совпадает с полученным в (3.2.21). Таким образом, необходимо выбором X(fey), fiw, Vw, Цу, Vv максимизировать

[detVx (/c0)]1/4 [d etrV wrT] [detVv]}(^

к°П

 

X exp {— 0,5 [j x (&0) — Цх (k0) fv-i(ko)—

 

Ч

 

 

- 0 , 5 2 И А) — M-y — h [x (A:), fc] |^_x —

 

— 0,5 2 flw(A) -

|Kwf-i) •

(3.3.5)

k=k*

VwJ


74 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3

Эта штрафная функция метода МАВ получается для сле­ дующей модели формирования сигнала и наблюдений с гауссовскими белыми шумами w (к) и у (к):

х + 1) =

<р [х (к), к) -f- Fw (к),

(3.3.6)

z{k) =

h[x(fc),ft] + у (к)

(3.3.7)

с (неизвестными) параметрами априорных распределений

f*w = $ {W {к)},

Yw =

var (w (к)},

Hv — $ (v (к)},

Уу =

var (v (/с)}

и (известными) параметрами априорных

распределений

|М&о) =

$ {х (*о)},

 

Vx {к0) =

var {х (к0)},

 

cov {w {к), v (/с)} =

0,

(3.3.9)

cov (х (А’о), w {к)} — О,

 

соv{x(A), v{k)} =

0.

 

Следует обратить внимание на то, что в этой формулировке неизвестные параметры, подлежащие оцениванию, обра­ зуют часть обобщенного вектора состояния X {к). Любые компоненты p,w, Vw, pv и Vv, которые известны заранее, считаются заданными и в максимизации штрафной функ­ ции (3.3.5) не участвуют. Максимизация (3.3.5) по пара­ метрам априорных распределений — стандартная задача матричного исчисления.

В результате получим

Yjiw{kf \kf) = к ^_к- f

FVW{kf |kf) Гт =

*/

2 x (/clfc/) — ф[ж{к — 1 \kf) , k — 1], *=M-1

(3.3.10)

2 ix(b\kf) -

f/c=/r„+i

<p [x — 1 1kf), к — 1] — Гц№{k, |kf)) (i (A |kt)

— ф[х(А — 1 1kf), к - 1] - ГД» {kf |kf)}1', (3.3.11)


3.3] ННИЗВЁСТНЫЕ АПРИОРНЫ Е РАСПРЕДЕЛЕНИЯ ?5

МАу |Ау) ==-p -L - S [JB(A) —h [X (Л J*/), A], (3.3.12)

/0 /С=Й„+1

Vv (fy 1A;) = j ., ■ 2 <*(*) — h lx (Л |Л,), ft] —

1

ft=Ar0+ l

 

— £v (Ay1 kf)} {z (A) — h [x (А|Ay), A] — fiv (kf |Ay)}T,

(3.3.13)

где через x (A |Ay) обозначено решение задачи иденти­ фикации, сформулированной как задача сглаживания, получающееся путем максимизации (3.3.5) по X (Ау) с ис­ пользованием вместо параметров априорных распреде­

лений их оценок r(iw (Ay |Ay), TVW(Ау |Ау) Гт, (tv (Ау |Ау),

Vv (Ау |Ау). Приближенные решения задачи сглаживания для класса сформулированных здесь задач даны в главе 9 книги Сейджа и Мелсы [127]. К сожалению, практиче­ ская реализация алгоритмов для х (А |Ау), объединенных с алгоритмами оценки параметров (3.3.10) — (3.3.13), может оказаться совсем не простой. Оценки параметров априорных распределений (3.3.10) — (3.3.13) будут ис­ пользованы при построении алгоритмов оценивания ме­ тодами градиента и стохастической аппроксимации в сле­ дующих двух главах. Обратимся теперь к формулировке задачи идентификации, для которой решение соответству­ ющей ДТКЗ может быть получен методами квазилинеа­ ризации и инвариантного погружения (главы 6, 7).

Удобнее минимизировать взятый с обратным знаком натуральный логарифм штрафной функции МАВ (3.3.5), что эквивалентно минимизации

/

= 0,51 х (А0) — цх (А0) f -1

+

 

 

 

 

 

кг 1

У%(*о)

 

 

 

 

 

 

Ч- ОД 2

( IIz “Ь 1)

Mv -Ь 1)]

 

 

 

— h [х (А + 1), А + 1] I®,

+

0,51|w (А) -

nw(A) f

 

+

 

 

Vy (л+1)

 

 

V^r (я)

 

+

0,5 In [det ГУ№(А) Гт ] + 0,5 In [det Vv (A +

1)]}.

(3.3.14)

Минимизация должна быть проведена при ограничениях, накладываемых моделью формирования сигнала (3.3.6)


76 ФУНКЦИЙ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ 1ГЛ. 3

и порождаемых (3.3.7) условиях постоянства параметров априорных распределений:

х +

1) =

<р [х (к), к\ + Tw (к),

(3.3.15)

(Hw (А; +

1) =

M-w (к),

(3.3.16)

VW(A +

1) =

YW(A),

(3.3.17)

l*v (A: Jt-1) =

цу (к),

(3.3.18)

Vv (A +

l) =

Vv (A).

(3.3.19)

К этой задаче можно непосредственно применить дискрет­

ный принцип максимума или уравнения

Эйлера — Ла­

гранжа. Определим гамильтониан:

 

Н [х(/е), w (к),%(к +

l),v w (к + 1),

 

 

Sw + 1), yv

1), Sv (к Jf- 1),

Mw (к), Yw {к), |иу {к), Vv (к), к] = - i - 1ъ (к + 1) — (А:+ 1) —

% (к), w (к), к

1] ||^-i(fc+i) + — 1w (А) — fiw (kfv-i(k) +

+

In {del ГVw (к) Гт} +

 

-1—— In {det Vv (k -j- 1)} -f- XT (k -f- 1) {ф [x (k), A:] -j- Tw (A:)} -|-

 

-f- Yw (k -j- 1) Цу/ (k)

Sp (3W(k -f- 1) rV w (к) Гт} -f-

+

Yy

+ 1) Mv (A:) +

Sp (3V(A: +

l)Vv(A + l)>,

(3.3.20)

где

X, Yw и Yv — векторные, a S w и Sv — матричные мно­

жители

Лагранжа.

 

 

 

 

Канонические уравнения запишутся в виде

 

:(к + 1 \к}) = ф I* (А: |kf), к]

ЦТ

(3.3.21)

 

 

дер [х (k\kf), /с]

 

- T V W{к\Щ)Г-

 

 

X |kf) -1- I > w |kf),

 

 

Эх |kj)

 

 

 

 

Эср [х |к^), к]

X|А^) +

 

к‘ (к + 1 1kf) = |

 

|

 

 

 

дх |kf)

 

 

 

 

dhT [х +

1 |kf) , к + 1 ]

v ^1(Л + 1 1Af^ X

 

 

 

дх +

1 |kf)

 

 

X (z +

1) — M'v |kf) — h [x (A: -f- 1 |kf), к -j- 1]},

(3.3.22)