Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 160

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

3.4]

(КРИ ТЕРИ И МАКСИМУМА ПРАВДОПОДОБИЯ

91

и в.

В результате

получится

 

 

х(А +

1 | М ) = ч>1х(А|е),А].

(3.4.43)

Таким образом, выписана полная система уравнений дискретного нелинейного алгоритма оценивания первого порядка по методу условного среднего. Они сведены в табл. 3.4.1, включающую алгоритмы, необходимые для определения штрафной функции максимального правдо­ подобия рассмотренным методом первого порядка. Можно пользоваться аппроксимациями более высокого порядка для оценки (Сейдж и Мелса [127]), однако здесь они рас­ сматриваться не будут.

Отметим, что эти (приближенные) алгоритмы фильтра­ ции условного среднего по сути являются обобщением алгоритмов фильтра Калмана. Если модели формирова­ ния и наблюдения сигнала линейны, то эти уравнения превращаются в обычные уравнения линейного фильтра Калмана. Итак, минимизация функции штрафа из табл. 3.4.1 при ограничениях, задаваемых разностными урав­ нениями из той же таблицы, ведет в итоге к алгоритмам идентификации по методу максимального правдоподобия. Дальнейшему развитию этих результатов посвящены сле­ дующие четыре главы. Теперь рассмотрим простой при­ мер, иллюстрирующий наиболее существенные моменты изложенных выше результатов.

Пример 3.4.1. Используем простой пример для демон­ страции процедуры определения функции штрафа при идентификации по максимуму правдоподобия. Скалярные модели формирования и наблюдения сигнала с постоян­ ными VD и Vw имеют вид

х {к -]-1) = Фх (к) + ш (к), z (к) = х (к) + v (к)

Для такой или любой линейной модели формирования и наблюдения сигнала алгоритмы табл. 3.4.1 являются точными, а не просто хорошими приближениями. Подле­ жащая минимизации штрафная функция (3.4.21) прини­ мает вид

/ = 4 - 2 flndetlF„ + Уг (А|Л-1,Ф)] +

к—К ^

(к) — х(к\к — 1, Ф)]2 )

Vv+ Гг (*|А-1,Ф ) /•


92 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФ ИКАЦИИ [ГЛ . 3

 

 

 

 

Т а б л и ц а

 

3.4.1

Алгоритмы первого порядка идентификации

 

 

 

по максимуму правдоподобия

 

 

 

 

 

(штрафная функция)

 

 

 

 

 

 

 

Модель формирования сигнала

 

 

 

 

 

 

 

х (ft + 1) =

ф [х (ft), к] + Г [х (к),

к] w (к)

 

 

 

 

Модель наблюдений

 

 

 

 

 

 

 

 

z (к) = h [х (к), к] + v (к)

 

 

 

 

 

 

Параметры априорных распределений

 

 

 

 

 

 

 

Ч (w (к)} = 0, cov {W (к), w (/')} = Vw (к) бк /),

 

 

 

<$(к)} = 0,

cov {V {к), v (/).} = Vv6K /),

 

 

 

 

% (х (0)} = рх (0) =

цХо, var {х (0)} = V~(0) =

Vx (0) =

V^,

 

cov(w (к), v (к)} = cov {х (к),

v (к)} = cov{x (к),

w (/')} 0, / >

к

Уравнение фильтра условного среднего

 

 

 

 

 

 

 

х (А- + 1 | ;0 )= х > + 1 |к, 0) +

К (ft + 1) [z(ft +

l) —

 

 

 

 

 

 

— h[x(ft + l|ft,

0,

 

ft+

1]]

Уравнение одношаговой

экстраполяции

 

 

 

 

 

 

 

X (ft +

1 |ft. в) = ф [х (ft |0),

ft]

 

 

 

 

 

Уравнение для коэффициента усиления

фильтра

 

 

 

 

 

ЭЬТ [х (ft + 1 1ft,

9), ft + 1]

xr-i

(ft + 1)

K(ft + l ) = V x (ft + l|0)

dx (ft + 1 |ft,

0)

 

Vv

 

 

 

 

 

 

 

 

Уравнение для априорной дисперсии ошибки фильтрации

V~ (ft + 1|Л, 0)

дф [ х (ft |0),

ft]

дфТ (x

(ft 10),

ft]

ax (ft I 0)

 

x (k)

dx (ft

I 0)

+

 

 

 

 

 

+ r[i(fc|0),

ft] Vw (ft)rT[x(ft|0),

ft]

 

 

 

Уравнения для дисперсии ошибки фильтрации

 

 

V - (ft +

1 |0) =

V~ (ft + 1 |ft,

0) -

V5 (ft +

1 |ft,

0) X

ahT [x (ft +

life. 0). fc + i]

dhT [x (ft 4-1 |ft, 0),

ft+

1]

X

 

0)

 

 

dx (ft 4- 1 |ft,

0)

 

Эх (ft 4 -1 1ft,

 

 

 

X V -(ft 4-1 |ft,

0)! dhT [x (ft 4-1 I ft, B),

fe + 1]

+

Vv (ft +

1)

 

 

dx (ft 4-1 |ft, 0)

 

 

 

 

dhT [x(ft4-l|fc,

0), ft +

1]

V-(ft +

1 1ft, 0)

 

X

dx (ft + 1

|ft, 0)

 

 

 

 

 

 

 

 

 

X

X


3.4]

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ

93

 

 

 

Т а б л и ц а 3.4.1

(продолжение)

 

Штрафная функция идентификации по максимуму правдо­

 

подобия

 

 

 

 

 

 

1

*1

 

 

 

 

J = - 2~ J'

In dot Vz |к 1, 0 )+ ||z(/c) — h[x(/c|/c —

 

 

к=к\

 

 

 

 

 

в).

V

 

 

Vv (*) +

 

 

llv-Vfclfc-i. в). V,(*|A-1. в) =

 

+

dhT[x(k\k — 1,

9),

k]

 

 

 

дх(к\к — 1,

0)

V - (AJ k — 1, 0) X

 

 

 

 

 

 

 

 

X

dhT[x (k |к — 1,

0), k\

 

 

 

dx (k |к — 1, 0)

 

 

 

 

 

 

Начальные условия фильтрации

 

 

 

 

х(0|0, 0) = Ц2о,

V- (О I 0, 0) = VXo

 

 

Алгоритмы одношаговой экстраполяции из табл. 3.4.1, которые снова оказываются точными, поскольку система линейна, выглядят так:

х + 1 1к, Ф) = Фх |к — 1, Ф) +

 

<DF_ (к\к — 1,Ф)

 

 

 

j

X

 

[z (к) — х |к — 1, Ф)],

'

V-(k\k — 1,Ф) + F

 

X

 

и

 

 

 

 

ФW V- (к\к — 1,Ф)

I

Т7

V~x (k +

l\k, Ф)

V X

'

V-(k\k — 1 , Ф ) + Vv

+

Vw

 

 

Для определения оптимального значения оценки Ф, переходной матрицы модели, мы минимизируем функ­ цию штрафа J относительно Ф при ограничениях, зада­ ваемых разностными уравнениями для х (к + 1 |к, Ф) и V- (к -j- 1 I /с, Ф). Поскольку имеется всего один настра­

иваемый параметр, оценка значений штрафной функции для всех значений Ф, для которых это необходимо, ока­ зывается сравнительно простой (для вычислительной ма­ шины) задачей. На рис. 3.4.1 — 3.4.3 показаны изменения J в зависимости от Ф для нескольких различных значений отношения Vv/Vw. Следует отметить, что при конечных размерах выборки (конечное к0 = 0) минимум функции


94 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3

штрафа может, при отдельных последовательностях шума, не всегда достигаться при истинном значении Ф. При «низком» уровне шума объекта и «длинной» последователь­ ности наблюдений минимум J достигается вблизи от истин­ ного значения Ф. По мере сокращения длины реализации или усиления шума наблюдений ошибка идентификации

ЛФ) ,, Ю*

I)1

_ . J

------------ 1----------

1------------

1------------

1_____Lllflt

I

.

,

 

п

Ц,г

 

ЦВ

\

/,0

 

 

Рис. 3.4.1.

Зависимость штрафа от Ф при разных значениях Vv/Vw

пример

3.4.1

(хо =

0, 0;

Vv/Vw =

р, к) = 800).

возрастает. Точно так же можно ожидать, что параметры априорного распределения х (к0) влияют на идентифика­ цию. Очевидно, что если Vx (к0) равна нулю и отсутствует шум объекта или шум наблюдений, получится простая разновидность задачи идентификации, рассмотренной в главе 2. На рис. 3.4.4 показана зависимость функции штрафа от У Vv при различных размерах выборки.

Эти приближенные алгоритмы нуждаются в незначи­ тельных изменениях для распространения их на случай, когда шумы объекта и измерений коррелированы. Урав­ нения (3.4.9) и (3.4.11) для функции штрафа сохраняют силу. Однако в выражениях для входящих в них матема­

тических ожиданий появляются

отличия

по

сравнению

со случаем некоррелированных

шумов.

В

самом деле,

h(к), к |0 |=

=Ш(z (ft) |Z - 1), 0} = Ш(h [х ), k]\Z(k 1), 0}.


3.41

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЯ

9 5

 

 

ЛФ)

Рис. 3.4.2. Зависимость штрафа от Ф при разных значениях I; пример 3.4.1 (L — число наблюдений, Vv = 1,0; Vw = 16,0 хо = = 0,5).

Рис. 3.4.3. Зависимость функции штрафа от kVw при разных Vv/Vw; пример 3.4.1 (р = VJVw, kf = 900 — число наблюдений, х0 =

= 0,0).

96

Ф у н к ц и и Шт р а ф а в з а д а ч а х и д е н т и ф и к а ц и и [г л . з

Применяя разложение в ряд Тейлора к уравнению (3.4.22), мы видим, что появляется необходимость в выражении для h [х |к — 1, 0)1, которое, конечно, по-прежнему определяется формулой (3.4.21). Алгоритм одношаговой

J

Рис. 3.4.4. Зависимость функции

штрафа от Y У» ПРИ

разных L

(VvIVw = р =

9,0, L — число наблюдений, х0 =

0,0).

экстраполяции

(3.4.43) в данном случае уже не

годится,

так как

 

 

 

х 1) = ф [х (к), к] -}- Г [х (к), к] w {к),

 

и аппроксимация первого порядка принимает

вид

х (Л -И | * ,в ) =

 

 

 

= ф [х 10), /с] 4- Г [х (к),

к] $ {w (к) |Z (к), 9}, (3.4.44)

что можно записать в виде

 

 

х + 1 1к, 0) =

<р [х 10), к] +

Г [х (к), к] х

(3.4.45)

X Vwv {к) V^1|к — 1, 0) {z (к) — h [х (к \к — 1, 0), к]},

применяя теорему об условном математическом ожидании (3.4.28) и соотношение

var (w (к) |Z (к), 0} = Vw (к) - Vwv (ft) V"1 (ft |ft - 1) Vvw (k). (3.4.46)