Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 150

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

5.2]

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

143

4)решить относительно X1' уравнение

а/Д

__ аб{(х*, и{)

PfT (х1, и1, g*) ki = 0

дх1

~~

дх1

 

5)определить градиент

ЭЯ1

_

Э9 (х*, u{)

afT (х*, u*,

au*

au*

an1

6) используя алгоритм стохастической аппроксимации построить новое приближение

,

ая 1

{ т г atf

iT

Я»

ь —

Uг+1 и* — К 1— г — их — Кх — :

 

Эи1

9u1

h au<

Пример 5.2.1. Рассмотрим задачу отыскания линей­ ного фильтра, минимизирующего

/ = £{1|x(f)-x(*)||l|Z(*)},

для стационарной линейной системы с некоррелирован­ ными входными шумами и ошибками измерений

х = Fx(f) + w(f), $ W O } = 0, cov {w (t), w (t)} =

= ^ W6D (t — T);

s = Hx (f) + v (0, ^ {v (i)} = 0, cov{v(0 , v (t)} =

= 4>vaD( f - 1 ) .

Хорошо известно, что решение этой задачи определяется следующей системой уравнений (Сейдж [116], Хо и Брай­ сон [50]; Сейдж и Мелса [127]):

х =

Fx (t) +

Ж (f) [г (t) -

H i (01, i (t0) =

(fo)b-

 

 

 

ar(t) = v 7 (0 H Tv ; 1,

 

 

V~ =

FV~ (t) +

V~ (t) FT -

V~ (t) НТ^ Н V - (t) +

(0,

 

 

Ух (to) =

var{x (*,,)}.

 

 

Предположим, что выход фильтра наблюдается достаточ­ но долго для того, чтобы закончились переходные про­ цессы. Допустим также, что мощности шумов являются


144

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

[Г Л 5

случайными по ансамблю и известны только их средние значения

ff{«Pv} = 4 " v.

Очевидны три метода конструирования фильтров: 1. Можно построить субоптимальный фильтр

X i = F x j + Жу [г (<) — Н х (*)],

жу=

О = F 3 y + E y F r - Е у К ' ^ И З у + ¥ w ,

являющийся стационарным фильтром Калмана, на кото­ рый поступает помеха со средней для ансамбля интенсив­ ностью.

2. Можно построить субоптимальный адаптивный фильтр

х2 = Fx2 (t) Ж<у (t) \ъ(t) — Нх (01,

X*(t) = S a H ^ ;1^),

Si = F 32 (t) + S2 (t) FT - S2 (t) Ht*F;xH32 (t) + *FW(0.

В этом случае для оценки параметров помех использу­ ются подходящие адаптивные алгоритмы оценивания (Сейдж и Хуса, [123]). Для многих задач это решение прак­ тически неприемлемо, так как приводит к слишком слож­ ным вычислительным процедурам.

3. Вместо фильтра пункта 1 можно использовать фильтр той же сложности реализации

х = Fx (t) + Жа [z (t) — Нх (£)],

где Х 3 — константа, которая выбирается так, чтобы мини­ мизировать ошибку оценивания с учетом случайно­ сти (по ансамблю) параметров 4*w и V y Легко показать (Сейдж [116]; Сейдж и Мелса [127]), что величина диспер­ сии ошибки Е = var {х (t) — xs0 (t)} на выходе субопти­ мального фильтра

xso = Fxso -f X so(t) [z (t) — H (t)x60 (f)l

5.2]

СТОХАСТИЧЕСКАЯ

АППРОКСИМАЦИЯ

145

|Пределяется уравнением

 

 

Ё =

D (О Е (0 + Е (t) DT (t) +

X so (t) *FV (t) W l (t) +

(0,

 

Е (t0) = var {х (t0)},

 

где D (if) = F — X S0El. Это справедливо для фильтров пунктов 1 и 3. Особенно интересно определить величину дисперсии ошибки в стационарном режиме для постоян­ ного Ж so. Для этого нужно найти положительно опреде­ ленное решение уравнения

0 = DE + EDT -f X t0'iryx Z + 'Fw,

где D — F — Ж,011. Используем функцию штрафа вида

/= rS {Sp E)

вкоторую подставляются неотрицательно определенные решения Е. Для фильтра из пункта 1 усиление X s0 опре­

деляется средними значениями 4*w и Фу. Для фильтра пункта 3 мы хотим определить X s0, доставляющее ми­ нимум J. В силу случайности 4*w и Фу будем пользовать­ ся методом стохастической аппроксимации. Мы хотим минимизировать выбором Жf0 функцию штрафа

 

J = g{S pE }

 

 

при учете ограничения

 

 

0 = (F — ЖаоВ) Е l Е (FT- ИТХ 1) +

Ж ^ ж 1 +

»FW,

где ф №и

— случайные величины с известными плот­

ностями вероятности.

 

 

Определим гамильтониан, являющийся случайной ве­

личиной:

 

 

 

Н = Sp Е +

Sp [Л [(F _ Ж80В) Е -[- Е (FT -

В тж1) +

 

 

I- X sovFvxJ0+

4TW]},

здесь Л — симметрическая матрица множителей Лагран­ жа. Оптимальная величина Жso определяется решением следующей системы уравнений:


146

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

[ГЛ. 5

Из этих уравнений находим

 

 

О =

(F - ЖаоН) Е +

Е (FT-

HT^ ST0).+

+ Ww,

 

Е {I + A (F -

^ S0H) +

(FT - HT.%f0) A} =

О,

 

g{A E H T + A.%-so4\} = 0. .

 

В этом частном случае математические ожидания легко вычисляются, в результате имеем

«■,0 = - g { E } H T4f;1,

где ё {Е } определяется уравнением ограничения. Под­ ставляя выражение для Ж80 в уравнение ограничений, на­ ходим простую форму записи ограничения на выбор оп­ тимальной ошибки Е:

О = ¥ ё {Е} -| - Щ{Е} FT - Щ{Е} HT^ ; 1Hg {Е} + ¥ w.

Мы приходим к не такому уж удивительному выводу о том, что «наилучшее» усиление калмановского фильтра определяется подачей на фильтр Калмана средних зна­

чений 4*w и фу.

Интересно проверить этот результат на простом при­ мере. Рассмотрим следующую систему уравнений вход­

ного сигнала и наблюдений:

 

х = w (О,

=

1,

z — х (f) +

v (1);

= 1 = 4V

Величина 'Fw равномерно распределена на отрезке [1 — а,

1 +

а]''так, что var (Тц,) =

а2/3.

 

Фактическая дисперсия ошибки определится как

 

Е

УСJ , / 2SO

Г V

 

2.Г

 

 

Видно, что Е также имеет

равномерное распределение

со

средним значением

 

 

УС,

g(E) = - f -

wr„

и максимальным отклонением ± olI2Kso. В этом частном случае мы видим, что «наилучшее», т. е. минимизирующее


5.2]

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

14?

& {Е }:

значение 3CS0 есть Жа0 = 1, которое

получается

как коэффициент усиления фильтра Калмана с характе­

ристиками помехи

=

Ч/'в = 1. Здесь «наилучший»

от­

носится к минимизации средней дисперсии ошибки.

 

Так

как '¥1В может

в действительности

принимать

любые

значения

на отрезке 1 — а

1 + а,

то

Рис. 5.2.1. Дисперсия ошибки Е как функция и; пример 5.2.1.

очевидно, что максимальное и минимальное значения дис­

персии

ошибки при использовании 3CS0 =

1 составляют

Яшах =

[1 +

(1 + а)]/2 И Ет in = [1 4- (1 — а)]/2, где,

ко­

нечно,

а < 1 ,

поскольку

Д> 0. Другая

стратегия

со­

стоит в минимизации максимальной ошибки. В этом слу­

чае

максимальная ошибка

связана

со значением

=

= 1

+

а,

а наилучшим выбором для коэффициента усиле­

ния

становится

Жю =

У

= (1 -)- а )1'2, для

которого

минимальная величина

максимальной ошибки составляет

^min-max

= (1 +

а)‘ 2.

Фактически

величина

ошибки

Е =

[(1

+

а) + T U)]/[2 (1 +

сс)]1'2 и изменяется от 1/(1 Д- а)1'2

до (1 +

а )'2. Средняя

ошибка при использовании мини­

максного критерия составляет (2 +

а)/[2 (1 + а)]'Ч

 

На рис. 5.2.1

показано,

как влияет выбор различных

критериев

оптимизации на

величину средней дисперсии


148

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

[ГЛ.5

ошибки. Минимаксный критерий приводит к несколько меньшим значениям максимальной дисперсии ошибки. Таким образом, мы могли бы прийти к выводу о том, что оба критерия приводят к довольно близким результатам. Такое имеет место довольно часто, хотя, разумеется, не всегда. Можно считать этот факт счастливой удачей, так как минимизация среднего значения функции штрафа, хотя и достаточно трудная задача, но все же проще мини­ мизации максимальной ошибки.

Пример 5.2.2. Вернемся к примеру 5.2.1, предпо­ ложив на этот раз, что неизвестны матрицы коэффици­ ентов F, G и И. Таким образом, система описывается уравнениями

х =

Fx (t) -j- Gw (t),

cov (w (t), w(t)} =

lFw (t) bD(t t),

z (t) =

Hx (t) + v (t),

cov (v (t), v (t)} =

*FV («) 6D (t — t),

где интенсивности помех T w (t) и T v (т) предполагаются известными, а для F, G и Н известны только их средние

значения F, G и Н.

Один из возможных способов синтеза сводится к ис­ пользованию обычного фильтра Калмапа в предполо­

жении, что F, G и Н есть истинные значения коэффи­ циентов. В стационарном случае это приводит к алго­ ритму

х = Fx ф- Жх [z (t) — Нх (£)],

жч = а 1н тт ’; 1,

О = FB i+ SiF1’ - S iffV ^ H S ! + G'FWGT.

Лучшей альтернативой является использование фильтра вида

х = Fx (t) + Ж$0[z (t) — Нх (*)],

где Х ю подбирается так, чтобы минимизировать мате­ матическое ожидание дисперсии ошибки

{var {х (0 — х (t)}}.

5.2] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 149

Вычитая из уравнения системы уравнение субоптималь­

ного

фильтра, получим

х — (AF — X S0All) х (/) 4- (F — ЯГМН) х (t) f Gw (t) —

 

- X soy(t),

где

отклонения

 

AF = F - F, AH = H — H

характеризуют ошибку моделирования. Удобно ввести вектор расширенного состояния и вектор входов

Х(*) =

x(t)

w (0 = w (0

 

 

 

 

.*(*)_

V (0 J ’

 

для которых справедливо новое уравнение состояния

где

X =

A (f)X (0 +

B (0 W (0 ,

 

 

 

 

 

 

 

Гг - ж

so

н AF — Ж АН]

"о -

SO

0

 

 

SO

, В (t) =

 

 

 

F

0

 

 

 

.G

Хорошо известно, что дифференциальное уравнение для дисперсии ошибки имеет следующий вид:

Vx = А (0 Ух (<) + Vx (t) Ат (0 -J- В (0 *FWBT(t).

Интересно найти решение этого уравнения в стационарном

режиме; для этого положим Vx = 0. Коэффициент усиле­ ния субоптимального фильтра будет выбран так, чтобы $ {S pV -} было минимальным. Так как случайные пара­

метры F, G и Н на величину Vx не влияют, то минимиза­

ция

$ {Sp Vx } полностью

эквивалентна минимизации

» (Sp V -}.

необходимо минимизировать

Таким образом,

 

 

J =

Ш{Sp Ух)

при

ограничении

 

 

0 =

А (р, Х , 0) Vx +

VXAT (р, X so) + В (р, Х со) *F'WBT(p,^rf0).