Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 281

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

6-14. Доказать первое утверждение теоремы 6-3, исходя из соот­

ношения x(ft+l I

ft+ 1 + N)=E[x(k

+ 1) 1 z (1), z(2),

...,z(ft+/V)

ï(k+l+N\k

+

N)}.

 

 

 

6-16. Как следует модифицировать результаты теоремы 6-3, если

*(0), {w(k);

ft=0,

1 ... } и {v(k+l);

ft=0,

1 ... } имеют математи­

ческие ожидания, отличные от нуля?

 

 

 

6-16. Получить уравнения алгоритма

оптимального сглаживания

с единичным

запаздыванием для системы из задачи

6-7.

6J17. В тексте главы указана возможность упрощения результа­

тов теоремы 6-3 при отсутствии возмущения, т. е. при Q(ft)=0 для всех ft=0, 1 . . . Имеются ли дальнейшие возможности упрощения результатов теоремы в этом предположении и если имеются, то какие?

6-18. Показать, что теорема 6-3 переходит в теорему 5-5, если

положить запаздывание N равным нулю.

 

 

 

 

 

 

6-19.

Используя модель

системы с коррелированной ошибкой

из­

мерения

из задачи

4-13, составить алгоритмы

для

вычисления

опти­

мальных

оценок вида x (ft -J-

1 | ft),

x (ft + 1 | ft -f-

1)

и х (ft | ft +

1)

в предположении,

сделанном

также

в п. «б» задачи

4-13,

что

изме­

рения имеют вид

 

 

 

 

 

 

 

 

 

 

%(k)^z(k

+

1 ) _ 8(ftJ+

1 .ft)zT(ft) = [tf(ft+

1)Ф(й +

l.ft) —

 

—'6(ft

+ l,ft)

H(k)\x(k)

+

[H(k+

1) T (ft+

1,ft)]да(ft) + 5 (ft).

 

Заметим, что эта процедура в случае коррелированных ошибок измерения позволяет избежать расширения вектора состояния систе­ мы [Л. 6-6]. Предположить, что ж(0), гѵ(0), ѵ(0) и |(ft) равны нулю. Обратить особое внимание на начало работы алгоритма в предпо­ ложении Ç(0) = г ( 1 ) .

Г л а в а с е д ь м а я

ОПТИМАЛЬНЫЕ ОЦЕНКИ В НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМАХ. ДИСКРЕТНЫЕ АЛГОРИТМЫ ПРИ ПРЕДЕЛЬНО МАЛОМ ИНТЕРВАЛЕ ДИСКРЕТНОСТИ

После исследования в двух предыдущих главах за­ дачи оптимальных оценок в дискретных линейных систе­ мах обратимся к аналогичной задаче с непрерывным временем.

Мы рассмотрим два подхода к решению указанной задачи: первый — в настоящей главе, и втоірой — в гл. 8. В рамках первого подхода алгоритмы оптимальных оце­ нок будут получены при исследовании предельного пове­ дения алгоритмов оптимальных оценок для дискретных

281


линейных систем в предположении, что интервалы вре­ мени между измерениями сколь угодно малы. Этот под­ ход принадлежит Калману [Л. 7-І], который использовал его для вывода уравнений оптимальной фильтрации.

Впоследствии

аналогичный подход был применен Рау-

хом

и др. [Л.

7-2] для вывода алгоритма

оптимального

сглаживания

на

закрепленном интервале

и Медичем

[Л.

7-3, 7-4]

для

получения алгоритмов

оптимального

сглаживания в закрепленной точке и с постоянным за­ паздыванием.

В рамках второго подхода задача оптимальной оцен­ ки в непрерывных линейных системах решается непо­ средственно в непрерывном времени. Как и следует ожи­ дать, результаты в обоих случаях совпадают.

Настоящая глава начинается с формулировки задачи оценки в непрерывных линейных системах. Затем в це­ лях развития упомянутого выше первого подхода приво­ дится формулировка задачи оценки с дискретным вре­ менем, к которой можно применить процедуру предель­ ного перехода. В остальной части главы при получении алгоритмов оптимальной фильтрации, предсказания и сглаживания на закрепленном интервале, в закреплен­ ной точке и с постоянным запаздыванием для непрерыв­ ного времени будет использоваться непосредственный переход к соответствующим пределам.

7-1. ФОРМУЛИРОВКА З А Д А Ч И

Модель системы

Согласно § 4-3 рассматриваемая здесь модель си­ стемы описывается соотношениями

 

 

x =

F(t)x-r-G(t)w(t);

(7-1)

 

 

z{t)=H{t)x(t)+v{t)

 

(7-2)

для

t^t0,

где x — я-вектор; w — р-вектор, a z

и ѵ — m-

векторы.

Матрицы

F(t), G(t)

и H(t) имеют

размеры

пХп,

пХр

и шХп

и являются

непрерывными

функция­

ми времени. Время обозначается символом t, производ­

ная по времени — точкой сверху, а

фиксированное на­

чальное время — U.

 

 

 

 

Случайные процессы {w(t),

t^U)

и {v(t),

t^t0)

пред­

ставляют собой гауссовские

белые

шумы

с нулевыми

282


математическими ожиданиями и матричными корреля­ ционными функциями вида

 

 

E[w(t)w'(x)]

=

Q(t)à(t—x);

 

 

 

E[v(t)v'(x)]=R(t)à(t-

т)

 

соответственно для всех t, x^t0,

где Е обозначает

мате­

матическое

ожидание;

штрих — операцию транспониро­

вания, ô(t—т)—дельта-функцию

Дирака. Матрицы

Q(t)

размера

рХр

и R(t)

размера тХт непрерывны и поло­

жительно определены для t.^t0.

 

 

Предполагается

также, что два указанных случайных

процесса

независимы, т. е.

 

 

 

 

 

£ [ да(/)а'(т)]=0

 

для всех

/„ т^г^о- Это допущение в действительности не

накладывает на задачу дополнительных ограничений, поскольку процедура, используемая в настоящей главе, применима также, если эти два случайных процесса коррелированы. Однако такое предположение упрощает многие преобразования.

Начальное состояние x(to) представляет собой слу­ чайный гауссовский n-вектор с нулевым средним; он не

зависит

от {w(t),

t^to}

и {v(t),

t^t0}.

Корреляционная

матрица

x(t0),

обозначаемая P(t0) —Е[х(t0)x'(t0)],

неот­

рицательно определена.

 

 

 

 

 

 

Оптимальная

 

оценка

 

 

 

 

 

Для обозначения состояния х системы с непрерыв­

ным временем

заменим

дискретные

индексы

времени k

и / в прежних обозначениях на непрерывные

переменные

ti и t

Тогда оценка состояния

х в

некоторый

момент

времени

ti^t0

на

основе измерений

z(x)

на

интервале

^о^.т^1 ^ обозначается

x(U\t).

 

 

 

 

 

Если

tt^>t,

то xtyilf)

является поедсказанием, если

ti = t,

то это текущая оценка, а если ti<t,

то это сглажи­

вание или интерполяция, так же как и в случае

дискрет­

ного времени.

 

 

 

 

 

 

 

 

 

Ошибка оценки

определяется

выражением

 

 

 

 

x{tl\f)

=

x{tl)-x(t1\f),

 

 

 

283


а качество

оценки

характеризует критерий качества

 

 

/ ï * ( / 1 | / ) ] = £ { L [ î ( / 1 | O Ï } ,

 

где

L — некоторая

допустимая функция потерь

(соглас­

но определению в §

5-1).

 

 

Оценка

x(ti\t),

минимизирующая

J[x(ti\t)],

называ­

ется

оптимальной

оценкой.

 

 

 

Постановка

задачи

 

 

 

Для

системы

 

(7-1), (7-2) по измерениям

{.г(т);

to^r^lt}

определить

оптимальную

оценку

состояния

x{U).

 

 

 

 

 

 

 

7-2. ЭКВИВАЛЕНТНАЯ З А Д А Ч А С ДИСКРЕТНЫМ ВРЕМЕНЕМ

 

Чтобы использовать для решения

поставленной за­

дачи процедуру предельного перехода, упомянутую в на­ чале главы, приведем формулировку эквивалентной за­ дачи с дискретным временем.

Здесь для обозначения дискретного времени исполь­

зуется переменная / *. Точнее, для любого М>0

симво­

лом

t обозначаются

дискретные моменты

времени {t =

— t0

+ jM\ j — 0, 1 .. .}. Для любого

такого

г

в

§ 4-3 по­

казано, что дискретная модель системы (7-1)

представ­

ляет

собой

гауссовскую марковскую

последовательность

с нулевым

средним,

описываемую уравнением

 

где

x(t+At)=0(t+At,

t)x(t)+T(t+M.

t)w{t),

(7-3)

 

 

 

 

 

 

 

 

 

Q)(t+At, t)=I+F(t)Ml+0(At2);

 

 

 

(7-4)

 

 

T(t + At,

t) = G{i)At+0{AP),

 

 

(7-5)

a {w(t)\ t — to-\-jAt; / = 0, 1 . . .} гауссовокая белая после­ довательность с нулевым средним и корреляционной функцией

E[w{t)w'b)\=Q$-iih.

* В настоящей главе переменная t будет использоваться для обозначения как дискретного, так и непрерывного времени. Это позволит упростить необходимые преобразования и не вызовет пута­ ницы, поскольку характер использования переменной всегда будет ясен из контекста.

284


Здесь /

и

т

обозначают

дискретное

время,

причем

{x = U-\-kAt;

/г = 0,

1 . . .}; Q(t)

неотрицательно

определен­

ная матрица для всех t^to,

 

a öjk — символ

Кронекера.

Начальное

состояние x(to)

представляет

собой гауссов­

ский случайный п-вектор, независимый

от [w(t),

t = U-{-

+ jAt; / = 0,

1 . . .}, с нулевым

средним

и

неотрицательно

определенной

корреляционной

матрицей

E[x(t0)x'(t0)]

=

= P(to).

 

 

 

 

 

 

 

 

 

 

Дискретная модель уравнения измерений (7-2)

 

имеет

вид:

 

 

= H(t + At)x{t

+ At) + v{t+At),

 

 

 

z(H-Af)

 

 

(7-6)

где t, как и ранее, обозначает дискретное время. Слу­ чайный процесс {v (t + At), t = to + jAt; j = О, 1 . ..} — гауссовская белая последовательность, независимая от x(t0), с нулевым средним и корреляционной функцией вида

£ И* + At) V' +

Л/)] =

 

 

8J k ,

 

 

где т — дискретное

время,

а

матрица

R(i

+ At)

положи­

тельно определена

для

всех

t^t0.

 

 

 

 

Здесь предполагается, что две гауссовские белые по­

следовательности в уравнениях

(7-3)

и

(7-6)

 

незави­

симы.

 

 

 

 

 

 

 

 

 

Пусть ti = to + iAt,

і = 0 ,

 

1,

. . . — дискретное

время,

а оценки состояния х обозначаются x(ti\t).

Как

и ранее,

эти оценки классифицируются в соответствии

со

значе­

нием t относительно ti.

 

 

 

 

 

 

 

 

Определения ошибки оценки, критерия качества и

оптимальной оценки остаются

теми же, что и в § 7-1, за

исключением того, что ti я t здесь являются дискретны­ ми моментами времени.

Эквивалентная постановка задачи оценки имеет сле­

дующий вид.

 

 

 

 

Постановка

задачи

 

 

 

Для

системы

(7-3),

(7-6) по

измерениям {z{x);

% =

— ta + At,

U + 2At,

. . ., t)

определить

оптимальную

оценку

состояния

x(ti).

 

 

 

 

Решение этой задачи можно получить, используя ре­ зультаты гл. 5 и 6. Поскольку при переходе к пределу при At>-0 система (7-3), (7-6) переходит в систему

285