Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 281
Скачиваний: 1
6-14. Доказать первое утверждение теоремы 6-3, исходя из соот
ношения x(ft+l I |
ft+ 1 + N)=E[x(k |
+ 1) 1 z (1), z(2), |
...,z(ft+/V) |
||
ï(k+l+N\k |
+ |
N)}. |
|
|
|
6-16. Как следует модифицировать результаты теоремы 6-3, если |
|||||
*(0), {w(k); |
ft=0, |
1 ... } и {v(k+l); |
ft=0, |
1 ... } имеют математи |
|
ческие ожидания, отличные от нуля? |
|
|
|
||
6-16. Получить уравнения алгоритма |
оптимального сглаживания |
||||
с единичным |
запаздыванием для системы из задачи |
6-7. |
6J17. В тексте главы указана возможность упрощения результа
тов теоремы 6-3 при отсутствии возмущения, т. е. при Q(ft)=0 для всех ft=0, 1 . . . Имеются ли дальнейшие возможности упрощения результатов теоремы в этом предположении и если имеются, то какие?
6-18. Показать, что теорема 6-3 переходит в теорему 5-5, если
положить запаздывание N равным нулю. |
|
|
|
|
|
|
||||||
6-19. |
Используя модель |
системы с коррелированной ошибкой |
из |
|||||||||
мерения |
из задачи |
4-13, составить алгоритмы |
для |
вычисления |
опти |
|||||||
мальных |
оценок вида x (ft -J- |
1 | ft), |
x (ft + 1 | ft -f- |
1) |
и х (ft | ft + |
1) |
||||||
в предположении, |
сделанном |
также |
в п. «б» задачи |
4-13, |
что |
изме |
||||||
рения имеют вид |
|
|
|
|
|
|
|
|
|
|
||
%(k)^z(k |
+ |
1 ) _ 8(ftJ+ |
1 .ft)zT(ft) = [tf(ft+ |
1)Ф(й + |
l.ft) — |
|
||||||
—'6(ft |
+ l,ft) |
H(k)\x(k) |
+ |
[H(k+ |
1) T (ft+ |
1,ft)]да(ft) + 5 (ft). |
|
Заметим, что эта процедура в случае коррелированных ошибок измерения позволяет избежать расширения вектора состояния систе мы [Л. 6-6]. Предположить, что ж(0), гѵ(0), ѵ(0) и |(ft) равны нулю. Обратить особое внимание на начало работы алгоритма в предпо ложении Ç(0) = г ( 1 ) .
Г л а в а с е д ь м а я
ОПТИМАЛЬНЫЕ ОЦЕНКИ В НЕПРЕРЫВНЫХ ЛИНЕЙНЫХ СИСТЕМАХ. ДИСКРЕТНЫЕ АЛГОРИТМЫ ПРИ ПРЕДЕЛЬНО МАЛОМ ИНТЕРВАЛЕ ДИСКРЕТНОСТИ
После исследования в двух предыдущих главах за дачи оптимальных оценок в дискретных линейных систе мах обратимся к аналогичной задаче с непрерывным временем.
Мы рассмотрим два подхода к решению указанной задачи: первый — в настоящей главе, и втоірой — в гл. 8. В рамках первого подхода алгоритмы оптимальных оце нок будут получены при исследовании предельного пове дения алгоритмов оптимальных оценок для дискретных
281
линейных систем в предположении, что интервалы вре мени между измерениями сколь угодно малы. Этот под ход принадлежит Калману [Л. 7-І], который использовал его для вывода уравнений оптимальной фильтрации.
Впоследствии |
аналогичный подход был применен Рау- |
|||
хом |
и др. [Л. |
7-2] для вывода алгоритма |
оптимального |
|
сглаживания |
на |
закрепленном интервале |
и Медичем |
|
[Л. |
7-3, 7-4] |
для |
получения алгоритмов |
оптимального |
сглаживания в закрепленной точке и с постоянным за паздыванием.
В рамках второго подхода задача оптимальной оцен ки в непрерывных линейных системах решается непо средственно в непрерывном времени. Как и следует ожи дать, результаты в обоих случаях совпадают.
Настоящая глава начинается с формулировки задачи оценки в непрерывных линейных системах. Затем в це лях развития упомянутого выше первого подхода приво дится формулировка задачи оценки с дискретным вре менем, к которой можно применить процедуру предель ного перехода. В остальной части главы при получении алгоритмов оптимальной фильтрации, предсказания и сглаживания на закрепленном интервале, в закреплен ной точке и с постоянным запаздыванием для непрерыв ного времени будет использоваться непосредственный переход к соответствующим пределам.
7-1. ФОРМУЛИРОВКА З А Д А Ч И
Модель системы
Согласно § 4-3 рассматриваемая здесь модель си стемы описывается соотношениями
|
|
x = |
F(t)x-r-G(t)w(t); |
(7-1) |
|
|
|
z{t)=H{t)x(t)+v{t) |
|
(7-2) |
|
для |
t^t0, |
где x — я-вектор; w — р-вектор, a z |
и ѵ — m- |
||
векторы. |
Матрицы |
F(t), G(t) |
и H(t) имеют |
размеры |
|
пХп, |
пХр |
и шХп |
и являются |
непрерывными |
функция |
ми времени. Время обозначается символом t, производ
ная по времени — точкой сверху, а |
фиксированное на |
|||
чальное время — U. |
|
|
|
|
Случайные процессы {w(t), |
t^U) |
и {v(t), |
t^t0) |
пред |
ставляют собой гауссовские |
белые |
шумы |
с нулевыми |
282
математическими ожиданиями и матричными корреля ционными функциями вида
|
|
E[w(t)w'(x)] |
= |
Q(t)à(t—x); |
|
|
|
|
E[v(t)v'(x)]=R(t)à(t- |
т) |
|
||
соответственно для всех t, x^t0, |
где Е обозначает |
мате |
||||
матическое |
ожидание; |
штрих — операцию транспониро |
||||
вания, ô(t—т)—дельта-функцию |
Дирака. Матрицы |
Q(t) |
||||
размера |
рХр |
и R(t) |
размера тХт непрерывны и поло |
|||
жительно определены для t.^t0. |
|
|
||||
Предполагается |
также, что два указанных случайных |
|||||
процесса |
независимы, т. е. |
|
|
|||
|
|
|
£ [ да(/)а'(т)]=0 |
|
||
для всех |
/„ т^г^о- Это допущение в действительности не |
накладывает на задачу дополнительных ограничений, поскольку процедура, используемая в настоящей главе, применима также, если эти два случайных процесса коррелированы. Однако такое предположение упрощает многие преобразования.
Начальное состояние x(to) представляет собой слу чайный гауссовский n-вектор с нулевым средним; он не
зависит |
от {w(t), |
t^to} |
и {v(t), |
t^t0}. |
Корреляционная |
||||||
матрица |
x(t0), |
обозначаемая P(t0) —Е[х(t0)x'(t0)], |
неот |
||||||||
рицательно определена. |
|
|
|
|
|
|
|||||
Оптимальная |
|
оценка |
|
|
|
|
|
||||
Для обозначения состояния х системы с непрерыв |
|||||||||||
ным временем |
заменим |
дискретные |
индексы |
времени k |
|||||||
и / в прежних обозначениях на непрерывные |
переменные |
||||||||||
ti и t |
Тогда оценка состояния |
х в |
некоторый |
момент |
|||||||
времени |
ti^t0 |
на |
основе измерений |
z(x) |
на |
интервале |
|||||
^о^.т^1 ^ обозначается |
x(U\t). |
|
|
|
|
|
|||||
Если |
tt^>t, |
то xtyilf) |
является поедсказанием, если |
||||||||
ti = t, |
то это текущая оценка, а если ti<t, |
то это сглажи |
|||||||||
вание или интерполяция, так же как и в случае |
дискрет |
||||||||||
ного времени. |
|
|
|
|
|
|
|
|
|
||
Ошибка оценки |
определяется |
выражением |
|
||||||||
|
|
|
x{tl\f) |
= |
x{tl)-x(t1\f), |
|
|
|
283
а качество |
оценки |
характеризует критерий качества |
||||
|
|
/ ï * ( / 1 | / ) ] = £ { L [ î ( / 1 | O Ï } , |
|
|||
где |
L — некоторая |
допустимая функция потерь |
(соглас |
|||
но определению в § |
5-1). |
|
|
|||
Оценка |
x(ti\t), |
минимизирующая |
J[x(ti\t)], |
называ |
||
ется |
оптимальной |
оценкой. |
|
|
||
|
Постановка |
задачи |
|
|
||
|
Для |
системы |
|
(7-1), (7-2) по измерениям |
{.г(т); |
|
to^r^lt} |
определить |
оптимальную |
оценку |
состояния |
||
x{U). |
|
|
|
|
|
|
|
7-2. ЭКВИВАЛЕНТНАЯ З А Д А Ч А С ДИСКРЕТНЫМ ВРЕМЕНЕМ |
|||||
|
Чтобы использовать для решения |
поставленной за |
дачи процедуру предельного перехода, упомянутую в на чале главы, приведем формулировку эквивалентной за дачи с дискретным временем.
Здесь для обозначения дискретного времени исполь
зуется переменная / *. Точнее, для любого М>0 |
симво |
||||||
лом |
t обозначаются |
дискретные моменты |
времени {t = |
||||
— t0 |
+ jM\ j — 0, 1 .. .}. Для любого |
такого |
г |
в |
§ 4-3 по |
||
казано, что дискретная модель системы (7-1) |
представ |
||||||
ляет |
собой |
гауссовскую марковскую |
последовательность |
||||
с нулевым |
средним, |
описываемую уравнением |
|
||||
где |
x(t+At)=0(t+At, |
t)x(t)+T(t+M. |
t)w{t), |
(7-3) |
|||
|
|
|
|
|
|
|
|
|
|
Q)(t+At, t)=I+F(t)Ml+0(At2); |
|
|
|
(7-4) |
|
|
|
T(t + At, |
t) = G{i)At+0{AP), |
|
|
(7-5) |
a {w(t)\ t — to-\-jAt; / = 0, 1 . . .} гауссовокая белая после довательность с нулевым средним и корреляционной функцией
E[w{t)w'b)\=Q$-iih.
* В настоящей главе переменная t будет использоваться для обозначения как дискретного, так и непрерывного времени. Это позволит упростить необходимые преобразования и не вызовет пута ницы, поскольку характер использования переменной всегда будет ясен из контекста.
284
Здесь / |
и |
т |
обозначают |
дискретное |
время, |
причем |
||||
{x = U-\-kAt; |
/г = 0, |
1 . . .}; Q(t) |
неотрицательно |
определен |
||||||
ная матрица для всех t^to, |
|
a öjk — символ |
Кронекера. |
|||||||
Начальное |
состояние x(to) |
представляет |
собой гауссов |
|||||||
ский случайный п-вектор, независимый |
от [w(t), |
t = U-{- |
||||||||
+ jAt; / = 0, |
1 . . .}, с нулевым |
средним |
и |
неотрицательно |
||||||
определенной |
корреляционной |
матрицей |
E[x(t0)x'(t0)] |
= |
||||||
= P(to). |
|
|
|
|
|
|
|
|
|
|
Дискретная модель уравнения измерений (7-2) |
|
имеет |
||||||||
вид: |
|
|
= H(t + At)x{t |
+ At) + v{t+At), |
|
|
|
|||
z(H-Af) |
|
|
(7-6) |
где t, как и ранее, обозначает дискретное время. Слу чайный процесс {v (t + At), t = to + jAt; j = О, 1 . ..} — гауссовская белая последовательность, независимая от x(t0), с нулевым средним и корреляционной функцией вида
£ И* + At) V' (т + |
Л/)] = |
|
|
8J k , |
|
|
|||
где т — дискретное |
время, |
а |
матрица |
R(i |
+ At) |
положи |
|||
тельно определена |
для |
всех |
t^t0. |
|
|
|
|
||
Здесь предполагается, что две гауссовские белые по |
|||||||||
следовательности в уравнениях |
(7-3) |
и |
(7-6) |
|
незави |
||||
симы. |
|
|
|
|
|
|
|
|
|
Пусть ti = to + iAt, |
і = 0 , |
|
1, |
. . . — дискретное |
время, |
||||
а оценки состояния х обозначаются x(ti\t). |
Как |
и ранее, |
|||||||
эти оценки классифицируются в соответствии |
со |
значе |
|||||||
нием t относительно ti. |
|
|
|
|
|
|
|
|
|
Определения ошибки оценки, критерия качества и |
|||||||||
оптимальной оценки остаются |
теми же, что и в § 7-1, за |
исключением того, что ti я t здесь являются дискретны ми моментами времени.
Эквивалентная постановка задачи оценки имеет сле
дующий вид. |
|
|
|
|
|
Постановка |
задачи |
|
|
|
|
Для |
системы |
(7-3), |
(7-6) по |
измерениям {z{x); |
% = |
— ta + At, |
U + 2At, |
. . ., t) |
определить |
оптимальную |
оценку |
состояния |
x(ti). |
|
|
|
|
Решение этой задачи можно получить, используя ре зультаты гл. 5 и 6. Поскольку при переходе к пределу при At—>-0 система (7-3), (7-6) переходит в систему
285