Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.04.2024
Просмотров: 249
Скачиваний: 0
550 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. И
Предположим, что качество |
управления и — (и0, |
ит_х) |
измеряется квадратичным функционалом потерь |
|
|
' Г - 1 |
|
|
V (и) = М 2 (ѲШ (t) Ѳ, + |
utR (t) щ) + QtH (T) 0r |
, (14.57) |
_t= о |
|
|
где H (t), R(t) — детерминированные, ограниченные, |
симметри |
ческие, неотрицательно определенные матрицы порядков (k Х&),
(л X г) соответственно. |
йг_,), |
Требуется найти (оптимальное) управление й — (й0, . . . , |
|
для которого |
|
V (и) — inf V (и), |
(14.58) |
где inf берется по всем управлениям, удовлетворяющим усло виям (14.56).
Рассматриваемая задача является примером так называе мых задач управления по неполным данным, когда значения управляющих воздействий предполагаются зависящими лишь
от наблюдаемой части |
координат |
( |0, |
...), |
описывающих |
состояние управляемой |
системы. |
|
|
|
2 . При отыскании оптимальных управлений (в рассматри |
||||
ваемой задаче таковые |
существуют, |
что |
станет |
ясно из даль |
нейшего), помимо результатов оптимальной нелинейной фильт рации, будут использованы также идеи динамического про граммирования.
Введем ряд необходимых для дальнейшего обозначений. Пусть P(t) и У/, t = 0, 1, . . . , Т, — матричные функции по рядка (k X k), определяемые как решения рекуррентных урав
нений
P ( t ) = H ( t ) + a ( t ) P ( t + \ ) a ( t ) - |
|
|
||
- а * ( t ) P ( t + \ ) c (t) [R (t) + с* (0 P { t + \ ) c (/)]+ с* (0 Р (t + |
1) а (t) |
|||
с Р(Т) = Н(Т) и |
|
(14.59) |
||
|
|
|||
Уt+i = a (t) y ta* (t) + b (t) 6’ (t) — |
|
|
||
- |
a (t) ytA' (t) [В (t) B* (t) + A (t) ytA* (0]+ A (t) yta (t) |
(14.60) |
||
c Yo — Y- Пусть также |
|
|
||
D(t) = |
a (t) ytA' (t) {[B (t) B*{t) + A (t) уtA' (*)]v*} + |
(14.61) |
||
и p(t), t = |
0 , 1 , |
. .. , T, — последовательность |
неотрицательных |
|
чисел, определяемых рекуррентным образом: |
|
|
||
p ( t ) = p ( t + ! ) + |
S p P ,/2( / + l) D (t) D* (t) P U2 (t + |
1), P ( D = |
0. |
|
|
|
|
|
( 1 4 . 6 2 ) |
§ 31 |
ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ |
551 |
|
|
Из (14.62) следует, что
Г - 1
|
Р ( 0 = 2 |
SpPl/2 ( s + l ) D ( S)D*(s)P1/2 ( s + l ) . |
|
(14.63) |
|||||||||||
|
|
S = t |
|
|
|
|
|
|
|
|
|
|
|
|
|
Введенные |
матрицы |
Р (t), |
yt |
и |
числа |
р (t) находятся |
по |
||||||||
коэффициентам |
системы |
(14.55) |
и |
заданным |
матрицам |
H{t) |
|||||||||
и R(t). Поэтому они не зависят от «случая» и, являясь лишь |
|||||||||||||||
функциями времени t, могут быть найдены а priori. |
|
|
|
||||||||||||
Заметим, что матрицы P(t), |
t = |
О, I, . .. , |
Т, найденные из |
||||||||||||
рекуррентных уравнений (14.59), являются симметрическими и |
|||||||||||||||
неотрицательно |
определенными. |
Для |
того |
чтобы |
в этом |
убе |
|||||||||
диться, рассмотрим задачу фильтрации (см. |
§ 1 |
гл. |
13) |
для |
|||||||||||
процессов |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ѳ5+І- а ‘(^-5)Ѳ,+ Hll2(T-s)Bl(s+ 1), |
|
|
|
|||||||||||
|
L +i = |
с ' ( Т - |
s) 0S + |
Rlß (T - |
s) ë2 (s + 1), |
|
|
|
|
||||||
где ëj (s), |
ë2(s) — независимые |
гауссовские |
случайные |
векторы |
|||||||||||
с независимыми компонентами, |
средние которых равны нулю, |
||||||||||||||
а дисперсии — единице. |
Будем |
предполагать, |
что Ѳ0 является |
||||||||||||
гауссовским вектором, МѲ0= 0, |
МѲ0Ѳо == Я (Г), не зависящим от |
||||||||||||||
ëi(s), ë2 (s), s = |
0, |
|
Т — 1. |
|
|
|
|
|
|
|
|
|
|
||
Сравнивая уравнения (13.57) для yt — М [(Ѳ, — tnt){Qt — |
■ |
||||||||||||||
где mt = |
М (Ѳ, I g,, |
. . . , |
I,), с уравнением (14.59) |
для P(t), видим, |
|||||||||||
что Р(0 = Уг-/- |
Следовательно, |
матрицы P(t) являются сим |
|||||||||||||
метрическими и неотрицательно определенными. |
|
|
|
|
|||||||||||
3. |
Т е о р е м а |
14.2. В классе |
управлений, удовлетворяющих |
||||||||||||
условию |
(14.56), |
оптимальное |
|
управление |
й — {й0, . .. , |
йг_і) |
|||||||||
существует и задается формулами |
|
|
|
|
|
|
|
|
|||||||
ü(t, l) = |
- [ R ( t) + |
c*(t)P(t+ 1)с(0]+ с * ф Р Н 1 ) а ( 0 т , |
(14.64) |
где матрицы Р (t) определяются из (14.59), а пг, находятся из рекуррентных уравнений оптимальной фильтрации
mt+i = с (t) üt -f- а (t) mt +
+ |
fl (ОѴИ* (О [В (t) я* (0 + |
а (t) Ѵ(Л‘ Wl+ [ІШ - |
А (t) mt\ (14.65) |
|||||
с m0 = |
m и матрицами \ (, определенными в (14.60). |
процесс |
||||||
При |
этом |
входящий |
в |
(14.65) наблюдаемый |
||||
%t, t = |
1........ Т, |
определяется |
из |
системы |
|
|
||
|
|
Ѳ*+1 == с (t) щ + |
а (t) Ѳ( + |
b (t) e, (t + |
1 ), |
|
||
|
|
i/+i — |
A {t) 0; + |
В (t) e2 (t + |
1), |
|
||
a |
|
|
|
|
T |
|
|
|
|
|
V (ü) = p (0) + m P (0) m + 2 |
Sp Я 1/2 (0 ytHm (t). |
( 1 4 . 6 7 ) |
§ 3] |
ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ |
553 |
Поскольку функции Sp Н 1 (/) ytH /:(t) зависят лишь от вре мени t и не зависят ни от управления, ни от процессов, описы вающих состояние рассматриваемой, системы, то ясно, что оптимальное управление й в исходной задаче (если оно только, конечно, существует) совпадает с оптимальным управлением в задаче минимизации функционала
_ |
/ г |
|
Г-1 |
\ |
|
Ѵ(и) = |
М 2 К “)’ Я (/) m“ + |
2 utR (t) и.). |
(14.72) |
||
|
\ t = о 4 |
' |
t*=о |
V |
|
При этом «управляемый» процесс rrVf определяется из урав |
|||||
нения |
|
|
|
|
|
mf+l — с (i)ut -\- а (t) mat + |
|
|
|
|
|
+ а (/) ѵИ* W [В (t) B'(t) + |
А (t) ytA* (/)]+ [S“+I - |
А (t) m“]. |
(14.73) |
Согласно теореме 13.5 найдется последовательность незави |
|||||||
симых гауссовских векторов ë“ (/) — (ëf (t), . . . , |
ë“ (t)), t = |
1 , . . . , T, |
|||||
с независимыми |
компонентами, |
Më“(/) = |
0, |
M(ë?(/))2 = 1 , |
|||
t = l , . . . , / , |
такая, |
что |
|
|
|
|
|
|
m“+1 = |
c(/)a( -f й (/) m“ + |
D(t)lu(t + |
1). |
(14.74) |
||
Важно при этом отметить, что для всех допустимых и вели |
|||||||
чины ëu(t) |
совпадают (ёи (/) == ё (/) /, / = 1 ........ Г). |
Вытекает это |
|||||
из (13.84) и того замечания, |
что Ѳ“— mut не зависят |
от и (см. |
|||||
(14.73) и (14.55)). |
исходная |
задача отыскания |
оптимального |
||||
Таким образом, |
управления для системы (14.55) и функционала (14.57) редуци руется к задаче нахождения оптимального управления для отфильтрованной системы (14.74) с функционалом (14.72) («прин
цип разделения» [26]). |
|
4. |
При отыскании оптимальных управлений в этой реду |
цированной задаче будут полезны следующие две леммы. |
|
Л е м м а 14.2. Если « = («„, . . . , иТ- х) — управление, подчи |
|
няющееся условию (14.56), то для всякой неотрицательно опре |
|
деленной симметрической матрицы S ( / + l ) |
М[(«?+,)’ S(/ + |
1) m“+1 |^ ] |
= |
М[ « +і)‘ S (/ + 1) m?+1 |m“, |
щ] = |
= (m“)*a*(/)S(/+ l)a(t)m“ + utc*(t)S(t+ l)c(t)ut + |
|
|||
+ 2 и / (t) S (t + |
1) а (t) m “ + |
S p |
S 1/2 (t + l) D (/) D ’ (t) S,/2 (/ + |
1). |
|
|
|
( 1 4 . 7 5 ) |