Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.04.2024
Просмотров: 223
Скачиваний: 0
Г Л А В А 16
ПРИМЕНЕНИЕ УРАВНЕНИЙ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ И ТЕОРИИ ИНФОРМАЦИИ
§ 1. Одна задача оптимального управления по неполным данным
1. В этом параграфе обобщаются на случай непрерывног времени результаты, полученные в § 3 гл. 14 для задачи
управления (по неполным данным) |
линейной системой с квад |
|||||||
ратичным функционалом потерь. |
|
наблюдаемый |
управляе |
|||||
Будем предполагать, |
что частично |
|||||||
мый процесс (Ѳ, £) = [(Ѳ,(0, . |
Ѳй(0); ( h ( t ) , |
|
° < |
|||||
задается стохастическими уравнениями |
|
|
||||||
dQt = |
Iе (О И/ + а (t) Ѳ,] dt + |
b (/) dWi (t), |
|
|
||||
d \ t = |
A (t) Q(dt + |
B (/) dW 2 (t). |
( |
' |
||||
Матрицы c(t), a(t), b(t), |
A(t), B(t) |
имеют размерности (k X 0, |
||||||
(k X k), (k X k), |
{I X k), |
(l X 0 |
соответственно, их |
элементы |
||||
Cij(i), aij(t), bij(t), A tj(t), |
Bij(t) |
являются детерминированными |
||||||
функциями времени, причем |
|
|
|
|
|
|
||
k / y ( f ) | < c , |
| й г / ( 1 ) К с , |
\ Ь ч У ) \ ^ с , |
|
|
||||
т |
|
< |
о о , |
т |
|
|
|
|
оJ |
А2іі (t) d t |
оj |
В 2ц (t) d t < OO |
|
|
при всех допустимых значениях i, j. Предполагается также,
что элементы |
матриц |
(В (t) В* |
|
равномерно |
ограничены. |
||
Входящие в (16.1) независимые винеровские |
процессы |
не |
|||||
= ( W n ( t ) , .. . . |
W xk{t)), |
W2 = (W2X(t), |
.. . . W2l(t)), |
О |
|||
зависят от гауссовского вектора Ѳ0 |
(МѲ0 = т 0, соѵ(Ѳ0, Ѳ0) = Ѵо), |
||||||
а Іо= О- |
[ul (t, l), |
. . . . ur (t, £)], |
входящий |
в (16.1), |
назы |
||
Вектор ut = |
|||||||
вается управляющим воздействием в |
момент времени t. |
Изме- |
610 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16
уравнения Риккати
- |
= a ( t ) P ( t ) + P |
|
( t ) + H ) ■ |
|
|
|
||
|
|
- P ( t()t )cа( t ) R |
1(t)c'(t)P(t),(t |
P(T) = |
h, |
(16.6) |
||
а вектор m t определяется |
из системы уравнений |
|
|
|||||
d m t = |
[с (t) üt + |
а (t) tnt] dt + |
y tA* (0 (в (0 (t))~l [dlt — А (t) tnt dt], |
|||||
|
|
|
|
|
tnQ= rnQ= МѲ0, |
(16.7) |
||
yt — a ( t) y t + |
*(0 + b(t) b* (t) — ytA* (t)(B (t)B* {t))~xA ( t) y t, |
|||||||
При |
этом |
|
|
|
Yo — cov (Ѳ0, Ѳ0). |
(16.8) |
||
|
|
|
|
|
|
|
||
V(ü, |
Т) — р (0) + rn"QP (0) m Q+ |
|
|
|
|
|||
|
|
+ Sp I |
Н ш (t) y tH lß (t) dt + |
h x'2yTh Xß |
, |
(16.9) |
||
где |
|
P(0 = |
■o |
|
|
|
|
|
|
T |
k |
|
|
|
|
||
|
|
|
|
|
|
|||
|
|
|
JYl |
Di l (s)Pii(s)ds, |
|
|
(16.10) |
tІ, /=*1
аDij{t) — элементы матрицы
D(t) = |
y tA*(t){B(t)B’ (t)}-x A { t)y t. |
(16.11) |
||
Д о к а з а т е л ь с т в о . Прежде |
всего |
отметим, |
что при сде |
|
ланных выше предположениях |
|
|
|
|
|
к |
|
|
|
м |
sup 2ѳ}(*) < |
оо, |
|
|
|
_о<г<г/=і |
‘ |
|
|
что доказывается, как и в лемме 12.1. Далее, так же, как и при доказательстве теоремы 14.2, устанавливается, что
V(и, t) = м jѳ;аѳг+ j [ѳ;я(оѳ( + u]r (t) ut] dt J =
= M |
M (0j.A0r I |
+ j [M (ѳ;я(0 0, | |
+ utR(t)ut\ dt |
= |
|
= |
M j (m“)* hm ^ + |
[(m“)* H (t) m “ + |
ut R (t) ut~\ dt + |
(16.12)j |
|
j |
+ Sp |
h my “hJ |
m + J H 1'2(t) y “H m (0 dt |
612 |
ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ |
[ГЛ. 16 |
зывать допустимым, если для него выполнено условие (16.17)
иуравнение (16.18) имеет единственное сильное решение.
Вкачестве функционала потерь рассмотрим функционал
Ѵ{щ Г) = м{({*?)’ Ä((*?)+ |
|
|
H ( t ) ^ t + u tR { t ) u t\ d t \ . |
(16.19) |
||||||
Покажем, |
что в этой задаче оптимальное управление й == |
|||||||||
— {üt, STt) определяется формулами |
|
|
|
|
||||||
|
|
йt = -R~'(t)c'{t)P(t)iit, |
|
|
(16.20) |
|||||
где Д„ |
находится |
из уравнения |
|
|
|
|||||
d\xt = \а (t) — |
с (t) Р~' (t) с* ( t ) P ( t ) ] |
Д, dt + |
y t A * ( t ) |
(В* (t ) ) ~ l |
dz t, |
|||||
|
|
|
До = |
m 0. |
|
|
|
(16.21) |
||
С этой целью введем функцию |
|
|
|
|
||||||
Q(t, |
x) = x*P{t)x + |
p{t), |
|
|
0 < f < 7 \ |
|
(16.22) |
|||
где P(t) определяется из |
уравнений |
(16.6), |
а p{t) — из |
(16.10). |
||||||
Л е мм а |
16.1. |
Функция |
Q(t, |
х) = х *P(t)x-\-p(t) |
является |
|||||
решением дифференциального уравнения |
|
|
|
|||||||
где |
|
Ф (t, |
X, |
Q(t, |
х ) ) ~ 0 , |
|
|
(16.23) |
||
|
|
|
|
|
|
|
|
|
|
|
Ф(/, .г, Q(t, x)) — x*H{t) X + |
х"а' (t) gradx Q(t, x) + |
|
|
|||||||
|
+ 1 |
S |
|
d2Q (t, x) |
. dQ (t, |
x) . |
|
|
||
|
|
дх. дх |
^ |
д Г |
^ |
|
|
|||
|
i, /= 1 |
+ |
min [u*P (t) и + mV (t) grad* Q (t, x)\ |
|||||||
|
|
|
||||||||
c u — (u\, |
ur), |
Q{T, x) = |
x ’hx. |
положительной определен |
||||||
Д о к а з а т е л ь с т в о . |
В |
силу |
||||||||
ности матриц P{t), |
0<Л=^Г, квадратичная форма |
|
|
|||||||
|
J (м; t) = и Р (t) и + |
uc*{t) grad* Q (t, x) |
|
|
является положительно определенной и достигает минималь
ного значения на |
векторе щ{х) |
= (йі (t, х), ... , |
ür (t, х)), удо |
|
влетворяющем системе линейных |
алгебраических уравнений |
|||
|
gradu 1 (м; t) — 0. |
|
||
Поскольку grad„/(M; t) = |
2P(t) и + c*(t) grad* Q(t, |
x), |
||
Щ (x) = |
— |
P ~ 1(/) c* (/) grad* Q (t, x). |
|