Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.04.2024
Просмотров: 220
Скачиваний: 0
§ И |
ЗАДАЧА |
УПРАВЛЕНИЯ |
ПО |
|
НЕПОЛНЫМ |
ДАННЫМ |
613 |
|||||||
Но |
|
|
grad* Q (t, |
х) = 2P(t)x. |
|
|
|
(16.24) |
||||||
Поэтому |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
(16.25) |
||
|
|
|
й,(х) = |
R - '(t)c*(t)P(t)x . |
|
|
||||||||
В силу (16.6), |
(16.22) |
|
|
|
|
|
|
|
|
|
|
|||
= |
х [ - a |
(t) P ( t ) - P (t) a (t) - |
Н {t) + P(t) c (t)R ~ l (t) c* (t) P (/)]* - |
|||||||||||
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
(/)/>„w |
(16.26) |
|
|
|
|
|
|
|
|
|
|
i, /'=1 |
|
|
|
|
|
|
|
|
d2Q (t |
x) |
|
|
|
|
|
|
|
(16.27) |
|
|
|
|
|
|
dx{ dxj, |
|
2Pi f (t). |
|
|
|
||||
= |
Формулы |
(16.24) — (16.27) |
вместе |
с равенством J{ü‘, t ) — |
||||||||||
тіп /(и ; |
t) показывают, что |
функция Q (t, |
х) = х*Р (t) х + Р (t) |
|||||||||||
|
U |
|
|
|
|
|
|
|
|
|
|
|
|
|
удовлетворяет уравнению (16.23). |
|
|
|
|
|
|
|
|||||||
|
Лемма доказана. |
|
|
|
|
|
|
|
|
|
|
|||
|
Покажем теперь, что для вспомогательной задачи управле |
|||||||||||||
ние, определяемое |
формулой |
(16.20), |
является оптимальным. |
|||||||||||
|
Из (16.23) |
ясно, что |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
Ф (г , fit, Q(t, £,)) = 0 . |
|
|
|
( |
||||||
Пусть теперь «/ = |
( м 1 (^)...........ur {t)), |
|
0 ^ . t ^ . T |
, |
— любое из допу |
|||||||||
стимых управлений и ц, — (ц, (/), |
.... р.*(/)) |
определяется из |
||||||||||||
уравнения |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
d\if = [с (t) ut -\- а (t) ц(] dt |
-f y tAl(B* |
|
d z t. |
(16.29) |
||||||||
Тогда из (16.23) и |
неравенства |
J (ü\ |
t ) ^ J { u , |
t) вытекает, что |
||||||||||
|
|
|
|
Ф(Р ц„ Q(t, |
ц())> 0 . |
|
|
|
(16.30) |
|||||
Применяя к Q(t, Д,) формулу Ито, находим, что |
|
|||||||||||||
Q(T, fir) |
Q (0, Д0) = |
|
|
|
|
|
|
|
|
|
|
|||
|
|
É.9JI: М + |
(с (s) üs |
|_ а |
|
grad. Q (s> дв) |
|
|||||||
|
0 |
L |
+ 4 У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
D„(s) |
d2Q (s, |
fis) |
ds + |
|
|||||||
|
|
|
|
dfi. dfif |
|
|||||||||
|
|
|
|
l, /=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
+ J [g r a d e s , |
fis)Y ysA* (s){B* (s))-1dzs. |
(16.31) |
|||||||||
|
|
|
о |
|
|
|
|
|
|
|
|
|
|
614 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16
Отсюда, принимая во внимание (16.28), находим
т
Q (Г, Дг) — Q (0, р,0) — ~ I КД*)’ Н (s) Д* + (“«)* ß (s) ds] ds +
о
+ Jг [gradp, Q(s, Д5)]‘ ysA'(s)(B* (s))“‘ dzs. (16.32)
о
Беря теперь математическое ожидание от обеих частей этого равенства и учитывая равенство Д0= т 0> получаем, что
<3(0, ш 0) =
= М |( Д г)*АДг+ j [(ДД’ Я ^ Д . + ^ Г |
R(t)üt] d t y |
(16.33) |
||||
Аналогично, применяя тот же прием к Q(t, |
ц,), находим, что |
|||||
<3(0, т 0Х |
|
|
|
|
|
|
< М (Дг)* h\xT + J [ ( X |
Н (t) р, + (uty |
R (t) и,I dt . |
(16.34) |
|||
Сравнивая (16.33) |
и (16.34), |
получаем |
|
|
|
|
УправлениеJ |
V(ü\ r) = Q(0, m0)< P (u , |
Т). |
(16.20),J |
(16.35) |
||
й, |
определяемое формулой |
является |
допустимым, поскольку линейное уравнение (16.21) имеет, и притом единственное, сильное решение (теорема 4.10). Усло вие (16.17) выполнено в силу векторного варианта теоремы 4.6. Вместе с (16.35) это доказывает, что в классе допустимых управлений управление й является оптимальным.
Этот результат можно получить тем же методом, что и при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить
Вг/(0 = е, е j 0. |
|
|
|
|
4. |
Чтобы |
завершить |
доказательство теоремы 16.1, рассмо |
|
трим подробнее процессы |
|
|
||
|
|
w u = { w “, &-?),. 0 < ( < І . |
|
|
Из (16.14) и (16.1) следует, |
что с вероятностью |
единица вели |
||
чины |
Ѳ“ — m" и |
d°t — m°t совпадают (индекс 0 |
соответствует |
«нулевому» управлению м ,= 0, Q ^ t ^ T ) . Поэтому из (16.15) ясно, что с вероятностью единица все процессы W “ совпадают
§ 1] |
ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ |
6l5 |
(F“ = F?) и, значит, уравнение (16.16) можно записать в таком
виде:
dm" = |
[с (О ut + а (/) m ut \ dt + |
y tA* (t) (ß’ (ОГ' dW°t. |
|
|
Пусть теперь ü — некоторое допустимое управление, |
— (If), |
|||
0^C/ s^7\ — соответствующий ему процесс и |
|
|
||
|
r f = o[<i>: I“, |
5<г). |
|
|
Воспользуемся |
результатами п. 3, |
взяв |
= |
z t — W°t. |
Пусть U — класс всех допустимых управлений и — (щ), 0 <11 Т,
являющихся ^ “-измеримыми при каждом t. Поскольку для любого й
|
|
|
|
|
3 r f = > 3 r J ü = s r y 0, |
о < * < г , |
|
||||||||||
то управление й, задаваемое формулой (16.21), принадлежит U |
|||||||||||||||||
для любого й (допустимость управления |
й следует из тео |
||||||||||||||||
ремы |
4.10 |
и |
векторного |
варианта теоремы |
4.6). |
Поэтому |
|||||||||||
(см. (16.35)) |
V (й; Т ) ^ Ѵ ( и ; |
|
Т) |
для |
всех и е І / . и , |
в |
частности, |
||||||||||
V [Гг, |
Т ) ^ і V (и; |
Т). В силу произвольности управления й отсюда |
|||||||||||||||
следует, что управление й является оптимальным. |
|
|
|||||||||||||||
и |
Наконец, |
заметим, |
|
что |
|
формула (16.9) |
вытекает из (16.13) |
||||||||||
равенств |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
V (й, T) — Q (0, |
m 0) = m*0P (0) m 0+ p (0). |
|
|
||||||||||
(§ |
З а ме ч а н и е . |
Как |
и |
|
в |
случае |
дискретного |
времени |
|||||||||
3 гл. |
14), |
доказанная теорема иллюстрирует (справедливый |
|||||||||||||||
и |
в более общей ситуации [26]) так называемый |
«принцип раз |
|||||||||||||||
деления», в соответствии с которым задача оптимального |
|||||||||||||||||
управления |
по неполным данным распадается |
на |
две: задачу |
||||||||||||||
фильтрации |
и задачу |
управления |
по полным данным для не |
||||||||||||||
которой системы. |
|
один |
|
частный случай системы (16.1). Пусть |
|||||||||||||
|
5. |
0, |
Рассмотрим |
|
|||||||||||||
6(0 = |
v4(0 = |
ß(ftxft)> |
ß(f) = |
0. Тогда, |
в |
задаче |
управления |
||||||||||
процессом Ѳ = ( Ѳ 0 , |
0 < t ^ T , |
с |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
l* L = |
c(t)u t + |
a ( f ) % |
|
|
|
(16.36) |
|||||
где Ѳ0 — детерминированный |
вектор, и функционалом |
||||||||||||||||
|
|
|
|
|
|
ѳ;/гѳг + |
|
т |
|
|
|
|
|
|
|
||
|
|
|
V (и, |
Т) = |
|
I"[ѳ;я (О Ѳ, + |
u]R (0 ut\ dt |
|
|||||||||
|
|
|
|
|
|
|
|
|
о |
|
|
|
|
|
|
|
|
оптимальное |
управление |
ü = |
(üt), |
|
|
|
существует и |
616 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16
задается |
формулой |
|
|
|
|
|
|
ü t = |
- R |
~ l (t)c, (t)P(t)Qt, |
|
(16.37) |
|
где P(t) является решением уравнения (16.6). |
При этом |
|
||||
|
Ѵ( й \ Т ) |
= іпіѴ ( и \ 7,) = |
Ѳ;Р(0)Ѳ0. |
(16.38) |
||
|
|
и |
|
|
|
|
Этот |
результат можно |
получить |
тем же |
методом, |
что и |
при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить
В ц (0 = 8 , 8 I 0.
§ 2. Асимптотические свойства фильтра Калмана — Бьюси
1. Рассмотрим гауссовский частично наблюдаемый случай ный процесс (Ѳ, £) = [(Ѳ,(0, ... , Qk (t)), (h{t), •••, Ы Щ , t > 0 ,
удовлетворяющий системе стохастических уравнений
|
|
ddt = |
КѲ, + |
a2g,] dt + |
bl d W l (t) + |
b2 dW 2 (t), |
|
|||||||||
|
|
dlt = |
[Л,Ѳ<+ |
A2|J dt + |
ß, d W x (t) + |
ß2 dW 2(t) |
(lb,d9) |
|||||||||
с постоянными матрицами а,, a2, |
A h |
A2, |
ft,, |
|
b2, ß, |
и ß2 |
поряд |
|||||||||
ков |
(k X k), |
( k X l ) , ( I X k ) , |
(I X |
l), |
{k X |
k), |
( k X l ) , U X k ) и |
|||||||||
(/X |
l) соответственно. |
Независимые |
между |
собой |
винеровские |
|||||||||||
процессы W x = |
{Wn (t), |
W lk (t)) |
и Г 2 (/) = |
(Г 21 (t), |
.. ., |
Г 2,(/)), |
||||||||||
|
0, предполагаются, как обычно, не зависящими от гаус |
|||||||||||||||
совского |
вектора начальных значений (Ѳ0, | 0). |
|
|
опре |
||||||||||||
|
Если |
матрица |
(ß ° ß) = |
ß ,ß t-{-ß2ß2 |
положительно |
|||||||||||
делена, то согласно теореме |
10.3 |
вектор |
апостериорных сред |
|||||||||||||
них значений m t — М (Ѳ( | STf) |
и матрица ковариаций |
|
||||||||||||||
|
|
|
|
|
y t = |
M[(Qt — m t)(Qt — m ty] |
|
|
|
(16.40) |
||||||
удовлетворяют системе уравнений |
|
|
|
|
|
|
|
|||||||||
d m t — [alm t + a2%tJ dt + |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
+ |
[(b ° ß) + |
yHIJ (ß 0 В У ' [äh - |
И іm t + |
A £ t) dt], |
(16.41) |
||||||||||
Y< = а іУі + |
Yt< — |
[(ft ° ß) + |
ѴИІ] (ß 0 ß)_1 [(ft 0 ß) + ѴИІ] + |
(ft ° ft)> |
||||||||||||
где (ft ° ft) = |
ftift* + |
b2b2, |
( b ° B ) = biBi + |
ft2ß2. |
|
|
|
(16.42) |
||||||||
|
|
|
|
|||||||||||||
|
Компоненты вектора |
== M (0f | |
являются наилучшими |
(в среднеквадратическом смысле) оценками соответствующих компонент вектора по наблюдениям gg. Элементы матрицы y t,
ее след Spy,, показывают точность «отслеживания» оценкой m t