Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.04.2024

Просмотров: 220

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ И

ЗАДАЧА

УПРАВЛЕНИЯ

ПО

 

НЕПОЛНЫМ

ДАННЫМ

613

Но

 

 

grad* Q (t,

х) = 2P(t)x.

 

 

 

(16.24)

Поэтому

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(16.25)

 

 

 

й,(х) =

R - '(t)c*(t)P(t)x .

 

 

В силу (16.6),

(16.22)

 

 

 

 

 

 

 

 

 

 

=

х [ - a

(t) P ( t ) - P (t) a (t) -

Н {t) + P(t) c (t)R ~ l (t) c* (t) P (/)]* -

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

(/)/>„w

(16.26)

 

 

 

 

 

 

 

 

 

 

i, /'=1

 

 

 

 

 

 

 

d2Q (t

x)

 

 

 

 

 

 

 

(16.27)

 

 

 

 

 

dx{ dxj,

 

2Pi f (t).

 

 

 

=

Формулы

(16.24) — (16.27)

вместе

с равенством J{ü‘, t ) —

тіп /(и ;

t) показывают, что

функция Q (t,

х) = х*Р (t) х + Р (t)

 

U

 

 

 

 

 

 

 

 

 

 

 

 

 

удовлетворяет уравнению (16.23).

 

 

 

 

 

 

 

 

Лемма доказана.

 

 

 

 

 

 

 

 

 

 

 

Покажем теперь, что для вспомогательной задачи управле­

ние, определяемое

формулой

(16.20),

является оптимальным.

 

Из (16.23)

ясно, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф (г , fit, Q(t, £,)) = 0 .

 

 

 

(

Пусть теперь «/ =

( м 1 (^)...........ur {t)),

 

0 ^ . t ^ . T

,

— любое из допу­

стимых управлений и ц, — (ц, (/),

.... р.*(/))

определяется из

уравнения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

d\if = [с (t) ut -\- а (t) ц(] dt

-f y tAl(B*

 

d z t.

(16.29)

Тогда из (16.23) и

неравенства

J (ü\

t ) ^ J { u ,

t) вытекает, что

 

 

 

 

Ф(Р ц„ Q(t,

ц())> 0 .

 

 

 

(16.30)

Применяя к Q(t, Д,) формулу Ито, находим, что

 

Q(T, fir)

Q (0, Д0) =

 

 

 

 

 

 

 

 

 

 

 

 

É.9JI: М +

(с (s) üs

|_ а

 

grad. Q (s> дв)

 

 

0

L

+ 4 У

 

 

 

 

 

 

 

 

 

 

 

 

 

D„(s)

d2Q (s,

fis)

ds +

 

 

 

 

 

dfi. dfif

 

 

 

 

 

l, /=1

 

 

 

 

 

 

 

 

 

 

 

 

+ J [g r a d e s ,

fis)Y ysA* (s){B* (s))-1dzs.

(16.31)

 

 

 

о

 

 

 

 

 

 

 

 

 

 


614 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16

Отсюда, принимая во внимание (16.28), находим

т

Q (Г, Дг) — Q (0, р,0) — ~ I КД*)’ Н (s) Д* + (“«)* ß (s) ds] ds +

о

+ Jг [gradp, Q(s, Д5)]‘ ysA'(s)(B* (s))“‘ dzs. (16.32)

о

Беря теперь математическое ожидание от обеих частей этого равенства и учитывая равенство Д0= т 0> получаем, что

<3(0, ш 0) =

= М |( Д г)*АДг+ j [(ДД’ Я ^ Д . + ^ Г

R(t)üt] d t y

(16.33)

Аналогично, применяя тот же прием к Q(t,

ц,), находим, что

<3(0, т 0Х

 

 

 

 

 

 

< М (Дг)* h\xT + J [ ( X

Н (t) р, + (uty

R (t) и,I dt .

(16.34)

Сравнивая (16.33)

и (16.34),

получаем

 

 

 

УправлениеJ

V(ü\ r) = Q(0, m0)< P (u ,

Т).

(16.20),J

(16.35)

й,

определяемое формулой

является

допустимым, поскольку линейное уравнение (16.21) имеет, и притом единственное, сильное решение (теорема 4.10). Усло­ вие (16.17) выполнено в силу векторного варианта теоремы 4.6. Вместе с (16.35) это доказывает, что в классе допустимых управлений управление й является оптимальным.

Этот результат можно получить тем же методом, что и при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить

Вг/(0 = е, е j 0.

 

 

 

4.

Чтобы

завершить

доказательство теоремы 16.1, рассмо

трим подробнее процессы

 

 

 

 

w u = { w “, &-?),. 0 < ( < І .

 

Из (16.14) и (16.1) следует,

что с вероятностью

единица вели­

чины

Ѳ“ — m" и

d°t m°t совпадают (индекс 0

соответствует

«нулевому» управлению м ,= 0, Q ^ t ^ T ) . Поэтому из (16.15) ясно, что с вероятностью единица все процессы W “ совпадают


§ 1]

ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

6l5

(F“ = F?) и, значит, уравнение (16.16) можно записать в таком

виде:

dm" =

ut + а (/) m ut \ dt +

y tA* (t) (ß’ (ОГ' dW°t.

 

Пусть теперь ü — некоторое допустимое управление,

— (If),

0^C/ s^7\ — соответствующий ему процесс и

 

 

 

r f = o[<i>: I“,

5<г).

 

 

Воспользуемся

результатами п. 3,

взяв

=

z t — W°t.

Пусть U — класс всех допустимых управлений и — (щ), 0 <11 Т,

являющихся ^ “-измеримыми при каждом t. Поскольку для любого й

 

 

 

 

 

3 r f = > 3 r J ü = s r y 0,

о < * < г ,

 

то управление й, задаваемое формулой (16.21), принадлежит U

для любого й (допустимость управления

й следует из тео­

ремы

4.10

и

векторного

варианта теоремы

4.6).

Поэтому

(см. (16.35))

V (й; Т ) ^ Ѵ ( и ;

 

Т)

для

всех и е І / . и ,

в

частности,

V [Гг,

Т ) ^ і V (и;

Т). В силу произвольности управления й отсюда

следует, что управление й является оптимальным.

 

 

и

Наконец,

заметим,

 

что

 

формула (16.9)

вытекает из (16.13)

равенств

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V (й, T) — Q (0,

m 0) = m*0P (0) m 0+ p (0).

 

 

З а ме ч а н и е .

Как

и

 

в

случае

дискретного

времени

3 гл.

14),

доказанная теорема иллюстрирует (справедливый

и

в более общей ситуации [26]) так называемый

«принцип раз­

деления», в соответствии с которым задача оптимального

управления

по неполным данным распадается

на

две: задачу

фильтрации

и задачу

управления

по полным данным для не­

которой системы.

 

один

 

частный случай системы (16.1). Пусть

 

5.

0,

Рассмотрим

 

6(0 =

v4(0 =

ß(ftxft)>

ß(f) =

0. Тогда,

в

задаче

управления

процессом Ѳ = ( Ѳ 0 ,

0 < t ^ T ,

с

 

 

 

 

 

 

 

 

 

 

 

 

l* L =

c(t)u t +

a ( f ) %

 

 

 

(16.36)

где Ѳ0 — детерминированный

вектор, и функционалом

 

 

 

 

 

 

ѳ;/гѳг +

 

т

 

 

 

 

 

 

 

 

 

 

V (и,

Т) =

 

I"[ѳ;я (О Ѳ, +

u]R (0 ut\ dt

 

 

 

 

 

 

 

 

 

 

о

 

 

 

 

 

 

 

оптимальное

управление

ü =

(üt),

 

 

 

существует и


616 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16

задается

формулой

 

 

 

 

 

 

ü t =

- R

~ l (t)c, (t)P(t)Qt,

 

(16.37)

где P(t) является решением уравнения (16.6).

При этом

 

 

Ѵ( й \ Т )

= іпіѴ ( и \ 7,) =

Ѳ;Р(0)Ѳ0.

(16.38)

 

 

и

 

 

 

 

Этот

результат можно

получить

тем же

методом,

что и

при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить

В ц (0 = 8 , 8 I 0.

§ 2. Асимптотические свойства фильтра Калмана — Бьюси

1. Рассмотрим гауссовский частично наблюдаемый случай­ ный процесс (Ѳ, £) = [(Ѳ,(0, ... , Qk (t)), (h{t), •••, Ы Щ , t > 0 ,

удовлетворяющий системе стохастических уравнений

 

 

ddt =

КѲ, +

a2g,] dt +

bl d W l (t) +

b2 dW 2 (t),

 

 

 

dlt =

[Л,Ѳ<+

A2|J dt +

ß, d W x (t) +

ß2 dW 2(t)

(lb,d9)

с постоянными матрицами а,, a2,

A h

A2,

ft,,

 

b2, ß,

и ß2

поряд­

ков

(k X k),

( k X l ) , ( I X k ) ,

(I X

l),

{k X

k),

( k X l ) , U X k ) и

(/X

l) соответственно.

Независимые

между

собой

винеровские

процессы W x =

{Wn (t),

W lk (t))

и Г 2 (/) =

(Г 21 (t),

.. .,

Г 2,(/)),

 

0, предполагаются, как обычно, не зависящими от гаус­

совского

вектора начальных значений (Ѳ0, | 0).

 

 

опре­

 

Если

матрица

(ß ° ß) =

ß ,ß t-{-ß2ß2

положительно

делена, то согласно теореме

10.3

вектор

апостериорных сред­

них значений m t — М (Ѳ( | STf)

и матрица ковариаций

 

 

 

 

 

 

y t =

M[(Qt — m t)(Qt — m ty]

 

 

 

(16.40)

удовлетворяют системе уравнений

 

 

 

 

 

 

 

d m t [alm t + a2%tJ dt +

 

 

 

 

 

 

 

 

 

 

 

 

+

[(b ° ß) +

yHIJ (ß 0 В У ' [äh -

И іm t +

A £ t) dt],

(16.41)

Y< = а іУі +

Yt< —

[(ft ° ß) +

ѴИІ] (ß 0 ß)_1 [(ft 0 ß) + ѴИІ] +

(ft ° ft)>

где (ft ° ft) =

ftift* +

b2b2,

( b ° B ) = biBi +

ft2ß2.

 

 

 

(16.42)

 

 

 

 

 

Компоненты вектора

== M (0f |

являются наилучшими

(в среднеквадратическом смысле) оценками соответствующих компонент вектора по наблюдениям gg. Элементы матрицы y t,

ее след Spy,, показывают точность «отслеживания» оценкой m t