Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.04.2024

Просмотров: 223

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г Л А В А 16

ПРИМЕНЕНИЕ УРАВНЕНИЙ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ И ТЕОРИИ ИНФОРМАЦИИ

§ 1. Одна задача оптимального управления по неполным данным

1. В этом параграфе обобщаются на случай непрерывног времени результаты, полученные в § 3 гл. 14 для задачи

управления (по неполным данным)

линейной системой с квад­

ратичным функционалом потерь.

 

наблюдаемый

управляе­

Будем предполагать,

что частично

мый процесс (Ѳ, £) = [(Ѳ,(0, .

Ѳй(0); ( h ( t ) ,

 

° <

задается стохастическими уравнениями

 

 

dQt =

Iе (О И/ + а (t) Ѳ,] dt +

b (/) dWi (t),

 

 

d \ t =

A (t) Q(dt +

B (/) dW 2 (t).

(

'

Матрицы c(t), a(t), b(t),

A(t), B(t)

имеют размерности (k X 0,

(k X k), (k X k),

{I X k),

(l X 0

соответственно, их

элементы

Cij(i), aij(t), bij(t), A tj(t),

Bij(t)

являются детерминированными

функциями времени, причем

 

 

 

 

 

 

k / y ( f ) | < c ,

| й г / ( 1 ) К с ,

\ Ь ч У ) \ ^ с ,

 

 

т

 

<

о о ,

т

 

 

 

оJ

А2іі (t) d t

оj

В 2ц (t) d t < OO

 

 

при всех допустимых значениях i, j. Предполагается также,

что элементы

матриц

(В (t) В*

 

равномерно

ограничены.

Входящие в (16.1) независимые винеровские

процессы

не

= ( W n ( t ) , .. . .

W xk{t)),

W2 = (W2X(t),

.. . . W2l(t)),

О

зависят от гауссовского вектора Ѳ0

(МѲ0 = т 0, соѵ(Ѳ0, Ѳ0) = Ѵо),

а Іо= О-

[ul (t, l),

. . . . ur (t, £)],

входящий

в (16.1),

назы­

Вектор ut =

вается управляющим воздействием в

момент времени t.

Изме-


§ 1) ЗАДАЧА УПРАВЛЕНИЯ По НЕПОЛНЫМ ДАННЫМ 609

римые процессы u } (t, |), / = 1, .... г, предполагаются такими,

что

Тг

(16.2)

о; = 1

авеличины (t, £) — ^-измеримыми.

Управления u = (ut), Os^/^ Г , для которых система урав­

нений (16.1) имеет единственное сильное решение и для кото­ рых выполнено условие (16.2), будут в дальнейшем называться

допустимыми.

 

 

 

 

 

управления,

введем в рас­

 

2.

 

Чтобы сформулировать цель

смотрение

функционал потерь.

 

 

 

 

определен­

 

Пусть h, Н (t) — симметрические неотрицательно

ные матрицы порядка ( k \ k ) .

Обозначим R(t) симметрические

равномерно *)

положительно

определенные

матрицы

(размер­

ности (г У. г)).

Предположим,

что элементы матриц Н (t) и

R(t)

являются измеримыми ограниченными функциями t.

 

0

 

 

Для

каждого допустимого управления

и = (щ),

 

 

рассмотрим функционал

потерь

 

 

 

 

 

 

 

 

 

V (и;

Т) = М I Q*Tfi6T + J [ѳ;я (t) Ѳ( + u]R (t) ut] dt

.

(16.3)

 

Допустимое управление ü называется оптимальным, если

 

 

 

 

 

 

V (й; Т) — inf V (и;

Т),

 

 

 

 

(16.4)

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

где inf берется по классу всех допустимых управленийJ .

 

 

Рассматривая допустимые управления и, положим

 

 

 

 

m f

М (Ѳ, j I),

у “ —

М [(Ѳ, — mfj (Ѳ( — m “)*],

 

где

Ѳ,

и

— соответствующие

этому

управлению

 

процессы,

определяемые

системой

(16.1).

 

 

 

 

 

 

 

 

Т е о р е м а

16.1.

В

классе

допустимых управлений

опти­

мальное

управление

ü = ( ü t),

 

 

существует

и опреде­

ляется

формулами

 

 

 

 

 

 

 

 

 

 

 

 

 

 

üt = - R ~ x(t)c*(t)P(t)mt,

0 < * < 7 \

 

 

 

(16.5)

где

неотрицательно

определенные симметрические**) матрицы

P{t) =

\\Pij{t)\\

порядка

( k y k ) ,

0 ^ . t ^ . T ,

являются

 

решением

 

*)

Элементы

матриц R

(t) равномерно ограничены.

матрицы

Р (t),

**) Неотрицательная определенность и симметричность

удовлетворяющей

уравнению

(16.6),

доказывается

так же,

как и в случае

дискретного

времени (§

3 гл.

14).

 

 

 

 

 

 

 

 

20 Р. Ш. Липцер, А. Н. Ширяев


610 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16

уравнения Риккати

-

= a ( t ) P ( t ) + P

 

( t ) + H ) ■

 

 

 

 

 

- P ( t()t )cа( t ) R

1(t)c'(t)P(t),(t

P(T) =

h,

(16.6)

а вектор m t определяется

из системы уравнений

 

 

d m t =

[с (t) üt +

а (t) tnt] dt +

y tA* (0 (в (0 (t))~l [dlt А (t) tnt dt],

 

 

 

 

 

tnQ= rnQ= МѲ0,

(16.7)

yt — a ( t) y t +

*(0 + b(t) b* (t) ytA* (t)(B (t)B* {t))~xA ( t) y t,

При

этом

 

 

 

Yo — cov (Ѳ0, Ѳ0).

(16.8)

 

 

 

 

 

 

 

V(ü,

Т) — р (0) + rn"QP (0) m Q+

 

 

 

 

 

 

+ Sp I

Н ш (t) y tH lß (t) dt +

h x'2yTh Xß

,

(16.9)

где

 

P(0 =

■o

 

 

 

 

 

 

T

k

 

 

 

 

 

 

 

 

 

 

 

 

 

JYl

Di l (s)Pii(s)ds,

 

 

(16.10)

tІ, /=*1

аDij{t) элементы матрицы

D(t) =

y tA*(t){B(t)B’ (t)}-x A { t)y t.

(16.11)

Д о к а з а т е л ь с т в о . Прежде

всего

отметим,

что при сде­

ланных выше предположениях

 

 

 

 

к

 

 

 

м

sup 2ѳ}(*) <

оо,

 

 

_о<г<г/=і

 

 

что доказывается, как и в лемме 12.1. Далее, так же, как и при доказательстве теоремы 14.2, устанавливается, что

V(и, t) = м jѳ;аѳг+ j [ѳ;яѳ( + u]r (t) ut] dt J =

= M

M (0j.A0r I

+ j [M (ѳ;я(0 0, |

+ utR(t)ut\ dt

=

=

M j (m“)* hm ^ +

[(m“)* H (t) m “ +

ut R (t) ut~\ dt +

(16.12)j

j

+ Sp

h my “hJ

m + J H 1'2(t) y “H m (0 dt


§ Ч

ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

611

Важно заметить, что функция у“ не зависит от управле­

ния и и совпадает с функцией у/, удовлетворяющей уравне­

нию (16.8) (см. теорему 12.1). Поэтому

Ѵ(и\ Т) = Sp

h >l2yTh 112 -f

j*

H V2(t)ytH 1,2(t)dt

+

 

 

 

+

M I {triff h m tu -f

[ \(т“У

 

utR (t)ut] d t \ ,

(16.13)

где согласно той же теореме 12.1

m“,

 

находится из

уравнения

 

 

 

 

 

 

 

 

 

 

d m ut = [c(t) ut + а (t) mjf] dt +

y t (В (t) В* (t))~\dla A(t)

dt],

 

 

 

 

 

 

 

 

 

 

 

 

(16.14)

с процессом %ut ,

 

 

определяемым из системы (16.1).

Согласно

векторному

варианту леммы

11.3

процесс Wu =*

= ( # “, F f ) ,

 

Т,

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

j

B~l (s)[dfs ~

A ( s ) m U u \ ,

 

(16.15)

 

 

 

 

о

 

 

 

 

 

 

 

 

является винеровским. Поэтому в силу (16.14) и (16.15)

 

d m “=

[с (t) ut +

a (t) m“] dt -f уtA* (t)(ß* (0)“' dW “t.

(16.16)

3.

 

Для

решения

исходной

задачи рассмотрим

теперь сле­

дующую вспомогательную задачу.

 

 

пространство,

Пусть

(Q,

F ,

Р) — некоторое вероятностное

( F t),

O ^ i t ^ T , — неубывающее семейство ст-подалгебр F , z —

= (z„

F t) — r-мерный винеровский процесс, и — {и„ F t) — /‘-мер­

ный процесс, удовлетворяющий условию

 

 

 

 

 

 

 

 

Т

г

 

 

 

 

 

 

 

 

 

 

М [

 

иj (£,

со) Л < оо,

 

 

(16.17)

 

 

 

 

О /л=1

 

 

 

 

 

 

где (ut (t, со),

. . . ,

ur {t,

(ä))~ut.

С

управлением

u (ut, F t),

0 < f < 7 \

свяжем управляемый

процесс

 

 

 

 

 

dp,“ — [с (t) ut -f a(t)

n’t] dt +

уtA*(t) (ß*(0)~! dzt,

(16.18)

где c(t), a(t), y t, A(t), В (t) — введенные выше матрицы, p“ — m0. Как и раньше, управление u — {ut, F t), 0 ^ Г, будем на­

20*


612

ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ

[ГЛ. 16

зывать допустимым, если для него выполнено условие (16.17)

иуравнение (16.18) имеет единственное сильное решение.

Вкачестве функционала потерь рассмотрим функционал

Ѵ{щ Г) = м{({*?)’ Ä((*?)+

 

 

H ( t ) ^ t + u tR { t ) u t\ d t \ .

(16.19)

Покажем,

что в этой задаче оптимальное управление й ==

— {üt, STt) определяется формулами

 

 

 

 

 

 

йt = -R~'(t)c'{t)P(t)iit,

 

 

(16.20)

где Д„

находится

из уравнения

 

 

 

d\xt = \а (t) —

с (t) Р~' (t) с* ( t ) P ( t ) ]

Д, dt +

y t A * ( t )

(В* (t ) ) ~ l

dz t,

 

 

 

До =

m 0.

 

 

 

(16.21)

С этой целью введем функцию

 

 

 

 

Q(t,

x) = x*P{t)x +

p{t),

 

 

0 < f < 7 \

 

(16.22)

где P(t) определяется из

уравнений

(16.6),

а p{t) — из

(16.10).

Л е мм а

16.1.

Функция

Q(t,

х) = х *P(t)x-\-p(t)

является

решением дифференциального уравнения

 

 

 

где

 

Ф (t,

X,

Q(t,

х ) ) ~ 0 ,

 

 

(16.23)

 

 

 

 

 

 

 

 

 

 

Ф(/, .г, Q(t, x)) — x*H{t) X +

х"а' (t) gradx Q(t, x) +

 

 

 

+ 1

S

 

d2Q (t, x)

. dQ (t,

x) .

 

 

 

 

дх. дх

^

д Г

^

 

 

 

i, /= 1

+

min [u*P (t) и + mV (t) grad* Q (t, x)\

 

 

 

c u — (u\,

ur),

Q{T, x) =

x ’hx.

положительной определен­

Д о к а з а т е л ь с т в о .

В

силу

ности матриц P{t),

0<Л=^Г, квадратичная форма

 

 

 

J (м; t) = и Р (t) и +

uc*{t) grad* Q (t, x)

 

 

является положительно определенной и достигает минималь­

ного значения на

векторе щ{х)

= (йі (t, х), ... ,

ür (t, х)), удо­

влетворяющем системе линейных

алгебраических уравнений

 

gradu 1 (м; t) — 0.

 

Поскольку grad„/(M; t) =

2P(t) и + c*(t) grad* Q(t,

x),

Щ (x) =

P ~ 1(/) c* (/) grad* Q (t, x).