Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.04.2024

Просмотров: 249

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 3]

ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

549

Теперь в силу

(14.48)

и (14.49)

имеем

( />

1)

 

 

t

(1 + у, (s -

і))2

 

 

 

 

Dt

_5_ _|_ ^

 

 

 

 

12

5— 1

1 +

Y

(s —

1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ѳ, =

- I

5 г.

I

V

(1 + V, (s -

1)) ( i

(s) -

Vo (s - 1, £))

 

D 't

12

 

 

 

 

i + Y (s JTij

 

 

 

 

5 = 1

 

 

 

 

 

 

 

 

 

 

 

 

 

§

3. Одна задача управления по неполным данным

 

(линейная система с квадратичным функционалом потерь)

1. В этом

параграфе

будет показано, как

уравнения

опти­

мальной нелинейной фильтрации, выведенные в предыдущей главе, могут быть применены для отыскания оптимальных управлений.

Будем предполагать, что состояние некоторой «управляе­

мой»

системы описывается процессом (Ѳ,

^) = [(Oj (f),

9fe(0)>

(gi (t),

. . . , g;(0)].

t — 0, 1,

 

T < oo,

который

подчиняется

уравнениям

 

 

 

 

 

 

 

 

Ѳ<+і — c ( t ) ut -\- а (t) 9, + b (t) (t + 1 ),

 

(14.55)

 

h+i=

 

А (0 9, + В (t)

+ 1).

 

 

 

 

 

Здесь

c(t), a(t),

b (t),

A(t)

и

В (t) — матрицы

размерностей

(k X r), (k X k), (k X k),

(l X k),

(I X l) соответственно

с эле­

ментами, являющимися детерминированными ограниченными функциями t = 0, 1, . .. , Т — 1. Входящие в (14.55) независи­ мые между собой случайные последовательности е, (і) — (еи (t), ...

■■■, hkit)),

«г (t) = (e2i (i), ■■■, e2Z(0),

t = 1,

... ,

T,

являются

гауссовскими

с

независимыми

компонентами,

Мег/(^) = 0,

Me].(t)=\.

 

 

 

 

 

 

 

 

 

 

Система

(14.55) решается

при начальном условии

Ѳ0, где

Ѳ0— гауссовский

случайный

вектор,

МѲ0= т,

М [(Ѳ0m0) X

X 0m0)*] — y,'

не зависящий

от последовательностей E{(t),

і — 1, 2, t =

1,

. .., Т. В систему

(14.55) входит также

вектор-

столбец «, =

(«, (t, g), . .. , ur (t, g)), где при каждом t = 0,

1,..., Т—1

функции

Ui (t,

£),

играющие

роль управляющих

воздействий,

являются

5г | =

ст{со: g0>•••. ^-измеримыми

(£0 =

0).

 

мг_.,)

Все рассматриваемые далее

управления

и — {и0,

 

будут предполагаться такими,

что

 

 

 

 

 

é Щ Ѵ ’ ! ) < « » ,

^ = 0, 1, . . . , Т — 1.

( 1 4 . 5 6 )


550 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. И

Предположим, что качество

управления и — (и0,

ит_х)

измеряется квадратичным функционалом потерь

 

' Г - 1

 

 

V (и) = М 2 (ѲШ (t) Ѳ, +

utR (t) щ) + QtH (T) 0r

, (14.57)

_t= о

 

 

где H (t), R(t) — детерминированные, ограниченные,

симметри­

ческие, неотрицательно определенные матрицы порядков (k Х&),

(л X г) соответственно.

йг_,),

Требуется найти (оптимальное) управление й — (й0, . . . ,

для которого

 

V (и) — inf V (и),

(14.58)

где inf берется по всем управлениям, удовлетворяющим усло­ виям (14.56).

Рассматриваемая задача является примером так называе­ мых задач управления по неполным данным, когда значения управляющих воздействий предполагаются зависящими лишь

от наблюдаемой части

координат

( |0,

...),

описывающих

состояние управляемой

системы.

 

 

 

2 . При отыскании оптимальных управлений (в рассматри­

ваемой задаче таковые

существуют,

что

станет

ясно из даль­

нейшего), помимо результатов оптимальной нелинейной фильт­ рации, будут использованы также идеи динамического про­ граммирования.

Введем ряд необходимых для дальнейшего обозначений. Пусть P(t) и У/, t = 0, 1, . . . , Т, — матричные функции по­ рядка (k X k), определяемые как решения рекуррентных урав­

нений

P ( t ) = H ( t ) + a ( t ) P ( t + \ ) a ( t ) -

 

 

- а * ( t ) P ( t + \ ) c (t) [R (t) + с* (0 P { t + \ ) c (/)]+ с* (0 Р (t +

1) а (t)

с Р(Т) = Н(Т) и

 

(14.59)

 

 

Уt+i = a (t) y ta* (t) + b (t) 6’ (t)

 

 

-

a (t) ytA' (t) [В (t) B* (t) + A (t) ytA* (0]+ A (t) yta (t)

(14.60)

c Yo — Y- Пусть также

 

 

D(t) =

a (t) ytA' (t) {[B (t) B*{t) + A (t) уtA' (*)]v*} +

(14.61)

и p(t), t =

0 , 1 ,

. .. , T, — последовательность

неотрицательных

чисел, определяемых рекуррентным образом:

 

 

p ( t ) = p ( t + ! ) +

S p P ,/2( / + l) D (t) D* (t) P U2 (t +

1), P ( D =

0.

 

 

 

 

( 1 4 . 6 2 )


§ 31

ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

551

 

 

Из (14.62) следует, что

Г - 1

 

Р ( 0 = 2

SpPl/2 ( s + l ) D ( S)D*(s)P1/2 ( s + l ) .

 

(14.63)

 

 

S = t

 

 

 

 

 

 

 

 

 

 

 

 

Введенные

матрицы

Р (t),

yt

и

числа

р (t) находятся

по

коэффициентам

системы

(14.55)

и

заданным

матрицам

H{t)

и R(t). Поэтому они не зависят от «случая» и, являясь лишь

функциями времени t, могут быть найдены а priori.

 

 

 

Заметим, что матрицы P(t),

t =

О, I, . .. ,

Т, найденные из

рекуррентных уравнений (14.59), являются симметрическими и

неотрицательно

определенными.

Для

того

чтобы

в этом

убе­

диться, рассмотрим задачу фильтрации (см.

§ 1

гл.

13)

для

процессов

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ѳ5+І- а ‘(^-5)Ѳ,+ Hll2(T-s)Bl(s+ 1),

 

 

 

 

L +i =

с ' ( Т -

s) 0S +

Rlß (T -

s) ë2 (s + 1),

 

 

 

 

где ëj (s),

ë2(s) — независимые

гауссовские

случайные

векторы

с независимыми компонентами,

средние которых равны нулю,

а дисперсии — единице.

Будем

предполагать,

что Ѳ0 является

гауссовским вектором, МѲ0= 0,

МѲ0Ѳо == Я (Г), не зависящим от

ëi(s), ë2 (s), s =

0,

 

Т — 1.

 

 

 

 

 

 

 

 

 

 

Сравнивая уравнения (13.57) для yt — М [(Ѳ, — tnt){Qt

где mt =

М (Ѳ, I g,,

. . . ,

I,), с уравнением (14.59)

для P(t), видим,

что Р(0 = Уг-/-

Следовательно,

матрицы P(t) являются сим­

метрическими и неотрицательно определенными.

 

 

 

 

3.

Т е о р е м а

14.2. В классе

управлений, удовлетворяющих

условию

(14.56),

оптимальное

 

управление

й — {й0, . .. ,

йг_і)

существует и задается формулами

 

 

 

 

 

 

 

 

ü(t, l) =

- [ R ( t) +

c*(t)P(t+ 1)с(0]+ с * ф Р Н 1 ) а ( 0 т ,

(14.64)

где матрицы Р (t) определяются из (14.59), а пг, находятся из рекуррентных уравнений оптимальной фильтрации

mt+i = с (t) üt -f- а (t) mt +

+

fl ѴИ* (О [В (t) я* (0 +

а (t) Ѵ(Л‘ Wl+ [ІШ -

А (t) mt\ (14.65)

с m0 =

m и матрицами \ (, определенными в (14.60).

процесс

При

этом

входящий

в

(14.65) наблюдаемый

%t, t =

1........ Т,

определяется

из

системы

 

 

 

 

Ѳ*+1 == с (t) щ +

а (t) Ѳ( +

b (t) e, (t +

1 ),

 

 

 

i/+i —

A {t) 0; +

В (t) e2 (t +

1),

 

a

 

 

 

 

T

 

 

 

 

 

V (ü) = p (0) + m P (0) m + 2

Sp Я 1/2 (0 ytHm (t).

( 1 4 . 6 7 )


552 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14

Д о к а з а т е л ь с т в о . Пусть

и = (и0, . . . ,

wr _i)— какое-то

управление,

удовлетворяющее

условию

(14.56).

Тогда

т

 

 

 

 

М (=0 Ѳ?Ѳ, < оо

и

Г -1

 

 

 

Т

 

 

Ѵ{и) = Ы 2

|0 І )

+

М s u*tR{t)ut. (14.68)

 

<=о

 

 

t= о

 

Для рассматриваемого управления

и — (и0, . . . ,

,) обо­

значим

 

 

 

 

 

 

m“ =

М (Ѳ“ I

), y“ =

M |(Ѳ“ — т “)(ѳ “ — m“)*],

где соответствующие управляемые процессы 0“ и

определены

в (14.55).

Важно

отметить*

что

для любого

управления

и — (и0, . . . ,

«т-_і),

подчиняющегося условию (14.56),

матрицы у“

удовлетворяют системе рекуррентных уравнений (14.60) (см. теорему 13.4 и свойство 3 в п. 4 § 2 гл. 13, стр. 511). По­ скольку ни коэффициенты этих уравнений, ни начальные усло­

вия не зависят от управления,

то матрицы yf одни и те

же

для разных и. Поэтому у“ = у,

(см. (14.60)).

 

 

Покажем теперь, что в (14.68)

 

 

 

М (Ѳ“*Я (t) Ѳ? I P f )

= {piff Я {t) mf +

Sp tf1/2 (/) ytHm (t). (14.69)

Имеем

 

 

 

 

 

 

 

M (Ѳ“*Я (t) 0“I ^ f )

=

M [(0“- m f + m f f H (0(0“- mf + m“)| ЗГ)и]=

 

=

(m^)’ Я (0 mf + 2M [(0J* — mf) H (t) mf | &~f“\ +

 

 

+

M [(0“ — mf)’ H (0 (0“ — mf) I

] =

 

=

{mf)’ H (0 mf +

Sp M [Я 1/2 (t)

(Ѳ? — «*“) (Ѳ? — О * Я 1/2(0 |^ * f ]=

=

(от?)* Я (0 m“ +

Sp Я 1/2 (0 M [(Ѳ? — mf) f — mf)’ | g r f ] H'l2(f).

Но согласно свойству 3 п. 4

§

2 гл.

(14.70)

13

 

 

М [(0“ — mf) (0“ — mf)’ I F f ]

=

M [(0“ - mf) (0“ — mf)’\ =

yt>

что вместе с (14,70) и доказывает (14.69).

 

 

Итак, в силу (14.68) и (14.69)

 

 

 

т

 

 

 

т

 

 

V (и) = 2

Sp Я1/2 (0 у,ЯІ/? (0 +

М 2 (« “)* Я (0 от“ +

 

 

<=0

 

 

 

*=0

'

 

 

 

 

 

 

 

 

Т-1

 

+ М % u’tR(i)ut. (14.71)


§ 3]

ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

553

Поскольку функции Sp Н 1 (/) ytH /:(t) зависят лишь от вре­ мени t и не зависят ни от управления, ни от процессов, описы­ вающих состояние рассматриваемой, системы, то ясно, что оптимальное управление й в исходной задаче (если оно только, конечно, существует) совпадает с оптимальным управлением в задаче минимизации функционала

_

/ г

 

Г-1

\

 

Ѵ(и) =

М 2 К “)’ Я (/) m“ +

2 utR (t) и.).

(14.72)

 

\ t = о 4

'

t*=о

V

 

При этом «управляемый» процесс rrVf определяется из урав­

нения

 

 

 

 

 

mf+l — с (i)ut -\- а (t) mat +

 

 

 

 

+ а (/) ѵИ* W (t) B'(t) +

А (t) ytA* (/)]+ [S“+I -

А (t) m“].

(14.73)

Согласно теореме 13.5 найдется последовательность незави­

симых гауссовских векторов ë“ (/) — (ëf (t), . . . ,

ë“ (t)), t =

1 , . . . , T,

с независимыми

компонентами,

Më“(/) =

0,

M(ë?(/))2 = 1 ,

t = l , . . . , / ,

такая,

что

 

 

 

 

 

 

m“+1 =

c(/)a( -f й (/) m“ +

D(t)lu(t +

1).

(14.74)

Важно при этом отметить, что для всех допустимых и вели­

чины ëu(t)

совпадают (ёи (/) == ё (/) /, / = 1 ........ Г).

Вытекает это

из (13.84) и того замечания,

что Ѳ“— mut не зависят

от и (см.

(14.73) и (14.55)).

исходная

задача отыскания

оптимального

Таким образом,

управления для системы (14.55) и функционала (14.57) редуци­ руется к задаче нахождения оптимального управления для отфильтрованной системы (14.74) с функционалом (14.72) («прин­

цип разделения» [26]).

4.

При отыскании оптимальных управлений в этой реду­

цированной задаче будут полезны следующие две леммы.

Л е м м а 14.2. Если « = («„, . . . , иТ- х) — управление, подчи­

няющееся условию (14.56), то для всякой неотрицательно опре­

деленной симметрической матрицы S ( / + l )

М[(«?+,)’ S(/ +

1) m“+1 |^ ]

=

М[ « +і)‘ S (/ + 1) m?+1 |m“,

щ] =

= (m“)*a*(/)S(/+ l)a(t)m“ + utc*(t)S(t+ l)c(t)ut +

 

+ 2 и / (t) S (t +

1) а (t) m “ +

S p

S 1/2 (t + l) D (/) D ’ (t) S,/2 (/ +

1).

 

 

 

( 1 4 . 7 5 )