Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

Скачать файл (19,70Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.04.2024

Просмотров: 220

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ И

ЗАДАЧА

УПРАВЛЕНИЯ

ПО

НЕПОЛНЫМ

ДАННЫМ

613

Но

grad* Q (t,

х) = 2P(t)x.

(16.24)

Поэтому

(16.25)

й,(х) =

R - '(t)c*(t)P(t)x .

В силу (16.6),

(16.22)

х [ - a

(t) P ( t ) - P (t) a (t) -

Н {t) + P(t) c (t)R ~ l (t) c* (t) P (/)]* -

(/)/>„w

(16.26)

i, /'=1

d2Q (t

(16.27)

dx{ dxj,

2Pi f (t).

Формулы

(16.24) — (16.27)

вместе

с равенством J{ü‘, t ) —

тіп /(и ;

t) показывают, что

функция Q (t,

х) = х*Р (t) х + Р (t)

удовлетворяет уравнению (16.23).

Лемма доказана.

Покажем теперь, что для вспомогательной задачи управле

ние, определяемое

формулой

(16.20),

является оптимальным.

Из (16.23)

ясно, что

Ф (г , fit, Q(t, £,)) = 0 .

(

Пусть теперь «/ =

( м 1 (^)...........ur {t)),

0 ^ . t ^ . T

— любое из допу

стимых управлений и ц, — (ц, (/),

.... р.*(/))

определяется из

уравнения

d\if = [с (t) ut -\- а (t) ц(] dt

-f y tAl(B*

d z t.

(16.29)

Тогда из (16.23) и

неравенства

J (ü\

t ) ^ J { u ,

t) вытекает, что

Ф(Р ц„ Q(t,

ц())> 0 .

(16.30)

Применяя к Q(t, Д,) формулу Ито, находим, что

Q(T, fir)

Q (0, Д0) =

É.9JI: М +

(с (s) üs

|_ а

grad. Q (s> дв)

+ 4 У

D„(s)

d2Q (s,

fis)

ds +

dfi. dfif

l, /=1

+ J [g r a d e s ,

fis)Y ysA* (s){B* (s))-1dzs.

(16.31)

614 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16

Отсюда, принимая во внимание (16.28), находим

Q (Г, Дг) — Q (0, р,0) — ~ I КД*)’ Н (s) Д* + (“«)* ß (s) ds] ds +

+ Jг [gradp, Q(s, Д5)]‘ ysA'(s)(B* (s))“‘ dzs. (16.32)

Беря теперь математическое ожидание от обеих частей этого равенства и учитывая равенство Д0= т 0> получаем, что

<3(0, ш 0) =

= М \|( Д г)*АДг+ j [(ДД’ Я ^ Д . + ^ Г				R(t)üt] d t y		(16.33)
Аналогично, применяя тот же прием к Q(t,					ц,), находим, что
<3(0, т 0Х
< М (Дг)* h\xT + J [ ( X			Н (t) р, + (uty	R (t) и,I dt .		(16.34)
Сравнивая (16.33)		и (16.34),	получаем
УправлениеJ	V(ü\ r) = Q(0, m0)< P (u ,			Т).	(16.20),J	(16.35)
	й,	определяемое формулой				является

допустимым, поскольку линейное уравнение (16.21) имеет, и притом единственное, сильное решение (теорема 4.10). Усло вие (16.17) выполнено в силу векторного варианта теоремы 4.6. Вместе с (16.35) это доказывает, что в классе допустимых управлений управление й является оптимальным.

Этот результат можно получить тем же методом, что и при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить

Вг/(0 = е, е j 0.
4.	Чтобы	завершить	доказательство теоремы 16.1, рассмо
трим подробнее процессы
		w u = { w “, &-?),. 0 < ( < І .
Из (16.14) и (16.1) следует,			что с вероятностью	единица вели
чины	Ѳ“ — m" и	d°t — m°t совпадают (индекс 0		соответствует

«нулевому» управлению м ,= 0, Q ^ t ^ T ) . Поэтому из (16.15) ясно, что с вероятностью единица все процессы W “ совпадают

§ 1]

ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

6l5

(F“ = F?) и, значит, уравнение (16.16) можно записать в таком

виде:

dm" =	[с (О ut + а (/) m ut \ dt +	y tA* (t) (ß’ (ОГ' dW°t.
Пусть теперь ü — некоторое допустимое управление,				— (If),
0^C/ s^7\ — соответствующий ему процесс и
	r f = o[<i>: I“,	5<г).
Воспользуемся	результатами п. 3,	взяв	=	z t — W°t.

Пусть U — класс всех допустимых управлений и — (щ), 0 <11 Т,

являющихся ^ “-измеримыми при каждом t. Поскольку для любого й

3 r f = > 3 r J ü = s r y 0,

о < * < г ,

то управление й, задаваемое формулой (16.21), принадлежит U

для любого й (допустимость управления

й следует из тео

ремы

4.10

векторного

варианта теоремы

4.6).

Поэтому

(см. (16.35))

V (й; Т ) ^ Ѵ ( и ;

Т)

для

всех и е І / . и ,

частности,

V [Гг,

Т ) ^ і V (и;

Т). В силу произвольности управления й отсюда

следует, что управление й является оптимальным.

Наконец,

заметим,

что

формула (16.9)

вытекает из (16.13)

равенств

V (й, T) — Q (0,

m 0) = m*0P (0) m 0+ p (0).

(§

З а ме ч а н и е .

Как

случае

дискретного

времени

3 гл.

14),

доказанная теорема иллюстрирует (справедливый

в более общей ситуации [26]) так называемый

«принцип раз

деления», в соответствии с которым задача оптимального

управления

по неполным данным распадается

на

две: задачу

фильтрации

и задачу

управления

по полным данным для не

которой системы.

один

частный случай системы (16.1). Пусть

Рассмотрим

6(0 =

v4(0 =

ß(ftxft)>

ß(f) =

0. Тогда,

задаче

управления

процессом Ѳ = ( Ѳ 0 ,

0 < t ^ T ,

l* L =

c(t)u t +

a ( f ) %

(16.36)

где Ѳ0 — детерминированный

вектор, и функционалом

ѳ;/гѳг +

V (и,

Т) =

I"[ѳ;я (О Ѳ, +

u]R (0 ut\ dt

оптимальное

управление

ü =

(üt),

существует и

616 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16

задается	формулой
	ü t =	- R	~ l (t)c, (t)P(t)Qt,			(16.37)
где P(t) является решением уравнения (16.6).					При этом
	Ѵ( й \ Т )	= іпіѴ ( и \ 7,) =		Ѳ;Р(0)Ѳ0.		(16.38)
		и
Этот	результат можно		получить	тем же	методом,	что и

при доказательстве теоремы 6.1. Он получается также из этой теоремы при формальном предельном переходе, если положить

В ц (0 = 8 , 8 I 0.

§ 2. Асимптотические свойства фильтра Калмана — Бьюси

1. Рассмотрим гауссовский частично наблюдаемый случай ный процесс (Ѳ, £) = [(Ѳ,(0, ... , Qk (t)), (h{t), •••, Ы Щ , t > 0 ,

удовлетворяющий системе стохастических уравнений

ddt =

КѲ, +

a2g,] dt +

bl d W l (t) +

b2 dW 2 (t),

dlt =

[Л,Ѳ<+

A2|J dt +

ß, d W x (t) +

ß2 dW 2(t)

(lb,d9)

с постоянными матрицами а,, a2,

A h

A2,

ft,,

b2, ß,

и ß2

поряд

ков

(k X k),

( k X l ) , ( I X k ) ,

(I X

l),

{k X

k),

( k X l ) , U X k ) и

(/X

l) соответственно.

Независимые

между

собой

винеровские

процессы W x =

{Wn (t),

W lk (t))

и Г 2 (/) =

(Г 21 (t),

.. .,

Г 2,(/)),

0, предполагаются, как обычно, не зависящими от гаус

совского

вектора начальных значений (Ѳ0, | 0).

опре

Если

матрица

(ß ° ß) =

ß ,ß t-{-ß2ß2

положительно

делена, то согласно теореме

10.3

вектор

апостериорных сред

них значений m t — М (Ѳ( | STf)

и матрица ковариаций

y t =

M[(Qt — m t)(Qt — m ty]

(16.40)

удовлетворяют системе уравнений

d m t — [alm t + a2%tJ dt +

[(b ° ß) +

yHIJ (ß 0 В У ' [äh -

И іm t +

A £ t) dt],

(16.41)

Y< = а іУі +

Yt< —

[(ft ° ß) +

ѴИІ] (ß 0 ß)_1 [(ft 0 ß) + ѴИІ] +

(ft ° ft)>

где (ft ° ft) =

ftift* +

b2b2,

( b ° B ) = biBi +

ft2ß2.

(16.42)

Компоненты вектора

== M (0f |

являются наилучшими

(в среднеквадратическом смысле) оценками соответствующих компонент вектора по наблюдениям gg. Элементы матрицы y t,

ее след Spy,, показывают точность «отслеживания» оценкой m t

Смотрите также файлы

Матлин Г.М. Проектирование оптимальных систем производственной связи.pdf

Месенжник Я.З. Кабели для нефтегазовой промышленности.pdf

Методы анализа лакокрасочных материалов..pdf

Митропольский Ю.А. Интегральные многообразия в нелинейной механике.pdf

Нестеров Ю.Ф. Теория и расчет судовой тепловой изоляции.pdf

Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно