Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

Скачать файл (19,70Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.04.2024

Просмотров: 223

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г Л А В А 16

ПРИМЕНЕНИЕ УРАВНЕНИЙ ОПТИМАЛЬНОЙ НЕЛИНЕЙНОЙ ФИЛЬТРАЦИИ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ И ТЕОРИИ ИНФОРМАЦИИ

§ 1. Одна задача оптимального управления по неполным данным

1. В этом параграфе обобщаются на случай непрерывног времени результаты, полученные в § 3 гл. 14 для задачи

управления (по неполным данным)					линейной системой с квад
ратичным функционалом потерь.						наблюдаемый	управляе
Будем предполагать,		что частично
мый процесс (Ѳ, £) = [(Ѳ,(0, .				Ѳй(0); ( h ( t ) ,				° <
задается стохастическими уравнениями
dQt =	Iе (О И/ + а (t) Ѳ,] dt +					b (/) dWi (t),
d \ t =	A (t) Q(dt +		B (/) dW 2 (t).				(	'
Матрицы c(t), a(t), b(t),		A(t), B(t)			имеют размерности (k X 0,
(k X k), (k X k),	{I X k),	(l X 0		соответственно, их			элементы
Cij(i), aij(t), bij(t), A tj(t),		Bij(t)		являются детерминированными
функциями времени, причем
k / y ( f ) \| < c ,		\| й г / ( 1 ) К с ,				\ Ь ч У ) \ ^ с ,
т		<	о о ,	т
оJ	А2іі (t) d t			оj	В 2ц (t) d t < OO

при всех допустимых значениях i, j. Предполагается также,


что элементы	матриц	(В (t) В*		равномерно		ограничены.
Входящие в (16.1) независимые винеровские					процессы		не
= ( W n ( t ) , .. . .	W xk{t)),	W2 = (W2X(t),	.. . . W2l(t)),			О
зависят от гауссовского вектора Ѳ0			(МѲ0 = т 0, соѵ(Ѳ0, Ѳ0) = Ѵо),
а Іо= О-	[ul (t, l),	. . . . ur (t, £)],		входящий	в (16.1),		назы
Вектор ut =
вается управляющим воздействием в				момент времени t.			Изме-

§ 1) ЗАДАЧА УПРАВЛЕНИЯ По НЕПОЛНЫМ ДАННЫМ 609

римые процессы u } (t, |), / = 1, .... г, предполагаются такими,

что

Тг

(16.2)

о; = 1

авеличины (t, £) — ^-измеримыми.

Управления u = (ut), Os^/^ Г , для которых система урав

нений (16.1) имеет единственное сильное решение и для кото рых выполнено условие (16.2), будут в дальнейшем называться

допустимыми.

управления,

введем в рас

Чтобы сформулировать цель

смотрение

функционал потерь.

определен

Пусть h, Н (t) — симметрические неотрицательно

ные матрицы порядка ( k \ k ) .

Обозначим R(t) симметрические

равномерно *)

положительно

определенные

матрицы

(размер

ности (г У. г)).

Предположим,

что элементы матриц Н (t) и

R(t)

являются измеримыми ограниченными функциями t.

Для

каждого допустимого управления

и = (щ),

рассмотрим функционал

потерь

V (и;

Т) = М I Q*Tfi6T + J [ѳ;я (t) Ѳ( + u]R (t) ut] dt

(16.3)

Допустимое управление ü называется оптимальным, если

V (й; Т) — inf V (и;

Т),

(16.4)

где inf берется по классу всех допустимых управленийJ .

Рассматривая допустимые управления и, положим

m f —

М (Ѳ, j I),

у “ —

М [(Ѳ, — mfj (Ѳ( — m “)*],

где

Ѳ,

— соответствующие

этому

управлению

процессы,

определяемые

системой

(16.1).

Т е о р е м а

16.1.

классе

допустимых управлений

опти

мальное

управление

ü = ( ü t),

существует

и опреде

ляется

формулами

üt = - R ~ x(t)c*(t)P(t)mt,

0 < * < 7 \

(16.5)

где

неотрицательно

определенные симметрические**) матрицы

P{t) =

\\Pij{t)\\

порядка

( k y k ) ,

0 ^ . t ^ . T ,

являются

решением

Элементы

матриц R

(t) равномерно ограничены.

матрицы

Р (t),

**) Неотрицательная определенность и симметричность

удовлетворяющей

уравнению

(16.6),

доказывается

так же,

как и в случае

дискретного

времени (§

3 гл.

14).

20 Р. Ш. Липцер, А. Н. Ширяев

610 ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ [ГЛ. 16

уравнения Риккати

-	= a ( t ) P ( t ) + P			( t ) + H ) ■
		- P ( t()t )cа( t ) R			1(t)c'(t)P(t),(t	P(T) =	h,	(16.6)
а вектор m t определяется				из системы уравнений
d m t =	[с (t) üt +	а (t) tnt] dt +		y tA* (0 (в (0 (t))~l [dlt — А (t) tnt dt],
					tnQ= rnQ= МѲ0,			(16.7)
yt — a ( t) y t +		(0 + b(t) b (t) — ytA* (t)(B (t)B* {t))~xA ( t) y t,
При	этом				Yo — cov (Ѳ0, Ѳ0).			(16.8)
При	этом
V(ü,	Т) — р (0) + rn"QP (0) m Q+
		+ Sp I		Н ш (t) y tH lß (t) dt +		h x'2yTh Xß	,	(16.9)
где		P(0 =	■o
где			T	k
			T	k
				JYl	Di l (s)Pii(s)ds,			(16.10)

tІ, /=*1

аDij{t) — элементы матрицы

D(t) =	y tA*(t){B(t)B’ (t)}-x A { t)y t.			(16.11)
Д о к а з а т е л ь с т в о . Прежде		всего	отметим,	что при сде
ланных выше предположениях
	к
м	sup 2ѳ}(*) <		оо,
	_о<г<г/=і	‘

что доказывается, как и в лемме 12.1. Далее, так же, как и при доказательстве теоремы 14.2, устанавливается, что

V(и, t) = м jѳ;аѳг+ j [ѳ;я(оѳ( + u]r (t) ut] dt J =

= M	M (0j.A0r I	+ j [M (ѳ;я(0 0, \|		+ utR(t)ut\ dt	=
=	M j (m“)* hm ^ +		[(m“)* H (t) m “ +	ut R (t) ut~\ dt +	(16.12)j
j	+ Sp	h my “hJ	m + J H 1'2(t) y “H m (0 dt		(16.12)j

§ Ч

ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

611

Важно заметить, что функция у“ не зависит от управле

ния и и совпадает с функцией у/, удовлетворяющей уравне

нию (16.8) (см. теорему 12.1). Поэтому

Ѵ(и\ Т) = Sp

h >l2yTh 112 -f

H V2(t)ytH 1,2(t)dt

M I {triff h m tu -f

[ \(т“У

utR (t)ut] d t \ ,

(16.13)

где согласно той же теореме 12.1

m“,

находится из

уравнения

d m ut = [c(t) ut + а (t) mjf] dt +

y t (В (t) В* (t))~\dla — A(t)

dt],

(16.14)

с процессом %ut ,

определяемым из системы (16.1).

Согласно

векторному

варианту леммы

11.3

процесс Wu =*

= ( # “, F f ) ,

Т,

B~l (s)[dfs ~

A ( s ) m U u \ ,

(16.15)

является винеровским. Поэтому в силу (16.14) и (16.15)

d m “=

[с (t) ut +

a (t) m“] dt -f уtA* (t)(ß* (0)“' dW “t.

(16.16)

Для

решения

исходной

задачи рассмотрим

теперь сле

дующую вспомогательную задачу.

пространство,

Пусть

(Q,

F ,

Р) — некоторое вероятностное

( F t),

O ^ i t ^ T , — неубывающее семейство ст-подалгебр F , z —

= (z„

F t) — r-мерный винеровский процесс, и — {и„ F t) — /‘-мер

ный процесс, удовлетворяющий условию

М [

иj (£,

со) Л < оо,

(16.17)

О /л=1

где (ut (t, со),

. . . ,

ur {t,

(ä))~ut.

управлением

u — (ut, F t),

0 < f < 7 \

свяжем управляемый

процесс

dp,“ — [с (t) ut -f a(t)

n’t] dt +

уtA*(t) (ß*(0)~! dzt,

(16.18)

где c(t), a(t), y t, A(t), В (t) — введенные выше матрицы, p“ — m0. Как и раньше, управление u — {ut, F t), 0 ^ Г, будем на

20*

612

ПРИМЕНЕНИЕ К НЕКОТОРЫМ ЗАДАЧАМ УПРАВЛЕНИЯ

[ГЛ. 16

зывать допустимым, если для него выполнено условие (16.17)

иуравнение (16.18) имеет единственное сильное решение.

Вкачестве функционала потерь рассмотрим функционал

Ѵ{щ Г) = м{({?)’ Ä((?)+					H ( t ) ^ t + u tR { t ) u t\ d t \ .					(16.19)
Покажем,	что в этой задаче оптимальное управление й ==
— {üt, STt) определяется формулами
		йt = -R~'(t)c'{t)P(t)iit,								(16.20)
где Д„	находится			из уравнения
d\xt = \а (t) —	с (t) Р~' (t) с* ( t ) P ( t ) ]				Д, dt +		y t A * ( t )	(В* (t ) ) ~ l	dz t,
			До =		m 0.					(16.21)
С этой целью введем функцию
Q(t,	x) = x*P{t)x +		p{t),				0 < f < 7 \			(16.22)
где P(t) определяется из			уравнений				(16.6),	а p{t) — из		(16.10).
Л е мм а	16.1.	Функция		Q(t,		х) = х *P(t)x-\-p(t)			является
решением дифференциального уравнения
где		Ф (t,	X,	Q(t,		х ) ) ~ 0 ,				(16.23)

Ф(/, .г, Q(t, x)) — x*H{t) X +			х"а' (t) gradx Q(t, x) +
	+ 1	S		d2Q (t, x)			. dQ (t,	x) .
				дх. дх		^	д Г	^
	i, /= 1		+	min [uP (t) и + mV (t) grad Q (t, x)\

c u — (u\,	ur),	Q{T, x) =		x ’hx.		положительной определен
Д о к а з а т е л ь с т в о .			В	силу
ности матриц P{t),		0<Л=^Г, квадратичная форма
	J (м; t) = и Р (t) и +				uc{t) grad Q (t, x)

является положительно определенной и достигает минималь


ного значения на	векторе щ{х)		= (йі (t, х), ... ,	ür (t, х)), удо
влетворяющем системе линейных			алгебраических уравнений
	gradu 1 (м; t) — 0.
Поскольку grad„/(M; t) =		2P(t) и + c(t) grad Q(t,		x),
Щ (x) =	—	P ~ 1(/) c* (/) grad* Q (t, x).

Смотрите также файлы

Матлин Г.М. Проектирование оптимальных систем производственной связи.pdf

Месенжник Я.З. Кабели для нефтегазовой промышленности.pdf

Методы анализа лакокрасочных материалов..pdf

Митропольский Ю.А. Интегральные многообразия в нелинейной механике.pdf

Нестеров Ю.Ф. Теория и расчет судовой тепловой изоляции.pdf

Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно