Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

Скачать файл (19,70Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.04.2024

Просмотров: 249

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 3]	ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ									549
Теперь в силу			(14.48)		и (14.49)		имеем	( />	1)	549
		t	(1 + у, (s -			і))2
Dt	_5_ _\|_ ^		(1 + у, (s -			і))2
Dt	12	5— 1	1 +	Y	(s —	1)
		5— 1
Ѳ, =	- I	5 г.	I	V	(1 + V, (s -		1)) ( i	(s) -	Vo (s - 1, £))
Ѳ, =	D 't	12					i + Y (s JTij
		12		5 = 1			i + Y (s JTij
				5 = 1
§	3. Одна задача управления по неполным данным
(линейная система с квадратичным функционалом потерь)
1. В этом		параграфе			будет показано, как				уравнения	опти

мальной нелинейной фильтрации, выведенные в предыдущей главе, могут быть применены для отыскания оптимальных управлений.

Будем предполагать, что состояние некоторой «управляе

мой»	системы описывается процессом (Ѳ,					^) = [(Oj (f),		9fe(0)>
(gi (t),	. . . , g;(0)].	t — 0, 1,			T < oo,	который	подчиняется
уравнениям
	Ѳ<+і — c ( t ) ut -\- а (t) 9, + b (t) (t + 1 ),							(14.55)
	h+i=			А (0 9, + В (t)		+ 1).

Здесь	c(t), a(t),	b (t),	A(t)	и	В (t) — матрицы		размерностей
(k X r), (k X k), (k X k),			(l X k),		(I X l) соответственно			с эле

ментами, являющимися детерминированными ограниченными функциями t = 0, 1, . .. , Т — 1. Входящие в (14.55) независи мые между собой случайные последовательности е, (і) — (еи (t), ...


■■■, hkit)),		«г (t) = (e2i (i), ■■■, e2Z(0),					t = 1,	... ,	T,	являются
гауссовскими			с	независимыми		компонентами,			Мег/(^) = 0,
Me].(t)=\.
Система		(14.55) решается			при начальном условии						Ѳ0, где
Ѳ0— гауссовский				случайный	вектор,		МѲ0= т,		М [(Ѳ0— m0) X
X (Ѳ0— m0)*] — y,'				не зависящий		от последовательностей E{(t),
і — 1, 2, t =		1,	. .., Т. В систему			(14.55) входит также					вектор-
столбец «, =		(«, (t, g), . .. , ur (t, g)), где при каждом t = 0,								1,..., Т—1
функции	Ui (t,		£),	играющие	роль управляющих				воздействий,
являются	5г \| =		ст{со: g0>•••. ^-измеримыми					(£0 =	0).		мг_.,)
Все рассматриваемые далее						управления		и — {и0,
будут предполагаться такими,					что

é Щ Ѵ ’ ! ) < « » ,

^ = 0, 1, . . . , Т — 1.

( 1 4 . 5 6 )

550 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. И

Предположим, что качество	управления и — (и0,	ит_х)
измеряется квадратичным функционалом потерь
' Г - 1
V (и) = М 2 (ѲШ (t) Ѳ, +	utR (t) щ) + QtH (T) 0r	, (14.57)
_t= о
где H (t), R(t) — детерминированные, ограниченные,		симметри

ческие, неотрицательно определенные матрицы порядков (k Х&),

(л X г) соответственно.	йг_,),
Требуется найти (оптимальное) управление й — (й0, . . . ,	йг_,),
для которого
V (и) — inf V (и),	(14.58)

где inf берется по всем управлениям, удовлетворяющим усло виям (14.56).

Рассматриваемая задача является примером так называе мых задач управления по неполным данным, когда значения управляющих воздействий предполагаются зависящими лишь

от наблюдаемой части	координат	( \|0,	...),	описывающих
состояние управляемой	системы.
2 . При отыскании оптимальных управлений (в рассматри
ваемой задаче таковые	существуют,	что	станет	ясно из даль

нейшего), помимо результатов оптимальной нелинейной фильт рации, будут использованы также идеи динамического про граммирования.

Введем ряд необходимых для дальнейшего обозначений. Пусть P(t) и У/, t = 0, 1, . . . , Т, — матричные функции по рядка (k X k), определяемые как решения рекуррентных урав

нений

P ( t ) = H ( t ) + a ( t ) P ( t + \ ) a ( t ) -
- а * ( t ) P ( t + \ ) c (t) [R (t) + с* (0 P { t + \ ) c (/)]+ с* (0 Р (t +				1) а (t)
с Р(Т) = Н(Т) и				(14.59)
с Р(Т) = Н(Т) и
Уt+i = a (t) y ta* (t) + b (t) 6’ (t) —
-	a (t) ytA' (t) [В (t) B* (t) + A (t) ytA* (0]+ A (t) yta (t)			(14.60)
c Yo — Y- Пусть также
D(t) =		a (t) ytA' (t) {[B (t) B{t) + A (t) уtA' ()]v*} +		(14.61)
и p(t), t =	0 , 1 ,	. .. , T, — последовательность	неотрицательных
чисел, определяемых рекуррентным образом:
p ( t ) = p ( t + ! ) +		S p P ,/2( / + l) D (t) D* (t) P U2 (t +	1), P ( D =	0.
				( 1 4 . 6 2 )

§ 31	ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ	551
		551

Из (14.62) следует, что

Г - 1

Р ( 0 = 2

SpPl/2 ( s + l ) D ( S)D*(s)P1/2 ( s + l ) .

(14.63)

S = t

Введенные

матрицы

Р (t),

числа

р (t) находятся

по

коэффициентам

системы

(14.55)

заданным

матрицам

H{t)

и R(t). Поэтому они не зависят от «случая» и, являясь лишь

функциями времени t, могут быть найдены а priori.

Заметим, что матрицы P(t),

t =

О, I, . .. ,

Т, найденные из

рекуррентных уравнений (14.59), являются симметрическими и

неотрицательно

определенными.

Для

того

чтобы

в этом

убе

диться, рассмотрим задачу фильтрации (см.

§ 1

гл.

13)

для

процессов

Ѳ5+І- а ‘(^-5)Ѳ,+ Hll2(T-s)Bl(s+ 1),

L +i =

с ' ( Т -

s) 0S +

Rlß (T -

s) ë2 (s + 1),

где ëj (s),

ë2(s) — независимые

гауссовские

случайные

векторы

с независимыми компонентами,

средние которых равны нулю,

а дисперсии — единице.

Будем

предполагать,

что Ѳ0 является

гауссовским вектором, МѲ0= 0,

МѲ0Ѳо == Я (Г), не зависящим от

ëi(s), ë2 (s), s =

Т — 1.

Сравнивая уравнения (13.57) для yt — М [(Ѳ, — tnt){Qt —

■

где mt =

М (Ѳ, I g,,

. . . ,

I,), с уравнением (14.59)

для P(t), видим,

что Р(0 = Уг-/-

Следовательно,

матрицы P(t) являются сим

метрическими и неотрицательно определенными.

Т е о р е м а

14.2. В классе

управлений, удовлетворяющих

условию

(14.56),

оптимальное

управление

й — {й0, . .. ,

йг_і)

существует и задается формулами

ü(t, l) =

- [ R ( t) +

c*(t)P(t+ 1)с(0]+ с * ф Р Н 1 ) а ( 0 т ,

(14.64)

где матрицы Р (t) определяются из (14.59), а пг, находятся из рекуррентных уравнений оптимальной фильтрации

mt+i = с (t) üt -f- а (t) mt +

+	fl (ОѴИ* (О [В (t) я* (0 +			а (t) Ѵ(Л‘ Wl+ [ІШ -			А (t) mt\ (14.65)
с m0 =		m и матрицами \ (, определенными в (14.60).						процесс
При		этом	входящий	в	(14.65) наблюдаемый
%t, t =	1........ Т,		определяется	из	системы
		Ѳ*+1 == с (t) щ +		а (t) Ѳ( +		b (t) e, (t +	1 ),
		i/+i —		A {t) 0; +		В (t) e2 (t +	1),
a					T
		V (ü) = p (0) + m P (0) m + 2				Sp Я 1/2 (0 ytHm (t).		( 1 4 . 6 7 )

552 ПРИМЕНЕНИЯ К ЗАДАЧАМ СТАТИСТИКИ [ГЛ. 14

Д о к а з а т е л ь с т в о . Пусть		и = (и0, . . . ,	wr _i)— какое-то
управление,	удовлетворяющее	условию	(14.56).	Тогда
т
М (=0 Ѳ?Ѳ, < оо	и	Г -1
	Т	Г -1

Ѵ{и) = Ы 2			\|0 І )	+	М s u*tR{t)ut. (14.68)
	<=о				t= о
Для рассматриваемого управления					и — (и0, . . . ,	,) обо
значим
m“ =	М (Ѳ“ I	), y“ =	M \|(Ѳ“ — т “)(ѳ “ — m“)*],
где соответствующие управляемые процессы 0“ и						определены
в (14.55).	Важно	отметить*	что	для любого		управления
и — (и0, . . . ,	«т-_і),	подчиняющегося условию (14.56),				матрицы у“

удовлетворяют системе рекуррентных уравнений (14.60) (см. теорему 13.4 и свойство 3 в п. 4 § 2 гл. 13, стр. 511). По скольку ни коэффициенты этих уравнений, ни начальные усло

вия не зависят от управления,						то матрицы yf одни и те		же
для разных и. Поэтому у“ = у,						(см. (14.60)).
	Покажем теперь, что в (14.68)
	М (Ѳ“*Я (t) Ѳ? I P f )			= {piff Я {t) mf +			Sp tf1/2 (/) ytHm (t). (14.69)
Имеем
M (Ѳ“*Я (t) 0“I ^ f )			=	M [(0“- m f + m f f H (0(0“- mf + m“)\| ЗГ)и]=
	=	(m^)’ Я (0 mf + 2M [(0J* — mf) H (t) mf \| &~f“\ +
	+	M [(0“ — mf)’ H (0 (0“ — mf) I					] =
=	{mf)’ H (0 mf +		Sp M [Я 1/2 (t)		(Ѳ? — «“) (Ѳ? — О Я 1/2(0 \|^ * f ]=
=	(от?)* Я (0 m“ +		Sp Я 1/2 (0 M [(Ѳ? — mf) (Ѳf — mf)’ \| g r f ] H'l2(f).
Но согласно свойству 3 п. 4					§	2 гл.	(14.70)
							13
	М [(0“ — mf) (0“ — mf)’ I F f ]				=	M [(0“ - mf) (0“ — mf)’\ =		yt>
что вместе с (14,70) и доказывает (14.69).
	Итак, в силу (14.68) и (14.69)
	т				т
V (и) = 2		Sp Я1/2 (0 у,ЯІ/? (0 +			М 2 (« “)* Я (0 от“ +
	<=0				*=0		'
							Т-1

+ М % u’tR(i)ut. (14.71)

§ 3]

ОДНА ЗАДАЧА УПРАВЛЕНИЯ ПО НЕПОЛНЫМ ДАННЫМ

553

Поскольку функции Sp Н 1 (/) ytH /:(t) зависят лишь от вре мени t и не зависят ни от управления, ни от процессов, описы вающих состояние рассматриваемой, системы, то ясно, что оптимальное управление й в исходной задаче (если оно только, конечно, существует) совпадает с оптимальным управлением в задаче минимизации функционала

_	/ г		Г-1	\
Ѵ(и) =	М 2 К “)’ Я (/) m“ +		2 utR (t) и.).		(14.72)
	\ t = о 4	'	t*=о	V
При этом «управляемый» процесс rrVf определяется из урав
нения
mf+l — с (i)ut -\- а (t) mat +
+ а (/) ѵИ* W [В (t) B'(t) +		А (t) ytA* (/)]+ [S“+I -		А (t) m“].	(14.73)

Согласно теореме 13.5 найдется последовательность незави
симых гауссовских векторов ë“ (/) — (ëf (t), . . . ,					ë“ (t)), t =		1 , . . . , T,
с независимыми		компонентами,		Më“(/) =	0,	M(ë?(/))2 = 1 ,
t = l , . . . , / ,	такая,	что
	m“+1 =	c(/)a( -f й (/) m“ +		D(t)lu(t +		1).	(14.74)
Важно при этом отметить, что для всех допустимых и вели
чины ëu(t)	совпадают (ёи (/) == ё (/) /, / = 1 ........ Г).					Вытекает это
из (13.84) и того замечания,			что Ѳ“— mut не зависят				от и (см.
(14.73) и (14.55)).		исходная	задача отыскания			оптимального
Таким образом,

управления для системы (14.55) и функционала (14.57) редуци руется к задаче нахождения оптимального управления для отфильтрованной системы (14.74) с функционалом (14.72) («прин

цип разделения» [26]).
4.	При отыскании оптимальных управлений в этой реду
цированной задаче будут полезны следующие две леммы.
Л е м м а 14.2. Если « = («„, . . . , иТ- х) — управление, подчи
няющееся условию (14.56), то для всякой неотрицательно опре
деленной симметрической матрицы S ( / + l )

М[(«?+,)’ S(/ +	1) m“+1 \|^ ]	=	М[ « +і)‘ S (/ + 1) m?+1 \|m“,	щ] =
= (m“)a(/)S(/+ l)a(t)m“ + utc*(t)S(t+ l)c(t)ut +
+ 2 и / (t) S (t +	1) а (t) m “ +	S p	S 1/2 (t + l) D (/) D ’ (t) S,/2 (/ +	1).
			( 1 4 . 7 5 )

Смотрите также файлы

Матлин Г.М. Проектирование оптимальных систем производственной связи.pdf

Месенжник Я.З. Кабели для нефтегазовой промышленности.pdf

Методы анализа лакокрасочных материалов..pdf

Митропольский Ю.А. Интегральные многообразия в нелинейной механике.pdf

Нестеров Ю.Ф. Теория и расчет судовой тепловой изоляции.pdf

Файл: Липцер Р.Ш. Статистика случайных процессов. Нелинейная фильтрация и смежные вопросы.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно