Файл: Сейдж Э.П. Идентификация систем управления.pdf

Скачать файл (7,54Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 162

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

3.2]

МАКСИМУМ АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ

чайные процессы w {t), v {t) и со (t) — некоррелированные между собой гауссовские белые шумы с нулевыми мате матическими ожиданиями и известными интенсивностями.

Составные части штрафной функции МАВ (3.2.62) и канонических уравнений (3.2.63) и (3.2.64) в данном случае имеют вид

- X l	(t)~	- X I	( f ) -	-— x\ (1) xi (<)'
	a	= X 2	(t) , f[x (),] =	0
-	e _	- X 3	(«)-	0

G [х (г), t] :

Px {^) =

>*, (**)'

_ .

W(t) = w(t), h[x(t),f]: I*i (t) + (0j

о			[o>Y ie(t)i>
, Twv(o =			[o>Y ie(t)i>
» + т „ ( Ч	1		0 ^o*	---1 О
	1	H	0 ^o*	---1 О
, V- (i0) == Vx (to) =	_____	оо		и о
, V- (i0) == Vx (to) =
	1			1

Поучительно выписать канонические уравнения для рас сматриваемой конкретной задачи. Они выглядят так:

i	1~	.	/Л	* „ «»<)		, ,Л ,	»(>	t ,Л
	1~	21	^ 2а W	(() +	(t)		(t) + ЧГа (t)
4 =		0,
4 =		0,
4	=	-у 1	lix (0 —	(0 — 4. (01 +		*^2(0	(0>
4	=	4х(t) Xi (t),
Граничные условия				запишутся		следующим образом:
			(^о) — Vxt {to) [4i {к)		Р*ч {to)],		{tf) == 0)
		^2 (£o) — Va [4a (to) Pali					^ { t f ) = 0,

^3(*o) = Vg [£3 {to) — Pelt

*-3 {tf) = 0.

72 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3

ДТКЗ явно нелинейна, и поэтому трудно надеяться на получение ее аналитического решения. Подробно выписав канонические уравнения, мы смогли понять, каким обра зом различные конкретные компоненты задачи, в част ности параметры априорного распределения, входят в ДТКЗ. В дальнейшем большое внимание будет уделено способам, которыми характеристики этого априорного рас пределения [VXl (t0), Va, Ve, цх, (t0), рд, pe] влияют на доступную для нас точность и быстроту идентификации параметров системы.

3.3. ИДЕНТИФИКАЦИЯ ПО КРИТЕРИЮ МАКСИМУМА АПОСТЕРИОРНОЙ ВЕРОЯТНОСТИ ПРИ НЕИЗВЕСТНЫХ ПАРАМЕТРАХ АПРИОРНЫХ РАСПРЕДЕЛЕНИЙ

Если параметры априорных распределений шумов объекта и измерений или каких-либо их составляющих неизвестны, решить сформулированную ДТКЗ для иден тификации системы не удается. Нередко неизвестные априори средние значения можно рассматривать как под лежащие идентификации неизвестные константы. Эти неизвестные постоянные добавляются к уравнениям объек та и наблюдений и к ДТКЗ, получаемой описанным в пре дыдущем разделе способом. Альтернативный подход ос нован на методах данного раздела. Неизвестные априор ные дисперсии, однако, приводят к значительно более существенным затруднениям, так как эти дисперсии вхо дят в неэкспоненциальную часть штрафной функции МАВ (3.2.21). Для обеспечения совместимости с иденти фикацией по методу МАВ удобно предположить, что апри орные параметры не меняются от шага к шагу и таковы, что по формуле Байеса для не зависящих от номера шага параметров априорного распределения можно написать

A[Z (kf) 1X (kf), pw,Vw, щ,, VY]

P [X (kf), fiw, Vw, Pv,Vv|Z(&/)] —

----p [Z(kf)]

X P [X ( k f ) |Pw? Vw, Pv> Vw] p [pw] p [Vw] p [Pv] P [VvL (3.3.1)

причем считается, что априорные параметры независимы. Снова совместная плотность р [Z (fy)] не влияет на про ц е д у р у оптимизации, поскольку она явным образом не зависит от переменных состояния X (к) и априорных па

3.3]

НЕИЗВЕСТНЫ Е АПРИОРНЫ Е РАСПРЕДЕЛЕНИЯ

раметров juw, Vw, juv, Vv, которые являются существенным переменными при оптимизации апостериорной плотности. Поэтому оценка МАВ может быть определена максимиза цией безусловной плотности

Р [X (kf)i Z (Л/)) f^W, Vw, Цу, Vy] —•

= p[Z (kf) |X (kf), p,w, Vw, p.v, V y]p[X (kf) |fiw, Vw, цу, Vv] X

X p [fiw] P [Vw] p [f*v] P [Vv].

(3.3.2)

Часто бывает удобно предположить, что априорные значе ния параметров распределены равномерно (Сейдж и Хьюза [122]), так что априорное распределение каждой компо ненты имеет вид

Р [Pioil — \|	max
l	0

— 1 Рш max ^ Ри>	Piu mini
min	(3.3.3)

в противном случае.

Предполагается, что все остальные априорные параметры распределены аналогичным образом. Допуская, что оцен ки априорных параметров таковы, что ограничения в вы ражениях равномерной плотности не нарушаются, оценки состояния, параметров системы и параметров априорных распределений определяются максимизацией выражения

Р [Z ( k f ) |X ( k f ) , jiw, Vw, fxv, Vvl p [X ( k f ) ] fiwj Vw, Цу, Vw]- (3.3.4)

При некоррелированных шумах объекта и измерений это выражение в точности совпадает с полученным в (3.2.21). Таким образом, необходимо выбором X(fey), fiw, Vw, Цу, Vv максимизировать

[detVx (/c0)]1/4 [d etrV wrT] [detVv]}(^	к°П
X exp {— 0,5 [j x (&0) — Цх (k0) fv-i(ko)—
Ч
- 0 , 5 2 И А) — M-y — h [x (A:), fc] \|^_x —
— 0,5 2 flw(A) -	\|Kwf-i) •	(3.3.5)

k=k*

VwJ

74 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ. 3

Эта штрафная функция метода МАВ получается для сле дующей модели формирования сигнала и наблюдений с гауссовскими белыми шумами w (к) и у (к):

х (к + 1) =	<р [х (к), к) -f- Fw (к),	(3.3.6)
z{k) =	h[x(fc),ft] + у (к)	(3.3.7)

с (неизвестными) параметрами априорных распределений

f*w = $ {W {к)},	Yw =	var (w (к)},
Hv — $ (v (к)},	Уу =	var (v (/с)}

и (известными) параметрами априорных		распределений
\|М&о) =	$ {х (*о)},
Vx {к0) =	var {х (к0)},
cov {w {к), v (/с)} =	0,	(3.3.9)
cov (х (А’о), w {к)} — О,
соv{x(A), v{k)} =	0.

Следует обратить внимание на то, что в этой формулировке неизвестные параметры, подлежащие оцениванию, обра зуют часть обобщенного вектора состояния X {к). Любые компоненты p,w, Vw, pv и Vv, которые известны заранее, считаются заданными и в максимизации штрафной функ ции (3.3.5) не участвуют. Максимизация (3.3.5) по пара метрам априорных распределений — стандартная задача матричного исчисления.

В результате получим

Yjiw{kf \kf) = к ^_к- f

FVW{kf |kf) Гт =

2 x (/clfc/) — ф[ж{к — 1 \kf) , k — 1], *=M-1

(3.3.10)

2 ix(b\kf) -

f/c=/r„+i

—<p [x (к — 1 1kf), к — 1] — Гц№{k, |kf)) (i (A |kt) —

— ф[х(А — 1 1kf), к - 1] - ГД» {kf |kf)}1', (3.3.11)

3.3] ННИЗВЁСТНЫЕ АПРИОРНЫ Е РАСПРЕДЕЛЕНИЯ ?5

МАу |Ау) ==-p -L - S [JB(A) —h [X (Л J*/), A], (3.3.12)

/0 /С=Й„+1

Vv (fy 1A;) = j ., ■ 2 <*(*) — h lx (Л |Л,), ft] —

1	ft=Ar0+ l
— £v (Ay1 kf)} {z (A) — h [x (А\|Ay), A] — fiv (kf \|Ay)}T,		(3.3.13)

где через x (A |Ay) обозначено решение задачи иденти фикации, сформулированной как задача сглаживания, получающееся путем максимизации (3.3.5) по X (Ау) с ис пользованием вместо параметров априорных распреде

лений их оценок r(iw (Ay |Ay), TVW(Ау |Ау) Гт, (tv (Ау |Ау),

Vv (Ау |Ау). Приближенные решения задачи сглаживания для класса сформулированных здесь задач даны в главе 9 книги Сейджа и Мелсы [127]. К сожалению, практиче ская реализация алгоритмов для х (А |Ау), объединенных с алгоритмами оценки параметров (3.3.10) — (3.3.13), может оказаться совсем не простой. Оценки параметров априорных распределений (3.3.10) — (3.3.13) будут ис пользованы при построении алгоритмов оценивания ме тодами градиента и стохастической аппроксимации в сле дующих двух главах. Обратимся теперь к формулировке задачи идентификации, для которой решение соответству ющей ДТКЗ может быть получен методами квазилинеа ризации и инвариантного погружения (главы 6, 7).

Удобнее минимизировать взятый с обратным знаком натуральный логарифм штрафной функции МАВ (3.3.5), что эквивалентно минимизации

/	= 0,51 х (А0) — цх (А0) f -1		+
	кг 1	У%(*о)
	Ч- ОД 2	( IIz (к “Ь 1)		Mv (к -Ь 1)]
	— h [х (А + 1), А + 1] I®,		+	0,51\|w (А) -	nw(A) f		+
		Vy (л+1)			V^r (я)
+	0,5 In [det ГУ№(А) Гт ] + 0,5 In [det Vv (A +				1)]}.	(3.3.14)

Минимизация должна быть проведена при ограничениях, накладываемых моделью формирования сигнала (3.3.6)

76 ФУНКЦИЙ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ 1ГЛ. 3

и порождаемых (3.3.7) условиях постоянства параметров априорных распределений:

х (к +	1) =	<р [х (к), к\ + Tw (к),	(3.3.15)
(Hw (А; +	1) =	M-w (к),	(3.3.16)
VW(A +	1) =	YW(A),	(3.3.17)
l*v (A: Jt-1) =		цу (к),	(3.3.18)
Vv (A +	l) =	Vv (A).	(3.3.19)

К этой задаче можно непосредственно применить дискрет

ный принцип максимума или уравнения		Эйлера — Ла
гранжа. Определим гамильтониан:
Н [х(/е), w (к),%(к +	l),v w (к + 1),
	Sw (к + 1), yv (к	1), Sv (к Jf- 1),
Mw (к), Yw {к), \|иу {к), Vv (к), к] = - i - 1ъ (к + 1) — (А:+ 1) —
— % [х (к), w (к), к	1] \|\|^-i(fc+i) + — 1w (А) — fiw (kfv-i(k) +
+	In {del ГVw (к) Гт} +

-1—— In {det Vv (k -j- 1)} -f- XT (k -f- 1) {ф [x (k), A:] -j- Tw (A:)} -|-

	-f- Yw (k -j- 1) Цу/ (k)			Sp (3W(k -f- 1) rV w (к) Гт} -f-
+	Yy	+ 1) Mv (A:) +	Sp (3V(A: +		l)Vv(A + l)>,	(3.3.20)
где	X, Yw и Yv — векторные, a S w и Sv — матричные мно
жители		Лагранжа.
Канонические уравнения запишутся в виде
:(к + 1 \к}) = ф I* (А: \|kf), к]					ЦТ	(3.3.21)
		дер [х (k\kf), /с]
- T V W{к\Щ)Г-					X (к \|kf) -1- I > w (к \|kf),
		Эх (к \|kj)
		Эср [х (к \|к^), к]			X(к \|А^) +
к‘ (к + 1 1kf) = \|				\|
		дх (к \|kf)
		dhT [х (к +	1 \|kf) , к + 1 ]		v ^1(Л + 1 1Af^ X
		дх (к +		1 \|kf)
X (z (к +		1) — M'v (к \|kf) — h [x (A: -f- 1 \|kf), к -j- 1]},				(3.3.22)

Смотрите также файлы

Семенов Б.В. Экономическая эффективность угольного производства и факторы ее повышения.pdf

Синавина В.С. Оценка качества функционирования АСУ. (Исследование достоверности обработки информации).pdf

Синицын А.П. Расчет балок и плит на упругом основании за пределом упругости пособие для проектировщиков.pdf

Сиразутдинов А.М. Основные показатели промышленных кондиций на руды цветных металлов.pdf

Современная фотоэлектрохимия. Фотоэмиссионные явления.pdf

Файл: Сейдж Э.П. Идентификация систем управления.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно