Файл: Сейдж Э.П. Идентификация систем управления.pdf

Скачать файл (7,54Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 172

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

82 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ . 3

X (к +	1 1kf) = X{к \|kf) -I- НТ(А +		1) V;1 (к +	1 1к,) х
		X [г (к + 1) - н (к + 1) i (к + 1 1Щ ,
	V„ (к	1 1kf) =	Vv (к \|kf),
SB(А +	1 1akf) = v (к j kt) —		+
	+ у; №°+5, ,	IM* +	») - н (t +	1) i (t + 1 ц,)\|.

Эти уравнения должны быть решены при двухточечных граничных условиях

X(01kf) =	У"1 [х (01kf) — цх], X{kt \|kf) = О,
3» (О \|к,) =	О, So(A/ \|ft/) = 0.

Обратимся теперь к формулировке задач идентифика ции с использованием метода максимума правдоподобия.

3.4. ИДЕНТИФИКАЦИЯ ПО КРИТЕРИЮ МАКСИМУМА ПРАВДОПОДОБИЯ

В предыдущем изложении штрафных функций для задач идентификации предполагалось, что необходимо оценить (идентифицировать) параметры и состояние си стемы. Избавимся теперь от формального требования идентифицировать состояние системы. Таким образом, при идентификации по максимуму апостериорной вероят

ности необходимо	максимизировать р [0	\|Z (kf)] или
p [ e \ z ( t f ) ] , где 0	обозначает неизвестные	постоянные

параметры (не включающие состояние системы), по отно шению к которым осуществляется максимизация. При идентификации по критерию максимума правдоподобия максимизируется p{ Z{ kf ) |0] или p [ Z { t f) |0] относи тельно 0. Если неизвестные параметры распределены рав

номерно или имеется	значительная неопределенность
(V0велика) в априорном	распределении, то, как показа

но в предыдущем разделе, методы идентификации по максимуму правдоподобия и апостериорной вероятности эквивалентны. В этом разделе будут исследованы только оценки максимального правдоподобия для параметров системы (в том числе и для параметров априорных рас пределений). Если известны априорные значения пара-

a.4j

КРИТЕРИЙ МАКСИМУМА ПРАВДОПОДОБИЙ.

8 3

метров распределений неизвестных параметров системы, их можно включать в штрафные функции, рассматрива емые в данном разделе. Однако подробно этот случай рас сматриваться не будет. Как и прежде, вначале исследуются дискретные системы. Затем результаты формулируются и для непрерывного случая. Для простоты рассмотрим сначала случай, когда помеха наблюдений не зависит от входного шума, а затем снимем это ограничение.

Рассмотрим нелинейную модель формирования и на блюдения сигнала (3.2.1), (3.2.2)

х (к + 1) =	<р [х (к), к, а] +	Т[х(к), к, b] w (к),	(3.4.1)
z (к) =	h [х(А), к, с] +	v (к),	(3.4.2)

где а, b и с — векторы неизвестных параметров, которые необходимо идентифицировать. Кроме того, некоррели рованные гауссовские шумы объекта и наблюдений с ну левыми средними значениями могут иметь ковариацион ные матрицы, также подлежащие идентификации. Пусть символ 6обозначает все неизвестные константы, которые должны быть идентифицированы. Мы не будем в явной форме указывать зависимость ф, Г и h от неизвестных па

раметров a, b и с, но должны постоянно помнить,			что в ф,
Г и Ь содержатся эти	параметры.	Необходимо	макси
мизировать функцию	р [Z (kf) \|0], которую, используя
определение условных	вероятностей,	можно переписать
р [Z (kf) I 0] =	Ч
р [Z (kf) I 0] =	П Р [z (A) IZ (А — 1), 0].		(3.4.3)

к^кг

Поскольку по предположению в момент к0 наблюдения не производятся, то

Р \г (/ci) \| z (А0), 0] =	Р [ъ (Ai) 10ф	(3.4.4)
Определим условные моменты:
Ь [х (к), /с\|0] = $ {z (к) \|Z (А — 1), 0} =
= &{h [х (к), k ] \ Z ( k - 1), 0},		(3.4.5)
V2(к \|А - 1,0) = var {z (А) \|Z (A -	1), 0} =
= V -(A \| A -1 ,0 ) + Vv (A),		(3.4.6)
V ~ (A 1A — 1 , 0 ) = v a r { h [ x ( к), к] \| Z (A — 1 ), 0 ) .		( 3 . 4 . 7 )

84 ФУНКЦИЙ Ш ТРАФА В ЗА Д А Ч А Х ИДЕНТИФИКАЦИИ [ГЛ.

Плотности распределений в (3.4.3), вообще говоря, не гауссовские. Возможно, однако, получить «псевдобайесовскую» плотность, допуская, что условные плотности в (3.4.3) гауссовские, так что

р [ж (к) IZ (к — 1), 0] =		------ р--------------------------- -т
1	V	(2я)й/а [det \х (к\ к — 1, 0)]'2
	X ехр {— 0,5 [г (к) — h [х (к), к \|0Ц1 х
	X V;1(к ( к — 1, 0) [г (к) — h [х(А), к \|0]]}.		(3.4.8)

При подобном псевдобайесовском допущении функция

правдоподобия примет		вид
	Ч
p [Z (k f)\Q]	ГГ ____________ 1____________ X
	,сД (2H)K/2[detVz(/£\|A-l,0)]V.
X ехр	- 4—1z (к \|к -		1, 0) II2_ !(к\к — 1, 0)} , (3.4.9)
	^		Vz	>
где z (к \|к — 1, 0) — так			называемый процесс	«невязки»
(Сейдж и Мелса [127]),
z (к \|к — 1, 0) = z (к) — h [х (к), к \|0] =
	= г (к)	— ё {z(k)\Z (к — 1), 0},		(3.4.10)

который представляет новую информацию, вносимую на блюдением z (к). Часто удобнее минимизировать взятый с обратным знаком логарифм выражения (3.4.9), а не

максимизировать саму функцию (3.4.9).
Таким		образом, идентификация по методу максимума
правдоподобия осуществляется минимизацией по			0функ
ции	штрафа
/ =	4~ 2	ln d e t{V ,(A \| A -l,0 )}
	к=1с,	+ \| z ( A \| A - l,0 ) ^ 1(4t_i>e).	(3.4.11)

Используя методы стохастического анализа Ито, можно показать, что по мере сгущения точек фиксации миними-

3.4]

К р и т е р и й м а к с и м у м а п г Ав д о г г о д о й и й

НЙ

зация (3.4.11) или максимизация (3.4.9) становится бес смысленной операцией. Это связано с двумя факторами. Дисперсии шумов объекта и измерений в непрерывном случае бесконечны. Кроме того, плотность (3.4.9) беско нечномерна по переменной Z (tf) в непрерывном случае. При этом отсутствует возможность идентификации Vw или Vv, поскольку они бесконечны. Отказавшись от возможности оценки Vv, задачу идентификации можно переформулировать как задачу максимизации отношения правдоподобия

	L [Z (kf ) \|0]				Р [Z (ft,) \| Жи 0]			(3.4.12)
	L [Z (kf ) \|0]				Р [Z (kf) \| Жч\		'	(3.4.12)
					Р [Z (kf) \| Жч\		'
где Ж\ означает		гипотезу, согласно				которой
	г (к) = h [х (к), к] -\- v (к),							(3.4.13)
и Ж 0 — гипотеза,			утверждающая,			что
Легко	показать,		что	z (к) = у (к).				(3.4.14)
Легко	показать,		что
р [ г ( к ) \ Ъ { к ~ \ ) , Ж , ] =
________ 1_______			X exp					(3.4.15)
(2я)К;2 Idet Vy (д-)уА
так что отношение правдоподобия принимает								вид
	ту				det [Vv (ft)]1'.
L [ Z( kf) \|0] = i i		[det v-			i * —i ,e)+ vv д а		x
					X exp {§ [Z (kf) \|0]),			(3.4.16)
где $	есть достаточная			статистика
			Ч
S [ Z ( i , ) \| e i - - A - S					i , « ) f l 4 \| , N i , -
					- ! Z(A) ^V yW(ft) -			(3-4Л7)

Если идентификация Vv не предусматривается, максими зация (3.4.16) по 0 эквивалентна максимизации (3.4.11)

80 ФУНКЦИИ Ш ТРАФ А В ЗА Д А Ч А Х ИДЕНТИФИКАЦИЙ [ГЛ. 3

по 0. Теперь все готово для перехода к пределу при стрем лении к пулю шага фиксации.

Можно показать (Маклендон и Сейдж [95]; Сейдж и Мелса [127]), что по мере сгущения точек фиксации мак симизация (3.4.16) становится эквивалентной миними зации

	U
J = -	(0 ^ (t) h [х (0 ,110] +
	^0
	4- ЬТ [x (0, ^] в] 'F-1(0dU (<)} +
	4
+	- i- ^ hT [X (0 ,110] W ? (t) h [X (t),110] dt,	(3.4.18)
где	dU (t) — z (t) dt	(3.4.19)
	dU (t) — z (t) dt	(3.4.19)

представляет наблюдения, а первый интеграл понимается

в смысле Ито. Как и в		дискретном случае,
h [х (0, t 10] =		%{h [х (t), t] \|Z (t), 0).	(3.4.20)
К сожалению, мы не в состоянии определить штраф
ные функции	(3.4.9) и	(3.4.11), порождаемые	членами
h [х (ft), к (0)]	и V2(к\к — 1, 0), которые, вообще говоря,

не удается найти точно. По-видимому, наиболее разумным способом определения этих членов является аппроксима

ция	h [х (к),	к]	отрезком	ряда	Тейлора	в	окрестности
х (к)	= х (к \|к —		1, 0), причем		оценка — условное ма
тематическое		ожидание — определяется				как
	х (Л \|ft — 1,0) =			(x(ft)\|Z(ft — 1),в).			(3.4.211
Для	линейного приближения получим
Ь [х (к), ft] = h [х (ft \|ft — 1, 0), ft] +
dhT [x (ft] ft —1,0), ft]				(ft) — X (ft I ft — 1,0)].			(3.4.22)
+			[X

Э х ( к | к — 1 , 0 )

Подстановка этого выражения в (3.4.5) — (3.4.7) приводит к следующей линейной аппроксимации рассматриваемых

Смотрите также файлы

Семенов Б.В. Экономическая эффективность угольного производства и факторы ее повышения.pdf

Синавина В.С. Оценка качества функционирования АСУ. (Исследование достоверности обработки информации).pdf

Синицын А.П. Расчет балок и плит на упругом основании за пределом упругости пособие для проектировщиков.pdf

Сиразутдинов А.М. Основные показатели промышленных кондиций на руды цветных металлов.pdf

Современная фотоэлектрохимия. Фотоэмиссионные явления.pdf

X(01kf) =	У"1 [х (01kf) — цх], X{kt \|kf) = О,
3» (О \|к,) =	О, So(A/ \|ft/) = 0.

Файл: Сейдж Э.П. Идентификация систем управления.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно