Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 142

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

6.4] РАЗНОСТНАЯ И ДИФФЕРЕНЦИАЛЬНАЯ АППРОКСИМАЦИЯ 201

ИЛИ

( “г 1

2 Fт [х (&), /с] F [х (А:), /«па = I к=к,

кг

1

= 2

ГТ 1х(/с),/c]{x (fe + 1 )— c[x(fc), А:]}. (6.4.6)

к=ко

Следовательно, оптимальная оценка вектора параметров а

определится

как

 

 

4-1

 

 

 

а =

2

FT [x(/c),/c]F[x(fc), к]

х

 

кко

 

 

 

 

X

2

Fa [х (к), к] +

1) — с [х (к), /с]}. (6.4.7)

 

 

к=к0

 

Отметим, что линейная по а система может быть существен­ но нелинейной по х.

Пример 6.4.1. Для иллюстрации метода рассмотрим ис­ пользование алгоритма дифференциальной аппроксима­ ции для определения параметра а следующей одномерной системы:

х (к + 1) = х (к) ах2(к) -f ю (к) + и (к),

где и (к) известно. Эта система линейна по а и, следователь­

но, результат

(6.4.7) применим. В этом

случае имеем

с 1х(к),

к] = х (к) +

и (к) и F [х {к), к] =

х2(к) так, что

оценка

а имеет вид

 

 

 

 

kr i

 

 

 

аД _

^

ж2 (к) [х (к + 1) — ж (к) и (Л)]

 

---------------------------------------к=к,

---------- ------------------------------------------------------

.

 

 

 

2 х4(*)

 

 

 

 

к=к0

 

Главная трудность на пути использования этого алгорит­ ма связана с необходимостью располагать полной инфор­ мацией о состоянии системы на конечном интервале вре­ мени. Один из возможных способов преодоления этой труд­ ности состоит в использовании точечных оценок с тем,


202

КВАЗИ ЛИНЕАРИЗАЦИЯ

[ГЛ. 6

чтобы по имеющимся данным получить грубую оценку тра­ ектории. А затем для оценивания параметров можно было бы использовать алгоритм разностной аппроксимации. Эти оценки могут быть и не слишком точными, если имеющиеся данные были искажены помехами. Тем не менее оценки параметров и состояния системы дают достаточно точное начальное приближение для использования градиентных алгоритмов или алгоритма квазилинеаризации,

К непрерывным системам можно применить алгоритм дифференциальной аппроксимации. В этом случае урав­ нения модели имеют вид

x{t) = f \x{t), a, t] -f w(<),

(6.4.8)

где f [x (t), a, t\ — того же вида, что и раньше, т. е. компо­ ненты f удовлетворяют (6.4.2). Показатель качества опре­ деляется, как

J = ^ I X (t) — f [х (<), a, t] |q(0* ,

(6.4.9)

to

 

где Q (t), как и раньше, произвольная положительно определенная матрица. Здесь х (t) и х (t) предполагаются известными на интервале [<„, tj].

Если приравнять частную производную / по а нулю, то для Q = I получим следующую систему алгебраических уравнений относительно а:

( а,ТЛ ^ - H 'W , а. ( 1 * -

*0

= ^ afT 1хэ(а0, а’ П X(0 dt. (6.4.10)

Непрерывный алгоритм по сравнению с дискретным имеет еще один недостаток — необходимость знания производной х (t). Один из выходов состоит в аппроксимации производ­ ной конечными разностями, что по существу превращает алгоритм в разностный.

6.51

ВЫ ВОДЫ

203

6.5. ВЫВОДЫ

Развитый в этой главе метод квазилинеаризации может быть использован для преодоления вычислительных труд­ ностей решения двухточечных краевых задач, связанных с некоторыми постановками задач идентификации систем. Хотя квазилинеаризация используется в основном как непрямой вычислительный метод, ее можно применить и для непосредственного решения некоторых классов задач идентификации, что приводит к простым и эффективным алгоритмам. Рассмотрены дискретная и непрерывная фор­ ма алгоритмов квазилинеаризации.

Также были изучены методы дифференциальной и раз­ ностной аппроксимации. Несмотря на присущие этим ал­ горитмам ограничения, существуют задачи, к которым они применимы, кроме того, эти алгоритмы могут быть ис­ пользованы для вычисления начальных приближений итеративных процедур типа квазилинеаризации или гра­ диентных методов.


Глава 7

ИНВАРИАНТНОЕ ПОГРУЖЕНИЕ И ПОСЛЕДОВАТЕЛЬНАЯ

ИДЕНТИФИКАЦИЯ

7.1.ВВЕДЕНИЕ

Вэтой главе рассматривается подход к идентификации систем, который отличен от большинства ранее рассмотрен-

н.IX методов. Будут развиты последовательные алгоритмы идентификации систем или идентификации в реальном

масштабе времени. Такой подход противопоставляется рассмотренным в предыдущих главах непоследовательным алгоритмам идентификации или идентификации вне кон­ тура регулирования. Во многих случаях (например, для многих задач теории управления) желательно в «скользя­ щем времени» иметь последовательные оценки параметров системы по мере поступления данных о функционировании.

По существу последовательное оценивание параметров систем — это не более чем задачи нелинейной фильтрации. По вопросам линейной и нелинейной фильтрации имеется обширная литература (см. ссылки в книгах Сейджа и Мелса [127], Язвинского [61]); читатели, более глубоко интересующиеся теорией нелинейной фильтрации, могут обратиться к этим источникам. Ниже развивается только один подход к нелинейной фильтрации. Это метод инвари­ антного погружения, который применяется к решению ДТКЗ, связанных с идентификацией систем (см. главу 3). Этот метод был выбран из-за его идейной простоты и боль­ шой гибкости. Сначала рассматривается более простой не­ прерывный случай.

7.2.НЕПРЕРЫВНЫЕ СИСТЕМЫ

Вэтом разделе будет рассмотрен непрерывный ва­ риант алгоритма инвариантного погружения. В целях упрощения обозначений и увеличения общности резуль­ татов исследование будет базироваться на общей постанов­ ке двухточечной краевой задачи. Необходимо найти

7.2]

НЕПРЕРЫ ВНЫ Е

СИСТЕМЫ

205

решение ДТКЗ:

 

 

 

 

 

х (0= v [ x ( 0 ,

А, (0, t],

(7.2.1)

 

4 0 = Их (0, ЦО, 11

(7.2.2)

с условиями на концах траектории

 

Ш

— Ах (<0)

b,

X(tf) — 0.

(7.2.3)

Эта формулировка охватывает все двухточечные краевые задачи из главы 3.

Основная идея инвариантного погружения состоит во включении частной задачи в более общую задачу. Если можно решить общую задачу,то частная задача ре­ шается автоматически. Удивительно, что часто легче ре­ шить более общую задачу.

Мы обобщим ДТКЗ, т. е. осуществим инвариантное погружение задачи (7.2.1) — (7.2.3), допустив, что условие на конце траектории при t — tt равно не 0, а с. Другими словами, вместо X (tf) — 0 будем писать X (tf) = с. Кроме того, будем предполагать, что как величина с, так и мо­ мент tf переменны. В частности, будут рассматриваться «соседние» траектории, одна из которых удовлетворяет условию X (tf) = с, а другая — условию X (tt + е) = = с -f Дс.

Относительно первой траектории допустим, что зна­ чение состояния системы на конце траектории имеет вид

х (tf) = г (с, tf).

(7.2.4)

Другими словами, функция г (с, tf) отражает связь между

условием

на

конце X (tf)

с и финальным значением

x(f) при

t =

tf.

Если эта

функция известна, то ДТКЗ

легко можно было бы решить, интегрируя х и X от конца

траектории при

условиях

Х(//) = с и х (tt) = г (с, tf).

Но функция г (с, t/) неизвестна, таким образом, необхо­ димо иметь метод ее определения.

Предположим, что имеется траектория, для которой при t = tf X (tf) = с и х (t/) = г (с, tf). Изменим слегка конечное значение tt на tf + е:

X(tf г) — с + Ас

(7.2.5)


206

ИНВАРИАНТНОЕ

ПОГРУЖЕНИЕ

[ГЛ. 7

и соответственно

 

 

 

X (tf + е) = X (tf) +

Ах = г (с, tf) + Дх,

(7.2.6)

где Дх и Дс имеют порядок О (е)*). Но, с другой стороны,

X (tf + е) = г (с + Дс,

tf + е).

(7.2.7)

Приравнивая правые части

(7.2.6)

и

(7.2.7),

получим

г (с, tf) -f- Дх =

г (с -f- Ac,

tf + е).

(7.2.8)

Если разложить правую часть уравнения (7.2.8) в ряд Тейлора относительно с и tf, получим

5г (с, t.)

 

dr , t А

_

Дх = -----— Дс -\------------8+

О (е2).

(7.2.9)

 

 

 

 

 

Обращаясь к уравнениям (7.2.1) и (7.2.2), видим, что

Дх =

Y I1' (с, tf),

с,

t,] в +

О (в2)

(7.2.10)

ДС =

p[r(c, I f ) ,

с,

tf\e +

0 { в2).

(7.2.11)

Так что уравнение (7.2.9) принимает вид

 

у [г (с, tf), с, tf\е =

5г (с, tf)

tf), с, tf] в +

 

-----р [г (с,

 

 

 

 

5г (с, г .)

 

 

+

а

е + ° ( е >- (7-2Л2)

Поделив (7.2.12) на в и устремляя в к нулю, получим урав­ нение в частных производных, которому должна удовлет­ ворять функция г (с, tf):

Y l r >с, t fI

дт[с, tf)

Р(г, с, tf)

дт(с, tj)

(7.2.13)

дс

dt.

 

 

К сожалению, неизвестно, как решать это уравнение в об­ щем виде. Однако часто мы можем аппроксимировать ре­ шение линейной функцией

г (с, tf) =

\{tf) + Р (0)с.

(7.2.1Л)

*) О (eJ) означает, н о

lim Q (e^)/sJ 1 =

0.

e-»o