Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 146

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

5.31 ИСПОЛЬЗОВАНИЕ СТОХАСТИЧЕСКОЙ АППРОКСИМАЦИИ 1?1

Можно проверить, что получающаяся оценка 0 является несмещенной. Предполагая, что w (к) доступны наблюде­ нию, приходим к следующему алгоритму стохастической аппроксимации

0 (А + 2N + 1) = е (к) + К (k/2N + 1) w + 2N) X

 

X [г (к -(- 2N + 1) -

 

wT(к + 2N) 0 (А)]

(5.3.59)

для к — 0, 2N + 1,

4/V -f- 2, ... Реализации разнесены на

2N + 1

временной

такт

(х — iV-вектор),

так

как из

(5.3.57)

видно, что автокоррелированность последователь­

ности у (к) распространяется на

2 N такта.

Если

вместо

w (к) наблюдается аддитивная

смесь с помехой

 

 

то (к) =

w {к)

+

v (к),

 

(5.3.60)

где v (к) — белый шум с нулевым средним, то можно, по­ вторяя рассуждения, приведшие к (5.3.59), и учитывая аналогичную предыдущему примеру составляющую сме­ щения, получить

0 (А + 2N + 1) = 0 (к) + К (A/2/V + 1) ( т (к + 2/V) X

X [z (к +

2N +

1) -

т Т(А +

2N) 0 (A)l -f Vvb (к)},

(5.3.61)

где

 

 

 

 

 

mт(/с) =

[то (А -

2

N + 1),

..., то (А — 1), то (А)].

(5.3.62)

Следует отметить, что пользоваться алгоритмами иденти­ фикации весовой функции 0 (к) или параметров при управ­ лении Г можно, только располагая результатами наблю­ дений входных сигналов. В результате идентификации по­

лучаем оптимальную оценку вектора параметров 0. Из первого уравнения (5.3.55) имеем

 

qn

 

0jV

®N+1 * ••®2N -l

“I

§2iv“j

 

 

Г

Г =

1

»

a = ®iV-l

0jv

• • 02iV—2

 

®2N-l

 

. . .

 

 

 

л

 

 

L

Si

J

 

02

- • • 0^v

-

QN+l _

Можно получить множество близких алгоритмов стохас­ тической аппроксимации для решения поставленных здесь задач идентификации.


172

СТО ХАОТИЧЕСКАЯ АППРОКСИМАЦИЯ

[ГЛ . 5

За справками читатель может обратиться к превосход­ ным работам Саридиса и Штейна [132] и Холмса [56], где рассматривается несколько отличных подходов к решению задачи идентификации методами стохастической аппрок­ симации.

5.4.ВЫВОДЫ

Вэтой главе представлено эвристическое введение в тео­ рию стохастической аппроксимации. Результаты приме­

нения алгоритмов стохастической аппроксимации на конеч­ ном интервале времени оказались довольно близки к рас­ смотренным ранее результатам применения градиентных методов. Рекуррентные алгоритмы стохастической аппро­ ксимации (в реальном масштабе времени) весьма напоми­ нают результаты, полученные в теории линейной фильтра­ ции в случае линейных систем, и, как мы увидим в главе 7, последовательные алгоритмы решения двухточечной крае­ вой задачи по методу инвариантного погружения.

Глава 6

КВАЗИЛИНЕАРИЗАЦИЯ

6.1.ВВЕДЕНИЕ

Впоследних двух главах были развиты прямые вычис­ лительные методы для идентификации систем. В этой главе рассматривается непрямой вычислительный метод, пред­ назначенный для решения задач идентификации, известный под названием метода квазилинеаризации. Напомним чи­ тателю, что под непрямыми методами понимаются методы решения двухточечной краевой задачи, которая возникает

втеории оптимизации. Квазилинеаризация, которую часто упоминают как обобщенный метод Ньютона — Рафсона, обязана своим появлением в основном Веллману и Калабе

[16]. Первые применения метода квазилинеаризации к идентификации систем принадлежат Детчменди и Шридхару [30] и Кумару и Шридхару [80]. В работе Сейджа и Айзенберга [120] рассматриваются обобщения ранее полу­ ченных результатов применительно к некоторым задачам моделирования систем. Изучению дискретного метода ква­ зилинеаризации уделено меньшее внимание, хотя у Энрики [46] можно найти доказательства сходимости для некото­ рых классов задач. Сейдж и Бурт [118], Сейдж и Смит [128] рассматривали применение дискретной квазилинеаризации в задачах идентификации систем.

В этой главе будут развиты методы квазилинеаризации как для непрерывных, так и для дискретных моделей. Не­ прерывный случай рассматривается в разделе 6.2, а дис­ кретный — в разделе 6.3. Особое внимание уделяется кон­ струированию алгоритмов решения двухточечной краевой задачи, поставленной в главе 3. Кроме того, будет показа­ но, что квазилинеаризацию можно использовать как прямой метод решения некоторых классов задач иденти­ фикации.

Алгоритм квазилинеаризации представляет собой ите­ ративный алгоритм, для сходимости которого часто требу-


174

КВАЗИ ЛИНЕАРИЗАЦИЯ

[ГЛ. В

ется очень хорошее начальное приближение. Один из ме­ тодов, который может быть использован на первых шагах алгоритма квазилинеаризации, известен под названием дифференциальной аппроксимации и рассматривается в разделе 6.4. К сожалению, применимость этого метода ограничена рядом строгих предположений, тем не менее дифференциальная аппроксимация дает эффективный спо­ соб реализации начального участка алгоритма квазили­ неаризации.

6.2. НЕПРЕРЫВНЫЕ СИСТЕМЫ

Рассмотрим решение следующей многоточечной крае­ вой задачи (МТКЗ). Необходимо найти такую траекто­ рию движения V (t), где t €E U0, tf] для TV-мерной нели­ нейной неавтономной системы:

т(0 =

П т(0. П ,

(6.2.1)

удовлетворяющую системе

линейных

ограничений

C(t})v(tj) =

b(fj),

; = 1,2,

(6.2.2)

где tj £Е U0, tf\. Для

простоты будем

предполагать, что

моменты времени tj упорядочены по возрастанию так, что tj <( tk, если / к. Сейчас мы не будем интересоваться тем, согласованы ли ограничения (6.2.2) с дифференциальным уравнением (6.2.1). Очевидно, что ограничения не могут быть выбраны произвольно. Предположим, что заданные ограничения таковы, что среди решений уравнения (6.2.1) существует решение, удовлетворяющее условиям (6.2.2). Впоследствии мы вернемся к вопросу о согласованности

(6.2.1) и (6.2.2).

Если условий N и все они заданы в один и тот же мо­ мент времени, то задача будет тривиальной, так как тогда уравнение (6.2.1) можно было бы легко проинтегрировать. Интересен случай, когда условия на траекторию заданы для разных моментов времени. Например, особый интерес вызывает случай, когда N/2 условий заданы в начальной точке t0, а остальные N/2 условий — на конце траектории при t = tf, т. е. случай двухточечной краевой задачи (ДТКЗ), которая впоследствии будет исследована более подробно.


6.2]

НЕПРЕРЫ ВНЫ Е СИСТЕМЫ

175

Если условия задачи распределены на отрезке U0, tj), то задача (6.2.1) поддается решению только для наиболее тривиального случая линейного дифференциального урав­ нения, а для отыскания решения, которое удовлетворяет распределенным во времени условиям, приходится обра­ щаться к итеративным методам. Рассмотрим траекторию T{t), которая, аппроксимируя решение системы (6.2.1), (6,2.2), сама может не удовлетворять ни уравнению (6.2.1), ни условиям (6.2.2). Вопрос о выборе такого начального приближения будет обсуждаться позднее. Если разложить Г ty (t), /] в ряд Тейлора в окрестности у» (t), то из урав­ нения (6.2.1) получим

Yi+1 = Г [у1 (О, П +

[Yi+1 -

У* (01 +

 

ОУ (Ч

 

+ члены более высокого

порядка. (6.2.3)

Здесь у (t) снабжена индексом i + 1, чтобы подчеркнуть итеративный характер алгоритма решения задачи.

Допустим, что траектория yi+1 (t) близка к начальному приближению у1(t), и пренебрежем членами второго по­ рядка малости в (6.2.3). В результате для yi+1 (t) получим линейное неоднородное уравнение с переменными коэф­ фициентами

Y 1+1 ( 0 =

] Y ' +1 ( 0 + [ Г I Y ; ( 0 , О

ОУ КЧ

L

Э1Ч < 9’ я у‘ («)] dyl(t)

(6.2.4)

Решение этого уравнения имеет вид

у*« (0 = ^ i+1 (t) yi+1 (t0) + Pi+1 (t),

(6.2.5)

где {2i+1 (t) удовлетворяет следующему дифференциально­ му уравнению:

jjHi ,t) = 9Г [у{

Qi+i

(6.2.6)

df (f)

 

 

fii+1(<o)=E

 

(6-2.7)

a pi+1 (t) есть частное решение неоднородного уравнения

pi+1 (0 = Г [у*(0. 0 -

[Г (0 - РЙ1 (01. (6.2.8)

и \

( Г )

Pi+1(«o) = 0.

(6.2.9)