Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 154

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ 125

Сейдж, [116]). Удобнее всего воспользоваться преобразо­ ванием Риккати. С линейными двухточечными задачами еще не раз придется встретиться в главе 6. Решение линей­ ных ДКЗ дает искомые значения Дх* (к0) и Др{ (к0);

5)определить из уравнения (4.3.46) Ди* (к);

6)используя (4.3.27) — (4.3.29), построить новое

приближение x i+1 (к0),

pi+1 (&0) и ui+1(/c);

7) вернуться к пункту 2) и повторять вычисления до

тех пор,

пока хг (к0), р1 (к0) и и1 (к) при переходе от ите­

рации и

итерации практически не перестанут меняться.

Как уже отмечалось, процедуру вычислений Ах (к),

Ли (к) и Лр (к) можно

упростить, используя преобразо­

вание Риккати. Но вместо того чтобы сразу же применить это преобразование для упрощения формул градиентного метода второго порядка, поступим несколько иначе.

Допустим снова, что уже выбраны начальные прибли­

жения

для управления ш (к), начального состояния

х* (к0) и

вектора параметров р1 (к0). Уравнения для со­

стояний и параметров (4.3.14), (4.3.15) решаются в пря­ мом времени, сопряженные уравнения (4.3.18) и (4.3.19) — в «обратном» времени. Затем предполагается, что вариации первого порядка, связаны условиями, вытекающими из уравнений (4.3.14), (4.3.15), (4.3.18) и (4.3.19), а именно:

Ax^ +1) =

 

AxW +

 

J'~ [ да (к) ЭХ (к + 1)]

Au W

+

[ ар (к) ЭХ (к + 1)] Ар ^

==

=

а д - Ах (*) +

a lw

Аи (*) + а д - Ар (*>.

(4-3-53)

 

Лр И )

= Ар (к),

(4.3.54)

АХ (к) =

ЭЧ1

 

Э

дН

 

_дх (А)2] Ах (к)

ди (к) дх (кd) Au +

 

 

ЭН

 

д

дН

 

Эр (к)

Эх (к) ] Ар (к) - [ щ

а д а д ] АМ * + 1 ), (4.3.55)

АГ(А)

[ дх (к) Эр (к) ] АХ ^ + [ Эи (к) Эр (к) ] Аи +

 

+ [а д г2] Ар + [ э а д if а д -] А^ + ^ + АГ (* + 1)>

(4.3.56)


126

ГРАДИ ЕНТНЫ Е М ЕТОДЫ ИДЕНТИФИКАЦИИ

[ГЛ . 4

где II определяется выражением (4.3.16). Изменение уп­ равления Ли определяется применением к дН/ди известно­ го линейного преобразования, а именно:

Г дЛ

"

Г

д

ЭН

Лх (к) +

' (Ml

 

 

 

 

 

_ д и (к) _

 

_ 9 и (к)

 

ди (/с)2;] AU (к )

 

л

 

д _

дН

 

д

дН

Лр(к).

 

 

 

 

 

 

ди (к)

др (к) J

(4.3.57)

 

 

 

 

 

 

 

 

Условия на концах для линейной двухточечной задачи имеют вид

Ы

(*о) = -

дв11Х{щ

]' ~ к (Ао) -

ЛХ (* о)> (4-3'58)

^

(*/) =

 

Лх (*/)’

(4-3-59)

лг (А0)= -

Г (к0),

ЛГ (к,) = 0.

(4.3.60)

Полученные соотношения можно записать в более простом виде:

Дх + 1)

ДХ (к)

Др + 1)

ДГ (к)

~Си {к) Сп (к) С13 (к) 0 -

Дх (к)

 

С21 (к) С22(к) С23 {к) 0

ДХ, (к + 1)

 

0

0

I

0

Др (к)

 

_<& <*)

< £ (* )

Сзз (к)

0

_Д Г + 1) _

 

 

 

 

 

Дон (к)

 

 

 

 

+

До>2 (к)

(4.3.61)

 

 

 

0

 

 

 

 

 

Дшз (к)

с условиями на концах (4.3.58) — (4.3.60).

Отправляясь от особенностей двухточечной задачи,

представляется

разумным искать ее решение в виде

М (к) = 3 Хх(£) Лх (к) + EipAp (к) + ах (А),

(4.3.62)

ЛГ (к) =

3 Гх(к) Лх (к) -f- 3 ГрЛр (к) -]- юг (к).

(4.3.63)

Подставляя эти выражения в (4.3.61) после несложных преобразований при отличных от нуля Дх и Ар получим


4.3] М ЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ 127

набор матричных уравнений Риккати. Таким образом, в этом случае уравнения для возмущений похожи на урав­ нения для задачи о замкнутой системе регулирования. Эти уравнения здесь не приводятся из-за чрезмерной сложности получающихся алгоритмов. Построение таких алгоритмов для конкретной задачи идентификации ока­ зывается не трудной, но часто утомительной работой. Процедура последовательного метода вторых вариаций, авторство которой в непрерывной форме принадлежит Мак-Рейнольдсу и Брайсону [97], по существу повторяет описанную выше процедуру градиентного метода второго порядка. Чисто техническое отличие состоит в том, что производится последовательное интегрирование в обрат­

ном времени неоднородных

уравнений

Риккати.

Затем

в прямом времени строятся

уравнения

(4.3.53),

(4.3.54)

с начальными условиями, которые определяются комби­

нацией выражений (4.3.58), (4.3.60),

(4.3.62) и

(4.3.63):

Ах ( к 0) = |з,.р(/с0)

Э?.х ( к 0)

ф-

дЮо [х (ко)]

 

 

Эх (fc0)a

 

 

 

 

 

 

 

+ 2Гр ( к0) Згх ( Ц X {3Гр(/с0)юг (&0) — Е,р ( к 0)

(&0)}>

 

 

 

 

 

(4.3.64)

Ар (к0) = { [ з , х (ко) + ^

)]]-Ч ,р(ко)

- Згх (А0) Згр( Ц х

X {Згх ( к в) сог ( К ) -

[3,х (ко) +

 

сах ( Ц •

 

 

 

 

 

(4.3.65)

Иногда желательно рассматривать уравнения (4.3.53),

(4.3.54) вместе с

уравнениями (4.3.14), (4.3.15). Воз­

можность итеративного выбора А(дН1да) может оказаться существенным преимуществом последовательного ме­ тода по сравнению с обычным градиентным методом вто­ рого порядка.

Алгоритмы метода сопряженного градиента для реше­ ния динамических задач идентификации в идейном плане являются прямым обобщением статического варианта метода сопряженного градиента. Сначала необходимо

определить начальные Хр, ро и и1. Затем в прямом време­ ни решаются уравнения для траекторий, а в обратном


128

ГРАДИ ЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ

[ГЛ. 4

времени — сопряженные уравнения. Это позволяет опре­ делить различные градиенты из уравнений (4.3.21) — (4.3.23) в дискретном случае и из уравнений (4.3.36) — (4.3.38) в непрерывном случае. Схема, намеченная на стр. 110 для статического варианта метода сопряженного градиента, используется в динамической задаче для каждого из трех векторов-градиентов. Независимо от того, какая задача — дискретная или непрерывная, для каждого из градиентов удобно определить

Затем вводится внутреннее произведение. В непрерывном случае по формуле

[,

<f (0. g(0> = J f (t)gT (t)dt, to

а в дискретном варианте по формуле

* Г г

< f(/c), g ( / c ) > = 2 f ( * ) g T (*)-

Блок-схема вычислений для метода сопряженного гра­ диента такова:

1)выбрать Xq, р!, и*;

2)решить в прямом времени основную систему урав­ нений и в обратном— сопряженную ей систему;

3)определить градиенты Сд„, сДХо и сгДр;

4)определить К Аи, К\Хо и Хдр так, чтобы минимизиро­ вать сходную функцию штрафа

J

^ Д и С Д ш х 0

^ДХо^Дхо! Р*

^ Д р С д р ].

На этом шаге используется оптимальный метод градиента, который обычно трудно реализуем. К приемлемому резуль­ тату приводит, как правило, интерполяция нескольких значений каждого из коэффициентов К&1„ КАХо и K Av\

4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ 129

5)используя К , определенные в предыдущем пункте, выбрать

6)используя эти значения решить в прямом времени уравнение для траектории и в обратном времени — сопря­ женное уравнение;

7)определить направления сопряженных градиентов

дН . {дН /ди’

8) вернуться к пункту 4). Таким образом мы видим, что после начальной процедуры сопряженные направле­ ния используются как направления поиска. Для того чтобы проиллюстрировать специфические особенности вы­ числительной процедуры, рассмотрим пример системы первого порядка.

Пример 4.3.2. Интересно рассмотреть применение ме­ тода сопряженного градиента для идентификации пара­ метра Ъ линейной системы

х = Ьх (2), и (2) = 1, х (0) = 0.

Минимизируется функция штрафа

о

Основная градиентная процедура чрезвычайно проста и представляет собой частный случай общей схемы, по­ строенной в примере 4.3.1:

1)задаемся начальным значением Ък\

2)решаем уравнение

^== _ &V (2) + 1, х1(0) = 0;

5 Э. Л. Сейдж, Дж. Л. Мелса


130

ГРАДИ ЕНТНЫ Е

МЕТОДЫ

ИДЕНТИФИКАЦИИ

[ГЛ. 4

3)

решаем сопряженные уравнения

 

 

v = z(0

-

&(t)-

(г), v (tf) = о,

 

 

f j

==**(*) **(*),

П(*,) = 0;

 

4)

определяем

новую итерацию неизвестного пара­

метра

 

Ьил =

K'T'i (0);

 

 

 

 

5) возвращаемся к пункту 2) и повторяем вычисления. Для того чтобы применить метод сопряженного гради.

ента, необходимо изменить процедуру, начиная с пункта 5); 5') определить К г, минимизирующее функцию штрафа

1

['

J — —

\ lz (0 — x(t)]2dt и вычислить 6т ;

 

о

6)используя bi+1, решить прямое и сопряженное уравнения;

7)определить направление сопряженного градиента

сдь = — Ti+1 (0) +

 

 

 

сдь

с начальным приближением едь =

Г° (0);

8) на следующей итерации использовать оценку па­

раметра

тЛ

j?-i

 

ri+1

i .

О — о

К Сдь,

9) вернуться к пункту

2)

и

повторять вычисления.

\ А . ВЫВОДЫ

Было построено несколько наборов алгоритмов для решения задач идентификации. В приведенных примерах рассматривалась идентификация систем путем минимиза­ ции функций штрафа, предложенных в главе 3. Теперь будут изучаться особенности метода стохастической ап­ проксимации, которую можно рассматривать как стати­ стический градиентный метод.