ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 154
Скачиваний: 0
4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ 125
Сейдж, [116]). Удобнее всего воспользоваться преобразо ванием Риккати. С линейными двухточечными задачами еще не раз придется встретиться в главе 6. Решение линей ных ДКЗ дает искомые значения Дх* (к0) и Др{ (к0);
5)определить из уравнения (4.3.46) Ди* (к);
6)используя (4.3.27) — (4.3.29), построить новое
приближение x i+1 (к0), |
pi+1 (&0) и ui+1(/c); |
|
7) вернуться к пункту 2) и повторять вычисления до |
||
тех пор, |
пока хг (к0), р1 (к0) и и1 (к) при переходе от ите |
|
рации и |
итерации практически не перестанут меняться. |
|
Как уже отмечалось, процедуру вычислений Ах (к), |
||
Ли (к) и Лр (к) можно |
упростить, используя преобразо |
вание Риккати. Но вместо того чтобы сразу же применить это преобразование для упрощения формул градиентного метода второго порядка, поступим несколько иначе.
Допустим снова, что уже выбраны начальные прибли
жения |
для управления ш (к), начального состояния |
х* (к0) и |
вектора параметров р1 (к0). Уравнения для со |
стояний и параметров (4.3.14), (4.3.15) решаются в пря мом времени, сопряженные уравнения (4.3.18) и (4.3.19) — в «обратном» времени. Затем предполагается, что вариации первого порядка, связаны условиями, вытекающими из уравнений (4.3.14), (4.3.15), (4.3.18) и (4.3.19), а именно:
Ax^ +1) = |
|
AxW + |
|
||
J'~ [ да (к) ЭХ (к + 1)] |
Au W |
+ |
[ ар (к) ЭХ (к + 1)] Ар ^ |
== |
|
= |
а д - Ах (*) + |
a lw |
Аи (*) + а д - Ар (*>. |
(4-3-53) |
|
|
Лр (к И ) |
= ■Ар (к), |
(4.3.54) |
||
АХ (к) = |
ЭЧ1 |
|
Э |
дН |
|
_дх (А)2] Ах (к) |
ди (к) дх (кd) Au + |
|
|||
|
ЭН |
|
д |
дН |
|
Эр (к) |
Эх (к) ] Ар (к) - [ щ |
а д а д ] АМ * + 1 ), (4.3.55) |
|||
АГ(А) |
[ дх (к) Эр (к) ] АХ ^ + [ Эи (к) Эр (к) ] Аи № + |
|
+ [а д г2] Ар + [ э а д if а д -] А^ (к + ^ + АГ (* + 1)>
(4.3.56)
126 |
ГРАДИ ЕНТНЫ Е М ЕТОДЫ ИДЕНТИФИКАЦИИ |
[ГЛ . 4 |
где II определяется выражением (4.3.16). Изменение уп равления Ли определяется применением к дН/ди известно го линейного преобразования, а именно:
Г дЛ |
" |
Г |
д |
ЭН |
Лх (к) + |
' (Ml |
|
|
|
|
|
||||||
_ д и (к) _ |
|
_ 9 и (к) |
|
ди (/с)2;] AU (к ) |
|
|||
л |
|
д _ |
дН |
|
д |
дН 1Т |
Лр(к). |
|
|
|
|
|
|
|
ди (к) |
др (к) J |
(4.3.57) |
|
|
|
|
|
|
|
|
Условия на концах для линейной двухточечной задачи имеют вид
Ы |
(*о) = - |
дв11Х{щ |
]' ~ к (Ао) - |
ЛХ (* о)> (4-3'58) |
^ |
(*/) = |
|
Лх (*/)’ |
(4-3-59) |
лг (А0)= - |
Г (к0), |
ЛГ (к,) = 0. |
(4.3.60) |
Полученные соотношения можно записать в более простом виде:
Дх (к + 1)
ДХ (к)
Др (к + 1)
ДГ (к)
~Си {к) Сп (к) С13 (к) 0 - |
Дх (к) |
|
|||
С21 (к) С22(к) С23 {к) 0 |
ДХ, (к + 1) |
|
|||
0 |
0 |
I |
0 |
Др (к) |
|
_<& <*) |
< £ (* ) |
Сзз (к) |
0 |
_Д Г (к + 1) _ |
|
|
|
|
|
Дон (к) |
|
|
|
|
+ |
До>2 (к) |
(4.3.61) |
|
|
|
0 |
||
|
|
|
|
|
Дшз (к)
с условиями на концах (4.3.58) — (4.3.60).
Отправляясь от особенностей двухточечной задачи,
представляется |
разумным искать ее решение в виде |
|
М (к) = 3 Хх(£) Лх (к) + EipAp (к) + ах (А), |
(4.3.62) |
|
ЛГ (к) = |
3 Гх(к) Лх (к) -f- 3 ГрЛр (к) -]- юг (к). |
(4.3.63) |
Подставляя эти выражения в (4.3.61) после несложных преобразований при отличных от нуля Дх и Ар получим
4.3] М ЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ 127
набор матричных уравнений Риккати. Таким образом, в этом случае уравнения для возмущений похожи на урав нения для задачи о замкнутой системе регулирования. Эти уравнения здесь не приводятся из-за чрезмерной сложности получающихся алгоритмов. Построение таких алгоритмов для конкретной задачи идентификации ока зывается не трудной, но часто утомительной работой. Процедура последовательного метода вторых вариаций, авторство которой в непрерывной форме принадлежит Мак-Рейнольдсу и Брайсону [97], по существу повторяет описанную выше процедуру градиентного метода второго порядка. Чисто техническое отличие состоит в том, что производится последовательное интегрирование в обрат
ном времени неоднородных |
уравнений |
Риккати. |
Затем |
в прямом времени строятся |
уравнения |
(4.3.53), |
(4.3.54) |
с начальными условиями, которые определяются комби
нацией выражений (4.3.58), (4.3.60), |
(4.3.62) и |
(4.3.63): |
|||
Ах ( к 0) = |з,.р(/с0) |
Э?.х ( к 0) |
ф- |
дЮо [х (ко)] |
|
|
Эх (fc0)a |
|
|
|||
|
|
|
|
|
|
+ 2Гр ( к0) Згх ( Ц X {3Гр(/с0)юг (&0) — Е,р ( к 0) |
(&0)}> |
||||
|
|
|
|
|
(4.3.64) |
Ар (к0) = { [ з , х (ко) + ^ |
)]]-Ч ,р(ко) |
- Згх (А0) Згр( Ц х |
|||
X {Згх ( к в) сог ( К ) - |
[3,х (ко) + |
|
сах ( Ц • |
||
|
|
|
|
|
(4.3.65) |
Иногда желательно рассматривать уравнения (4.3.53), |
|||||
(4.3.54) вместе с |
уравнениями (4.3.14), (4.3.15). Воз |
можность итеративного выбора А(дН1да) может оказаться существенным преимуществом последовательного ме тода по сравнению с обычным градиентным методом вто рого порядка.
Алгоритмы метода сопряженного градиента для реше ния динамических задач идентификации в идейном плане являются прямым обобщением статического варианта метода сопряженного градиента. Сначала необходимо
определить начальные Хр, ро и и1. Затем в прямом време ни решаются уравнения для траекторий, а в обратном
128 |
ГРАДИ ЕНТНЫ Е МЕТОДЫ ИДЕНТИФИКАЦИИ |
[ГЛ. 4 |
времени — сопряженные уравнения. Это позволяет опре делить различные градиенты из уравнений (4.3.21) — (4.3.23) в дискретном случае и из уравнений (4.3.36) — (4.3.38) в непрерывном случае. Схема, намеченная на стр. 110 для статического варианта метода сопряженного градиента, используется в динамической задаче для каждого из трех векторов-градиентов. Независимо от того, какая задача — дискретная или непрерывная, для каждого из градиентов удобно определить
Затем вводится внутреннее произведение. В непрерывном случае по формуле
[,
<f (0. g(0> = J f (t)gT (t)dt, to
а в дискретном варианте по формуле
* Г г
< f(/c), g ( / c ) > = 2 f ( * ) g T (*)-
Блок-схема вычислений для метода сопряженного гра диента такова:
1)выбрать Xq, р!, и*;
2)решить в прямом времени основную систему урав нений и в обратном— сопряженную ей систему;
3)определить градиенты Сд„, сДХо и сгДр;
4)определить К Аи, К\Хо и Хдр так, чтобы минимизиро вать сходную функцию штрафа
J [Ч |
^ Д и С Д ш х 0 |
^ДХо^Дхо! Р* |
^ Д р С д р ]. |
На этом шаге используется оптимальный метод градиента, который обычно трудно реализуем. К приемлемому резуль тату приводит, как правило, интерполяция нескольких значений каждого из коэффициентов К&1„ КАХо и K Av\
4.3] МЕТОДЫ ИДЕНТИФИКАЦИИ ДИ НАМ ИЧЕСКИ Х СИСТЕМ 129
5)используя К , определенные в предыдущем пункте, выбрать
6)используя эти значения решить в прямом времени уравнение для траектории и в обратном времени — сопря женное уравнение;
7)определить направления сопряженных градиентов
дН . {дН /ди’
8) вернуться к пункту 4). Таким образом мы видим, что после начальной процедуры сопряженные направле ния используются как направления поиска. Для того чтобы проиллюстрировать специфические особенности вы числительной процедуры, рассмотрим пример системы первого порядка.
Пример 4.3.2. Интересно рассмотреть применение ме тода сопряженного градиента для идентификации пара метра Ъ линейной системы
х = — Ьх (2), и (2) = 1, х (0) = 0.
Минимизируется функция штрафа
о
Основная градиентная процедура чрезвычайно проста и представляет собой частный случай общей схемы, по строенной в примере 4.3.1:
1)задаемся начальным значением Ък\
2)решаем уравнение
^== _ &V (2) + 1, х1(0) = 0;
5 Э. Л. Сейдж, Дж. Л. Мелса
130 |
ГРАДИ ЕНТНЫ Е |
МЕТОДЫ |
ИДЕНТИФИКАЦИИ |
[ГЛ. 4 |
|
3) |
решаем сопряженные уравнения |
|
|||
|
v = z(0 |
- |
&(t)- |
(г), v (tf) = о, |
|
|
f j |
==**(*) **(*), |
П(*,) = 0; |
|
|
4) |
определяем |
новую итерацию неизвестного пара |
|||
метра |
|
Ьил = |
K'T'i (0); |
|
|
|
|
|
5) возвращаемся к пункту 2) и повторяем вычисления. Для того чтобы применить метод сопряженного гради.
ента, необходимо изменить процедуру, начиная с пункта 5); 5') определить К г, минимизирующее функцию штрафа
1 |
[' |
J — — |
\ lz (0 — x(t)]2dt и вычислить 6т ; |
|
о |
6)используя bi+1, решить прямое и сопряженное уравнения;
7)определить направление сопряженного градиента
сдь = — Ti+1 (0) +
|
|
|
сдь |
с начальным приближением едь = |
Г° (0); |
||
8) на следующей итерации использовать оценку па |
|||
раметра |
тЛ |
j?-i |
|
ri+1 |
i . |
||
О — о — |
К Сдь, |
||
9) вернуться к пункту |
2) |
и |
повторять вычисления. |
\ А . ВЫВОДЫ
Было построено несколько наборов алгоритмов для решения задач идентификации. В приведенных примерах рассматривалась идентификация систем путем минимиза ции функций штрафа, предложенных в главе 3. Теперь будут изучаться особенности метода стохастической ап проксимации, которую можно рассматривать как стати стический градиентный метод.