Файл: Брикман, М. С. Аналитическая идентификация управляемых систем.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 22.10.2024
Просмотров: 119
Скачиваний: 0
ГЛАВА IV |
144 |
|
|
4.5. РЕГУЛЯРИЗАЦИЯ АЛГОРИТМА СТОХАСТИЧЕСКОЙ |
|
АППРОКСИМАЦИИ В ЗАДАЧЕ ИДЕНТИФИКАЦИИ |
|
Рассмотренные выше способы решения задачи идентификации в основном являются ретроспективными в том смысле, что они применяются после получения всей информации о результатах эксперимента над системой.
Вряде случаев оказывается удобным определять прибли женное решение задачи непосредственно в процессе экспери мента и уточнять это решение по мере поступления дополни тельной информации о поведении системы.
Мы в предыдущей главе уже описали ряд подобных алго ритмов, используемых применительно к проекционному методу решения задачи идентификации.
Впоследнее время для определения коэффициентов разло жения (3.1) из условия минимума нерегуляризованного фун кционала (2.9) непосредственно по данным эксперимента широ кое распространение получили методы стохастической аппрок симации [4.6, 4.17, 4.20, 4.27] и потенциальных функций [4.1].
Сущность алгоритма стохастической аппроксимации состоит
вследующем. Допустим, что система измерений описывается уравнениями (2.8) и требуется найти коэффициенты выражения (3.1) по нерегуляризованному методу Ритца. Тогда при доста точно общих условиях итерационный процесс
П |
Wjk+l = W jb -\-y k ( y h— |
|
|
- ^ w*(A |
А [**]срД ) , (* = 1 ,2 ,...; /= 7 дГ ) (4.55) |
г=1 |
|
сходится при k >-оо, почти наверное, к точному решению сис темы Ритца (3.27), построенной при а = 0, если [4.6] последова тельность положительных чисел {уь} удовлетворяет следующим условиям:
оооо
^ ,Y fc= °o ; |
(4.56) |
k=i |
k=i |
Здесь г/й, Xk(k = 1,2,.. . ) — наблюдаемые реакция системы и соответствующее ей воздействие.
Таким же образом можно записать и алгоритм идентифи
кации по методу потенциальных функций [4.1]. |
рас- |
|
На практике обычно в качестве последовательности {yft} |
||
сматривают последовательность |
удовлетворяющую, |
как |
{ 4 |
} . |
|
легко убедиться, условиям (4.56).
145 МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
Многочисленные примеры, иллюстрирующие возможности метода стохастической аппроксимации, приведены в работах
[4.1, 2.37, 4.20]*.
Рассмотрим некоторые особенности алгоритма (4.55). Из по строения видно, что данный алгоритм применим только к ко нечномерным задачам. В ряде работ [4.6, 4.11, 4.21, 4.25] полу чены результаты, относящиеся к вопросам применения стохасти ческой аппроксимации к отдельным классам задач в бесконеч номерных пространствах.
Во многих случаях разложение (3.1) аппроксимирует иско мый функциональный параметр с некоторой погрешностью. Вследствие этого оказывается, что приведенная к выходу сис темы помеха п2 (формула 2.8) имеет отличное от нуля матема тическое ожидание и зависит от входного сигнала х. Отсюда вытекает, что решение задачи идентификации, полученное при помощи процесса (4.55), может существенно отличаться от ис комого значения функционального параметра.
Особенно сильно указываемое явление наблюдается в том случае, когда пространство W бесконечномерно, что объясня ется некорректностью задачи идентификации. Воспользуемся методом регуляризации Тихонова для построения устойчивого алгоритма стохастической аппроксимации в гильбертовом про странстве. В дальнейшем мы используем следующий результат.
Лемма 4.1. Пусть |
{уЦ — последовательность положительных |
|
действительных чисел, |
удовлетворяющая условиям (4.56). Обо |
|
значим |
|
|
h |
|
(4.57) |
Т'ih— I |
|
|
(1—Yj)2, если 0^л-С/г; |
||
Ij—i+i |
|
если i= k; |
|
zk+l= ( l —yh) zzh+ c y k2-, |
|
|
|
zl= c . |
Тогда для любого положительного числа с и натурального числа i величины zh и Tik стремятся к нулю при А-^оо.
Доказательство. |
1. Рассмотрим последовательность {Tik}- |
|
Из |
(4.56) следует, |
что существует такое целое число т, что |
7 j< l |
при всех }>т. |
Используя неравенство 1— т<е~т, которое |
имеет место для всех т # 0 , находим
* При решении ряда задач используются непрерывные алгоритмы сто хастической аппроксимации [4.6], однако, вследствие ограниченной размер ности решаемых с их помощью задач мы на этом вопросе не останавлива емся.
10 — 2733
ГЛАВА IV |
146 |
тh
о< 7 ^ = П О - V ;) 2 П d - V 3)2^
3— i+i |
3 = т + 1 |
m |
k |
< n .(l- Y ,)* e x p |
{ —2 ^ Yj }, (k>m ). |
j = i + 1 |
j = m + l |
Переходя в этой формуле к пределу при &^-оо и учитывая пер вую формулу из (4.56), получим
lim Tih= 0 .
fc->oo
2. Докажем сначала, что последовательность {zk} сходится. Из условий леммы следует, что гк~^0. С другой стороны, преобра зуя (4.57), находим
|
k |
h |
|
k |
z h+ l = |
c ^ |
7г2 П ( ! — Tj)2= c |
^ Yi2T ik s ^ |
|
|
i = l |
j = i + l |
|
i = l |
|
|
m |
oo |
|
ssc |
max |
(1—Уз)г'с |
^ |
Yi2= ^ < ° ° - |
|
2=1,m |
j= 2 + l |
2=1 |
|
Таким образом, последовательность {zh} ограничена в совокуп ности положительным числом d. Этот результат вместе с (4.56) показывает, что
lim (zk+i—zh) = lim |
[—2Yft2fe-j-(c+ z^Ya2] ^ |
||
fe-^-oo |
k-+oo |
|
|
|
(c+rf) |
lim Yft2— 0; |
|
|
|
k~*CQ |
|
lim (zh+i—zh) ^ |
lim (—2ykZk) |
2c? lim ya= 0 . |
|
oo |
fe—►oo |
|
h~*-oo |
Следовательно, |гД-1 — |
|—>-0 при k-^oo, |
т. e. последовательность |
{zfe} сходится. Запишем соотношения (4.57) для различных
&=1,2, . . . , / и сложим полученные выражения. |
После неслож |
||
ных преобразований получим |
|
|
|
i |
г |
i |
|
zl+l= c ( 1+ Xf |
)—2Xj Vft2fe+ |
^ |
Yft22fe. |
a= i |
ft=i |
й= i |
|
Так как Os^ zh^ d и ряд |
S Ya2 сходится, |
то |
ряд из неполо- |
147 МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ
жительных членов |
( — 2 |
VkZh) также должен сходиться. В |
|
|
А-1 |
силу того что ^ |
yk = oo, получаем |
|
ь= 1 |
|
|
lim zh= 0. k-*-oo
Лемма доказана.
Теперь мы можем сформулировать основной результат дан ного параграфа.
Теорема 4.9. Допустим, что выполнены следующие условия:
1)пространство W гильбертово;
2)а>0;
3)оператор R\ положительно определен и ограничен;
4)уравнение (3.8) имеет единственное решение;
5)система измерения описывается уравнениями (2.8), в ко
торых
А= М {А *[х ]п 2}Ф0\
|
|
М{\\А*[х]п2—Д||2} < е < о о ; |
|
|
|
|
|
|
|
|
147 |
6) |
\\А*[х]А [х] |^ s < o o для всех x e l ; |
|
{уД |
удовлетво |
|
7) |
последовательность положительных чисел |
||||
ряет условиям |
(4.56). |
|
wl регуляризо- |
||
Тогда при |
любом начальном приближении |
||||
в.анный алгоритм стохастической аппроксимации |
|
|
|||
|
|
Wah+l::= w ah+ y h{A*[xh\yh— |
|
|
|
|
-(а /?1 + Л *[х л]Л [^ ])а ;0*}, |
(6 = 1 2 , |
...): |
(4.58) |
а) устойчив в среднеквадратическом к вариациям математи ческого ожидания Д помехи п2; б) M{\\wah~ w 0\\2}^-0 при k->-oo
и б — ||Л|—s-0, если а^-0 таким образом, что— ->0.
Здесь — решение уравнения (3.8).
Доказательство. Используя неравенство треугольника, легко показать, что
УМ { ||w a k — ®о112}^ У М {|| w a h — w a ||2} -|-
+ у м {||ш„—ша||2} + ум{||ща—ш0||2} =
= ум {||й аь—ща||2} + ||ша—wa\+ \\wa— т\\. |
(4.59) |
10*
ГЛАВА IV |
148 |
|
При записи выражения (4.59) мы сохранили обозначения, использовавшиеся в формуле (3.56), с учетом того, что в рас сматриваемом случае в уравнении (3.55)
/ б — f o - { - M {А* [ х ] п2} = / о + А ;
||/б—foil = ПА|= б.
Последний член неравенства (4.59) в соответствии с леммой 3.1 представляет собой некоторую непрерывную функцию h (а), причем h(a)-*-0 при а^О.
Для величины \\wa— WaL\\ имеет |
место оценка (3.59), в ко |
торой мы для простоты записи примем |30 = 0. |
|
Исследуем теперь первое слагаемое формулы (4.59). Легко |
|
показать, что элемент wa удовлетворяет уравнению |
|
Wa= W a+yk{A*[xk] (yk—M2,ft-(-A) — |
|
— (а#1+Л *[л:й]Л [Xh\)wa}, |
( k = l , 2 , . . . ) . |
Вычитая это выражение из (4.58), находим
wah+l—wa= {I—yk{aRi+A*[xk]A[xk\}(wah— wa) +
+Уи(А*[хк]п2,и—A). (4.60)
Введя обозначения
Fh= I —yh(aRi+A* [xk\A [xk] );
g k= A * [ x h]n2,k—A,
получаем на основании (4.60)
\\wak+l—Wa\2= \\Fk(wak—Wa) ||2-f
+2yk(Fh(wah—Wa) , gk) +yk2\\gk\\Z. |
(4.61) |
Оператор уДа/^+ЛДхИЛ [xH) при всех k в силу условий теоремы положительно определен, причем нижняя граница его спектра не меньше, чем у^сфь а верхняя — не превосходит y&(a||/?i|| + s ) < оо (0! — число, введенное в лемме 3.1).
Из условия уk~^0 при k—^oo вытекает, что существует на туральное число I такое, что для всех k ^ l справедливо нера венство
2
Уh <
а ( P i~ b IIД1Н)
149 |
МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ |
Используя это неравенство и определение нормы самосопряжен ного оператора [1.1], находим
max |1—YiA| = l —Ya o Pi C I . |
(4.62) |
api<a.sSa№i|!+s
Учитывая, что сходимость последовательности не меняется, если опустить конечное число членов, принимаем без ограничения общности, что (4.62) выполняется для всех £ = 1 ,2 ,...
Преобразовав выражение (4.61) с учетом неравенства (4.62)
и определив математическое ожидание полученного результата, находим
М { |wah+i—ша|2} ^ (1—YsaPi) гМ { |wah—wa|2} +
+Уи2М { ||gft|2} < (1- Y*api) Ш { |т>аь - wa\\z} +
(463)
Из леммы 4.1 и (4.63) вытекает, что
lim M{\\wak+i—Wall2} = 0 . k-+oo
Подставив полученные оценки в правую часть формулы (4.59) и перейдя к пределу при £^-оо, находим
lim уЛ4{||ша*—®о||2} < |
+ /г(а). |
fe-мо |
“ P‘ |
Из этого неравенства следуют оба утверждения теоремы.
З а м е ч а н и е 4.1. При выводе формулы (4.63) предполагалось, что
M{(wa*--wa, g*)} = 0, (6 = 1 ,2 ,...) .
Если это условие не выполняется, то можно показать, что доказанная тео рема сохраняет силу, если в условии 5 заменить требование AffllgsIPJ^O более жестким
Нт М{||^|Р} = 0. k-+oo
Таким образом, регуляризованный метод стохастической аппроксимации позволяет при весьма общих условиях находить решение задачи идентификации в гильбертовом пространстве непосредственно в процессе эксперимента.