Файл: Брикман, М. С. Аналитическая идентификация управляемых систем.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 22.10.2024

Просмотров: 119

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ГЛАВА IV

144

 

4.5. РЕГУЛЯРИЗАЦИЯ АЛГОРИТМА СТОХАСТИЧЕСКОЙ

 

АППРОКСИМАЦИИ В ЗАДАЧЕ ИДЕНТИФИКАЦИИ

 

Рассмотренные выше способы решения задачи идентификации в основном являются ретроспективными в том смысле, что они применяются после получения всей информации о результатах эксперимента над системой.

Вряде случаев оказывается удобным определять прибли­ женное решение задачи непосредственно в процессе экспери­ мента и уточнять это решение по мере поступления дополни­ тельной информации о поведении системы.

Мы в предыдущей главе уже описали ряд подобных алго­ ритмов, используемых применительно к проекционному методу решения задачи идентификации.

Впоследнее время для определения коэффициентов разло­ жения (3.1) из условия минимума нерегуляризованного фун­ кционала (2.9) непосредственно по данным эксперимента широ­ кое распространение получили методы стохастической аппрок­ симации [4.6, 4.17, 4.20, 4.27] и потенциальных функций [4.1].

Сущность алгоритма стохастической аппроксимации состоит

вследующем. Допустим, что система измерений описывается уравнениями (2.8) и требуется найти коэффициенты выражения (3.1) по нерегуляризованному методу Ритца. Тогда при доста­ точно общих условиях итерационный процесс

П

Wjk+l = W jb -\-y k ( y h—

 

- ^ w*(A

А [**]срД ) , (* = 1 ,2 ,...; /= 7 дГ ) (4.55)

г=1

 

сходится при k >-оо, почти наверное, к точному решению сис­ темы Ритца (3.27), построенной при а = 0, если [4.6] последова­ тельность положительных чисел {уь} удовлетворяет следующим условиям:

оооо

^ ,Y fc= °o ;

(4.56)

k=i

k=i

Здесь г/й, Xk(k = 1,2,.. . ) — наблюдаемые реакция системы и соответствующее ей воздействие.

Таким же образом можно записать и алгоритм идентифи

кации по методу потенциальных функций [4.1].

рас-

На практике обычно в качестве последовательности {yft}

сматривают последовательность

удовлетворяющую,

как

{ 4

} .

 

легко убедиться, условиям (4.56).


145 МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ

Многочисленные примеры, иллюстрирующие возможности метода стохастической аппроксимации, приведены в работах

[4.1, 2.37, 4.20]*.

Рассмотрим некоторые особенности алгоритма (4.55). Из по­ строения видно, что данный алгоритм применим только к ко­ нечномерным задачам. В ряде работ [4.6, 4.11, 4.21, 4.25] полу­ чены результаты, относящиеся к вопросам применения стохасти­ ческой аппроксимации к отдельным классам задач в бесконеч­ номерных пространствах.

Во многих случаях разложение (3.1) аппроксимирует иско­ мый функциональный параметр с некоторой погрешностью. Вследствие этого оказывается, что приведенная к выходу сис­ темы помеха п2 (формула 2.8) имеет отличное от нуля матема­ тическое ожидание и зависит от входного сигнала х. Отсюда вытекает, что решение задачи идентификации, полученное при помощи процесса (4.55), может существенно отличаться от ис­ комого значения функционального параметра.

Особенно сильно указываемое явление наблюдается в том случае, когда пространство W бесконечномерно, что объясня­ ется некорректностью задачи идентификации. Воспользуемся методом регуляризации Тихонова для построения устойчивого алгоритма стохастической аппроксимации в гильбертовом про­ странстве. В дальнейшем мы используем следующий результат.

Лемма 4.1. Пусть

{уЦ — последовательность положительных

действительных чисел,

удовлетворяющая условиям (4.56). Обо­

значим

 

 

h

 

(4.57)

Т'ih— I

 

(1—Yj)2, если 0^л-С/г;

Ij—i+i

 

если i= k;

 

zk+l= ( l —yh) zzh+ c y k2-,

 

 

zl= c .

Тогда для любого положительного числа с и натурального числа i величины zh и Tik стремятся к нулю при А-^оо.

Доказательство.

1. Рассмотрим последовательность {Tik}-

Из

(4.56) следует,

что существует такое целое число т, что

7 j< l

при всех }>т.

Используя неравенство 1— т<е~т, которое

имеет место для всех т # 0 , находим

* При решении ряда задач используются непрерывные алгоритмы сто­ хастической аппроксимации [4.6], однако, вследствие ограниченной размер­ ности решаемых с их помощью задач мы на этом вопросе не останавлива­ емся.

10 — 2733


ГЛАВА IV

146

тh

о< 7 ^ = П О - V ;) 2 П d - V 3)2^

3— i+i

3 = т + 1

m

k

< n .(l- Y ,)* e x p

{ —2 ^ Yj }, (k>m ).

j = i + 1

j = m + l

Переходя в этой формуле к пределу при &^-оо и учитывая пер­ вую формулу из (4.56), получим

lim Tih= 0 .

fc->oo

2. Докажем сначала, что последовательность {zk} сходится. Из условий леммы следует, что гк~^0. С другой стороны, преобра­ зуя (4.57), находим

 

k

h

 

k

z h+ l =

c ^

7г2 П ( ! — Tj)2= c

^ Yi2T ik s ^

 

i = l

j = i + l

 

i = l

 

 

m

oo

 

ssc

max

(1—Уз)г'с

^

Yi2= ^ < ° ° -

 

2=1,m

j= 2 + l

2=1

 

Таким образом, последовательность {zh} ограничена в совокуп­ ности положительным числом d. Этот результат вместе с (4.56) показывает, что

lim (zk+i—zh) = lim

[—2Yft2fe-j-(c+ z^Ya2] ^

fe-^-oo

k-+oo

 

 

 

(c+rf)

lim Yft2— 0;

 

 

k~*CQ

 

lim (zh+i—zh) ^

lim (—2ykZk)

2c? lim ya= 0 .

oo

fe—►oo

 

h~*-oo

Следовательно, |гД-1 —

|—>-0 при k-^oo,

т. e. последовательность

{zfe} сходится. Запишем соотношения (4.57) для различных

&=1,2, . . . , / и сложим полученные выражения.

После неслож­

ных преобразований получим

 

 

i

г

i

 

zl+l= c ( 1+ Xf

)—2Xj Vft2fe+

^

Yft22fe.

a= i

ft=i

й= i

Так как Os^ zh^ d и ряд

S Ya2 сходится,

то

ряд из неполо-


147 МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ

жительных членов

( — 2

VkZh) также должен сходиться. В

 

 

А-1

силу того что ^

yk = oo, получаем

ь= 1

 

 

lim zh= 0. k-*-oo

Лемма доказана.

Теперь мы можем сформулировать основной результат дан­ ного параграфа.

Теорема 4.9. Допустим, что выполнены следующие условия:

1)пространство W гильбертово;

2)а>0;

3)оператор R\ положительно определен и ограничен;

4)уравнение (3.8) имеет единственное решение;

5)система измерения описывается уравнениями (2.8), в ко­

торых

А= М {А *[х ]п 2}Ф0\

 

 

М{\\А*[х]п2—Д||2} < е < о о ;

 

 

 

 

 

 

 

147

6)

\\А*[х]А [х] |^ s < o o для всех x e l ;

 

{уД

удовлетво­

7)

последовательность положительных чисел

ряет условиям

(4.56).

 

wl регуляризо-

Тогда при

любом начальном приближении

в.анный алгоритм стохастической аппроксимации

 

 

 

 

Wah+l::= w ah+ y h{A*[xh\yh—

 

 

 

-(а /?1 + Л *[х л]Л [^ ])а ;0*},

(6 = 1 2 ,

...):

(4.58)

а) устойчив в среднеквадратическом к вариациям математи­ ческого ожидания Д помехи п2; б) M{\\wah~ w 0\\2}^-0 при k->-oo

и б — ||Л|—s-0, если а^-0 таким образом, что— ->0.

Здесь — решение уравнения (3.8).

Доказательство. Используя неравенство треугольника, легко показать, что

УМ { ||w a k — ®о112}^ У М {|| w a h — w a ||2} -|-

+ у м {||ш„—ша||2} + ум{||ща—ш0||2} =

= ум {||й аь—ща||2} + ||ша—wa\+ \\wa— т\\.

(4.59)

10*


ГЛАВА IV

148

 

При записи выражения (4.59) мы сохранили обозначения, использовавшиеся в формуле (3.56), с учетом того, что в рас­ сматриваемом случае в уравнении (3.55)

/ б — f o - { - M {А* [ х ] п2} = / о + А ;

||/б—foil = ПА|= б.

Последний член неравенства (4.59) в соответствии с леммой 3.1 представляет собой некоторую непрерывную функцию h (а), причем h(a)-*-0 при а^О.

Для величины \\wa— WaL\\ имеет

место оценка (3.59), в ко­

торой мы для простоты записи примем |30 = 0.

Исследуем теперь первое слагаемое формулы (4.59). Легко

показать, что элемент wa удовлетворяет уравнению

Wa= W a+yk{A*[xk] (yk—M2,ft-(-A)

— (а#1+Л *[л:й]Л [Xh\)wa},

( k = l , 2 , . . . ) .

Вычитая это выражение из (4.58), находим

wah+l—wa= {I—yk{aRi+A*[xk]A[xk\}(wah— wa) +

+Уи(А*[хк]п2,и—A). (4.60)

Введя обозначения

Fh= I —yh(aRi+A* [xk\A [xk] );

g k= A * [ x h]n2,k—A,

получаем на основании (4.60)

\\wak+l—Wa\2= \\Fk(wak—Wa) ||2-f

+2yk(Fh(wah—Wa) , gk) +yk2\\gk\\Z.

(4.61)

Оператор уДа/^+ЛДхИЛ [xH) при всех k в силу условий теоремы положительно определен, причем нижняя граница его спектра не меньше, чем у^сфь а верхняя — не превосходит y&(a||/?i|| + s ) < оо (0! — число, введенное в лемме 3.1).

Из условия уk~^0 при k—^oo вытекает, что существует на­ туральное число I такое, что для всех k ^ l справедливо нера­ венство

2

Уh <

а ( P i~ b IIД1Н)

149

МЕТОД ПОСЛЕДОВАТЕЛЬНЫХ ПРИБЛИЖЕНИЙ

Используя это неравенство и определение нормы самосопряжен­ ного оператора [1.1], находим

max |1—YiA| = l —Ya o Pi C I .

(4.62)

api<a.sSa№i|!+s

Учитывая, что сходимость последовательности не меняется, если опустить конечное число членов, принимаем без ограничения общности, что (4.62) выполняется для всех £ = 1 ,2 ,...

Преобразовав выражение (4.61) с учетом неравенства (4.62)

и определив математическое ожидание полученного результата, находим

М { |wah+i—ша|2} ^ (1—YsaPi) гМ { |wah—wa|2} +

+Уи2М { ||gft|2} < (1- Y*api) Ш { |т>аь - wa\\z} +

(463)

Из леммы 4.1 и (4.63) вытекает, что

lim M{\\wak+i—Wall2} = 0 . k-+oo

Подставив полученные оценки в правую часть формулы (4.59) и перейдя к пределу при £^-оо, находим

lim уЛ4{||ша*—®о||2} <

+ /г(а).

fe-мо

“ P‘

Из этого неравенства следуют оба утверждения теоремы.

З а м е ч а н и е 4.1. При выводе формулы (4.63) предполагалось, что

M{(wa*--wa, g*)} = 0, (6 = 1 ,2 ,...) .

Если это условие не выполняется, то можно показать, что доказанная тео­ рема сохраняет силу, если в условии 5 заменить требование AffllgsIPJ^O более жестким

Нт М{||^|Р} = 0. k-+oo

Таким образом, регуляризованный метод стохастической аппроксимации позволяет при весьма общих условиях находить решение задачи идентификации в гильбертовом пространстве непосредственно в процессе эксперимента.