Файл: Сейдж Э.П. Идентификация систем управления.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 27.06.2024

Просмотров: 171

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

150 СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ [ГЛ . 5

Здесь р используется для обозначения случайных пара­ метров F, G и Н.

Определим гамильтониан (случайную величину):

 

Я =

Sp {Vx} + Sp {A (AVX +

VXAT -|- В Ч ^ В Т)}.

Необходимые

условия минимума

 

 

 

 

э\

-

о

дН

=

0,

9

э н

0.

 

 

 

 

 

и’

 

 

Алгоритм стохастической аппроксимации имеет вид:

1)

задаться значением С№\0\

 

 

вектора р* =

2)

выбрать

 

реализацию

случайного

= (F1, G{,

 

Н1),

имеющего

 

распределение с известной

плотностью вероятности; 3) выбрать симметрическую матрицу множителей Ла­

гранжа

такую,

что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= I + A W

+

AiTA4 = 0;

 

 

 

 

 

aVxi

 

 

 

 

 

 

 

 

 

 

 

4)

 

вычислить дН11дЖ\0 при известных

значениях ЗС\а,

F1, G1, Н1 и А1;

алгоритм стохастической

аппроксима­

L5)

используя

ции, определить новую итерацию

 

коэффициента

уси­

ления

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

иг s0

__

-уЛ

so

к-ч

 

.

.

 

 

 

 

 

 

л

л

 

,

 

 

 

 

 

 

 

 

 

 

 

 

0Лso

 

 

 

 

6)

вернуться к пункту 2)

и повторить вычисления.

 

Рассмотрим систему вида

 

 

 

 

 

 

 

 

 

 

± =

— x(t) +

w(t),

Т ш(г) =

1,

 

 

 

 

z = x ( t )

+

v(t),

 

x¥ v (t) =

1.

 

 

Здесь F — l,

G =

G =

i и Н =

Н =

H Фильтр

Кал-

мана для системы с параметрами F, G и Н имеет коэффи­

циент усиления

СКХ— 0,414. Усиление

субоптимального

фильтра

определяется

в

результате

минимизации

 

 

J = £{Sp v x} =

ш(F~ +

v j

=

FX+

9 {F~}

 



5.2] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 151

при ограничениях

О == - 2 (1 + Х го) V - + 2 (F + 1) V ~ + 1 + Л?о,

0 = ( ^ - l - 5 S r , o)F ~ + (F + l)F se + i |

0 = 2FVs ± l .

Теперь можно непосредственно воспользоваться только что построенными алгоритмами, а преобразуя три послед­ ние уравнения, легко получить

Т7

1 + ^ s o

( 1 + Л ( 1 - Л

 

* ^ 2 ( 1 + X J

2F (Ж80 + 1 - F) (1 + X " )

В этом выражении первый член соответствует той состав­ ляющей дисперсии ошибки, которая возникает, если F действительно равно —1. Вычислительная схема такова:

1)выбрать

2)получить реализацию F1 в соответствии с извест­ ным распределением вероятностей для F,

3)определить дУх/дЖ\0,

4)вычислить следующую итерацию,

'Л/ел — *Л/s К 1

 

 

 

 

a xl

5)

вернуться к пункту 2) и повторить вычисления.

На рис.

5.2.2

показан

характер

сходимости X s0. Из

рисунка,

в частности, видно, что процесс сходится гораз­

до медленнее,

чем можно

было бы

ожидать при исполь­

зовании градиентного алгоритма. Усиление субоптималь­ ного калмановского фильтра всегда больше усиления оптимального фильтра с F — — 1, и коэффициент усиле­ ния тем больше, чем больше неопределенность в F. В этом примере не предпринималось никаких попыток оптимиза­ ции алгоритма с тем, чтобы обеспечить более быструю сходимость, что, вообще говоря, вполне возможно.

Полученные результаты относительно просто обобща­ ются на динамический случай. Рассмотрим минимизацию


152 СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ [ГЛ . 5

функции штрафа

 

 

k,-i

 

I =

[ а ( к , ) ] + 0о [х(/с0)] + 2 Ф[х (*).«(*). S (А:), &]}

 

 

(5.2.23)

при разностном ограничении вида

 

 

X (ft -|- 1) == <р [X (к), и (к), I (к), к],

(5.2.24)

где х (к) — вектор обобщенного все неизвестные параметры, а чайный процесс с известной

состояния, включающий £ (к) — векторный слу­ плотностью вероятности

Рис. 5.2.2. Усиление калмановского фильтра; пример 5.2.2.

р [£ (/с)]. Так же, как и в стационарном случае, можно выбрать какую-либо реализацию случайного процесса £*(ft) и поставить детерминированную задачу оптимизации. Опре­ делим гамильтониан

Я* = (р [х (к), и (к), £*(&), к] + *T (fc+ 1) q>[х (ft), u (ft), £*(*), fcl-

(5.2.25)

5.2]

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

153

Запишем канонические уравнения соответствующей двух­ точечной краевой задач i

дНг

 

dlP

=

0,

дТ11

 

 

д%(к + 1) = х ( М - 1),

du (к)

дх (к)

=

к(к),

^ (К) = —

д9о (Лйр)]

, X ( k f ) —

ах (/с,)

 

 

Э х (ко)

 

 

 

 

 

 

 

 

 

 

 

 

(5.2.26)

Вероятность

равна P h i

=

1,

2, . . .М.

Таким образом,

решение исходной стохастической задачи эквивалентно решению взвешенной последовательности задач с весо­

выми коэффициентами

P t. Необходимые

условия для

задачи (5.2.23), (5.2.24) запишутся в виде

 

дН

 

 

 

м

 

 

= * (* 1 -1 ),

 

3 ? . ™ = ®

дк (к + 1 )

 

 

 

 

 

du (к)

 

2 р >

~

’•(*)] =

0,

 

м

 

 

 

 

 

 

2 / . [ м * . ) + ^

]

= о.

 

 

 

д&, [х (Ау)] ]

Л

 

 

 

 

dx(kf)

J

 

Осуществив формальный переход от дискретного распре­ деления P t к непрерывному распределению процесса £ (к), получаем запись уравнений стохастического принципа максимума для дискретной по времени задачи

Н= Ф (к), и (к), £ (к), к) +

++ 1)ф [х (к), и (к), £ (к), к],

д% (к + 1 ) = х (к + !)» $ { а„ (Л) } = °»

(5.2.27)

# {

-*•<*>}- ° -

 

а0/ [*(*/)]

= 0.

 

дх (к

 

*/>

)


154

СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ

tPJt. 5

Полученные результаты сразу же намечают схему исполь­ зования алгоритмов стохастической аппроксимации:

1)выбрать и* {к),

2)задаться х4 (к0),

3)в соответствии с распределением р [£ (А:)] получить

реализацию £4 (к),

4)решить разностное уравнение с начальным услови­ ем х1 0)

х4 + 1) = <р [х4 (к), и4 (к), g4 (к), к],

5)решить сопряженное уравнение с условием на

конце

9 0 , [х (А.)]

V (к) =

 

 

дт

9х4 ( к )

 

К (к + 1),

V '

д х 1 ( к )

Эх4 ( к )

6) используя алгоритм стохастической аппроксима­ ции, определить новую итерацию управления

и1

г л

9 Д 4

 

 

Ли

{■ ;

 

 

 

 

 

(5.2.28)

 

 

 

ЛТ

u4+1 =

и4 — Кги

1)

(k +

 

 

9и4

9иг v

'

7) используя алгоритм стохастической аппроксима­ ции, определить новую итерацию начальных условий

х4+1 (к0) = X4 (/с0) — К х1 99» [хг (ко)] + к1 {ко) , (5.2.29)

9х4 (/£о)

8) вернуться к пункту 3) и повторить вычисления. Пример 5.2.3. Система описывается уравнением

х(к + 1) = х{к) + и (к) -f w(k),

% (ко) =

где w (к) — случайный входной процесс с известным рас­ пределением вероятностей. Попробуем выяснить свойства