ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 27.06.2024
Просмотров: 171
Скачиваний: 0
150 СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ [ГЛ . 5
Здесь р используется для обозначения случайных пара метров F, G и Н.
Определим гамильтониан (случайную величину):
|
Я = |
Sp {Vx} + Sp {A (AVX + |
VXAT -|- В Ч ^ В Т)}. |
|||||||
Необходимые |
условия минимума |
|
|
|
||||||
|
э\ |
- |
о |
дН |
= |
0, |
9 |
э н |
0. |
|
|
|
|
||||||||
|
|
и’ |
|
|
||||||
Алгоритм стохастической аппроксимации имеет вид: |
||||||||||
1) |
задаться значением С№\0\ |
|
|
вектора р* = |
||||||
2) |
выбрать |
|
реализацию |
случайного |
||||||
= (F1, G{, |
|
Н1), |
имеющего |
|
распределение с известной |
плотностью вероятности; 3) выбрать симметрическую матрицу множителей Ла
гранжа |
такую, |
что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= I + A W |
+ |
AiTA4 = 0; |
|
|
|
||||||
|
|
aVxi |
|
|
|
|
|
|
|
|
|
|
|
|
4) |
|
вычислить дН11дЖ\0 при известных |
значениях ЗС\а, |
|||||||||||
F1, G1, Н1 и А1; |
алгоритм стохастической |
аппроксима |
||||||||||||
L5) |
используя |
|||||||||||||
ции, определить новую итерацию |
|
коэффициента |
уси |
|||||||||||
ления |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
иг s0 |
__ |
-уЛ |
so |
к-ч |
|
. |
. |
|
|
|
|
|
|
|
— |
л |
л |
|
, |
|
|
|
||||
|
|
|
|
|
|
|
|
|
0Лso |
|
|
|
|
|
6) |
вернуться к пункту 2) |
и повторить вычисления. |
|
|||||||||||
Рассмотрим систему вида |
|
|
|
|
|
|
|
|
||||||
|
|
± = |
— x(t) + |
w(t), |
Т ш(г) = |
1, |
|
|
||||||
|
|
z = x ( t ) |
+ |
v(t), |
|
x¥ v (t) = |
1. |
|
|
|||||
Здесь F — — l, |
G = |
G = |
i и Н = |
Н = |
H Фильтр |
Кал- |
||||||||
мана для системы с параметрами F, G и Н имеет коэффи |
||||||||||||||
циент усиления |
СКХ— 0,414. Усиление |
субоптимального |
||||||||||||
фильтра |
определяется |
в |
результате |
минимизации |
|
|||||||||
|
J = £{Sp v x} = |
ш(F~ + |
v j |
= |
FX+ |
9 {F~} |
|
5.2] СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ 151
при ограничениях
О == - 2 (1 + Х го) V - + 2 (F + 1) V ~ + 1 + Л?о,
0 = ( ^ - l - 5 S r , o)F ~ + (F + l)F se + i |
0 = 2FVs ± l .
Теперь можно непосредственно воспользоваться только что построенными алгоритмами, а преобразуя три послед ние уравнения, легко получить
Т7 |
1 + ^ s o |
( 1 + Л ( 1 - Л |
|
* ^ 2 ( 1 + X J |
2F (Ж80 + 1 - F) (1 + X " ) • |
В этом выражении первый член соответствует той состав ляющей дисперсии ошибки, которая возникает, если F действительно равно —1. Вычислительная схема такова:
1)выбрать
2)получить реализацию F1 в соответствии с извест ным распределением вероятностей для F,
3)определить дУх/дЖ\0,
4)вычислить следующую итерацию,
'Л/ел — *Л/s К 1
|
|
|
|
a xl |
5) |
вернуться к пункту 2) и повторить вычисления. |
|||
На рис. |
5.2.2 |
показан |
характер |
сходимости X s0. Из |
рисунка, |
в частности, видно, что процесс сходится гораз |
|||
до медленнее, |
чем можно |
было бы |
ожидать при исполь |
зовании градиентного алгоритма. Усиление субоптималь ного калмановского фильтра всегда больше усиления оптимального фильтра с F — — 1, и коэффициент усиле ния тем больше, чем больше неопределенность в F. В этом примере не предпринималось никаких попыток оптимиза ции алгоритма с тем, чтобы обеспечить более быструю сходимость, что, вообще говоря, вполне возможно.
Полученные результаты относительно просто обобща ются на динамический случай. Рассмотрим минимизацию
152 СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ [ГЛ . 5
функции штрафа |
|
|
|
k,-i |
|
I = |
[ а ( к , ) ] + 0о [х(/с0)] + 2 Ф[х (*).«(*). S (А:), &]} |
|
|
|
(5.2.23) |
при разностном ограничении вида |
|
|
|
X (ft -|- 1) == <р [X (к), и (к), I (к), к], |
(5.2.24) |
где х (к) — вектор обобщенного все неизвестные параметры, а чайный процесс с известной
состояния, включающий £ (к) — векторный слу плотностью вероятности
Рис. 5.2.2. Усиление калмановского фильтра; пример 5.2.2.
р [£ (/с)]. Так же, как и в стационарном случае, можно выбрать какую-либо реализацию случайного процесса £*(ft) и поставить детерминированную задачу оптимизации. Опре делим гамильтониан
Я* = (р [х (к), и (к), £*(&), к] + *T (fc+ 1) q>[х (ft), u (ft), £*(*), fcl-
(5.2.25)
5.2] |
СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ |
153 |
Запишем канонические уравнения соответствующей двух точечной краевой задач i
дНг |
|
dlP |
= |
0, |
дТ11 |
|
|
д%(к + 1) = х ( М - 1), |
du (к) |
дх (к) |
= |
к(к), |
|||
^ (К) = — |
д9о \х (Лйр)] |
, X ( k f ) — |
ах (/с,) |
|
|
||
Э х (ко) |
|
|
|
|
|
||
|
|
|
|
|
|
|
(5.2.26) |
Вероятность |
равна P h i |
= |
1, |
2, . . .М. |
Таким образом, |
решение исходной стохастической задачи эквивалентно решению взвешенной последовательности задач с весо
выми коэффициентами |
P t. Необходимые |
условия для |
||||
задачи (5.2.23), (5.2.24) запишутся в виде |
|
|||||
дН |
|
|
|
м |
|
|
= * (* 1 -1 ), |
|
3 ? . ™ = ® |
||||
дк (к + 1 ) |
|
|||||
|
|
|
|
du (к) |
|
|
2 р > |
~ |
’•(*)] = |
0, |
|
||
м |
|
|
|
|
|
|
2 / . [ м * . ) + ^ |
] |
= о. |
||||
|
|
|
д&, [х (Ау)] ] |
Л |
||
|
|
|
|
dx(kf) |
J |
|
Осуществив формальный переход от дискретного распре деления P t к непрерывному распределению процесса £ (к), получаем запись уравнений стохастического принципа максимума для дискретной по времени задачи
Н= Ф [х (к), и (к), £ (к), к) +
+{к + 1)ф [х (к), и (к), £ (к), к],
д% (к + 1 ) = х (к + !)» $ { а„ (Л) } = °»
(5.2.27)
# { |
-*•<*>}- ° - |
|
|
а0/ [*(*/)] |
= 0. |
|
дх (к |
|
|
*/> |
) |
154 |
СТОХАСТИЧЕСКАЯ АППРОКСИМАЦИЯ |
tPJt. 5 |
Полученные результаты сразу же намечают схему исполь зования алгоритмов стохастической аппроксимации:
1)выбрать и* {к),
2)задаться х4 (к0),
3)в соответствии с распределением р [£ (А:)] получить
реализацию £4 (к),
4)решить разностное уравнение с начальным услови ем х1 (к0)
х4 (к + 1) = <р [х4 (к), и4 (к), g4 (к), к],
5)решить сопряженное уравнение с условием на
конце
9 0 , [х (А.)]
V (к) = |
|
|
дт |
9х4 ( к ) |
|
К (к + 1), |
|
V ' |
д х 1 ( к ) |
Эх4 ( к ) |
6) используя алгоритм стохастической аппроксима ции, определить новую итерацию управления
и1 |
г л |
9 Д 4 |
|
|
|
Ли |
{■ ; |
|
|
||
|
|
9и |
|
(5.2.28) |
|
|
|
|
ЛТ |
||
u4+1 = |
и4 — Кги |
1) |
|||
(k + |
|||||
|
|
9и4 |
9иг v |
' |
7) используя алгоритм стохастической аппроксима ции, определить новую итерацию начальных условий
х4+1 (к0) = X4 (/с0) — К х1 99» [хг (ко)] + к1 {ко) , (5.2.29)
9х4 (/£о)
8) вернуться к пункту 3) и повторить вычисления. Пример 5.2.3. Система описывается уравнением
х(к + 1) = х{к) + и (к) -f w(k),
% (ко) =
где w (к) — случайный входной процесс с известным рас пределением вероятностей. Попробуем выяснить свойства