Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 98

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Рис. 39. Блок-схема устрой­ ства управления

При таком представлении информации о состоянии объекта управляющее воздействие может рассматриваться как функционал относительно q (t, х):

и = и [t, q {t, х), —оо < х < о о ].

(381)

Тогда блок выработки управления естественно

разбивается

на устройство обработки информации, вырабатывающее апосте­ риорную плотность вероятностей q (t, х), —оо < х < со, и регу­ лятор, формирующий управление по закону (381) (рис. 39).

Таким образом, задача обработки данных является неотъем­ лемой частью задачи оптимального управления при неточных наблюдениях.

Вопросам расчета апостериорного распределения вероятностей для непрерывного марковского процесса, линейной и нелинейной

фильтрации

посвящен ряд работ [9, 53, 60, 93, 103, 105, 113,

139, 140].

Однако в ранних работах были допущены ошибки

вследствие пренебрежения членами второго порядка малости. Позднее результаты были уточнены и обобщены на более широкий класс марковских процессов. Здесь будет приведен вывод урав­ нения в частных производных для апострериорной плотности вероятностей q (t, х) марковского процесса х (t), при наблюде­ ниях у (і), заданных формулой (376). Как частный случай, будет получен результат Калмана по оптимальной линейной фильтрации.

Рассмотрим допредельную дискретную модель объекта упра­ вления и измерителя. Для этого вводится дискретное время tk —

4-1 + А» где А — малая величина, которая позднее будет устремлена к нулю. Согласно уравнению объекта (342) можно записать

 

*k

 

 

*k

 

X (4) = X (4_j) -f

J

/ [т, X (т), и (т)] dx-ф J

G(t)£ (т) dx.

 

lk-i

 

 

(k-i

 

 

В соответствии

со

свойствами

нормально

распределенного

«белого» шума | (і),

описываемого уравнения_(343),

процесс

 

l { t ) = J G (т) і (т) dx

 

 

 

 

 

t

 

 

 

распределен также нормально и имеет характеристики

 

 

M l (0 = 0 .

 

 

M l (t) l* (t)=

<+д

Q (X) G* (t)

dx-

 

j G (T)

(382)

 

 

 

t

 

 

 

M l

(4)

l*

(tj) = 0

при / ф j.

 

 

164


Таким образом,

lk

X ( 4 ) = X ( 4 - l ) +

j / [т, X (т), и ( t ) ]

dx +

I ( 4 _ i) .

 

*k-!

 

 

 

Рассмотрим процесс 2 с дискретным временем, который опи­

сывается разностным

уравнением

 

 

 

^k-l

~>~ /

(4 -1>

^к-1) ^

~4" X/t-l>

(3 8 3 )

где индекс означает

отсчет времени. Случайный

процесс хь-і

нормально распределен и имеет независимые значения. Плот­

ность распределения процесса % в момент времени

4-г

зададим

выражением

 

 

 

 

 

р (4-ь х)

 

 

X

 

 

 

|/ '( 2 я ) п | с й_ 1< г ^ 1е ; _ 1 | л

 

 

X ехр

â~X (G*_iQ*_iöft_i)_1x

 

(384)

где Gk_x =-- G (4_2); Qk_x =■■ Q (4_x).

Нетрудно

видеть,

что про­

цесс с дискретным временем %k является допредельной

моделью

процесса £ (/), а процесс zk — процесса х (t),

так

что

 

1.

і. ш. X* =

I (4);

 

 

 

 

Д - > 0

 

 

 

(385)

1.

і. т. zk =

X (4),.

 

 

 

 

 

д^о

где 1. і. ш. означает предел в среднем квадратическом.

Для построения дискретной модели измерений перейдем от

процесса у (t) к

sk, где

 

 

 

 

 

h

= h (4.

 

гк) + V*.

(386)

Здесь ѵА— нормально

распределенный дискретный белый

шум с одномерной плотностью распределения вероятностей:

Р Ун, ѵ) = V {2nY'\ Rk I

exp

(387)

где Rk = R (4).

Таким образом,

характеристики

процесса ѵк

связаны с соответствующими характеристиками (377) предельного процесса г) (I).

Поставим задачу расчета апостериорной плотности распре­ деления вероятностей процесса z в момент времени 4 ПРИ усло­

вии известных наблюдений процесса st, 0

< і с k

Р (4. Ч \

si> 0 < / < 4 )

=

=

q(tк, гк).

(388)

165


Рассмотрим п + /•-мерный вектор (z, s), составленный из век­ тора состояния объекта г и вектора измерений s. Этот вектор является марковским. Доказательство данного утверждения сво­ дится к проверке равенства

 

 

 

 

 

\

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Р (4>

4>

4

I 4-1 .

4 - 1 .

4 - i .

 

 

 

 

 

 

 

4-2» 4-2» 4 -2 . ■ • •)

'

 

 

 

 

 

~

P {tki

4 »

 

4

I 4-1 .

4 -1 > 4 - l)

 

 

для

любых tk >

4-1 >

4-2 > •

Здесь

и в

дальнейшем под

Р ( 4 .

4 .

4 І 4 - і .

4 -i>

4-Т.

4 -2 .

4 - 2. s*_2;

. . .) понимается ус­

ловная

плотность

распределения

вероятностей

вектора

(z (4),

s (4)

относительно

событий

 

z (t{) —■zit

s (t() = s(-, i —

k — 1,

k — 2 , . . .

 

 

условных вероятностей

 

 

Согласно формуле

 

 

 

 

 

 

Р (4>

4 .

4

14-i>

4 - i . 4-1 >

 

 

 

 

4-2. 4 -2 . 4 - 2 '.

• •)

=

р (4.

1^/г-1» ^k-Ъ

 

 

 

4-2. 4 -2 .

4 -г !

• •)р ( 4 14,

^ki

 

 

 

4-2. ^k-2> ^£-2» • • .)■

Поскольку вектор выходных координат объекта х является марковским процессом, то можно записать:

Р (4»

4 14-і.

4-і» 4-11

 

 

 

4-2. 4-2. 4-2;

• • •) =

Р (4> 4 |

4-1.

4-і)-

(390)

В соответствии с формулой (386) распределение вероятностей

вектора s (4) при известном значении г (4)

= 4

связано только

с законом распределения шума измерений для абсолютно случай­

ного процесса ѵ (4)

и не зависит от знания

г (/,) = zt, s (4)

= st-,

i = k \, k — 2, . . .

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

p (4 14. 4 .

4-1. 4-1.

4-1 >

 

4-2. 4-2. 4-2’. • •

•)

= P ( 4 14> 4)- .

(391)

Подставляя выражения (390),

(391) в формулу (389), получим-.

(

Р (4.

4 . 4І

4-1. 4-1. 4-1;

 

 

4 -2 . 4 - 2 . 4 - 2 >

• • •)

 

 

= Р (4. 4

14-1. 4-і)

Р (4 | 4.

4) =

( 392)

 

Р (4.

4 . 4 14-і> 4-1. 4 -і).

 

 

что и доказывает марковское свойство вектора (z, s).

166



Согласно известным свойствам плотности распределения веро­ ятностей искомая апостериорная плотность вероятностей (388) может быть представлена в следующем виде:

 

 

Я (4.

z*) =

р (tk, zk \slt

0 < i < 4 ) =

 

 

=

р (4,

zk I sk,

s[t

0 «

i <

k — 1) =

 

 

 

^

P(tk, zk, sk Isit 0<g i ^ k — 1)

_

 

 

 

 

 

 

p(tk, Sft/s,-,

 

— 1)

 

 

 

 

 

 

P (tk,

Zk, sk I S[, 0 ^

i gg k — 1)

 

(393)

 

 

 

 

\d zkp{tk, zk, s* |s£, O s ^ i ^ k — 1)

 

 

 

 

 

Входящая в выражение (393) плотность

вероятностей р (tk,

zk, sA/st-,

О <

i <

k

1) может рассчитываться по формуле

 

 

Р (4.

zb

h I Sit 0

< i

<

k — 1)

=

=

J dzk_!p

(tk,

zk\ 4_lt

zk_p, sjs,.,

0 <

i

« k — 1) =

 

 

 

, =

j

dzk-xp

(tk,

2a,sa | 4-1>

 

 

S(., 0 < i <

k

1) p I 4_J,

S;, 0 < t < k — 1).

Учитывая

доказанное

выше

марковское

 

свойство вектора

(z, s), а также формулы (390) и (392), последнее выражение может быть преобразовано следующим образом

Р (4,

Zk, SkI S;, 0 <

i < k — 1) =

= 1

dZk-lP (4.

I 4-1> ^A-l>

s*-i) P (4-1- z*-iI S£, 0 < t < /г — 1) = = J dZk^p (4, z*| 4-lf z^j) p X

X (s* I 4- z^) <7^4-1- z^_i).

После подстановки полученного результата в формулу (393) будем иметь следующее выражение для q (4, zft):

I

dzk-iP (<A, z* I

z * . x) p (s* I

z*) q (tk-1 , Z A .i)

 

q (4, z*) = / -

—=-----------------------

■----- -------

—-----— -----

• (394)

J dzk I dzk-iP (tk, zk j tk-1, Zk-!) p (Sk I tk, zk) q (tk-г, Zk-1)

Соотношение (394) дает рекуррентную процедуру вычисления q{tk, z k). Здесь р (4, zk \ 4_i, zk_x) легко рассчитывается на

167