Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 310

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

имеют размеры пХп, пХр, пХг и тХп соответственно. Все они непрерывны по t. Начальное время /о фиксиро­ вано, точка обозначает производную по времени.

Случайные процессы {w(t), t^U) и {v(t), t^<t0}

представляют собой гауссовские белые шумы с нулевы­ ми математическими ожиданиями, причем

E[w(t)w'(x)]

=

Q(t)6(i-x);

 

E[v{t)v'(x)]=*R(t)b(t-x);

 

E[w(i)v'(x)]

= 0,

 

для всех t, x^to, где все обозначения были

описаны

ранее.

 

 

 

Начальное состояние

считается гауссовский

случай­

ным вектором с нулевым средним и корреляционной матрицей E[x(t0)x (t0)] = P(t0), как и ранее, независи­ мым от обоих шумовых процессов.

Критерий качества

Задача заключается в отыскании такого сигнала управления u(*t), t^t 0 , чтобы система (10-1) действова­ ла некоторым желаемым образом. Иными словами, тре­ буется определить сигнал управления, минимизирующий критерий качества:

/ = E jx' (t,) Л x(tt) + г | \х' (0 A (t) x ( 0 + « ' (О В (t) и (t)] л | .

(10-3)

В уравнении (10-3) U>t0 является закрепленным конечным временем. Следовательно, как и в дискретном

случае, задача представляет

собой задачу

оптимизации

с закрепленным временем. В уравнении

(10-3) Л и

A(t)—симметрические

неотрицательно

определенные

матрицы размера пХп;

B(t)—симметрическая

положи­

тельно определенная матрица

размера rXr; Е обозна­

чает операцию математического ожидания. Предпола­ гается, что матрицы A(t) и B(t) непрерывны для всех

Критерий (10-3) аналогичен критерию (9-3) для ди­ скретной задачи стохастического линейного регулятора. Он также квадратичный по состоянию и управлению, но место суммы в уравнении (9-3) занимает интеграл. Слагаемое x'(tі)Лх(іл) используется для того, чтобы

414


ввести в критерии качества в явном виде конечную

ошибку, в

то

время как интеграл

учитывает

ошиб­

ку системы

и

управляющее усилие

на всем

интер­

вале времени действия системы. Аналогия между урав­ нениями (10-3) и (9-3) станет более ясной из § 10-2. Однако сразу следует отметить важное различие между

этими уравнениями. В уравнении

(9-3)

требуется, чтобы

матрица В(і—1);

і = 1 , 2,

N

была

неотрицательно

определена, в то

время

как матрица

B(t)

£o=S^<^i

в уравнении (10-3) должна быть положительно опреде­ ленной. Причина заключается в том, что алгоритм опти­ мального управления для непрерывной задачи требует, чтобы матрица B(t) была несингулярной для всех [t0, ti]. Это означает, что в непрерывной задаче недо­

пустимы такие критерии качества,

как

/ =

£ [ . * ' ( * , ) Л * ( * , ) ] ;

J=E

ч,

 

fx' (t)A{t)x{t)

dx

или же любая их линейная комбинация, тогда как реше­ ние аналогичной дискретной задачи в некоторых слу­ чаях возможно.

Физически реализуемые

управления

Как и в дискретной задаче стохастического линей­ ного регулятора, здесь требуется, чтобы управления были реализуемы в смысле физической доступности све­ дений о состоянии системы. Поэтому назовем закон управления физически реализуемым, если он имеет вид:

 

M ( * ) = I I [ Z ( T ) ,

* о < т < г ; x(t0);

t],

(10-4)

где (1 — r-мерная

вектор-функция

измерений

{г(т),

to^x^t},

математического

ожидания

начального

состоя­

ния и текущего времени /.

 

 

 

 

Теперь можно сформулировать непрерывную задачу

стохастического линейного

регулятора.

 

 

Постановка

задачи

 

 

 

 

Определить

физически

реализуемый

закон

управ­

ления вида (10-4)

для системы (10-1),

(10-2) минимизи­

рующей

критерий

качества

(10-3).

 

 

 

Такое

управление

называется оптимальным

управле­

нием.

 

 

 

 

 

 

 

415


10-2. ЭКВИВАЛЕНТНАЯ ДИСКРЕТНАЯ З А Д А Ч А

Модель системы

Включая в модель с дискретным временем, введен­ ную в § 7-2 для задачи непрерывной оценки, аддитивное управляющее воздействие, получим требуемую модель (см. также § 4-3) :

x{t

+ M)=0(t

+ M,

t)x{>t)+T(t

 

+ At, t)w(t) +

где

 

+ X¥(t + At, t)u(t),

 

 

(10-5)

 

 

 

 

 

 

 

 

 

Oit

+ At,

t)=I

+ F(t).te

+ 0(AP);

(10-6)

 

T(t, + At,

t) = G{t)At

+ 0(AP);

(10-7)

 

W(t+At,

t)=C(t)At

+ 0(At2).

(10-8)

Здесь

t обозначает

дискретное

время

{t = to + jAt;

/ = 0, 1 . . . } и At>0.

Здесь, как

и

в

гл. 7,

переменная t

будет использоваться для обозначения как дискретного, так и непрерывного времени; характер использования t будет ясен из контекста.

Потребуем, чтобы сигнал управления был кусочнопостоянным, и предположим, что интервал [t0, ti] разде­

лен на N частей длины

Ai, где

N — положительное це­

лое число,

а Д / = (ti—to)/N.

 

 

В пределе при At—>-0 потребуем, чтобы

N удовле­

творяло равенству

ti—/о=const.

 

 

NAt =

 

Сигнал

управления

и способ

разбиения

интервала

[h, ti] изображен на рис. 10-1. Заметим, что значения / ограничены числом N.

 

 

N-1

N

\t„+At

+ 2M

t0+(N-l)àt

. 2

t0

 

 

Рис. 10-1. Кусочно-постоянное управление и разбиение интервала управления.

416


Согласно

§

7-2

в уравнении

 

(10-5)

процесс

 

(w(t),

t = t0

+ j.\t;

/ = 0,

1 . . . } является

гауссовской

белой

после­

довательностью с нулевым средним и матричной корре­

ляционной

функцией

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E[w(t)w>(i)]

=

*gl&ihi

 

 

 

 

 

 

 

 

 

 

где

матрица

Q(k)

 

неотрицательно

определена

 

для

всех

t^t 0 ,

т — дискретное

время

{r=<t0 + kAt;

k = 0,

 

1 . . . } ,

ôjft — символ

Кронекера, a x(t0)—гауссовский

 

 

 

случай­

ный

«-вектор,

независимый

от

{w(t),

 

 

t = t0

+ jAt;

/ = 0 ,

1 . . . } , с нулевым

средним

и

 

корреляционной

матри­

цей

P(to).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Дискретное уравнение измерения имеет вид:

 

 

 

 

 

 

z(t

+ At)

 

= H(t+At)x(t+Ai)

 

+ v{t + At),

 

 

( 1 0 - 9 )

где

{v(t,+At);

t=>t0

+ jAt\

/ = 0 ,

1 . . .

}

гауссовская бе­

лая

последовательность,

независимая

от

{w(t)\

 

 

t = lo +

+ jAt;

/ = 0,

1 . . . } и x(to),

с нулевым

средним

и

 

матрич­

ной корреляционной

функцией

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Е

[V (t

+

ДО и'

(х +

ДО] =

 

^ ±

*

й

 

Bj f t ,

 

 

 

 

 

 

причем

матрица

R(t

+ At)

положительно

определена

для

всех t^t 0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Критерий

 

качества

 

 

 

 

 

 

 

 

 

 

Предположим,

что

к

системе

( 1 0 - 1 )

приложено

не­

которое произвольное известное, но не обязательно оп­

тимальное

 

управление

u(t),

 

и

рассмотрим

 

случайную

величину

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ß = x'

(*,) Ах

( 0 +

j

x'

А (0 x

(0 dt

 

 

 

(10-10)

из

уравнения

( 1 0 - 3 ) .

Разделим

 

интервал

[to,

 

ti]

на

Л/

частей

длиной

Д / = ( А — 4 ) / J V

И используем

индекс

і

для

нумерации

этих

 

частей,

как

показано

на

рис.

1 0 - 2 .

Как

и ранее, потребуем, чтобы при At—И)

N

удовлетворяло

равенству

NAt

= tt10.

Очевидно,

при

этом

ta

+ NAt = ti

для любого

N.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

417


О 1 Z

N-Z

N

j

Рис. 10-2. Представление критерия каче­ ства, включающего в себя конечную ошиб­ ку и интеграл от текущей ошибки системы.

Используя разбиение, изображенное на рис. 10-2, можно представить уравнение (10-10) в виде

В = Hm [x' (t0 + NM) Ax {t0 + NM +

дг->о

N

 

 

+ И

(t0 + ІМ) A (t0 - f ІМ) x (t0 + ІМ) М].

(10-11)

(=i

 

 

Теперь рассмотрим случайную величину

 

 

t,

 

 

Y = = | V (t)B(t)u(t)dt.

(10-12)

 

h

 

Используя то же разбиение, что и ранее, но опре­ деляя значения u(t) по левым, а не правым граничным точкам интервалов разбиения (ср. рис. 10-Г и 10-2), пе­ репишем уравнение (10-12) в виде

 

N

 

 

 

у = lim S К, + («'— *) Д'] ß ['о +

-

 

-

1) Afl a [f0 +

(« — 1)Д*]Д*.

(Ю-13)

Теперь из уравнений (10-3),

(10-10) — (10-13)

следует,

что

 

 

 

 

У =

E -f у) = E I lim Le' (t0 -f- NM) Ax (t0 + NAt) -f

 

+ S JC' (f0

-f iAt) A {t0 +

/Д0 x (t0 4- iM) M

+

 

i=i

 

 

 

+

£ a'[fa +

( ( - l ) W ] ß [ ^ ( f - l ) A < ] u [ f 0

+

418