Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 312

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

смотрено

ранее

в непрерывной

задаче

оптимальной

фильтрации.

 

 

 

 

Матрица W(l)

симметрическая

и в силу этого, как и

в задаче

фильтрации,

содержит

п(п+\)/2

различных

элементов.

 

 

 

 

 

Теперь

из уравнений

(10-27) и

(10-28)

очевидна при­

чина требования положительной определенности матри­

цы

B(t)

в критерии качества

(Ю-З) для / о < І ^ Л -

 

Как и следовало ожидать, здесь также получен прин­

цип

разделения. Из уравнений

(10-27) и (10-28) видно,

что S (г)

не зависит от статистических

параметров задачи,

а именно от P(to), Q(t) и R(t).

Если

все переменные со­

стояния можно измерить точно, уравнение (10-29) прини­

мает вид u{t) =S(t)x{t).

Ясно,

что способ

определения

S(t) не зависит от наличия или отсутствия

неопределен­

ности в системе.

 

 

 

 

 

Для

стохастической

задачи

в оптимальном

фильтре

должно

быть

учтено влияние

управляющего

воздейст­

вия. Поэтому

уравнение

фильтра здесь

принимает вид:

 

x = F (t) x + К (t) [г {t) -

H (t),x] +

С (t) и (t)

для to^t^ti, где все обозначения были введены ранее.

10-4. КРИТЕРИЙ КАЧЕСТВА

 

 

 

 

 

 

 

Возвращаясь

вновь

к

эквивалентной

дискретной

задаче

 

и полагая,

что

t

обозначает

дискретное

время

t = to+>k>M\

k — 0,

1,

 

N—1, из

уравнений

 

(9-84) и

(9-85)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

V(ti—t)

= Е[х'

(t)M(t)x{t)]+a(4);

 

 

(10-30)

a(t)

=

a(t

+ At) -f- E [w' (t) Г" (r +

At, t)W (t +

At) Г (t +

+

At, t)w(t)\-

E[x'(t

 

I *)Ф'(/ +

Д*, t)W{t

+

 

 

 

+ At)W(t-y-At,

t)S(t)x(t

I t)].

 

 

(10-31)

В уравнении (10-30)

V(ti—t)

соответствует

величи­

не VN-k

из уравнения

(9-84)

и является значением кри­

терия

качества оптимального

управления на

интервале

[t, ti],

 

где

t — дискретное

время,

определенное

выше.

Согласно § 9-3 граничное условие для уравнения

(10-31)

имеет вид а(/і) =0.

 

 

 

 

 

 

 

 

 

 

423


Подставляя уравнение (10-24) в уравнение (10-30), получаем выражение

V(h-t)=E{x'(t)[W(t)-A(t)St]x(t)}

+ a(t),

которое в пределе при At>0 принимает вид

V(ti—t) =E[x'{t)W(t)x(t)]

+ a(t)

(10-32)

В предположении, что существует предел lima(/).

В уравнении (10-32) t является непрерывной пере­ менной, определенной на интервале [to, ti].

Поскольку в первую очередь обычно требуется полу­ чить значение критерия качества для всего интервала

управления,

то, положив

в уравнении

(10-32)

t = t0,

по­

лучим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V(ti-t0)=E[x/(io)W(to)x(t0)]

 

 

 

+

a(to).

 

 

 

 

Отсюда

следует, что

 

 

 

 

 

 

 

 

 

 

 

 

 

ѵ(*. - g=s P £ [ и ? ( д ( g ]

+

 

 

 

 

 

 

 

+ a (t0) =

Sp [W (/„) P (t0))

+

a (t0),

 

 

( 10-33)

где матрица

W(t0)

является решением уравнения

(10-27),

а P (t0)—корреляционная

 

матрица

начального

состоя­

ния.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь

исследуем

предельное

поведение

уравнения

(10-31)

при

At—>-0. Вначале

запишем

это

уравнение

в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a (/) =

a (t + M) - f E {S? [Г'

 

(t-\-At,t)W(tA~

 

 

- f

At) Г (t +

Д*. /) w (t) w' (t)]}-

E {Sp [Ф' (t - f Д*. 0 W (t

+

+

Д ^ У ^ + Д/,

 

 

I t)x'{t

I 01} = a

+ Д0 +

 

 

+

S? [ P

(* +

Д*. t)W (t -\- At)Y(t

+

 

 

 

 

 

-

 

— Sn [Ф' (t A- At,

t) W (t +

ДО ЧГ (* +

Д*, 0 5 (t) P (t \ t)},

где использованы

соотношения

 

 

 

 

 

 

 

(10-34)

 

 

 

 

 

 

 

 

 

 

 

 

 

E[w(t)w'(t)]

=

Q(t)/At;

 

 

 

 

 

 

 

 

 

 

E[x(t\t)x'(t\t)\

 

=

P(t\t).

 

 

 

 

 

Последняя матрица представляет собой корреляцион­ ную матрицу ошибки фильтрации.

424


Подставляя

в

(ІО-34)

уравнения

(10-6) — (10-8) и

группируя

члены, получаем:

 

 

 

 

 

 

 

 

a (t) =

a (t + At) -f Sp -J [G' (t) At A-О {At2)] W (t +

 

 

+

ДО [G (0 At Ar О (At2)} Ш.

\ ~ So {[/ + F (t) At +

 

 

+

О (At2)} W (tArAt)

[C (t) At Ar О (At )} S (t) P (t | 0}

=

=

a (t Ar At) Ar Sp [G' (t) W (t + At) G (t) Q(t) + 0 (At)} At

-

 

 

-

Sp [W (t Ar At) С (0 S(t)P(t

I t)-\-0

(At)} At.

( 10-35)

Из (10-35) ясно,

что l\m a. (t-{-At) —a. (t).

Перенеся

a(t

+ At)

в левую часть уравнения и разделив

обе части

на At, в пределе при At—й)

получим:

 

 

 

 

 

 

 

 

- *

=

 

Sp[G'(t)W(t)G(t)Q(t)]~

 

 

 

 

 

 

 

 

-

Sp [w с s P (t I 01

 

(10-36)

для

U^t^ti,

где использовано

существование

извест­

ных пределов

 

lim S (0;

lim P (t | 0-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь

 

первый

предел

 

определяется

уравнением

(10-28),

а

второй

является

корреляционной

матрицей

ошибки оптимальной непрерывной линейной фильтрации. Из уравнения (10-28) следует:

C'(t,)W(t)=-B(t)S(t).

Транспонируя обе части этого соотношения и учиты­ вая симметричность матриц W(t) и В(і), имеем:

W(t)C(l)=—S'(t)B(t).

Используя этот результат, можно представить урав­ нение (10-36) в виде

a = - S p [G'(t)W(t)G(t)Q(t)}

-

 

 

-~Sp[S'(t)B(t)S(t)P{t

\t)}

(10-37)

для to^t^ti.

Напомним, что этому

уравнению

соответ­

ствует граничное условие а(0 ) =0.

 

 

Решение

уравнения (10-37) позволяет получить з н а ­

чение a (/о),

необходимое для вычисления

V (0—to)

28—85

 

 

425


Ö помоидью уравнения (ІО-33). Как можно

видеть, вы­

ражение для а(7) состоит из двух

слагаемых,

аналогич­

ных слагаемым

a(k)

в дискретной

задаче. Первое сла­

гаемое связано

с

возмущением

системы,

а

второе —

с ошибкой фильтрации. Поэтому возможна

интерпрета­

ция уравнения (10-33), аналогичная интерпретации кри­ терия качества дискретного стохастического линейного

регулятора

(см. пример 9-4).

 

 

 

 

 

 

 

Сформулируем полученные результаты в виде сле­

дующей теоремы.

 

 

 

 

 

 

 

 

 

Теорема

10-1. Оптимальное

управление

 

для

задачи

непрерывного

стохастического

линейного

 

регулятора

описывается

соотношениями

 

 

 

 

 

 

 

 

 

 

u(t)=^S(t)x(t

I t);

 

 

 

(10-38)

 

 

 

S(t)=—B-l(t)C'(t)W(t);

 

 

 

 

(10-39)

W=-F'

(t)\W -

WF (t) -4rWC(t)Bi

 

(t) С

(t)

W — A (t);

 

 

 

 

 

 

 

 

 

 

 

(10-40)

 

x =

F(t)x + 'K (t)[z{t)-H

{t)x]4rC(t)u(t)

 

(10-41)

для t0<t<tl,

где

W(tt) = A,

a

x^=x(t

\t)

опти­

мальная

текущая

оценка

состояния

системы.

 

 

Значение

критерия качества

для

оптимального

управ­

ления составляет:

 

 

 

 

 

 

 

 

 

 

 

V (ti—to) = Sp [W (to) P(to)]

+ a(t0),

 

(10-42)

где

a(t0)

—решение

дифференциального

уравнения

 

 

 

k =

 

-Sp[G'(t)W(t)G(t)Q(t)]-

 

 

 

 

 

—Sp [S'(t)B(t)S(t)P(t\t)]

 

 

 

 

(10-43)

для

to^t^ti

при

условии

a(ti)=0.

 

Здесь

P(t\t)

явля­

ется корреляционной

матрицей

ошибки

фильтрации.

 

Структурная схема оптимальной системы управления

изображена

на рис. 10-3.

 

 

 

 

 

 

 

 

Принцип

разделения

для задачи

стохастического ли­

нейного регулятора получен Поттером [Л. 10-18] в 1964 г. Результаты Уонхэма [Л. 10-22], полученные в 1968 г., позволили применить принцип разделения к значительно

426


более широкому классу

задач. В частности, доказано,

что для справедливости

принципа

разделения критерий

качества не

обязательно

должен

быть квадратичным,

а управление

линейным

относительно состояния или его

оптимальной

оценки.

 

 

C(t)

z(t) =^Ф=^\ Kit) x(t\t) S(t) U LL(t)

F(t)

Н(і)

Рис. 10-3. Оптимальная система управления для задачи непрерыв­ ного стохастического линейного регулятора.

Пример 10-1. Рассмотрим класс

задач,

в которых

все

компо­

ненты вектора состояния системы x=F(t)x+G(t)w

(t) +

G(t)u(t)

можно

измерить

точно при Г о ^ ^ і ,

а

критерий

 

качества

описы

вается уравнением (10-3).

 

 

 

 

 

 

 

 

 

Поскольку

переменные состояния можно'измерить

точно, x (г | г) =

Il x (t) с нулевой

ошибкой,

так что

P(t\t)

— 0

для

г 0 ^ / < ^ .

Оптимальное управление имеет вид u(t)

=S(t)x(t),

 

где S(t)

опре­

деляется с помощью уравнений (10-39)

и (10-40).

 

 

 

 

Для

вычисления

критерия

качества

рассмотрим первое

равен­

ство в

(10-33). Поскольку x{to)

можно

измерить

точно,

то

 

 

 

Vitt—to)

=Sp E{W ito)xita)x'

іЩ+aito)

 

=

 

 

 

 

 

=SplWit0)x(lo)x'it0)]

 

+

aiU)

 

 

 

 

или, что то же самое,

 

 

 

 

 

 

 

 

 

 

 

 

 

Vid—to) =x'it0)

Wito)xito)+a(to).

 

 

(10-44)

Так

как Pit\t)=0

для ^о=£^=£^і,

то

уравнение

(10-43)

примет

вид

 

 

à=-Sp

[G'(t)W(t)

G(t)Q(t)]

 

 

 

 

 

 

 

 

 

 

 

для ttt^t^ti,

где а(^і)=0,

а

матрица

W(r) является

решением

уравнения (10-40). Интегрируя последнее уравнение, получаем соот­ ношение

 

U

 

 

 

 

а (*„) =

Sp J G' {t) W it)

G {t) Q it)

dt,

 

(10-45)

 

h

 

 

 

 

которое определяет составляющую критерия качества,

обусловлен­

ную возмущением системы. Очевидно,

что если

возмущение

системы

отсутствует, то задача

становится детерминированной

при

<х(го)=0

иVih—to)=Jc'(to)W{to)x{tQ).

28*

427