Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 311

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

+

— 1) Д*]Д/

\==UmE\x'{t0-t-Nbt)Ax(t0-\-Nàt)

+

 

 

+ E

 

(t0

+

iAt) A (ta

+

iAt) x (t0

+ iAt) At -f

+

S

[t0 A-(i-i)At]B

[ f 0 + ( i

-

1) Af] u [ r 0 - f ( i -

1) Af] Atj.

 

Для известного

Л7 введем

обозначение

(10-14)

 

 

 

 

У„ =

E J

(f0 + ЛГДО Ах [t0 +

JVДО +

 

 

 

N

 

 

- f iAt) A {t0

Ar iAt) x {t0

Ar Ш) M - f

 

 

+ £

 

(*0

 

N

 

 

 

 

 

 

 

 

 

j

+

S

" ' M - С -

i ) A O ß U . +

( « -

1)A*]"IU-0'-1)AOA*

и заметим,

что

 

 

 

 

 

 

 

(10-15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

У=1іга/Л ,,

 

 

 

 

 

 

 

 

 

JV->oo

 

 

 

если

At-^0,

при условии NAt =

t1—t0.

 

Уравнение (10-15) определяет критерий качества для эквивалентной дискретной задачи. Сравнивая это урав­ нение с уравнением (9-3) для дискретной задачи стоха­ стического линейного регулятора, получаем следующие соотношения:

А(І)=\АѴ»

+ Ш

Для

t ' = l , 2 , ....

 

( l Q

1Л + Л(*,)Д*

для

i=N;

 

 

 

—1) =

В[*0

+ ( І - 1 ) Д * ] Д* для

» =

1,2,

N. (10-17)

Физически

реализуемые

управления

 

)

Как

уже

отмечалось

ранее

и

как

показано на

рис. 10-1, требуется, чтобы

дискретный сигнал управле­

ния u(t)

был кусочно-постоянным. Теперь

дополнитель­

но потребуем, чтобы он был функцией

только физически

419



доступных данных о состоянии системы. Для этого представим уравнение (10-4) в дискретном виде:

u(t)=ii,[z(t0

+ iàt);

t = 0,

1, . . . , / ; x (to)],

(10-18)

где-* = *о + /А*; / = 0,

1, . . . . N— 1.

 

 

 

 

Эквивалентная

задача

 

 

 

 

 

Для заданного

значения

Л/ задача,

описываемая

уравнениями (10-5),

(10-9), (10-15) и (10-18), в которой

требуется определить управляющую

последовательность

{u(t)\ t — tc + jàt;

/ = 0, 1,

N—1},

минимизирующую

значение JN, В ТОЧНОСТИ совпадает с задачей

дискретного

стохастического

линейного

регулятора

из гл. 9.

 

В то же время в пределе при At—>-0 и Л/ таком, что

Л/А/ = /і—to, она

является

задачей непрерывного

стоха­

стического линейного регулятора, поставленной в § 10-1. Следовательно, теперь к этой задаче можно приме­

нить результаты гл. 9 и рассмотреть предельное

поведе­

ние полученного алгоритма управления.

 

 

 

 

10-3. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ

 

 

 

 

 

Для заданного N

и любого

t = t0 + jAt;

/ = 0,

1,

 

А/1 применение результатов гл. 9 к поставленной

здесь дискретной задаче приводит к следующей

системе

уравнений

оптимального управления:

 

 

 

 

 

 

u(t)=S(t)x{t

 

 

\ t);

 

 

(10-19)

W (t + At) =

M (t - f At) + A (t +

Д/) Д^;

(10-20)

S(t) =

— \W (t -f- At, t) W (t +

Ai) W(t

+

At, t) - f

 

-\-B(i)At]-1W'(t-]-At,

 

t)W(t

+

At)U>(t + At, t);

(10-21)

M (t) = Ф' (t - f

t)W(t

+

At) Ф(* +

Af, t) —

 

 

- Ф'(/ + A f , t)W(t

+ At)4r(t +

At, t)[4F'(t

+

At, t)W(t

+

 

+ At)W{t

+

At, t) +

B(t) Аі]~Р'(і

+

 

 

 

- f At, t) W (t - f At) Ф(і-{-

At,

t).

 

(10-22)

При составлении этих уравнений использованы урав­

нения (9-46) —(9-48),

(9-80), (10-16) и

(10-17).

 

 

Значения / при

вычислении

 

S(t),

как это видно

из

уравнений

(10-20) —(10-22),

равны t = t0

+ (N-l)At,

 

t0 +

+ (N—2)At,

to+At,

U.

 

 

 

 

 

 

 

 

420


Вычисления начинаются с граничного условия

W(to+№t)=W(t1)=A+A(ti)At,

(10-23)

полученного из уравнения (10-16). Последовательность

вычислений,

разумеется,

совпадает

с

последователь­

ностью вычислений в гл. 9.

 

 

 

 

 

 

 

 

 

 

 

 

 

Из уравнения

(10-20)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M(t)=W(t)—A(t)At.

 

 

 

 

 

 

(10-24)

 

Подставляя этот результат в левую часть (10-22) и

решая

полученное уравнение относительно W(t),

имеем:

 

 

 

W (t) =

Ф' (t +

Д*, t)W(t

+

At) Ф (t +

At, t)

-

 

 

 

-

Ф'(^ +

Д ^

t)W(t

+ At)W(t

+

At,

t)[W'(t

+

At, t)W(t

+

 

 

+

At)W(t

+

At, t) +

B(t) At}~lW

(t + At, t)W (t

+

 

 

 

 

 

 

 

 

+

At) Ф (t +

 

t) +

A (t) At.

 

 

 

 

(10-25)

 

Подставляя

соотношения

(10-6) — (10-8)

 

в

уравнение

(10-25) и раскрывая скобки, получаем:

 

 

 

 

 

 

 

 

 

 

 

W (t) =

[/ + F (t) At +

О (At2)}'

W(t +

At) [I

+

 

 

 

- f

F (t) At +

О {At2)] -

 

[I + F (t) At +

О (At2)}'

W (t

+

 

+

At) [C (t) At +

O (At2)}

{[C (t) At + О (At2)]'

W {t

+

 

 

 

 

 

+ At) [C (t) At + О (At2)}

-\-B(t)

At}'1

[C(t) At

+

 

 

 

+

О (At2)}'

W(t

+ At) [I +

F (t) At + O (At2)]

+

A (t) At

 

=

=

W{t+At)

 

+

F' (t) W (t +

At) At +

W{t-[-

At) F (t) At

 

-

 

-

W (t +

At) С (t) [C (t) W(t-{-

At) С (t) At2

+

В (t) At

+

 

+

О (At3)} -1 С

(t) At2W (t +

At) +

A (t) At +

O (At2) =

 

 

=

W{t +

 

At) +

F'{t)W(t

 

+

At) At + W (t +

At) F (t) At

-

-W(t

 

+At)

 

С (t) [C (t) W (t+Af)

С (t) At + ß (t)} -1С

(t) W ( 4 -

 

 

 

 

 

 

+

At) At +

A (t) At +

O {At*).

 

 

 

 

(10-26)

 

Полагая,

что

предел

W(t+At)

при At—>-0

сущест­

вует, из уравнения (10-26)

имеем:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l\vaW{t

+

At) = W(t).

 

 

 

 

 

 

 

 

 

Тогда,

переписывая уравнение (10-26) в виде

 

 

 

 

 

W(t)

— W(t +

At) =

F' (t) W{t + At) At +

W (t

+

 

 

 

+

At) F (t) At — W (t+

At) С (t) [С (t) W(t + At) С (t) At

+

 

 

 

+ В (t)} -1С

(t) W(t

+

At) At +

A (t) At +

O

(Af),

 

 

421


деля обе его части на Al и переходя к пределу при At—>-0, получаем матричное дифференциальное урав­ нение

— W(t) = F' (t) W(t) +

W (t) F

(t)~

 

- W(t)C{t)B-4t)C'{t)W{t)

+

A(t),

(10-27)

где t теперь обозначает непрерывное

время,

причем

fo<:f<*i .

Из уравнения (10-23) следует, что граничное усло­ вие, соответствующее уравнению (10-27), имеет вид:

№ ( 0 ) = Л .

Это условие получается в результате предельного перехода в выражении (10-23) при At—>-0.

Теперь рассмотрим предельное поведение уравнения (10-21). Подставляя в него соотношения (10-6) и (10-8), имеем:

 

S(t)=

{{С (t) At + О (At2)]' W(t + At) [С (t)"At +

 

+

О (M2)}

- f В (t) At} - 1

[C (t) At A-О (At2)}' W(t

+

bt)\I

+

 

+ F (t) At + О (At2)]

== - [С (t) W (t A- ДО С (t) At2

+

 

-f- B (t) At A- О (ДО] - 1 [ С (0 W (t -f- ДО At - f О (At2)}

=

= -

(0 W(t + ДО С (0

At А-В

(t) А-О (At2)]'1

(t) W (t - f

 

 

+

д/) +

о ( д о ] .

 

 

 

 

В пределе при At—>-0 отсюда следует, что

 

 

 

 

S(i)=—B-i(t)C,(t)W(t)

 

(10-28)

ДЛЯ tos^ts^.ti.

 

в пределе при А^—*-0 остает­

 

Вид уравнения (10-19)

ся

прежним:

 

 

 

 

 

 

 

 

u(t)

=

S (t)x (t\ t)

 

(10-29)

для to<cZ-t<£Zti. Оптимальное управление для задачи не­ прерывного стохастического линейного регулятора опи­ сывается уравнениями (10-27) — (10-29).

Для определения матрицы передачи обратной

связи

S(t)

требуется решить систему обыкновенных диффе­

ренциальных уравнений первого порядка (10-27)

при

граничном условии № ( 0 ) = Л . Ясно, что вычисления

сле­

дует

проводить в обратном времени, начиная с 0. Урав­

нение (10-27) является матричным дифференциальным уравнением Риккати, точно таким же, какое было рас-

422