Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 302

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

минимизирующее / на интервале [tu t2]. Обозначим это оптимальное управление через u°(t) и соответствующее ему значение критерия качества через /°.

Рассмотрим

некоторый момент времени

t'Œ(ti,

t2) и

предположим,

что на интервале [/', \t2] существует

управ­

ление u*(t), для

которого /

меньше, чем для

на

том же интервале

и при том же начальном

состоянии.

В силу этого предположения

управление

 

 

и** (t) =

«40; * е ft,*')

 

u*(t);t^[t',t2]

обеспечивает значение критерия качества / * * < / ° на ин­ тервале [ti, t2]. Однако согласно гипотезе и°(і) является оптимальным управлением для системы S и поэтому не может быть улучшено. Следовательно, налицо противо­ речие, доказывающее теорему.

Заметим, что управление u°(,t) не обязательно един­ ственно, и поэтому возможно существование управления и* (t) Фи°(і) на интервале [f, t2], такого, что управление

и** (t) =

J

t^[t',t2]

 

u*(t),

обеспечивает /** = /" на интервале [tu t2].

Достаточно простая

интерпретация принципа опти­

мальности иллюстрируется рис. 9-3. Предположим, что для некоторой системы с непрерывным временем и на-

 

 

чальным

состоянием

x{t\)

и."(t)

 

изображенное на

рисунке

 

управление {u°(t),

 

 

ti^t^t2)

 

о

минимизирует

некоторый

 

критерий

качества

/

на ин­

 

 

 

 

тервале [/i, t2]. Принцип оп­

 

 

тимальности утверждает, что

 

 

{u°(t),

t'^.t^t2}

минимизи­

x(t)

 

рует

тот же критерий

каче­

 

 

ства

на интервале

 

[f,

t2], ес­

tли состояние системы в мо­ мент времени V возникло в результате управления и ° ( 1 ) на интервале (/), t'].

Рис.

9-3. Иллюстрация прин­

Принцип оптимальности

ципа

оптимальности,

оказался мощным средством

378


для решения задач оптимизации систем управления. В задачах с дискретным временем его используют для сведения задачи определения всей управляющей после­ довательности к рекуррентному вычислению отдельных членов этой последовательности. В задачах с непрерыв­ ным временем применение принципа позволяет свести вариационную задачу к решению уравнения в частных производных специального вида, а также получить не­ обходимые и (или) достаточные условия оптимальности управления, которые сами по себе удобны для приложе­ ний. Все эти замечания впоследствии широко иллюстри­ руются.

Решение

детерминированной

задачи

 

 

Обозначим

символом

 

VN

минимальное

значение

критерия

качества

JN вида

 

(9-7)

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

VN

=

min ... min

£

[x'

(i) A (t)

x (t) - f u' (t -

1)

X

 

 

u(0)

»<Л '-і)г .

= 1

 

 

 

 

 

 

 

 

 

 

X 5 ( i - l ) « ( i - l ) ] .

 

(9-9)

Задача

заключается

в

отыскании

значений

rN

пере­

менных

величин,

а

точнее,

компонент векторов

«(0),

ы(1), ... , u(N1),

таким

образом,

чтобы минимизиро­

вать указанную квадратичную форму. Если для этой це­ ли использовать дифференциальное исчисление, то мож­ но получить систему из rN алгебраических уравнений, которые следует решать при условии (9-6). Очевидно, что вычислительные трудности при решении такой зада­ чи оказываются чрезмерными, за исключением некото­

рых

тривиальных случаев, например, малых

значений г

и N.

Задачу минимизации, описываемую

уравнением

(9-9), можно также рассматривать как ЛЛшаговый про­ цесс принятия решений. Тогда N принимаемых решений вида u(0),...,u(N1) должны минимизировать задан­ ную квадратичную форму. Вместо того, чтобы принимать N решений одновременно, желательно разработать про­ цедуру поочередного принятия решений, т. е. свести .ZVшаговую задачу к одношаговой. Принцип оптимальности представляет средство для достижения этой цели. По­ ставленная здесь задача будет решаться по индукции, начиная с последнего шага управления.

379



Одношаговая задача

Предположим, что задача заключается в отыскании управления, минимизирующего критерий качества для последнего шага управления, т. е. является-задачей одношаговой оптимизации.

Обозначим

1 ^ = т і п [ ; с ' ( Л 0 Л ( у Ѵ ) х ( Л 0 + « '

{N ~

l)B(N-

\)u(N

-

1)]

 

u(N—\)

 

 

 

 

 

 

 

 

(9-10)

 

Согласно уравнению

(9-6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x(N)=0(N,

N—l)x(N—l)+W(N,

 

N—\)u(N1).

 

 

Подставляя этот результат в уравнение (9-10) и рас­

крывая скобки, получаем:

 

 

 

 

 

 

 

 

Ѵ ^ = г п і п { [ Ф ( # , # -

l)x(N

— l) +

W(N,N

1 ) Х

 

 

u(N—l)

 

 

 

 

 

 

 

 

 

 

X

и (N -

1)]' A (N) (N, N -

1) x {N -

1)

+

 

 

+

W(N,N

l)u(N - l)] + u' {N-1)B(N

l)u(N-

1 ) } =

= m; n {x'(N -

1) Ф' (N, N—l)

A (N) Ф (N, N — l) x (N— l)-f-

u(N—l)

 

 

 

 

 

 

 

 

 

 

-\-x'(N

- \)<b'(N,N—

\)A(N)V(N,N

 

— \)u(N—\)

 

+

+

u'(N—

\)W

(N, N 1)А(/Ѵ)Ф(/Ѵ, Л/ — 1)л(УѴ- 1)

+

 

- f W (M 1) [»F (N, N — 1) A(N)W

(N, N ~

1)

+

 

+ß ( i V - l ) ] « ( / V - l ) } .

Так как Л(/Ѵ) симметрическая матрица, второе сла­ гаемое равно транспонированному третьему, а поскольку оба они скаляры, то эти два слагаемых равны. Следова­ тельно, можно записать:

Ѵ1 = тт[х'Ф'АФх +

2х'Ф'АЧ?и + и' (WAW -f- В) и], (9-11)

и

 

где аргументы опущены.

Минимум в правой

части уравнения (9-11) можно по­

лучить, полагая равным нулю градиент по и от выраже­ ния в квадратных скобках. Тогда

2x'O'AW + 2u'(W,AW +

B)=0.

 

 

Решая это уравнение относительно и, имеем

 

u(N— 1)

 

N—l)A{N)W(N,

N—l) +

 

+ В (N—{)]-"¥'(N,

N—l)A(N)0(N,

N—

 

 

-l)x(N-l),

 

(9-12)

 

где использована

симметричность

матриц

A(N)

и

B(N—l).

 

 

 

 

 

380


Заметим, что полученный закон управления — физи­ чески реализуемый. Кроме того, он является линейным и включает в себя обратную связь по текущему состоя­

нию

x(N—1).

 

 

 

 

 

 

 

 

 

 

 

 

Введем

матрицу

 

 

 

 

 

 

 

 

 

 

 

S(N—

1) =—[W'(N,

N—l)A{N)W(N,

 

N—l)

+

 

 

+B(N—l)]-iW,(N,

 

N—\)A(N)Cb(N,

N—l)

 

(9-13)

и запишем закон управления в виде

 

 

 

 

 

 

 

 

 

 

u(N—l)=S{N—l)x(N—l).

 

 

 

 

(9-14)

Матрица

5

размера гХп

называется

матрицей

 

пере­

дачи

обратной

связи

системы управления.

Заметим,

что

S(N—1)

и u(N—1)

существуют

тогда

и

только

тогда,

когда

матрица

[W{N, N—l)A(N)W(N,

 

N— 1) +B{N—

1)]

несингулярна.

 

 

 

 

 

 

 

 

 

 

 

 

Теперь вычислим

Vi. Подставляя

уравнение

(9-12)

в (9-11),

получаем:

 

 

 

 

 

 

 

 

 

 

 

ѴІ = х'Ф'А

Фх—2х'Ф'А

XY

( WA

XV + В ) -lW

X

 

 

 

X АФх + х'Ф'А

W (WAW

+ В ) -іУАФх

= x'

{N—

 

— 1)Ф'(#,

N— 1){A(N)

— A(N)W(N,

N—l)[4T(N,

 

N—

— l)A(N)W(N,

N—l)+B(N—l)]~iW'(N,

 

 

N—l)A(N)}X

Полагая

 

ХФ(Ы,

 

N—l)x{N—l).

 

 

 

 

 

 

 

W(N)=A(N);

 

 

 

 

(9-15)

 

 

 

 

 

 

 

 

 

 

M(N—

1) =Ф'(Ы,

N— 1){W(N)

— W(N)W(N,

N—\)X

X[W(N,

N—l)W(N)W(N,

N— l)+B(N—

l)]-'X

 

получаем:

XW(N,

 

N—l)

W(N)№(N,

 

N—l),

 

(9-16)

Vi=x'(N—

l)M(N—

l)x{N—1).

 

 

(9-17)

 

 

 

 

 

Полезность обозначений (9-15) и (9-16) станет ясной позднее. Пока важно заметить, что минимальное значе­ ние критерия качества одношагового управления Vt представляет собой квадратичную форму от начального

состояния рассматриваемой

одношаговой

задачи

x(N—

— 1). Заметим

также,

что

по определению

W(N) и

M(N—1)симметрические

 

матрицы размера

пХп.

Наконец, подставляя

(9-15) в уравнение (9-13),

полу­

чаем:

 

 

 

 

 

 

S(N—l)

(N,

N—l)W(N)W(N,

N—1)

+

 

+ B(N—l)y-iW'(N,

N—l)W(N)Ф{N,

N—l).

 

(9-18)

381