минимизирующее / на интервале [tu t2]. Обозначим это оптимальное управление через u°(t) и соответствующее ему значение критерия качества через /°.
|
|
|
|
|
|
Рассмотрим |
некоторый момент времени |
t'Œ(ti, |
t2) и |
предположим, |
что на интервале [/', \t2] существует |
управ |
ление u*(t), для |
которого / |
меньше, чем для |
на |
том же интервале |
и при том же начальном |
состоянии. |
В силу этого предположения |
управление |
|
|
и** (t) = |
«40; * е ft,*') |
|
u*(t);t^[t',t2] |
обеспечивает значение критерия качества / * * < / ° на ин тервале [ti, t2]. Однако согласно гипотезе и°(і) является оптимальным управлением для системы S и поэтому не может быть улучшено. Следовательно, налицо противо речие, доказывающее теорему.
Заметим, что управление u°(,t) не обязательно един ственно, и поэтому возможно существование управления и* (t) Фи°(і) на интервале [f, t2], такого, что управление
и** (t) = |
J |
t^[t',t2] |
|
u*(t), |
обеспечивает /** = /" на интервале [tu t2]. |
Достаточно простая |
интерпретация принципа опти |
мальности иллюстрируется рис. 9-3. Предположим, что для некоторой системы с непрерывным временем и на-
|
|
|
|
|
|
|
|
|
|
чальным |
состоянием |
x{t\) |
и."(t) |
|
изображенное на |
рисунке |
|
управление {u°(t), |
|
|
ti^t^t2) |
|
о |
минимизирует |
некоторый |
|
критерий |
качества |
/ |
на ин |
|
|
|
|
тервале [/i, t2]. Принцип оп |
|
|
тимальности утверждает, что |
|
|
{u°(t), |
t'^.t^t2} |
минимизи |
x(t) |
|
рует |
тот же критерий |
каче |
|
|
ства |
на интервале |
|
[f, |
t2], ес |
tли состояние системы в мо мент времени V возникло в результате управления и ° ( 1 ) на интервале (/), t'].
Рис. |
9-3. Иллюстрация прин |
Принцип оптимальности |
ципа |
оптимальности, |
оказался мощным средством |
для решения задач оптимизации систем управления. В задачах с дискретным временем его используют для сведения задачи определения всей управляющей после довательности к рекуррентному вычислению отдельных членов этой последовательности. В задачах с непрерыв ным временем применение принципа позволяет свести вариационную задачу к решению уравнения в частных производных специального вида, а также получить не обходимые и (или) достаточные условия оптимальности управления, которые сами по себе удобны для приложе ний. Все эти замечания впоследствии широко иллюстри руются.
Решение |
детерминированной |
задачи |
|
|
Обозначим |
символом |
|
VN |
минимальное |
значение |
критерия |
качества |
JN вида |
|
(9-7) |
|
|
|
|
|
|
|
|
|
N |
|
|
|
|
|
|
|
VN |
= |
min ... min |
£ |
[x' |
(i) A (t) |
x (t) - f u' (t - |
1) |
X |
|
|
u(0) |
»<Л '-і)г . |
= 1 |
|
|
|
|
|
|
|
|
|
|
X 5 ( i - l ) « ( i - l ) ] . |
|
(9-9) |
Задача |
заключается |
в |
отыскании |
значений |
rN |
пере |
менных |
величин, |
а |
точнее, |
компонент векторов |
«(0), |
ы(1), ... , u(N—1), |
таким |
образом, |
чтобы минимизиро |
вать указанную квадратичную форму. Если для этой це ли использовать дифференциальное исчисление, то мож но получить систему из rN алгебраических уравнений, которые следует решать при условии (9-6). Очевидно, что вычислительные трудности при решении такой зада чи оказываются чрезмерными, за исключением некото
рых |
тривиальных случаев, например, малых |
значений г |
и N. |
Задачу минимизации, описываемую |
уравнением |
(9-9), можно также рассматривать как ЛЛшаговый про цесс принятия решений. Тогда N принимаемых решений вида u(0),...,u(N—1) должны минимизировать задан ную квадратичную форму. Вместо того, чтобы принимать N решений одновременно, желательно разработать про цедуру поочередного принятия решений, т. е. свести .ZVшаговую задачу к одношаговой. Принцип оптимальности представляет средство для достижения этой цели. По ставленная здесь задача будет решаться по индукции, начиная с последнего шага управления.
Одношаговая задача
Предположим, что задача заключается в отыскании управления, минимизирующего критерий качества для последнего шага управления, т. е. является-задачей одношаговой оптимизации.
Обозначим
1 ^ = т і п [ ; с ' ( Л 0 Л ( у Ѵ ) х ( Л 0 + « ' |
{N ~ |
l)B(N- |
\)u(N |
- |
1)] |
|
u(N—\) |
|
|
|
|
|
|
|
|
(9-10) |
|
Согласно уравнению |
(9-6) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x(N)=0(N, |
N—l)x(N—l)+W(N, |
|
N—\)u(N—1). |
|
|
Подставляя этот результат в уравнение (9-10) и рас |
крывая скобки, получаем: |
|
|
|
|
|
|
|
|
Ѵ ^ = г п і п { [ Ф ( # , # - |
l)x(N |
— l) + |
W(N,N |
— |
1 ) Х |
|
|
u(N—l) |
|
|
|
|
|
|
|
|
|
|
X |
и (N - |
1)]' A (N) [Ф (N, N - |
1) x {N - |
1) |
+ |
|
|
+ |
W(N,N |
— l)u(N - l)] + u' {N-1)B(N |
— l)u(N- |
1 ) } = |
= m; n {x'(N - |
1) Ф' (N, N—l) |
A (N) Ф (N, N — l) x (N— l)-f- |
u(N—l) |
|
|
|
|
|
|
|
|
|
|
-\-x'(N |
- \)<b'(N,N— |
\)A(N)V(N,N |
|
— \)u(N—\) |
|
+ |
+ |
u'(N— |
\)W |
(N, N — 1)А(/Ѵ)Ф(/Ѵ, Л/ — 1)л(УѴ- 1) |
+ |
|
- f W (M — 1) [»F (N, N — 1) A(N)W |
(N, N ~ |
1) |
+ |
|
+ß ( i V - l ) ] « ( / V - l ) } .
Так как Л(/Ѵ) —симметрическая матрица, второе сла гаемое равно транспонированному третьему, а поскольку оба они скаляры, то эти два слагаемых равны. Следова тельно, можно записать:
Ѵ1 = тт[х'Ф'АФх + |
2х'Ф'АЧ?и + и' (WAW -f- В) и], (9-11) |
и |
|
где аргументы опущены. |
Минимум в правой |
части уравнения (9-11) можно по |
лучить, полагая равным нулю градиент по и от выраже ния в квадратных скобках. Тогда
2x'O'AW + 2u'(W,AW + |
B)=0. |
|
|
Решая это уравнение относительно и, имеем |
|
u(N— 1) |
|
N—l)A{N)W(N, |
N—l) + |
|
+ В (N—{)]-"¥'(N, |
N—l)A(N)0(N, |
N— |
|
|
-l)x(N-l), |
|
(9-12) |
|
где использована |
симметричность |
матриц |
A(N) |
и |
B(N—l). |
|
|
|
|
|
Заметим, что полученный закон управления — физи чески реализуемый. Кроме того, он является линейным и включает в себя обратную связь по текущему состоя
нию |
x(N—1). |
|
|
|
|
|
|
|
|
|
|
|
|
Введем |
матрицу |
|
|
|
|
|
|
|
|
|
|
|
S(N— |
1) =—[W'(N, |
N—l)A{N)W(N, |
|
N—l) |
+ |
|
|
+B(N—l)]-iW,(N, |
|
N—\)A(N)Cb(N, |
N—l) |
|
(9-13) |
и запишем закон управления в виде |
|
|
|
|
|
|
|
|
|
|
u(N—l)=S{N—l)x(N—l). |
|
|
|
|
(9-14) |
Матрица |
5 |
размера гХп |
называется |
матрицей |
|
пере |
дачи |
обратной |
связи |
системы управления. |
Заметим, |
что |
S(N—1) |
и u(N—1) |
существуют |
тогда |
и |
только |
тогда, |
когда |
матрица |
[W{N, N—l)A(N)W(N, |
|
N— 1) +B{N— |
1)] |
несингулярна. |
|
|
|
|
|
|
|
|
|
|
|
|
Теперь вычислим |
Vi. Подставляя |
уравнение |
(9-12) |
в (9-11), |
получаем: |
|
|
|
|
|
|
|
|
|
|
|
ѴІ = х'Ф'А |
Фх—2х'Ф'А |
XY |
( WA |
XV + В ) -lW |
X |
|
|
|
X АФх + х'Ф'А |
W (WAW |
+ В ) -іУАФх |
= x' |
{N— |
|
— 1)Ф'(#, |
N— 1){A(N) |
— A(N)W(N, |
N—l)[4T(N, |
|
N— |
— l)A(N)W(N, |
N—l)+B(N—l)]~iW'(N, |
|
|
N—l)A(N)}X |
Полагая |
|
ХФ(Ы, |
|
N—l)x{N—l). |
|
|
|
|
|
|
|
W(N)=A(N); |
|
|
|
|
(9-15) |
|
|
|
|
|
|
|
|
|
|
M(N— |
1) =Ф'(Ы, |
N— 1){W(N) |
— W(N)W(N, |
N—\)X |
X[W(N, |
N—l)W(N)W(N, |
N— l)+B(N— |
l)]-'X |
|
получаем: |
XW(N, |
|
N—l) |
W(N)№(N, |
|
N—l), |
|
(9-16) |
Vi=x'(N— |
l)M(N— |
l)x{N—1). |
|
|
(9-17) |
|
|
|
|
|
Полезность обозначений (9-15) и (9-16) станет ясной позднее. Пока важно заметить, что минимальное значе ние критерия качества одношагового управления Vt представляет собой квадратичную форму от начального
состояния рассматриваемой |
одношаговой |
задачи |
x(N— |
— 1). Заметим |
также, |
что |
по определению |
W(N) и |
M(N—1)—симметрические |
|
матрицы размера |
пХп. |
Наконец, подставляя |
(9-15) в уравнение (9-13), |
полу |
чаем: |
|
|
|
|
|
|
S(N—l) |
(N, |
N—l)W(N)W(N, |
N—1) |
+ |
|
+ B(N—l)y-iW'(N, |
N—l)W(N)Ф{N, |
N—l). |
|
(9-18) |