Двухшаговая задача
Рассмотрим задачу оптимального управления для двухшагового процесса. Положим:
V2 = |
rain |
min |
{[x'(N |
- |
l)A{N- |
|
l)x{N |
- |
1) |
+ |
|
|
u(N—2) U{N—1) |
|
|
|
|
|
|
|
|
|
- f |
u' (iV - |
2) В (N - 2) и {N - |
2)] - f [x' (N) A (N) x (N) + |
|
|
|
-j-и' |
( / V - |
l ) ß ( / V - 1 ) м ( / Ѵ - 1)]}. |
|
|
Из принципа оптимальности следует, что это соотно |
шение можно представить в виде |
|
|
|
|
|
|
|
|
Vs |
= |
mm[x' |
(N — \)A(N |
- |
l)x{N — 1) |
+ |
|
|
|
|
u(N—2) |
|
|
|
|
|
|
|
|
|
|
|
|
- f |
u' (/V - |
2) ß (/V - |
2) « (ІѴ - |
2) + |
VJ, |
|
(9-19) |
так как выбор u(N—1) |
не влияет па |
x(N—1). |
|
|
Подставляя |
(9-17) |
в |
уравнение |
(9-19), |
имеем: |
|
|
V2 |
= |
min[jc' (N—l)A(N- |
|
l)x(N— |
1) |
+ |
|
|
|
|
|
u(N—2) |
|
|
|
|
|
|
|
|
|
|
|
- f |
и' (N |
- |
2) ß (N - |
2) u (/V - |
2) + |
je' (/V - |
1) |
X |
И ЛИ |
|
|
|
|
|
X M ( / V - |
l)jc(/V — 1)] |
|
|
|
|
l / 2 |
= |
min [x'(N |
— l)W(N |
- |
\)x(N- |
1) |
+ |
|
|
|
|
|
|
|
и(Л/—2) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- f - u ' ( W - 2 ) ß ( / V - 2 ) u ( / V - 2 ) ] , |
|
(9-20) |
где |
обозначено |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
W(yV— 1) =М(іѴ— 1) + Л ( У Ѵ — 1). |
|
(9-21) |
Заметим, |
что |
W(N—1) •—симметрическая |
матрица |
размера |
пХп. |
|
|
|
|
|
|
|
|
|
|
|
Сравнивая уравнения (9-20) и (9-10), можно видеть, что они аналогичны по форме и переходят одно в дру гое в результате следующей подстановки:
N—^N—l; |
|
N—1—v/V—2; |
|
A(N) = W(N)^W(N—\) |
• |
B(N— 1 |
2). |
Следовательно, выражение для управления u(N—2), минимизирующего правую часть (9-20), будет иметь ту
же форму, что и u(N—1) в уравнении (9-12), при усло вии приведенной здесь подстановки. По аналогии с урав нениями (9-14) и (9-18) запишем:
u(N—2) =S(N—2)x(N—2); |
(9-22) |
S(N—2) = |
1, N—2) |
W(N— l)W(N— |
1, |
N—2) +B(N—2)]-W(N— |
1, |
УѴ—2) W(JV— 1) X |
Х Ф ( І Ѵ - 1 , |
2), |
(9-23) |
где W(N—1) определяется с помощью уравнения (9-21). Значение Ѵ2 легко получить, повторяя операции, при водящие к уравнению (9-17), с использованием той же
подстановки. Тогда
1/2 = Х '(Л/—2)M(N—2)x(N—2), (9-24)
где
|
M(N—2) |
=®'(N— |
1, N—2){W(N— |
1) — |
|
|
|
—W(N— 1)¥(ІѴ— 1, .V—2)[4f'{N—\, |
N—2)W{N— |
|
— l)W(N—l, |
N—2) |
|
|
+B(N—2)]~iX¥'(N—'1, |
|
|
|
|
N—2)W(N—\)}0>{N—\, |
|
|
ІѴ—2). |
|
|
(9-25) |
|
Вновь |
отметим |
симметричность |
матрицы |
M (ІѴ—2). |
|
Процедура вычисления двух матриц передачи обрат |
ной |
связи |
S(N—1) |
и S(N—2) |
|
для |
задачи |
двухшагово- |
го |
управления |
теперь |
вполне |
очевидна. |
|
Подставив |
W(N)=A(N) |
в |
(9-18) |
и |
(9-16), |
получим |
S(N—l) |
и |
M(N—1) |
соответственно. Последнюю матрицу |
и |
|
A(N— |
— 1) используем |
в уравнении |
(9-21), а подставив |
резуль |
тат |
W(N—l), в |
(9-23), получим |
|
S(N—2). |
Наконец, |
если |
требуется |
значение |
Ѵ2, |
подставляем W (N—1) |
в |
(9-25), |
что |
дает |
матрицу |
M(N—2), |
|
которая |
при |
известном |
x(N—2) позволяет |
получить |
Ѵ2 |
с |
помощью |
уравнения |
(9-24). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Важно заметить, что вычисления проводятся рекуррентно в обратном времени. Следует также заметить, что повторения части вычислений можно избежать, под ставляя в (9-25) уравнение (9-23) и получая выражение
M(N—2)=<b'(N—U |
N—2)W(N—l)(I>(N—l, |
N—2) +Ф'(УѴ—1, |
N—2)W(N—l)W{N—\, |
N—2)S{N—2),
и аналогично для M(N—1). Дальнейшие вычисления можно провести в последовательности
W(N) = A(N)—+S(N—\)—>M(N—\)^W(N—
— 1)-^S(/V—2)—WW(/V—2)—>К2 .
(j—1)-шаговая задача
По индукции имеем для некоторого / ^ З , что опти мальное управление в момент времени N—/+1 для про цесса, состоящего из /—1 шагов, описывается системой уравнений:
W(N—j |
+ 2) = M(N—j + 2)+A(N—/ |
|
+ 2); |
(9-26) |
5(N—j |
+ 1 ) = —[W(N—j |
+ 2, N—j + |
\)W(N— |
—/ + 2) ¥ |
(N—j + 2, N—j +\)+B |
(N—j |
+ 1 ) |
(N— |
—j + 2, |
N—j + l)W(N—j+2)Ф(N—j |
|
+ 2, |
|
|
|
|
|
N-j+l); |
|
|
|
|
|
(9-27) |
и(N-j |
+ 1 ) = S (N—j |
+ \)x(N-j |
+ 1 ) ; |
(9-28) |
M(N—j+\) |
|
= <D'(N—j + 2, |
N—j+\)W(N—j |
+ 2) X |
XO(N—j |
+ 2, |
N—/+ |
1) + Ф' (N—j |
+ 2, |
N—j+\)X |
XW(N—j |
+ 2)W(N—j |
+ 2, N—j+\)S(N—j+\); |
|
(9-29) |
V)-! = x' (N-j |
+l)M (N—j |
+\)x |
(N—j |
+ 1 ), |
(9-30) |
где W и M — симметрические |
матрицы |
размера |
nXn. |
j-шаговая задача
Для / шагов управления из принципа оптимально сти следует, что
Vi = |
mm \х' |
(N - |
/ + 1) A (N - |
j + |
1) x(N - |
j + |
1) + |
|
u(N-j) |
|
|
|
|
|
|
|
+ a'(N-j)B(N-j)u(N-j) |
|
+ Vj_1). |
|
|
Подставляя |
сюда уравнение |
(9-30) и полагая |
|
|
W{N—i+l)=M(N—j+l)+A(N—j+\), |
|
(9-31) |
имеем: |
|
|
|
|
|
|
|
Vi = |
mjn |
(N - |
/ + 1 ) W (N - |
j + |
1 ) x (N - |
j + |
1 ) + |
|
' ^u'(N-j)B(N-j)u(N-j)\. |
|
|
|
(9-32) |
Однако согласно уравнению |
(9-6) |
|
|
|
x (N-j |
+ 1 ) = Ф {N—J+1, |
N-j) |
x (N-j) |
+ |
|
+ W(N-j+l, |
N-j) |
и |
(N-j) |
|
и уравнение (9-32) принимает вид: |
|
|
|
Vi = min [(Фх + |
Wu)' W {Фх - f Wu) + и'Bu] == |
|
u |
|
|
|
|
|
|
|
= min [х'Ф'ФФх |
+ л:'ФW u |
- f и'Ч^Фх |
+ |
U |
|
|
|
|
|
|
|
|
- f «' (WWW |
- f ß) |
и] = |
min |
[ Л ' Ф ' Г Ф Л + 2х'Ф'№Чы -f- |
|
|
|
« |
|
|
|
|
|
|
+ |
ы'(Т'й7ЧГ + |
Б)и]. |
|
(9-33) |
(Здесь в |
последней |
строке |
используется |
симметрич |
ность матрицы W). Аргументы для простоты записи опу |
щены. Однако в уравнении |
(9-33) |
подразумевается, что |
x = x(N—j); |
u = u(N—j); |
Ф = Ф(ЛГ—/+1, |
N—j); |
= W(N-j+l, |
N-j); |
B = B(N-j); |
|
|
W=W(N-j+\). |
Полагая градиент по и от выражения в квадратных скобках в (9-33) равным нулю, получаем уравнение
2x'(b'W4r |
+ 2u'(W'WW |
+ B)=0> |
(9-34) |
решение которого имеет вид: |
|
|
|
и (N—j) |
=-[W'(N-j+ |
1, |
N—j) |
W(N-j |
+ |
+ 1 ) Y (N—j |
+ 1, N-j) |
+ В (N-j) f-«F' (N-j |
+ |
+ |
1, |
|
N—j)W(N—j+\)<b(N—j+l, |
|
Полагая |
|
|
|
N-j)x(N-j). |
|
|
(9-35) |
|
|
|
|
|
|
|
|
5 ( / |
) |
= |
_(чг' ( i V - / + 1 , |
JV-/) |
Г (N-j |
+ |
+ 1 ) W(N-j |
|
+ 1 , |
—/) + В (N-j)]-i4" |
( Л Г - / + 1 , |
N—j) |
W(N-j |
+ 1 ) Ф {N—j - f 1, N—/'), |
(9-36) |
запишем закон управления в виде |
|
|
|
|
u(N-j) |
=S(N-j)x(N-j). |
|
(9-37) |
Сравнивая уравнения (9-31), (9-36) и (9-37) с уравне ниями (9-26), і(9-27) и (9-28), можно убедиться, что пер вые три уравнения совпадают с последними тремя, если не считать очевидного изменения времени на единицу.
Теперь легко вычислить Vj, подставляя |
(9-35) |
в урав |
нение (9-33) и получая |
|
|
|
Vj=[x'Q)'WOx—2x/0,WW(W,W4r |
+ |
|
+ Я ) - « F ' №фх+х'Ф' |
WW |
+ |
|
+ B)-WWOx] |
= x' (N—j) M (N—j) x(N—j), |
(9-38) |
где |
|
|
|
|
|
M (N—j) |
= Ф' (N—/ + 1 , |
N—j) W (N—j |
+ 1 ) X |
X<b(N—/+1, |
N—j)+0'(N—j+\, |
N—j)X |
|
XW(N-i+l)W(N-j+l, |
N-j)S(N-j). |
|
(9-39) |
Уравнения |
(9-39) |
и (9-38) |
имеют тот же вид, что и |
уравнения (9-29) и (9-30) при очевидной замене индек сов времени.
Оптимальное управление для задачи детерминиро ванного линейного регулятора теперь описывается урав
нениями |
(9-31) — (9-39). |
Индекс |
/ принимает |
значения |
/ = 1 , 2,...,N; |
вычисления начинаются с замены в |
урав |
нении (9-36) W(N) |
на |
A(N) |
при / = 1 для |
получения |
S(N—l). |
|
|
|
|
|
|
|
|
|
Возможно упрощение обозначений за счет введения |
новых индексов времени. Полагая |
k = N—/, |
из уравнений |
(9-31), |
(9-36) —(9-39) получаем: |
|
|
|
|
|
|
W(k+\)=M(k+l)+A(k+\); |
|
|
(9-40) |
S(k) |
=—[W(k+U |
k)W(k+l)W(k+l, |
k) + |
|
+B(k)]-^'(k |
+ \, |
k)W(k+l)0(k+l, |
k); |
(9-41) |
|
|
|
u(k)=S(k)x(k); |
|
|
|
(9-42) |
|
M(k)=ti)'(k+l, |
|
k)W(k |
+ l)Q>(k+l, |
k) |
+ |
|
|
+<H'(k + l, k)W(k+\)W(k+l, |
k)S(k); |
(9-43) |
|
|
VN-h=x'(k)M(k)x(k),- |
|
|
(9-44) |
где k = N—1, Л/—2, |
0, причем при начале вычислений |
в уравнении |
(9-41) |
используется |
значение |
W (N) |
=A(N). |
Уравнение (9-40) не участвует |
в вычислениях, |
пока |
k не |
достигнет значения |
N—2. |
|
|
|
|
|
Очевиден рекуррентный характер вычислений, прово димых при формировании оптимальной управляющей по следовательности. Как и в задаче оценки, это позволяет существенно экономить память вычислительной машины.