|
+ |
— 1) Д*]Д/ |
\==UmE\x'{t0-t-Nbt)Ax(t0-\-Nàt) |
+ |
|
|
+ E |
|
(t0 |
+ |
iAt) A (ta |
+ |
iAt) x (t0 |
+ iAt) At -f |
+ |
S |
[t0 A-(i-i)At]B |
[ f 0 + ( i |
- |
1) Af] u [ r 0 - f ( i - |
1) Af] Atj. |
|
Для известного |
Л7 введем |
обозначение |
(10-14) |
|
|
|
|
У„ = |
E J |
(f0 + ЛГДО Ах [t0 + |
JVДО + |
|
|
|
N |
|
|
- f iAt) A {t0 |
Ar iAt) x {t0 |
Ar Ш) M - f |
|
|
+ £ |
|
(*0 |
|
N |
|
|
|
|
|
|
|
|
|
j |
+ |
S |
" ' M - С - |
i ) A O ß U . + |
( « - |
1)A*]"IU-0'-1)AOA* |
и заметим, |
что |
|
|
|
|
|
|
|
(10-15) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
У=1іга/Л ,, |
|
|
|
|
|
|
|
|
|
JV->oo |
|
|
|
если |
At-^0, |
при условии NAt = |
t1—t0. |
|
Уравнение (10-15) определяет критерий качества для эквивалентной дискретной задачи. Сравнивая это урав нение с уравнением (9-3) для дискретной задачи стоха стического линейного регулятора, получаем следующие соотношения:
|
|
|
|
|
|
|
|
А(І)=\АѴ» |
+ Ш)Ы |
Для |
t ' = l , 2 , .... |
|
( l Q |
1Л + Л(*,)Д* |
для |
i=N; |
|
|
|
—1) = |
В[*0 |
+ ( І - 1 ) Д * ] Д* для |
» = |
1,2, |
N. (10-17) |
Физически |
реализуемые |
управления |
|
) |
Как |
уже |
отмечалось |
ранее |
и |
как |
показано на |
рис. 10-1, требуется, чтобы |
дискретный сигнал управле |
ния u(t) |
был кусочно-постоянным. Теперь |
дополнитель |
но потребуем, чтобы он был функцией |
только физически |
доступных данных о состоянии системы. Для этого представим уравнение (10-4) в дискретном виде:
|
|
|
|
|
|
|
|
u(t)=ii,[z(t0 |
+ iàt); |
t = 0, |
1, . . . , / ; x (to)], |
(10-18) |
где-* = *о + /А*; / = 0, |
1, . . . . N— 1. |
|
|
|
|
Эквивалентная |
задача |
|
|
|
|
|
Для заданного |
значения |
Л/ задача, |
описываемая |
уравнениями (10-5), |
(10-9), (10-15) и (10-18), в которой |
требуется определить управляющую |
последовательность |
{u(t)\ t — tc + jàt; |
/ = 0, 1, |
N—1}, |
минимизирующую |
значение JN, В ТОЧНОСТИ совпадает с задачей |
дискретного |
стохастического |
линейного |
регулятора |
из гл. 9. |
|
В то же время в пределе при At—>-0 и Л/ таком, что |
Л/А/ = /і—to, она |
является |
задачей непрерывного |
стоха |
стического линейного регулятора, поставленной в § 10-1. Следовательно, теперь к этой задаче можно приме
нить результаты гл. 9 и рассмотреть предельное |
поведе |
ние полученного алгоритма управления. |
|
|
|
|
10-3. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ |
|
|
|
|
|
Для заданного N |
и любого |
t = t0 + jAt; |
/ = 0, |
1, |
|
А/—1 применение результатов гл. 9 к поставленной |
здесь дискретной задаче приводит к следующей |
системе |
уравнений |
оптимального управления: |
|
|
|
|
|
|
u(t)=S(t)x{t |
|
|
\ t); |
|
|
(10-19) |
W (t + At) = |
M (t - f At) + A (t + |
Д/) Д^; |
(10-20) |
S(t) = |
— \W (t -f- At, t) W (t + |
Ai) W(t |
+ |
At, t) - f |
|
-\-B(i)At]-1W'(t-]-At, |
|
t)W(t |
+ |
At)U>(t + At, t); |
(10-21) |
M (t) = Ф' (t - f |
t)W(t |
+ |
At) Ф(* + |
Af, t) — |
|
|
- Ф'(/ + A f , t)W(t |
+ At)4r(t + |
At, t)[4F'(t |
+ |
At, t)W(t |
+ |
|
+ At)W{t |
+ |
At, t) + |
B(t) Аі]~1хР'(і |
+ |
|
|
|
- f At, t) W (t - f At) Ф(і-{- |
At, |
t). |
|
(10-22) |
При составлении этих уравнений использованы урав |
нения (9-46) —(9-48), |
(9-80), (10-16) и |
(10-17). |
|
|
Значения / при |
вычислении |
|
S(t), |
как это видно |
из |
уравнений |
(10-20) —(10-22), |
равны t = t0 |
+ (N-l)At, |
|
t0 + |
+ (N—2)At, |
to+At, |
U. |
|
|
|
|
|
|
|
|
Вычисления начинаются с граничного условия
W(to+№t)=W(t1)=A+A(ti)At, |
(10-23) |
полученного из уравнения (10-16). Последовательность
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
вычислений, |
разумеется, |
совпадает |
с |
последователь |
ностью вычислений в гл. 9. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Из уравнения |
(10-20) |
имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M(t)=W(t)—A(t)At. |
|
|
|
|
|
|
(10-24) |
|
Подставляя этот результат в левую часть (10-22) и |
решая |
полученное уравнение относительно W(t), |
имеем: |
|
|
|
W (t) = |
Ф' (t + |
Д*, t)W(t |
+ |
At) Ф (t + |
At, t) |
- |
|
|
|
- |
Ф'(^ + |
Д ^ |
t)W(t |
+ At)W(t |
+ |
At, |
t)[W'(t |
+ |
At, t)W(t |
+ |
|
|
+ |
At)W(t |
+ |
At, t) + |
B(t) At}~lW |
(t + At, t)W (t |
+ |
|
|
|
|
|
|
|
|
+ |
At) Ф (t + |
|
t) + |
A (t) At. |
|
|
|
|
(10-25) |
|
Подставляя |
соотношения |
(10-6) — (10-8) |
|
в |
уравнение |
(10-25) и раскрывая скобки, получаем: |
|
|
|
|
|
|
|
|
|
|
|
W (t) = |
[/ + F (t) At + |
О (At2)}' |
W(t + |
At) [I |
+ |
|
|
|
- f |
F (t) At + |
О {At2)] - |
|
[I + F (t) At + |
О (At2)}' |
W (t |
+ |
|
+ |
At) [C (t) At + |
O (At2)} |
{[C (t) At + О (At2)]' |
W {t |
+ |
|
|
|
|
|
+ At) [C (t) At + О (At2)} |
-\-B(t) |
At}'1 |
[C(t) At |
+ |
|
|
|
+ |
О (At2)}' |
W(t |
+ At) [I + |
F (t) At + O (At2)] |
+ |
A (t) At |
|
= |
= |
W{t+At) |
|
+ |
F' (t) W (t + |
At) At + |
W{t-[- |
At) F (t) At |
|
- |
|
- |
W (t + |
At) С (t) [C (t) W(t-{- |
At) С (t) At2 |
+ |
В (t) At |
+ |
|
+ |
О (At3)} -1 С |
(t) At2W (t + |
At) + |
A (t) At + |
O (At2) = |
|
|
= |
W{t + |
|
At) + |
F'{t)W(t |
|
+ |
At) At + W (t + |
At) F (t) At |
- |
-W(t |
|
+At) |
|
С (t) [C (t) W (t+Af) |
С (t) At + ß (t)} -1С |
(t) W ( 4 - |
|
|
|
|
|
|
+ |
At) At + |
A (t) At + |
O {At*). |
|
|
|
|
(10-26) |
|
Полагая, |
что |
предел |
W(t+At) |
при At—>-0 |
сущест |
вует, из уравнения (10-26) |
имеем: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
l\vaW{t |
+ |
At) = W(t). |
|
|
|
|
|
|
|
|
|
Тогда, |
переписывая уравнение (10-26) в виде |
|
|
|
|
|
W(t) |
— W(t + |
At) = |
F' (t) W{t + At) At + |
W (t |
+ |
|
|
|
+ |
At) F (t) At — W (t+ |
At) С (t) [С (t) W(t + At) С (t) At |
+ |
|
|
|
+ В (t)} -1С |
(t) W(t |
+ |
At) At + |
A (t) At + |
O |
(Af), |
|
|
деля обе его части на Al и переходя к пределу при At—>-0, получаем матричное дифференциальное урав нение
— W(t) = F' (t) W(t) + |
W (t) F |
(t)~ |
|
- W(t)C{t)B-4t)C'{t)W{t) |
+ |
A(t), |
(10-27) |
где t теперь обозначает непрерывное |
время, |
причем |
fo<:f<*i .
Из уравнения (10-23) следует, что граничное усло вие, соответствующее уравнению (10-27), имеет вид:
№ ( 0 ) = Л .
Это условие получается в результате предельного перехода в выражении (10-23) при At—>-0.
Теперь рассмотрим предельное поведение уравнения (10-21). Подставляя в него соотношения (10-6) и (10-8), имеем:
|
S(t)= |
— {{С (t) At + О (At2)]' W(t + At) [С (t)"At + |
|
+ |
О (M2)} |
- f В (t) At} - 1 |
[C (t) At A-О (At2)}' W(t |
+ |
bt)\I |
+ |
|
+ F (t) At + О (At2)] |
== - [С (t) W (t A- ДО С (t) At2 |
+ |
|
-f- B (t) At A- О (ДО] - 1 [ С (0 W (t -f- ДО At - f О (At2)} |
= |
= - |
[С (0 W(t + ДО С (0 |
At А-В |
(t) А-О (At2)]'1 |
[С |
(t) W (t - f |
|
|
+ |
д/) + |
о ( д о ] . |
|
|
|
|
В пределе при At—>-0 отсюда следует, что |
|
|
|
|
S(i)=—B-i(t)C,(t)W(t) |
|
(10-28) |
ДЛЯ tos^ts^.ti. |
|
в пределе при А^—*-0 остает |
|
Вид уравнения (10-19) |
ся |
прежним: |
|
|
|
|
|
|
|
|
u(t) |
= |
S (t)x (t\ t) |
|
(10-29) |
для to<cZ-t<£Zti. Оптимальное управление для задачи не прерывного стохастического линейного регулятора опи сывается уравнениями (10-27) — (10-29).
|
|
|
Для определения матрицы передачи обратной |
связи |
S(t) |
требуется решить систему обыкновенных диффе |
ренциальных уравнений первого порядка (10-27) |
при |
граничном условии № ( 0 ) = Л . Ясно, что вычисления |
сле |
дует |
проводить в обратном времени, начиная с 0. Урав |
нение (10-27) является матричным дифференциальным уравнением Риккати, точно таким же, какое было рас-