Файл: Специальные разделы теории управления. Оптимальное управление.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 05.05.2024
Просмотров: 89
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
t
t
t
≤
:
]
[
min
)
,
(
min
*
u
x
u
J
t
V
J
J
=
=
При решении задачи методом динамического программирования целесообразно руководствоваться последовательно- стью действий, изложенной в сводке общих процедур (см. табл. 2). В соответствии с табл. 2 составляем функцию
)
,
,
,
(
u
λ
x
t
H
(гамильтониан) для данной задачи
)
(
)
(
2 1
)
,
,
(
)
,
,
(
)
,
,
,
(
0
f
u
x
λ
u
u
x
u
u
x
x
x
l
x
l
u
x
λ
u
x
u
λ
x
T
3
T
2
C
B
A
P
N
N
Q
u
t
f
t
f
t
H
T
T
T
T
T
T
T
+
+
+
+
+
+
+
+
+
=
+
=
и заменяем сопряженный вектор
T
λ
на градиент
)
,
( x
x
t
V
(градиент
)
,
(
)
,
(
x
x
x
x
t
V
t
V
=
∂
∂
функции
)
,
( x
t
V
считается вектором-
строкой) функции V(t, x) по x:
)
(
)
2
(
2 1
)
,
,
,
(
f
u
x
u
u
u
x
x
x
u
l
x
l
u
x
x
T
3
T
2
x
C
B
A
V
P
N
Q
V
t
H
T
T
T
+
+
+
+
+
+
+
=
Дифференциальное уравнение Гамильтона–Беллмана (45) в данном случае имеет вид
0
)
(
)
2
(
2 1
min
=
+
+
+
+
+
+
+
+
+
∂
∂
f
u
x
u
u
u
x
x
x
u
l
x
l
x
T
3
T
2
u
C
B
A
V
P
N
Q
t
V
T
T
T
, (IV) где функция V(t, x) удовлетворяет граничному условию (55"):
x
x
x
l
x
T
1
1 1
2 1
)
,
(
R
t
V
T
+
=
. (V)
Поскольку, по предположению, P(t) – положительно определенная матрица, то минимум
)
,
,
,
(
u
x
x
V
t
H
достигается в стационарной точке, где
0
=
∂
∂
u
H
]
[
)
,
,
,
(
min arg
3 1
*
T
T
T
V
B
N
P
V
t
H
x
x
u
x
l
u
x
u
+
+
−
=
=
−
. (VI)
Подставляя теперь полученное выражение для u
*
в (VI), находим окончательный вид основного дифференциального уравнения динамического программирования (в данном случае это будет дифференциальное уравнение Гамильтона–Якоби, так как u
*
найдено из условия стационарности H):
)
VII
(
0 2
1 2
1 2
1 2
1 2
1 2
1 1
1 3
1 3
3 1
3 2
1 1
3 1
=
−
+
+
−
−
−
+
+
+
−
−
−
+
∂
∂
−
−
−
−
−
−
−
x
x
x
x
l
x
l
l
l
x
l
f
x
l
x
x
x
x
x
x
x
T
T
T
T
T
T
T
T
T
T
T
T
N
NP
Q
V
B
P
N
P
P
C
V
V
B
BP
V
N
BP
V
BP
V
Ax
V
t
V
Доказано, что в линейных системах с квадратичным критерием качества при сделанных предположениях относительно матриц Q(t), P(t), N(t),
1
R
решение уравнения (VII) с краевым условием (V) существует и его можно искать в виде
)
(
)
(
)
(
2 1
)
,
(
t
r
t
t
R
t
V
+
+
=
x
q
x
x
x
T
T
, (VIII) где R(t) – симметричная матрица размерности n
× n; q(t) – n-мерный вектор; r(t) – скаляр.
Частные производные функции V(t, x), записанной в форме (VIII), имеют вид
)
(
)
(
)
(
2 1
)
,
(
t
r
t
t
R
t
t
V
T
T
&
&
&
+
+
=
∂
∂
x
q
x
x
x
; (IX)
T
T
T
T
R
t
V
t
t
R
t
V
t
V
q
x
x
x
q
x
x
x
x
x
+
=
∂
∂
+
=
∂
∂
=
)
,
(
);
(
)
(
)
,
(
)
,
(
. (X)
Подставляя выражения (IX) и (X) в уравнение (VII) и учитывая, что:
1) при одновременном умножении произвольной матрицы М слева и справа на вектор x имеет место соотношение
x
x
x
x
)
(
2 1
T
T
T
M
M
M
+
=
(т.е. происходит выделение симметричной части
)
(
2 1
T
M
M
+
матрицы М);
2) скалярное произведение обладает свойством транспонируемости
y
b
b
y
T
T
=
, получим
)
XI
(
0 2
1 2
1
]
)
(
)
(
[
]
)
(
)
(
[
2 1
3 1
3 1
3 1
2 1
3 1
1 3
1 1
1 1
1
=
−
−
+
−
−
+
+
+
−
−
−
−
−
+
+
−
−
−
+
−
+
−
+
−
−
−
−
−
−
−
−
−
−
−
l
l
f
q
q
l
q
q
x
f
l
l
q
l
q
q
x
x
P
C
B
P
B
BP
r
R
C
N
P
R
B
BP
R
B
P
N
BP
A
R
B
RBP
N
NP
Q
R
N
BP
A
N
BP
A
R
R
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
&
&
&
Поскольку условие (XI) должно выполняться тождественно для любых значений x и поскольку при
1
t
t
=
для любых значений x должно выполняться тождественно следующее соотношение [см. (V) и (VIII)]
x
R
t
r
t
t
R
T
T
T
T
1 1
1 1
1 2
1
)
(
)
(
)
(
2 1
l
x
x
x
q
x
x
+
=
+
+
,
)
(
)
2
(
2 1
)
,
,
,
(
f
u
x
u
u
u
x
x
x
u
l
x
l
u
x
x
T
3
T
2
x
C
B
A
V
P
N
Q
V
t
H
T
T
T
+
+
+
+
+
+
+
=
Дифференциальное уравнение Гамильтона–Беллмана (45) в данном случае имеет вид
0
)
(
)
2
(
2 1
min
=
+
+
+
+
+
+
+
+
+
∂
∂
f
u
x
u
u
u
x
x
x
u
l
x
l
x
T
3
T
2
u
C
B
A
V
P
N
Q
t
V
T
T
T
, (IV) где функция V(t, x) удовлетворяет граничному условию (55"):
x
x
x
l
x
T
1
1 1
2 1
)
,
(
R
t
V
T
+
=
. (V)
Поскольку, по предположению, P(t) – положительно определенная матрица, то минимум
)
,
,
,
(
u
x
x
V
t
H
достигается в стационарной точке, где
0
=
∂
∂
u
H
]
[
)
,
,
,
(
min arg
3 1
*
T
T
T
V
B
N
P
V
t
H
x
x
u
x
l
u
x
u
+
+
−
=
=
−
. (VI)
Подставляя теперь полученное выражение для u
*
в (VI), находим окончательный вид основного дифференциального уравнения динамического программирования (в данном случае это будет дифференциальное уравнение Гамильтона–Якоби, так как u
*
найдено из условия стационарности H):
)
VII
(
0 2
1 2
1 2
1 2
1 2
1 2
1 1
1 3
1 3
3 1
3 2
1 1
3 1
=
−
+
+
−
−
−
+
+
+
−
−
−
+
∂
∂
−
−
−
−
−
−
−
x
x
x
x
l
x
l
l
l
x
l
f
x
l
x
x
x
x
x
x
x
T
T
T
T
T
T
T
T
T
T
T
T
N
NP
Q
V
B
P
N
P
P
C
V
V
B
BP
V
N
BP
V
BP
V
Ax
V
t
V
Доказано, что в линейных системах с квадратичным критерием качества при сделанных предположениях относительно матриц Q(t), P(t), N(t),
1
R
решение уравнения (VII) с краевым условием (V) существует и его можно искать в виде
)
(
)
(
)
(
2 1
)
,
(
t
r
t
t
R
t
V
+
+
=
x
q
x
x
x
T
T
, (VIII) где R(t) – симметричная матрица размерности n
× n; q(t) – n-мерный вектор; r(t) – скаляр.
Частные производные функции V(t, x), записанной в форме (VIII), имеют вид
)
(
)
(
)
(
2 1
)
,
(
t
r
t
t
R
t
t
V
T
T
&
&
&
+
+
=
∂
∂
x
q
x
x
x
; (IX)
T
T
T
T
R
t
V
t
t
R
t
V
t
V
q
x
x
x
q
x
x
x
x
x
+
=
∂
∂
+
=
∂
∂
=
)
,
(
);
(
)
(
)
,
(
)
,
(
. (X)
Подставляя выражения (IX) и (X) в уравнение (VII) и учитывая, что:
1) при одновременном умножении произвольной матрицы М слева и справа на вектор x имеет место соотношение
x
x
x
x
)
(
2 1
T
T
T
M
M
M
+
=
(т.е. происходит выделение симметричной части
)
(
2 1
T
M
M
+
матрицы М);
2) скалярное произведение обладает свойством транспонируемости
y
b
b
y
T
T
=
, получим
)
XI
(
0 2
1 2
1
]
)
(
)
(
[
]
)
(
)
(
[
2 1
3 1
3 1
3 1
2 1
3 1
1 3
1 1
1 1
1
=
−
−
+
−
−
+
+
+
−
−
−
−
−
+
+
−
−
−
+
−
+
−
+
−
−
−
−
−
−
−
−
−
−
−
l
l
f
q
q
l
q
q
x
f
l
l
q
l
q
q
x
x
P
C
B
P
B
BP
r
R
C
N
P
R
B
BP
R
B
P
N
BP
A
R
B
RBP
N
NP
Q
R
N
BP
A
N
BP
A
R
R
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
&
&
&
Поскольку условие (XI) должно выполняться тождественно для любых значений x и поскольку при
1
t
t
=
для любых значений x должно выполняться тождественно следующее соотношение [см. (V) и (VIII)]
x
R
t
r
t
t
R
T
T
T
T
1 1
1 1
1 2
1
)
(
)
(
)
(
2 1
l
x
x
x
q
x
x
+
=
+
+
,
то для определения матрицы R(t), вектора q(t) и скаляра r(t) получаем следующие уравнения и граничные условия:
1)
)
XII
(
;
0
)
(
)
(
)
(
)
(
1 1
1 1
1
=
+
+
+
−
+
+
=
−
−
+
−
−
+
−
+
−
−
−
−
−
Q
R
B
N
P
N
RB
R
A
RA
R
N
NP
Q
R
B
RBP
R
N
BP
A
N
BP
A
R
R
T
T
T
T
T
T
T
T
&
&
)
(
1 1
R
t
R
=
(XII')
2)
)
XIII
(
;
0
)
(
)
(
2 1
3 1
1 3
1
=
+
+
−
−
−
−
−
+
−
−
−
−
R
C
N
P
R
B
BP
R
B
P
N
BP
A
T
T
T
T
T
T
T
T
T
T
T
f
l
l
q
l
q
q&
T
T
t
1 1
)
(
l
q
=
. (XIII')
3)
0 2
1 2
1 3
1 3
1 3
1
=
−
+
−
−
−
−
−
l
l
f
q
q
l
q
q
P
C
B
P
B
BP
r
T
T
T
T
T
T
&
; (XIV)
0
)
(
1
=
t
r
. (XIV')
Полученные уравнения следует интегрировать в обратном времени от
1
t
t
=
к
0
t
t
=
Оптимальный закон управления с обратной связью имеет вид
)]
(
)
(
)
(
))
(
)
(
)
(
)[
(
)
,
(
3 1
*
t
t
t
B
t
N
t
R
t
B
t
P
t
T
T
T
l
q
x
x
u
+
+
+
−
=
−
. (XV)
Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качества приведены в табл. 3. В пп. 1 – 7 (строках 1 – 7) этой таблицы приведены постановка и решения задачи синтеза оптимального закона управления при свободных граничных условиях на правом конце траектории, а в п. 8 – постановка и решение задачи при заданных граничных условиях на правом конце. В пп. 1 – 6, 8 рассматриваются однородные линейные системы, в п. 7 – неоднородная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационар- ного квадратичного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 2 – для стационарной (независящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 3 – для стационарной системы и стационарного критерия качества на неограниченном интервале времени (
[ ]
∞
,
0
), в п. 4 – для нестационарной системы и нестационарного квадратичного критерия более общего вида, чем в пп. 1 – 3 (критерий содержит перекрестные члены типа
Nu
x
T
). В п. 5 приведено решение задачи, которая в оп- ределенном смысле эквивалентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано решение для оптимизации отклонения системы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза оптимального закона управления для неодно- родной линейной системы, в п. 8 – синтез оптимального закона управления при заданных граничных условиях на правом конце и квадратичном критерии более общего вида. Некоторые из приведенных в табл. 3 решений (пп. 1 – 4, 6, 7) являются частными случаями рассмотренной выше задачи.
Контрольные вопросы
1. Принцип оптимальности динамического программирования.
2. Ослабленное необходимое условие.
3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значения управляющих функций
№
строки
Уравнение движения системы
Начальные и конечные условия
Критерий качества J[u]
Оптимальный закон управле- ния
(в смысле минимума J[u])
u
*
= v
*
(x, t)
Оптимальное значение крите- рия качества
1 2 3
4 5
6 1
u
x
x
)
(
)
(
t
B
t
A
+
=
&
,
T
n
x
x
)
...,
,
(
1
=
x
,
T
m
u
u
)
...,
,
(
1
=
u
,
A(t) – матрица раз- мерности n
× n, B(t)
– матрица размер- ности n
× m
0
t
– задано,
0 0
)
(
x
x
=
t
–
задано,
1 0
t
t
t
≤
≤
1
t
– задано,
1 1
)
(
x
x
=
t
–
свободно
dt
t
P
t
Q
R
J
t
t
T
T
T
∫
+
+
+
=
1 0
]
)
(
)
(
[
2 1
2 1
]
[
1 1
1
u
u
x
x
x
x
u
)
(
,
1
t
Q
R
– положительно полуопределенные сим- метричные матрицы размерности n
× n;
P(t) – положительно определенная симмет-
x
u
)
(
)
(
)
(
1
*
t
R
t
B
t
P
T
−
−
=
, где R(t) – решение матрич- ного уравнения Риккати:
1 1
1
)
(
),
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
R
t
R
t
R
t
B
t
P
t
B
t
R
t
Q
t
R
t
A
t
A
t
R
t
R
T
=
+
+
−
−
−
−
=
−
&
(интегрирование от
1
t
до
0
t
) или
)
(
)
(
)
(
2 1
)
,
(
0 0
0 0
0
min
*
t
t
R
t
t
V
J
J
T
1)
)
XII
(
;
0
)
(
)
(
)
(
)
(
1 1
1 1
1
=
+
+
+
−
+
+
=
−
−
+
−
−
+
−
+
−
−
−
−
−
Q
R
B
N
P
N
RB
R
A
RA
R
N
NP
Q
R
B
RBP
R
N
BP
A
N
BP
A
R
R
T
T
T
T
T
T
T
T
&
&
)
(
1 1
R
t
R
=
(XII')
2)
)
XIII
(
;
0
)
(
)
(
2 1
3 1
1 3
1
=
+
+
−
−
−
−
−
+
−
−
−
−
R
C
N
P
R
B
BP
R
B
P
N
BP
A
T
T
T
T
T
T
T
T
T
T
T
f
l
l
q
l
q
q&
T
T
t
1 1
)
(
l
q
=
. (XIII')
3)
0 2
1 2
1 3
1 3
1 3
1
=
−
+
−
−
−
−
−
l
l
f
q
q
l
q
q
P
C
B
P
B
BP
r
T
T
T
T
T
T
&
; (XIV)
0
)
(
1
=
t
r
. (XIV')
Полученные уравнения следует интегрировать в обратном времени от
1
t
t
=
к
0
t
t
=
Оптимальный закон управления с обратной связью имеет вид
)]
(
)
(
)
(
))
(
)
(
)
(
)[
(
)
,
(
3 1
*
t
t
t
B
t
N
t
R
t
B
t
P
t
T
T
T
l
q
x
x
u
+
+
+
−
=
−
. (XV)
Решения некоторых других задач оптимального управления для линейных систем с квадратичным критерием качества приведены в табл. 3. В пп. 1 – 7 (строках 1 – 7) этой таблицы приведены постановка и решения задачи синтеза оптимального закона управления при свободных граничных условиях на правом конце траектории, а в п. 8 – постановка и решение задачи при заданных граничных условиях на правом конце. В пп. 1 – 6, 8 рассматриваются однородные линейные системы, в п. 7 – неоднородная линейная система. В п. 1 дано решение задачи синтеза для нестационарной линейной системы и нестационар- ного квадратичного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 2 – для стационарной (независящей явно от t) системы и стационарного критерия качества при фиксированном конечном интервале времени процесса управления, в п. 3 – для стационарной системы и стационарного критерия качества на неограниченном интервале времени (
[ ]
∞
,
0
), в п. 4 – для нестационарной системы и нестационарного квадратичного критерия более общего вида, чем в пп. 1 – 3 (критерий содержит перекрестные члены типа
Nu
x
T
). В п. 5 приведено решение задачи, которая в оп- ределенном смысле эквивалентна задаче п. 4 (см. 5-й столбец таблицы), в п. 6 дано решение для оптимизации отклонения системы от заданного желаемого поведения, в п. 7 рассмотрен случай синтеза оптимального закона управления для неодно- родной линейной системы, в п. 8 – синтез оптимального закона управления при заданных граничных условиях на правом конце и квадратичном критерии более общего вида. Некоторые из приведенных в табл. 3 решений (пп. 1 – 4, 6, 7) являются частными случаями рассмотренной выше задачи.
Контрольные вопросы
1. Принцип оптимальности динамического программирования.
2. Ослабленное необходимое условие.
3 Оптимизация линейных систем с квадратичным критерием качества при отсутствии ограничений на значения управляющих функций
№
строки
Уравнение движения системы
Начальные и конечные условия
Критерий качества J[u]
Оптимальный закон управле- ния
(в смысле минимума J[u])
u
*
= v
*
(x, t)
Оптимальное значение крите- рия качества
1 2 3
4 5
6 1
u
x
x
)
(
)
(
t
B
t
A
+
=
&
,
T
n
x
x
)
...,
,
(
1
=
x
,
T
m
u
u
)
...,
,
(
1
=
u
,
A(t) – матрица раз- мерности n
× n, B(t)
– матрица размер- ности n
× m
0
t
– задано,
0 0
)
(
x
x
=
t
–
задано,
1 0
t
t
t
≤
≤
1
t
– задано,
1 1
)
(
x
x
=
t
–
свободно
dt
t
P
t
Q
R
J
t
t
T
T
T
∫
+
+
+
=
1 0
]
)
(
)
(
[
2 1
2 1
]
[
1 1
1
u
u
x
x
x
x
u
)
(
,
1
t
Q
R
– положительно полуопределенные сим- метричные матрицы размерности n
× n;
P(t) – положительно определенная симмет-
x
u
)
(
)
(
)
(
1
*
t
R
t
B
t
P
T
−
−
=
, где R(t) – решение матрич- ного уравнения Риккати:
1 1
1
)
(
),
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
)
(
R
t
R
t
R
t
B
t
P
t
B
t
R
t
Q
t
R
t
A
t
A
t
R
t
R
T
=
+
+
−
−
−
−
=
−
&
(интегрирование от
1
t
до
0
t
) или
)
(
)
(
)
(
2 1
)
,
(
0 0
0 0
0
min
*
t
t
R
t
t
V
J
J
T
1 ... 4 5 6 7 8 9 10 11 ... 15
x
x
x
×
×
=
=
=
=
=
ричная матрица размер- ности m
× m
1 1
1 1
1 1
1 1
1 1
)
(
))
(
(
−
−
−
−
−
−
−
−
=
+
−
−
+
=
R
t
R
QR
R
B
BP
A
R
AR
t
R
dt
d
T
T
2
u
x
x
B
A
+
=
&
A, B – постоянные матрицы размер- ности n
× n и n × m, соответственно
T
n
x
x
)
...,
,
(
1
=
x
,
T
m
u
u
)
...,
,
(
1
=
u
0 0
=
t
,
0 0
)
(
x
x
=
t
–
задано,
1 0
t
t
≤
≤
1
t – задано,
1 1
)
(
x
x
=
t
,
1
x
– сво- бодно
,
]
[
2 1
2 1
]
[
1 0
1 1
1
∫
+
+
+
=
t
T
T
T
dt
P
Q
R
J
u
u
x
x
x
x
u
1
, R
Q
– постоянные положительно полуоп- ределенные симмет- ричные матрицы раз- мерности n
× n; P – по- стоянная положительно определенная симмет- ричная матрица раз- мерности m
× m
x
u
)
(
1
*
t
t
K
−
−
=
, где
)
(
)
(
1 1
1
t
t
R
B
P
t
t
K
T
−
=
−
−
)
(
1
t
t
R
− – решение мат- ричного уравнения Рикка- ти:
1 1
1 1
0
,
,
)
0
(
),
(
)
(
)
(
)
(
t
t
t
R
R
R
B
BP
R
Q
R
A
A
R
d
dR
T
T
≤
τ
≤
−
=
τ
=
τ
τ
−
−
+
τ
+
τ
=
τ
−
0
)
(
)
(
)
(
2 1
)
,
(
0 0
0 1
0 0
0
min
*
=
−
×
×
=
=
=
=
=
t
t
t
t
R
t
t
V
J
J
T
x
x
x
3
u
x
x
B
A
+
=
&
A, B – постоянные матрицы размер- ности n
× n и n × m, соответственно
,
)
...,
,
(
,
)
...,
,
(
1 1
Y
m
T
n
u
u
x
x
=
=
u
x
,
)
...,
,
(
,
)
...,
,
(
1 1
T
T
u
x
m
n
u
u
x
x
=
=
0 0
=
t
,
0 0
)
(
x
x
=
t
– задано,
∞
=
≤
≤
1 0
t
t
,
)
(
1
t
x
– свободно
,
]
[
2 1
]
[
0
dt
P
Q
J
T
T
∫
∞
+
=
=
u
u
x
x
u
Q – постоянная поло- жительно полуопреде- ленная симметричная матрица размерности n
× n; P – постоянная положительно опреде- ленная симметричная матрица размерности m
× m u* = –Kx, где
0 1
R
B
P
K
T
−
=
– посто- янная матрица;
0
R – уста- новившееся решение мат- ричного уравнения Рикка- ти, т.е.
)
(
lim
0
τ
=
∞
→
τ
R
R
, где
0
)
0
(
;
1
=
−
−
+
+
=
τ
−
R
R
B
RBP
Q
R
A
RA
d
dR
T
T
0 0
0 0
0
min
*
2 1
)
,
(
x
x
x
R
t
V
J
J
T
=
=
=
=
=
3 0
R
может быть также оп- ределена из квадратного алгебраического матрич- ного уравнения Риккати
0 0
1 0
0 0
=
−
−
+
+
−
R
B
BP
R
Q
R
A
A
R
T
T
как его единственное по- ложительно определенное решение
4
u
x
x
)
(
)
(
t
B
t
A
+
=
&
, где A(t), B(t), x, u – матрицы и векто- ры, определенные в п. 1 0
t
– задано,
0 0
)
(
x
x
=
t
– задано,
,
1 0
t
t
t
≤
≤
1
t
– задано,
,
]
,
[
2 1
2 1
]
[
1 0
1 1
1
dt
P
N
N
Q
R
J
T
t
t
T
T
T
×
×
+
=
∫
u
x
u
x
x
x
u
x
u
]
[
1
*
T
T
N
R
B
P
+
−
=
−
, где
× m
1 1
1 1
1 1
1 1
1 1
)
(
))
(
(
−
−
−
−
−
−
−
−
=
+
−
−
+
=
R
t
R
QR
R
B
BP
A
R
AR
t
R
dt
d
T
T
2
u
x
x
B
A
+
=
&
A, B – постоянные матрицы размер- ности n
× n и n × m, соответственно
T
n
x
x
)
...,
,
(
1
=
x
,
T
m
u
u
)
...,
,
(
1
=
u
0 0
=
t
,
0 0
)
(
x
x
=
t
–
задано,
1 0
t
t
≤
≤
1
t – задано,
1 1
)
(
x
x
=
t
,
1
x
– сво- бодно
,
]
[
2 1
2 1
]
[
1 0
1 1
1
∫
+
+
+
=
t
T
T
T
dt
P
Q
R
J
u
u
x
x
x
x
u
1
, R
Q
– постоянные положительно полуоп- ределенные симмет- ричные матрицы раз- мерности n
× n; P – по- стоянная положительно определенная симмет- ричная матрица раз- мерности m
× m
x
u
)
(
1
*
t
t
K
−
−
=
, где
)
(
)
(
1 1
1
t
t
R
B
P
t
t
K
T
−
=
−
−
)
(
1
t
t
R
− – решение мат- ричного уравнения Рикка- ти:
1 1
1 1
0
,
,
)
0
(
),
(
)
(
)
(
)
(
t
t
t
R
R
R
B
BP
R
Q
R
A
A
R
d
dR
T
T
≤
τ
≤
−
=
τ
=
τ
τ
−
−
+
τ
+
τ
=
τ
−
0
)
(
)
(
)
(
2 1
)
,
(
0 0
0 1
0 0
0
min
*
=
−
×
×
=
=
=
=
=
t
t
t
t
R
t
t
V
J
J
T
x
x
x
3
u
x
x
B
A
+
=
&
A, B – постоянные матрицы размер- ности n
× n и n × m, соответственно
,
)
...,
,
(
,
)
...,
,
(
1 1
Y
m
T
n
u
u
x
x
=
=
u
x
,
)
...,
,
(
,
)
...,
,
(
1 1
T
T
u
x
m
n
u
u
x
x
=
=
0 0
=
t
,
0 0
)
(
x
x
=
t
– задано,
∞
=
≤
≤
1 0
t
t
,
)
(
1
t
x
– свободно
,
]
[
2 1
]
[
0
dt
P
Q
J
T
T
∫
∞
+
=
=
u
u
x
x
u
Q – постоянная поло- жительно полуопреде- ленная симметричная матрица размерности n
× n; P – постоянная положительно опреде- ленная симметричная матрица размерности m
× m u* = –Kx, где
0 1
R
B
P
K
T
−
=
– посто- янная матрица;
0
R – уста- новившееся решение мат- ричного уравнения Рикка- ти, т.е.
)
(
lim
0
τ
=
∞
→
τ
R
R
, где
0
)
0
(
;
1
=
−
−
+
+
=
τ
−
R
R
B
RBP
Q
R
A
RA
d
dR
T
T
0 0
0 0
0
min
*
2 1
)
,
(
x
x
x
R
t
V
J
J
T
=
=
=
=
=
3 0
R
может быть также оп- ределена из квадратного алгебраического матрич- ного уравнения Риккати
0 0
1 0
0 0
=
−
−
+
+
−
R
B
BP
R
Q
R
A
A
R
T
T
как его единственное по- ложительно определенное решение
4
u
x
x
)
(
)
(
t
B
t
A
+
=
&
, где A(t), B(t), x, u – матрицы и векто- ры, определенные в п. 1 0
t
– задано,
0 0
)
(
x
x
=
t
– задано,
,
1 0
t
t
t
≤
≤
1
t
– задано,
,
]
,
[
2 1
2 1
]
[
1 0
1 1
1
dt
P
N
N
Q
R
J
T
t
t
T
T
T
×
×
+
=
∫
u
x
u
x
x
x
u
x
u
]
[
1
*
T
T
N
R
B
P
+
−
=
−
, где
1 1
)
(
x
x
=
t
,
1
x
– свободно где
0 1
≥
−
−
T
N
NP
Q
;
N(t) – матрица размер- ности n
× m; P(t) – по- ложительно опреде- ленная матрица раз- мерности m
× m;
1
R
– см. п. 1 1
1 1
)
(
,
)
(
)
(
R
t
R
Q
R
B
N
P
N
RB
R
A
RA
R
T
T
T
=
−
+
×
×
+
+
+
−
−
=
−
&
5
,
)
(
1
u
x
x
B
N
BP
A
T
+
+
−
=
−
&
где A(t), B(t), x, u – матрицы и векто- ры, определенные в п. 1; P(t), N(t) – матрицы, опреде- лённые в п. 4 0
t – задано,
0
x – зада- но,
,
1 0
t
t
t
≤
≤
1
t – задано,
1 1
)
(
x
x
=
t
,
1
x
– свободно
dt
P
N
NP
Q
R
J
T
t
t
T
T
T
−
×
×
+
+
=
−
∫
u
x
u
x
x
x
u
,
0 0
,
]
,
[
2 1
2 1
]
[
1 1
1 1
1 0
,
1
*
)
4
(
1
*
x
u
x
u
T
T
N
P
R
B
P
−
−
+
=
=
−
=
где R и
*
)
4
(
u
определены в п. 4 6
u
x
x
)
(
)
(
t
B
t
A
+
=
&
, где A(t), B(t), x, u – матрицы и векто- ры, определенные в п. 1 0
t – задано,
0
x – зада- но,
,
1 0
t
t
t
≤
≤
1
t – задано,
1 1
)
(
x
x
=
t
,
1
x – свободно
,
]
)
(
)
)
(
)
(
)(
(
)
)
(
)
(
[(
2 1
]
[
1 0
dt
t
P
t
M
t
t
Q
t
M
t
J
T
T
t
t
u
u
x
y
x
y
u
+
−
−
−
−
=
∫
где y(t) – заданная функция
(желаемый выходной сигнал); M(t)
– матрица размерности n
× n; P(t), Q(t) – см. п. 2;
M(t)x – полученный выходной сигнал
T
n
y
y
y
)
...,
,
,
(
2 1
=
y
),
(
)
(
*
t
t
C
h
x
u
+
−
=
где
,
;
1 1
g
h
T
T
B
P
R
B
P
C
−
−
=
=
а матрица R(t) и вектор g(t) определяется из решений уравнений:
,
0
)
(
,
1 1
=
−
+
+
−
−
=
−
t
R
QM
M
R
B
RBP
R
A
RA
R
T
T
T
&
,
)
(
1
y
g
g
Q
M
B
RBP
A
T
T
T
+
+
−
−
=
−
&
0
)
(
1
=
t
g
7
),
(
)
(
)
(
t
t
B
t
A
f
u
x
x
+
+
+
=
&
где f(t) – известный
n-мерный вектор; элементы A(t), B(t),
x
, u – определены в п. 1 0
t
– задано,
0 0
)
(
x
x
=
t
– задано,
1 0
t
t
t
≤
≤
,
1
t
– задано,
1 1
)
(
x
x
=
t
– свободно
,
]
)
(
)
(
[
2 1
2 1
]
[
1 0
1 1
1
dt
t
P
t
Q
R
J
t
t
T
T
T
∫
+
×
×
+
=
u
u
x
x
x
x
u
)
(
),
(
,
1
t
P
t
Q
R
– см. п. 1
),
(
1
*
w
x
u
+
−
=
−
R
B
P
T
где
0
)
(
,
)
(
,
)
(
,
1 1
1 1
1
=
−
−
=
=
+
−
−
−
−
=
−
−
t
R
A
B
RBP
R
t
R
R
B
RBP
Q
R
A
RA
R
T
T
T
T
w
f
w
w&
&
8
u
x
x
)
(
)
(
t
B
t
A
+
=
&
, где A(t), B(t), x, u – матрицы и векторы, определенные в п. 1 0
t
– задано,
0 0
)
(
x
x
=
t
–
задано,
1 0
t
t
t
≤
≤
,
1
t
– задано,
1 1
)
(
φ
=
t
Mx
,
M – матрица
(q
×
n);
1
φ
– заданный
q-мерный вектор q
≤ n
,
2 1
]
)
(
)
(
2
)
(
[
2 1
]
[
1 1
1 1
0
x
x
u
u
u
x
x
x
u
R
dt
t
P
t
N
t
Q
J
T
T
T
t
t
T
+
+
+
+
=
∫
Q (t), N(t), P(t),
1
R
–
см. п. 1
,
)]
*
(
[
1 1
1 1
1
*
φ
−
−
−
×
×
+
−
=
−
−
−
−
FG
B
P
F
FG
R
B
N
P
T
T
T
T
x
u
где
,
)
(
),
(
)
(
1 1
1
R
t
R
R
B
N
P
N
RB
Q
R
A
RA
R
T
T
T
=
+
+
+
+
−
−
−
=
−
&
0
)
(
,
,
)
(
,
]
)
(
[
1 1
1 1
=
=
=
+
−
−
=
−
−
t
G
F
B
BP
F
G
M
t
F
F
B
P
N
RB
A
F
T
T
T
T
T
&
&
1 1
0 1
1 0
1 0
0 0
0
min
*
2 1
)
(
))
(
)
(
)
(
)
(
(
2 1
)
,
(
−
−
−
φ
−
×
×
φ
+
+
×
×
−
−
=
=
=
=
=
G
FG
t
F
t
G
t
F
t
R
t
V
J
J
T
T
T
x
x
x
x
Г л а в а 6
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
ОСОБОГО УПРАВЛЕНИЯ
6.1. Краткая формулировка задачи
При решении задач встречаются случаи, когда управление u входит в дифференциальные уравнения математической модели объекта линейно,
u
x
x
γ
u
x
f
x
)
,
(
)
,
(
)
,
,
(
t
R
t
t
dt
d
+
=
=
, (56) где
;
,
)
...,
,
,
(
;
,
)
...,
,
,
(
2 1
2 1
m
T
m
n
T
n
U
u
u
u
X
x
x
x
∈
=
∈
=
u
u
x
x
;
)
...,
,
,
(
2 1
T
n
γ
γ
γ
=
γ
],
,
[
;
)
,
1
,
,
1
(
)}
,
(
{
1 0
t
t
t
m
j
n
i
t
r
R
ij
∈
=
=
=
x
а критерий качества имеет вид
)
57
(
,
)]
,
(
)
,
(
[
)
,
,
,
(
)
,
,
(
)
,
,
,
(
]
,
,
,
,
[
1 0
1 0
0 0
1 0
1 0
0 1
0 1
0 1
0 1
0
∫
∫
+
+
+
Φ
=
+
Φ
=
t
t
T
t
t
dt
t
t
t
t
dt
t
f
t
t
t
t
J
x
r
u
x
γ
x
x
u
x
x
x
x
x
u
где
T
m
r
r
r
)
...,
,
,
(
0 02 01 0
=
r
;
∑
=
=
m
j
j
T
u
r
1 0
0
r
u
Функция Гамильтона H для (56), (57) имеет вид
)
58
(
)
,
(
)
,
(
0 1
0 0
0 1
0
∑
∑ ∑
∑
∑ ∑
∑
=
=
=
=
=
=
=
λ
+
γ
λ
=
=
λ
+
γ
λ
=
λ
=
n
i
m
j
j
n
i
ij
i
i
i
n
i
n
i
m
j
j
ij
i
n
i
i
i
i
i
u
r
t
u
r
t
f
H
x
x
Если
m
U
– m-мерный прямоугольник:
)
,
1
(
},
...,
,
,
)
...,
,
,
(
{
2 2
2 1
1 1
2 1
m
j
b
a
b
u
a
b
u
a
b
u
a
u
u
u
U
j
j
m
m
m
T
m
m
=
<
≤
≤
≤
≤
≤
≤
=
= u
(
j
j
b
a ,
могут зависеть от t), то в силу принципа максимума (см. п. 4.3) для минимизации J[u] оптимальное управление опре- деляется из условия
)
,
,
,
(
min arg
λ
=
∈
u
x
u
u
t
H
m
U
(59) или
<
λ
>
λ
=
∑
∑
=
=
n
i
ij
i
j
n
i
ij
i
j
j
r
b
r
a
u
0 0
0
при
;
0
при
(60)
При некоторых значениях x и
λ
функция H в (58) может оказаться независящей явно от какой-либо компоненты
j
u
на отрезке
0
]
,
[
1 2
2 1
>
τ
−
τ
τ
τ
. В этом случае выполняется соотношение (рис. 9)
0
)
,
(
)
,
,
(
0
≡
λ
=
Φ
∑
=
n
i
ij
i
j
t
r
t
1 ... 5 6 7 8 9 10 11 12 ... 15