Файл: Специальные разделы теории управления. Оптимальное управление.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 05.05.2024
Просмотров: 62
Скачиваний: 0
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
x
t
может толковаться либо как связь, наложенная на начальные значения
)
,
(
0 0
x
t
, либо как связь, наложенная на конечные значения
)
,
(
1 1
x
t
, в зависимости от порядка следования участков с
0 1
>
φ
и
0 1
=
φ
При трех участках, если сначала идет граничный участок, затем участок с
0 1
>
φ
и далее снова граничный участок, множители тоже непрерывны вдоль всей траектории. При всех других порядках следования участков, если последних боль- ше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях
)
(t
i
λ
можно осуществить на любом конце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, на котором происходит скачок, не имеет значения). Если этот конец выбран в момент времени
2
t′
, то условия скачка имеют вид
x
λ
λ
∂
φ
∂
−
=
−
+
)
(
)
(
)
(
2 1
2 2
t
C
t
t
; (81)
t
t
C
t
H
t
H
∂
′
∂φ
+
′
=
′
−
+
)
(
)
(
)
(
2 1
2 1
2
; (82)
0
)
(
2 1
=
′
φ
−
t
, (83) где С – произвольная постоянная; индексы «+» и «–» обозначают пределы справа и слева, соответственно.
Если условия (81) подставить в (82), то коэффициент при С будет
1
φ&
и, таким образом, условие (82) не зависит от С, а содержит только значения
)
(
2
t′
λ
−
. После указанной подстановки уравнение (82) может быть использовано в качестве экви- валентного необходимого условия.
В данной задаче решение
)
(
),
(
t
t λ
x
не зависит от
0
i
λ
, С как от параметров
)
,
,
(
);
,
,
(
0 0
C
t
C
t
i
i
λ
=
λ
=
λ
λ
x
x
В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина С не может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точку схода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом пара- метров, что существенно усложняет ее практическое решение даже с помощью ЭВМ.
П р и м е р 3. Пусть имеются три участка оптимальной траектории, следующие в таком порядке:
1 участок – траектория в открытой области,
0 1
>
φ
;
2 участок – граничная траектория,
0 1
=
φ
;
3 участок – снова траектория в открытой области,
0 1
>
φ
Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных
C
t
i
,
,
1 0
λ
. Условия
(82), (83) и
0
)
0
(
2
=
+
′
β t
(84) определяют точку
2
t′
и дают дополнительное уравнение относительно неизвестных
C
t
i
,
,
1 0
λ
. Задача, таким образом, све- лась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными.
Если участков больше, чем три, задача сводится к многоточечной краевой проблеме.
7.4. Второй тип необходимых условий для оптимальности
управления на граничных участках
Пусть вх
t
– момент входа траектории на границу допустимой области, сх
t
– момент схода с этой границы. Гамильтони- ан
2
H
для граничных участков может быть представлен в следующем виде:
1 2
1 1
1 1
2 1
1 0
0 2
φ
β
+
φ
β
+
=
φ
β
+
φ
β
+
λ
+
λ
=
∑
=
&
&
H
f
f
H
n
i
i
i
, где
,
0 2
1
=
β
=
β
если
0 1
>
φ
;
0
,
0 2
1
≠
β
≠
β
, если
0 1
=
φ
, а
1
φ&
определяется правой частью соотношения (78).
На граничном участке (т.е. при сх вх
t
t
t
≤
≤
) вдоль оптимальной траектории выполняются условия
0
,
0
,
,
1 1
2 2
=
φ
=
φ
∂
∂
−
=
∂
∂
=
&
&
&
T
t
H
H
x
λ
λ
x
. (85)
Оптимальное управление на граничном участке определяется из условия минимума H по
)
,
(
1
x
u
t
U
m
∈
, где
)
,
(
1
x
t
U
m
– та часть значений u из области
m
U
, которая удовлетворяет условию
0
)
,
,
(
1
=
φ
u
x
t
Если минимум H по u в области
)
,
(
1
x
t
U
m
достигается в ее внутренней точке, то
0
)
,
,
(
,
0
)
,
(
,
0
))
,
,
(
(
1 1
2 2
=
φ
=
φ
=
φ
∂
∂
β
+
∂
∂
=
∂
∂
u
x
x
u
x
u
u
u
t
t
t
H
H
&
&
Значения вектора
λ
и гамильтониана
2
H
непрерывны в точке входа на границу допустимой области:
)
0
(
)
0
(
);
0
(
)
0
(
вх
2
вх
2
вх вх
−
=
+
−
=
+
t
H
t
H
t
t
λ
λ
Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см. п. 4.3). В частности, из этих условий следует, что при
1
t
t
=
))
(
,
(
))
(
,
(
;
)
(
1 1
1 1
1 1
t
t
t
t
L
L
t
T
t
t
T
x
q
µ
x
x
λ
+
Φ
=
∂
∂
=
=
;
0
)
(
1 2
1
=
+
∂
∂
t
H
t
L
(если
1
t
– не задано).
Кроме того, к этим условиям надо добавить заданное граничное условие (76):
0
))
(
,
(
1 1
=
t
t
x
q
Контрольные вопросы
1. Необходимые условия оптимальности.
2. Первый тип необходимых условий оптимальности для граничных участков траектории.
3. Второй тип необходимых условий для оптимальности управления на граничных участках.
Г л а в а 8
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ
ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО
ФАЗОВЫЕ КООРДИНАТЫ
x И УПРАВЛЕНИЕ u
При рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функ- ций не должны превосходить пределов, зависящих от текущего состояния системы.
Ограничения рассматриваемого типа можно записать в виде
0
)
,
,
(
≤
u
x
t
ℵ
, (86) где
ℵ
явным образом зависит от состояния x и управления u. Принцип максимума, сформулированный в п. 4.3, справедлив лишь для неравенств типа
0
)
,
(
≤
u
t
i
ℵ
, (87) т.е. не содержащих фазовых координат x явно.
Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86).
8.1. Краткая формулировка задачи
Пусть эволюция системы S описывается векторным дифференциальным уравнением
)
,
(
u
x,
f
x
t
dt
d =
, (88) где
T
n
x
x
x
)
...,
,
,
(
2 1
=
x
– n-мерный вектор состояния;
T
m
u
u
u
)
...,
,
,
(
2 1
=
u
– m-мерный вектор управления.
На значения управляющего вектора u наложены ограничения
0
)
,
,
(
≥
u
x
t
ℵ
, (89) где
T
v
)
...,
,
,
(
1 2
1
ℵ
ℵ
ℵ
=
ℵ
–
1
v
-мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, не превосходит m.
Область
m
U
допустимых значений u зависит от t, x:
)
,
( x
t
U
U
m
m
=
и задается уравнением (89). Предполагается, что вектор u явно входит в уравнение (89).
В начальный момент времени
0
t
t
=
задано состояние системы
0 0
)
(
x
x
=
t
. (90)
Необходимо перевести систему S из состояния
0
x
в некоторое конечное состояние, определяемое соотношениями
0
))
(
,
(
1 1
=
t
t
x
q
, (91) где
1
),
...,
,
,
(
2 2
1 2
+
≤
=
n
l
q
q
q
l
q
Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционал
∫
+
Φ
=
1 0
)
,
,
(
))
(
,
(
]
[
0 1
1
t
t
dt
t
f
t
t
J
u
x
x
u
(92) принимает минимальное значение на решениях системы (88).
Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывными производными. Точки
α
t
, где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точ- ками. Точки
s
t
, в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (89), называют- ся точками соединения.
8.2. Типы граничных условий
Задача, в которой
0
))
(
,
(
1 1
≡
Φ
t
t
x
, а граничные условия (97) имеют вид
)
,
1
(
0
)
(
2 1
1
n
l
i
x
t
x
i
i
≤
=
=
−
(93) или
)
1
,
1
(
0
)
(
2 1
1
n
l
i
x
t
x
i
i
≤
−
=
=
−
, (94)
0
зад
1
=
− t
t
, где зад
1
, t
x
i
– заданные числа, называется иногда простейшей.
При
n
l
=
2
условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При
n
l
<
2
условия
(93) приводят к задаче с частично свободным правым концом и свободным временем
1
t
. Условия типа (94) относятся к зада- че с закрепленным временем зад
1
t
t
=
и частично свободным правым концом траектории.
8.3. Необходимые условия оптимальности
Если
)
,
(
)
(
*
t
U
t
m
x
u
∈
[
m
U
определяется условиями (89)] является управлением, минимизирующим функционал J[u], то найдутся такие постоянные числа
T
l
)
...,
,
(
,
1 2
1 0
µ
µ
=
=
λ
µ
, не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы
T
n
t
t
t
))
(
...,
),
(
)
(
1
λ
λ
=
λ
(непрерывный на
]
,
[
1 0
t
t
) и
T
v
t
t
t
))
(
...,
),
(
(
)
(
1 1
β
β
=
β
(непрерывный на
]
,
[
1 0
t
t
всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосторонние пределы), что на
]
,
[
1 0
t
t
имеют место соотношения
T
T
T
H
H
dt
d
∂
∂
−
=
∂
∂
−
∂
∂
−
=
x
β
x
x
λ
1
ℵ
; (95)
T
T
H
H
dt
d
∂
∂
=
∂
∂
=
λ
λ
x
1
; (96)
)
,
1
(
0 1
v
j
j
j
=
=
ℵ
β
, (97) где
0
≤
β
. (98)
Для всех фиксированных
)
,
,
(
λ
x
t
и u, удовлетворяющих (89), выполняется принцип максимума (см. п. 4.3)
)
,
,
,
(
)
,
,
,
(
*
u
λ
x
u
λ
x
t
H
t
H
≤
, (99) т.е.
)
,
,
,
(
)
,
,
,
(
min
*
u
λ
x
u
λ
x
t
H
t
H
m
U
u
=
∈
, где гамильтониан H определяется, как и в п. 4.2, выражением
f
λ
T
f
H
+
λ
=
0 0
, (100) а
ℵ
T
H
H
β
+
=
1
. (101)
Если минимум H достигается во внутренней точке области
m
U
, то
β
u
u
u
T
H
H
∂
∂
+
∂
∂
=
∂
∂
ℵ
1
. (102)
В угловых точках
α
t
выполняются следующие условия: а) сопряженный вектор
)
(t
λ
непрерывен, т.е.
)
0
(
)
0
(
−
=
+
α
α
t
t
λ
λ
; (103) б) функция H непрерывна, т.е.
))
0
(
),
(
),
(
,
(
))
0
(
),
(
),
(
,
(
*
*
−
=
+
α
α
α
α
α
α
α
α
t
t
t
t
H
t
t
t
t
H
u
λ
x
u
λ
x
(104)
(условие (99) соблюдается со знаком равенства); в) уравнения (97) и (102) сохраняются.
Условия a) – в) являются аналогом условий Вейерштрасса–Эрдмана.
В конечной точке
(
)
1 1
, x
t
для любых значений
)
(
,
1 1
t
d
dt
x
выполняются условия трансверсальности
0
)
(
1 1
1 1
0 1
1
=
−
∂
∂
+
∂
Φ
∂
+
∂
∂
+
∂
Φ
∂
+
+
=
=
t
d
dt
t
t
f
T
t
t
T
T
t
t
T
T
x
λ
µ
x
q
x
q
µ
f
λ
;
(105)
0
))
(
,
(
1 1
=
t
t x
q
Из (105) следует, что
1 1
1 1
0 1
)
(
)
(
t
T
t
T
t
t
f
t
H
∂
∂
+
∂
Φ
∂
−
=
+
=
q
µ
f
λ
; (106)
1
)
(
1
t
T
T
t
∂
∂
+
∂
Φ
∂
=
µ
x
q
x
λ
. (107)
Для простейшей задачи условия (106) и (107) упрощаются. Так, например, в случае (93) они имеют вид
+
=
=
λ
=
µ
=
λ
=
).
,
1
(
0
)
(
);
,
1
(
)
(
;
0
)
(
2 1
2 1
1
n
l
i
t
l
i
t
t
H
i
i
i
(108)
8.4. Аналог необходимого условия Клебша
Обозначим через
ℵ
те компоненты вектора ограничений
ℵ
, которые в каждой точке минимизирующей кривой x
*
(t),
u
*
(t) удовлетворяются в виде равенств. Пусть β – соответствующий им вектор множителей. Тогда
ℵ
T
H
H
β
+
=
1
(109) и для внутренних точек области
m
U
на минимизирующем управлении u
*
(t) имеет место неравенство
0 2
1 2
≥
∂
∂
η
u
η
H
T
(110) для всех
0
)
...,
,
,
(
2 1
≠
η
η
η
=
T
m
η
, удовлетворяющих условию
0
=
∂
∂
t
может толковаться либо как связь, наложенная на начальные значения
)
,
(
0 0
x
t
, либо как связь, наложенная на конечные значения
)
,
(
1 1
x
t
, в зависимости от порядка следования участков с
0 1
>
φ
и
0 1
=
φ
При трех участках, если сначала идет граничный участок, затем участок с
0 1
>
φ
и далее снова граничный участок, множители тоже непрерывны вдоль всей траектории. При всех других порядках следования участков, если последних боль- ше трех, сопряженные переменные имеют разрыв типа скачка. Этот скачок в значениях
)
(t
i
λ
можно осуществить на любом конце граничного участка, при этом на другом конце множители уже могут быть выбраны непрерывными (выбор конца, на котором происходит скачок, не имеет значения). Если этот конец выбран в момент времени
2
t′
, то условия скачка имеют вид
x
λ
λ
∂
φ
∂
−
=
−
+
)
(
)
(
)
(
2 1
2 2
t
C
t
t
; (81)
t
t
C
t
H
t
H
∂
′
∂φ
+
′
=
′
−
+
)
(
)
(
)
(
2 1
2 1
2
; (82)
0
)
(
2 1
=
′
φ
−
t
, (83) где С – произвольная постоянная; индексы «+» и «–» обозначают пределы справа и слева, соответственно.
Если условия (81) подставить в (82), то коэффициент при С будет
1
φ&
и, таким образом, условие (82) не зависит от С, а содержит только значения
)
(
2
t′
λ
−
. После указанной подстановки уравнение (82) может быть использовано в качестве экви- валентного необходимого условия.
В данной задаче решение
)
(
),
(
t
t λ
x
не зависит от
0
i
λ
, С как от параметров
)
,
,
(
);
,
,
(
0 0
C
t
C
t
i
i
λ
=
λ
=
λ
λ
x
x
В каждой точке разрыва непрерывности сопряженных переменных должна добавляться новая константа С. Величина С не может быть определена заранее из необходимых условий и является дополнительным параметром, определяющим точку схода. Поскольку число граничных участков заранее неизвестно, задача становится проблемой с переменным числом пара- метров, что существенно усложняет ее практическое решение даже с помощью ЭВМ.
П р и м е р 3. Пусть имеются три участка оптимальной траектории, следующие в таком порядке:
1 участок – траектория в открытой области,
0 1
>
φ
;
2 участок – граничная траектория,
0 1
=
φ
;
3 участок – снова траектория в открытой области,
0 1
>
φ
Необходимые условия в конечной точке дают (n + 1) уравнение относительно (n + 2) неизвестных
C
t
i
,
,
1 0
λ
. Условия
(82), (83) и
0
)
0
(
2
=
+
′
β t
(84) определяют точку
2
t′
и дают дополнительное уравнение относительно неизвестных
C
t
i
,
,
1 0
λ
. Задача, таким образом, све- лась к нахождению решения (n + 2) уравнений с (n + 2) неизвестными.
Если участков больше, чем три, задача сводится к многоточечной краевой проблеме.
7.4. Второй тип необходимых условий для оптимальности
управления на граничных участках
Пусть вх
t
– момент входа траектории на границу допустимой области, сх
t
– момент схода с этой границы. Гамильтони- ан
2
H
для граничных участков может быть представлен в следующем виде:
1 2
1 1
1 1
2 1
1 0
0 2
φ
β
+
φ
β
+
=
φ
β
+
φ
β
+
λ
+
λ
=
∑
=
&
&
H
f
f
H
n
i
i
i
, где
,
0 2
1
=
β
=
β
если
0 1
>
φ
;
0
,
0 2
1
≠
β
≠
β
, если
0 1
=
φ
, а
1
φ&
определяется правой частью соотношения (78).
На граничном участке (т.е. при сх вх
t
t
t
≤
≤
) вдоль оптимальной траектории выполняются условия
0
,
0
,
,
1 1
2 2
=
φ
=
φ
∂
∂
−
=
∂
∂
=
&
&
&
T
t
H
H
x
λ
λ
x
. (85)
Оптимальное управление на граничном участке определяется из условия минимума H по
)
,
(
1
x
u
t
U
m
∈
, где
)
,
(
1
x
t
U
m
– та часть значений u из области
m
U
, которая удовлетворяет условию
0
)
,
,
(
1
=
φ
u
x
t
Если минимум H по u в области
)
,
(
1
x
t
U
m
достигается в ее внутренней точке, то
0
)
,
,
(
,
0
)
,
(
,
0
))
,
,
(
(
1 1
2 2
=
φ
=
φ
=
φ
∂
∂
β
+
∂
∂
=
∂
∂
u
x
x
u
x
u
u
u
t
t
t
H
H
&
&
Значения вектора
λ
и гамильтониана
2
H
непрерывны в точке входа на границу допустимой области:
)
0
(
)
0
(
);
0
(
)
0
(
вх
2
вх
2
вх вх
−
=
+
−
=
+
t
H
t
H
t
t
λ
λ
Остальные недостающие граничные условия могут быть найдены из общих условий трансверсальности (см. п. 4.3). В частности, из этих условий следует, что при
1
t
t
=
))
(
,
(
))
(
,
(
;
)
(
1 1
1 1
1 1
t
t
t
t
L
L
t
T
t
t
T
x
q
µ
x
x
λ
+
Φ
=
∂
∂
=
=
;
0
)
(
1 2
1
=
+
∂
∂
t
H
t
L
(если
1
t
– не задано).
Кроме того, к этим условиям надо добавить заданное граничное условие (76):
0
))
(
,
(
1 1
=
t
t
x
q
Контрольные вопросы
1. Необходимые условия оптимальности.
2. Первый тип необходимых условий оптимальности для граничных участков траектории.
3. Второй тип необходимых условий для оптимальности управления на граничных участках.
Г л а в а 8
НЕОБХОДИМЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
УПРАВЛЕНИЯ В ЗАДАЧАХ С ОГРАНИЧЕНИЯМИ
ТИПА НЕРАВЕНСТВ, СОДЕРЖАЩИМИ ОДНОВРЕМЕННО
ФАЗОВЫЕ КООРДИНАТЫ
x И УПРАВЛЕНИЕ u
При рассмотрении технических систем часто встречаются задачи, в которых допустимые значения управляющих функ- ций не должны превосходить пределов, зависящих от текущего состояния системы.
Ограничения рассматриваемого типа можно записать в виде
0
)
,
,
(
≤
u
x
t
ℵ
, (86) где
ℵ
явным образом зависит от состояния x и управления u. Принцип максимума, сформулированный в п. 4.3, справедлив лишь для неравенств типа
0
)
,
(
≤
u
t
i
ℵ
, (87) т.е. не содержащих фазовых координат x явно.
Ниже приводится формулировка принципа максимума, пригодная для ограничений типа (86).
8.1. Краткая формулировка задачи
Пусть эволюция системы S описывается векторным дифференциальным уравнением
)
,
(
u
x,
f
x
t
dt
d =
, (88) где
T
n
x
x
x
)
...,
,
,
(
2 1
=
x
– n-мерный вектор состояния;
T
m
u
u
u
)
...,
,
,
(
2 1
=
u
– m-мерный вектор управления.
На значения управляющего вектора u наложены ограничения
0
)
,
,
(
≥
u
x
t
ℵ
, (89) где
T
v
)
...,
,
,
(
1 2
1
ℵ
ℵ
ℵ
=
ℵ
–
1
v
-мерный вектор, причем число связей, одновременно удовлетворяющихся в виде равенств, не превосходит m.
Область
m
U
допустимых значений u зависит от t, x:
)
,
( x
t
U
U
m
m
=
и задается уравнением (89). Предполагается, что вектор u явно входит в уравнение (89).
В начальный момент времени
0
t
t
=
задано состояние системы
0 0
)
(
x
x
=
t
. (90)
Необходимо перевести систему S из состояния
0
x
в некоторое конечное состояние, определяемое соотношениями
0
))
(
,
(
1 1
=
t
t
x
q
, (91) где
1
),
...,
,
,
(
2 2
1 2
+
≤
=
n
l
q
q
q
l
q
Требуется найти такой допустимый кусочно-непрерывный вектор u(t), удовлетворяющий (89), что функционал
∫
+
Φ
=
1 0
)
,
,
(
))
(
,
(
]
[
0 1
1
t
t
dt
t
f
t
t
J
u
x
x
u
(92) принимает минимальное значение на решениях системы (88).
Решения x(t) системы (88) предполагаются непрерывными и обладающими, по крайней мере, абсолютно непрерывными производными. Точки
α
t
, где одна или более компонент вектора u терпят разрыв первого рода, называются угловыми точ- ками. Точки
s
t
, в которых изменяется знак «>» на «=» (или наоборот) в одном или нескольких ограничениях (89), называют- ся точками соединения.
8.2. Типы граничных условий
Задача, в которой
0
))
(
,
(
1 1
≡
Φ
t
t
x
, а граничные условия (97) имеют вид
)
,
1
(
0
)
(
2 1
1
n
l
i
x
t
x
i
i
≤
=
=
−
(93) или
)
1
,
1
(
0
)
(
2 1
1
n
l
i
x
t
x
i
i
≤
−
=
=
−
, (94)
0
зад
1
=
− t
t
, где зад
1
, t
x
i
– заданные числа, называется иногда простейшей.
При
n
l
=
2
условия (93) приводят к задаче с закрепленным правым концом и свободным временем. При
n
l
<
2
условия
(93) приводят к задаче с частично свободным правым концом и свободным временем
1
t
. Условия типа (94) относятся к зада- че с закрепленным временем зад
1
t
t
=
и частично свободным правым концом траектории.
8.3. Необходимые условия оптимальности
Если
)
,
(
)
(
*
t
U
t
m
x
u
∈
[
m
U
определяется условиями (89)] является управлением, минимизирующим функционал J[u], то найдутся такие постоянные числа
T
l
)
...,
,
(
,
1 2
1 0
µ
µ
=
=
λ
µ
, не все равные нулю, и такие одновременно не обращающиеся в нуль переменные векторы
T
n
t
t
t
))
(
...,
),
(
)
(
1
λ
λ
=
λ
(непрерывный на
]
,
[
1 0
t
t
) и
T
v
t
t
t
))
(
...,
),
(
(
)
(
1 1
β
β
=
β
(непрерывный на
]
,
[
1 0
t
t
всюду, за исключением, быть может, точек разрыва управления u(t), где, однако, у него существуют единственные право- и левосторонние пределы), что на
]
,
[
1 0
t
t
имеют место соотношения
T
T
T
H
H
dt
d
∂
∂
−
=
∂
∂
−
∂
∂
−
=
x
β
x
x
λ
1
ℵ
; (95)
T
T
H
H
dt
d
∂
∂
=
∂
∂
=
λ
λ
x
1
; (96)
)
,
1
(
0 1
v
j
j
j
=
=
ℵ
β
, (97) где
0
≤
β
. (98)
Для всех фиксированных
)
,
,
(
λ
x
t
и u, удовлетворяющих (89), выполняется принцип максимума (см. п. 4.3)
)
,
,
,
(
)
,
,
,
(
*
u
λ
x
u
λ
x
t
H
t
H
≤
, (99) т.е.
)
,
,
,
(
)
,
,
,
(
min
*
u
λ
x
u
λ
x
t
H
t
H
m
U
u
=
∈
, где гамильтониан H определяется, как и в п. 4.2, выражением
f
λ
T
f
H
+
λ
=
0 0
, (100) а
ℵ
T
H
H
β
+
=
1
. (101)
Если минимум H достигается во внутренней точке области
m
U
, то
β
u
u
u
T
H
H
∂
∂
+
∂
∂
=
∂
∂
ℵ
1
. (102)
В угловых точках
α
t
выполняются следующие условия: а) сопряженный вектор
)
(t
λ
непрерывен, т.е.
)
0
(
)
0
(
−
=
+
α
α
t
t
λ
λ
; (103) б) функция H непрерывна, т.е.
))
0
(
),
(
),
(
,
(
))
0
(
),
(
),
(
,
(
*
*
−
=
+
α
α
α
α
α
α
α
α
t
t
t
t
H
t
t
t
t
H
u
λ
x
u
λ
x
(104)
(условие (99) соблюдается со знаком равенства); в) уравнения (97) и (102) сохраняются.
Условия a) – в) являются аналогом условий Вейерштрасса–Эрдмана.
В конечной точке
(
)
1 1
, x
t
для любых значений
)
(
,
1 1
t
d
dt
x
выполняются условия трансверсальности
0
)
(
1 1
1 1
0 1
1
=
−
∂
∂
+
∂
Φ
∂
+
∂
∂
+
∂
Φ
∂
+
+
=
=
t
d
dt
t
t
f
T
t
t
T
T
t
t
T
T
x
λ
µ
x
q
x
q
µ
f
λ
;
(105)
0
))
(
,
(
1 1
=
t
t x
q
Из (105) следует, что
1 1
1 1
0 1
)
(
)
(
t
T
t
T
t
t
f
t
H
∂
∂
+
∂
Φ
∂
−
=
+
=
q
µ
f
λ
; (106)
1
)
(
1
t
T
T
t
∂
∂
+
∂
Φ
∂
=
µ
x
q
x
λ
. (107)
Для простейшей задачи условия (106) и (107) упрощаются. Так, например, в случае (93) они имеют вид
+
=
=
λ
=
µ
=
λ
=
).
,
1
(
0
)
(
);
,
1
(
)
(
;
0
)
(
2 1
2 1
1
n
l
i
t
l
i
t
t
H
i
i
i
(108)
8.4. Аналог необходимого условия Клебша
Обозначим через
ℵ
те компоненты вектора ограничений
ℵ
, которые в каждой точке минимизирующей кривой x
*
(t),
u
*
(t) удовлетворяются в виде равенств. Пусть β – соответствующий им вектор множителей. Тогда
ℵ
T
H
H
β
+
=
1
(109) и для внутренних точек области
m
U
на минимизирующем управлении u
*
(t) имеет место неравенство
0 2
1 2
≥
∂
∂
η
u
η
H
T
(110) для всех
0
)
...,
,
,
(
2 1
≠
η
η
η
=
T
m
η
, удовлетворяющих условию
0
=
∂
∂
1 ... 7 8 9 10 11 12 13 14 15
η
u
ℵ
. (111)
Здесь
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
∂
∂
2 1
2 1
1 2
1 1
2 2
1 1
2 2
1 2
,
,
,
,
m
m
m
u
H
u
u
H
u
u
H
u
H
H
L
L
L
L
L
u
Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения
0 0
,
det
)
(
2 1
2
=
∂
∂
∂
∂
−
∂
∂
=
u
u
u
ℵ
ℵ
T
sE
H
s
D
. (112)
Неравенство нулю определителя матрицы
∂
∂
∂
∂
∂
∂
0 2
1 2
u
u
u
ℵ
ℵ
T
H
(113) во всех точках x
*
(t), u
*
(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u
*
(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы- вается невырожденной.
С л е д с т в и я . 1. Условия для открытого ядра области
)
,
( x
t
U
m
(условия (95) – (99)) означают, что во всех точках тра- ектории, в которых минимум H по u,
)
,
( t
U
m
x
u
∈
достигается при выполнении строгих неравенств
)
,
1
(
0
)
,
,
(
v
i
t
i
=
>
ℵ
u
x
(114)
(т.е. в так называемом открытом ядре области
)
,
( t
U
m
x
) справедлив принцип максимума (см. п. 4.3), не учитывающий нали- чие связей (89). Здесь все
)
,
1
(
0 1
v
i
i
=
=
β
и дифференциальные уравнения (95)–(96) при условии (99), дающем
)
,
,
(
λ
x
u
u
t
=
имеют единственное решение:
λ
λ
=
λ
λ
=
).
,
,
,
(
);
,
,
,
(
0 0
0 0
0 0
i
i
i
i
i
i
t
t
t
t
x
x
x
x
(115)
В этом случае
)
,
,
,
(
0 0
0
i
t
t
λ
=
x
u
u
(116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
, по крайней мере, непрерывно.
Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци- руемо по
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
2. Если
)
,
,
(
u
x
t
i
ℵ
не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае
)
,
( t
U
m
x
зависит лишь от t:
)
(t
U
U
m
m
=
3. Условия для границы области
)
,
( t
U
m
x
находятся следующим образом. Если при определении минимума H по u часть компонент вектора
ℵ
удовлетворяются в виде равенств, то недостающие множители
j
β
могут быть найдены из усло- вий (102). Если минимум H по u достигается во внутренней точке области
m
U
, то управление
j
u
и множители
j
β
нахо- дятся из условий (102) и тех из (89), которые выполняются в виде равенств
0
)
,
,
(
;
0
=
=
∂
∂
+
∂
∂
u
x
β
u
u
t
H
T
ℵ
ℵ
(117)
Из (117) находятся u и
β
. При этом
)
,
(
),
,
(
λ
x
β
β
λ
x
u
u
=
=
непрерывны в точке соединения, если только в ней нет раз- рыва в функции u(t).
Контрольные вопросы
1. Типы граничных условий.
2. Необходимые условия оптимальности.
3. Аналог необходимого условия Клебша.
Г л а в а 9
ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО
ИСЧИСЛЕНИЯ
Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав- нений первого порядка, разрешенных относительно производных)
*
, а управляющие функции u(t) явно не введены (и по ка- ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно- го исчисления.
Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен- но для такой системы разработаны эффективные алгоритмы численного интегрирования.
9.1. Задачи Больца, Майера, Лагранжа
Задача Больца
.
Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.
Пусть класс траекторий определяется:
1) кривыми x(t) c координатами
1 0
),
,
1
(
)
(
t
t
t
n
i
t
x
i
≤
≤
=
;
2) параметрами
)
,
1
(
r
j
a
j
=
Параметры
j
a можно рассматривать как некоторые постоянные координаты кривой С:
Y
t
t
)
),
(
(
)
(
a
x
z
=
в (n + r)-мерном пространстве,
T
r
n
a
a
x
x
x
z
)
...,
,
,
...,
,
,
(
1 2
1
=
Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида
)
,
1
(
0
)
,
,
,
(
n
m
j
t
F
j
<
=
=
=
a
x
x
&
(118) и условиям
)
,
1
(
0
)
,
,
,
(
)
),
(
,
),
(
,
(
1 0
1 1
0 0
ρ
=
=
+
Φ
=
∫
k
dt
t
f
t
t
t
t
I
t
t
k
k
k
a
x
x
a
x
x
&
, (119) где
T
n
x
x
dt
d
)
...,
,
(
1
&
&
&
=
=
x
x
Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал
∫
+
Φ
=
1 0
)
,
,
,
(
)
,
,
,
,
(
1 1
0 0
t
t
dt
t
f
t
t
J
a
x
x
a
x
x
&
. (120)
Задача Майера
.
Эта задача формально получается из задачи Больца при
)
,
1
(
0
,
0
ρ
=
≡
≡
k
f
f
k
. В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть
2 2
+
+
=
ρ
r
n
. Если фиксирован век- тор параметров а, то число степеней свободы
σ системы дифференциальных уравнений (118), равное разности между чис- лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно:
m
n
−
=
σ
Задача Лагранжа
.
Эта задача вытекает из задачи Больца при
ρ
=
≡
≡
Φ
,
1
,
0
,
0
k
f
k
Виды связей и граничных условий. Связи вида (119) при
)
(a
k
k
Φ
=
Φ
, т.е. при
∫
Φ
−
=
t
t
t
k
k
dt
t
f
0
)
(
)
,
,
,
(
a
a
x
x &
, где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если
0
≡
k
f
, то связи типа (119) задают под- вижные граничные условия. Если связи типа (119) имеют вид
,
,
0
);
,
1
(
0
)
(
);
,
1
(
0
)
(
10 1
2 2
00 0
1 2
2 1
1 1
0 0
2 2
2 1
1 1
t
t
t
t
n
k
x
t
x
n
k
x
t
x
n
n
k
k
k
k
k
k
−
≡
Φ
=
−
≡
Φ
=
=
−
≡
Φ
=
=
−
≡
Φ
+
+
где
10 0
...,
,
1
t
x
k
– заданные числа, то граничные условия называются закрепленными.
Если
0
;
0
;
,
1
;
,
1 10 1
00 0
1 2
1
=
−
=
−
<
=
=
t
t
t
t
n
n
k
n
k
, то
1
n
концов закреплено, а остальные условия называются свобод- ными граничными условиями.
Если граничные условия
0
)
,
,
,
(
1 0
1 0
=
Φ
x
x
t
t
k
при
)
,
1
,
0
(
ρ
=
=
k
f
k
можно разбить на две группы
0
)
,
(
0 0
1
=
Φ
x
t
k
;
0
)
,
(
1 1
2
=
Φ
x
t
k
;
n
k
k
<
ρ
ρ
+
ρ
=
ρ
=
1 1
2 1
1
,
...,
,
1
,
,
1
и если
)
,
(
)
,
(
0 0
1 1
x
x
t
h
t
q
−
≡
Φ
, то задача называется задачей с разделенными
условиями для концов.
Общие условия (119) называются смешанными граничными условиями.
9.2. Первое необходимое условие экстремума функционала
в задаче Больца
Первое необходимое условие экстремума состоит из:
• правила множителей Лагранжа;
• уравнений Эйлера–Лагранжа;
• условий Эрдмана–Вейерштрасса;
• условий трансверсальности.
Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по
)
(t
x&
) ва- риации
)
(
)
(
)
(
),
(
)
(
)
(
t
t
t
t
t
t
x
x
x
x
x
x
&
&
&
−
=
δ
−
=
δ
по любым совместимым со связями (118) направлениям в пространстве
n
n
X
X
∈
x
,
и функции
k
k
f
f
Φ
Φ,
,
,
обладают непрерывными производными до третьего порядка. Тогда необходимые ус- ловия экстремума формулируются следующим образом.
Правило множителей Лагранжа
: существуют функции
µ
0
,
µ
k
,
)
(t
j
λ
и функции
∑
∑
ρ
=
=
+
+
=
1 1
0
)
,
,
,
(
)
(
k
m
j
j
j
k
k
t
F
t
f
f
F
a
x
x
λ
µ
µ
&
; (121)
∑
ρ
=
Φ
+
Φ
=
1 1
1 0
0 1
1 0
0 0
)
),
(
,
),
(
,
(
)
),
(
,
),
(
,
(
k
k
k
t
t
t
t
t
t
t
t
L
a
x
x
µ
a
x
x
µ
(122) такие, что множители
k
µ
µ
,
0 0
≥
– постоянные и решение исходной задачи на условный экстремум лежит среди решений
задачи на безусловный экстремум для вспомогательного функционала
∫
+
=
1 0
t
t
Fdt
L
J
Всегда можно считать
1 0
=
µ
, за исключением особых (анормальных) случаев.
Уравнения Эйлера–Лагранжа
.
Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа:
t
n
i
x
i
F
F
x
F
dt
d
i
=
−
∑
=1
&
&
; (123)
)
,
1
(
0
n
i
F
dt
d
F
i
i
x
x
=
=
−
&
, (124) где
t
F
F
x
F
F
x
F
F
t
i
x
i
x
i
i
∂
∂
=
∂
∂
=
∂
∂
=
;
;
&
&
З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все
)
(t
x
i
обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу.
C
F
x
F
n
i
x
i
i
=
−
∑
=1
&
&
(125) в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
Условия Эрдмана–Вейерштрасса
.
Величины
∑
=
−
n
i
x
i
i
F
x
F
1
&
&
и
)
,
1
(
n
i
F
i
x
=
&
непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при
t
t
′
= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте
)
(t
x
i
имеет место разрыв (перво- го рода) в производной:
+
+
′
=
−
′
=
=
≠
=
i
t
t
i
t
t
i
i
x
dt
t
dx
dt
t
dx
x
&
&
0 0
)
(
)
(
, (126) то справедливы соотношения
)
,
1
(
n
i
F
x
F
x
F
F
i
i
i
i
i
i
x
x
x
i
x
x
i
x
=
=
∂
∂
=
∂
∂
=
+
=
=
+
&
&
&
&
&
&
&
&
(127) и
1 1
1 1
∑
∑
∑
∑
=
+
+
+
=
=
=
=
=
−
=
−
=
−
=
−
+
−
n
i
x
i
x
x
n
i
x
i
x
x
n
i
x
i
n
i
x
i
i
i
i
i
i
i
i
i
F
x
F
F
x
F
F
x
F
F
x
F
&
&
&
&
&
&
&
&
&
&
&
&
(128)
Здесь
)
,...,
(
;
)
,...,
,
(
;
)
,
,
,
(
;
)
,
,
,
(
2 1
2 1
T
n
T
n
x
x
x
x
x
x
t
F
F
t
F
F
−
−
−
−
+
+
+
+
=
+
=
−
=
=
=
=
=
+
−
&
&
&
&
&
&
&
&
&
&
&
&
&
&
x
x
a
x
x
a
x
x
x
x
x
x
Условие трансверсальности
.
Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство
∑∫
∑
∑
=
=
=
=
+
+
+
−
r
j
t
t
j
a
n
i
i
x
n
i
x
i
dt
da
F
dL
dx
F
dt
F
x
F
j
i
i
1 1
0 1
1 1
0 0
&
&
&
(129) выполняется тождественно для
j
i
i
i
i
da
t
dx
dx
t
dx
dx
dt
dt
),
(
),
(
,
,
1 1
0 0
1 0
=
=
(т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции
)
,
),
(
),
(
,
,
(
1 0
1 0
k
t
t
t
t
L
1 ... 7 8 9 10 11 12 13 14 15
η
u
ℵ
. (111)
Здесь
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
∂
∂
2 1
2 1
1 2
1 1
2 2
1 1
2 2
1 2
,
,
,
,
m
m
m
u
H
u
u
H
u
u
H
u
H
H
L
L
L
L
L
u
Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения
0 0
,
det
)
(
2 1
2
=
∂
∂
∂
∂
−
∂
∂
=
u
u
u
ℵ
ℵ
T
sE
H
s
D
. (112)
Неравенство нулю определителя матрицы
∂
∂
∂
∂
∂
∂
0 2
1 2
u
u
u
ℵ
ℵ
T
H
(113) во всех точках x
*
(t), u
*
(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u
*
(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы- вается невырожденной.
С л е д с т в и я . 1. Условия для открытого ядра области
)
,
( x
t
U
m
(условия (95) – (99)) означают, что во всех точках тра- ектории, в которых минимум H по u,
)
,
( t
U
m
x
u
∈
достигается при выполнении строгих неравенств
)
,
1
(
0
)
,
,
(
v
i
t
i
=
>
ℵ
u
x
(114)
(т.е. в так называемом открытом ядре области
)
,
( t
U
m
x
) справедлив принцип максимума (см. п. 4.3), не учитывающий нали- чие связей (89). Здесь все
)
,
1
(
0 1
v
i
i
=
=
β
и дифференциальные уравнения (95)–(96) при условии (99), дающем
)
,
,
(
λ
x
u
u
t
=
имеют единственное решение:
λ
λ
=
λ
λ
=
).
,
,
,
(
);
,
,
,
(
0 0
0 0
0 0
i
i
i
i
i
i
t
t
t
t
x
x
x
x
(115)
В этом случае
)
,
,
,
(
0 0
0
i
t
t
λ
=
x
u
u
(116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
, по крайней мере, непрерывно.
Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци- руемо по
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
2. Если
)
,
,
(
u
x
t
i
ℵ
не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае
)
,
( t
U
m
x
зависит лишь от t:
)
(t
U
U
m
m
=
3. Условия для границы области
)
,
( t
U
m
x
находятся следующим образом. Если при определении минимума H по u часть компонент вектора
ℵ
удовлетворяются в виде равенств, то недостающие множители
j
β
могут быть найдены из усло- вий (102). Если минимум H по u достигается во внутренней точке области
m
U
, то управление
j
u
и множители
j
β
нахо- дятся из условий (102) и тех из (89), которые выполняются в виде равенств
0
)
,
,
(
;
0
=
=
∂
∂
+
∂
∂
u
x
β
u
u
t
H
T
ℵ
ℵ
(117)
Из (117) находятся u и
β
. При этом
)
,
(
),
,
(
λ
x
β
β
λ
x
u
u
=
=
непрерывны в точке соединения, если только в ней нет раз- рыва в функции u(t).
Контрольные вопросы
1. Типы граничных условий.
2. Необходимые условия оптимальности.
3. Аналог необходимого условия Клебша.
Г л а в а 9
ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО
ИСЧИСЛЕНИЯ
Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав- нений первого порядка, разрешенных относительно производных)
*
, а управляющие функции u(t) явно не введены (и по ка- ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно- го исчисления.
Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен- но для такой системы разработаны эффективные алгоритмы численного интегрирования.
9.1. Задачи Больца, Майера, Лагранжа
Задача Больца
.
Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.
Пусть класс траекторий определяется:
1) кривыми x(t) c координатами
1 0
),
,
1
(
)
(
t
t
t
n
i
t
x
i
≤
≤
=
;
2) параметрами
)
,
1
(
r
j
a
j
=
Параметры
j
a можно рассматривать как некоторые постоянные координаты кривой С:
Y
t
t
)
),
(
(
)
(
a
x
z
=
в (n + r)-мерном пространстве,
T
r
n
a
a
x
x
x
z
)
...,
,
,
...,
,
,
(
1 2
1
=
Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида
)
,
1
(
0
)
,
,
,
(
n
m
j
t
F
j
<
=
=
=
a
x
x
&
(118) и условиям
)
,
1
(
0
)
,
,
,
(
)
),
(
,
),
(
,
(
1 0
1 1
0 0
ρ
=
=
+
Φ
=
∫
k
dt
t
f
t
t
t
t
I
t
t
k
k
k
a
x
x
a
x
x
&
, (119) где
T
n
x
x
dt
d
)
...,
,
(
1
&
&
&
=
=
x
x
Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал
∫
+
Φ
=
1 0
)
,
,
,
(
)
,
,
,
,
(
1 1
0 0
t
t
dt
t
f
t
t
J
a
x
x
a
x
x
&
. (120)
Задача Майера
.
Эта задача формально получается из задачи Больца при
)
,
1
(
0
,
0
ρ
=
≡
≡
k
f
f
k
. В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть
2 2
+
+
=
ρ
r
n
. Если фиксирован век- тор параметров а, то число степеней свободы
σ системы дифференциальных уравнений (118), равное разности между чис- лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно:
m
n
−
=
σ
Задача Лагранжа
.
Эта задача вытекает из задачи Больца при
ρ
=
≡
≡
Φ
,
1
,
0
,
0
k
f
k
Виды связей и граничных условий. Связи вида (119) при
)
(a
k
k
Φ
=
Φ
, т.е. при
∫
Φ
−
=
t
t
t
k
k
dt
t
f
0
)
(
)
,
,
,
(
a
a
x
x &
, где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если
0
≡
k
f
, то связи типа (119) задают под- вижные граничные условия. Если связи типа (119) имеют вид
,
,
0
);
,
1
(
0
)
(
);
,
1
(
0
)
(
10 1
2 2
00 0
1 2
2 1
1 1
0 0
2 2
2 1
1 1
t
t
t
t
n
k
x
t
x
n
k
x
t
x
n
n
k
k
k
k
k
k
−
≡
Φ
=
−
≡
Φ
=
=
−
≡
Φ
=
=
−
≡
Φ
+
+
где
10 0
...,
,
1
t
x
k
– заданные числа, то граничные условия называются закрепленными.
Если
0
;
0
;
,
1
;
,
1 10 1
00 0
1 2
1
=
−
=
−
<
=
=
t
t
t
t
n
n
k
n
k
, то
1
n
концов закреплено, а остальные условия называются свобод- ными граничными условиями.
Если граничные условия
0
)
,
,
,
(
1 0
1 0
=
Φ
x
x
t
t
k
при
)
,
1
,
0
(
ρ
=
=
k
f
k
можно разбить на две группы
0
)
,
(
0 0
1
=
Φ
x
t
k
;
0
)
,
(
1 1
2
=
Φ
x
t
k
;
n
k
k
<
ρ
ρ
+
ρ
=
ρ
=
1 1
2 1
1
,
...,
,
1
,
,
1
и если
)
,
(
)
,
(
0 0
1 1
x
x
t
h
t
q
−
≡
Φ
, то задача называется задачей с разделенными
условиями для концов.
Общие условия (119) называются смешанными граничными условиями.
9.2. Первое необходимое условие экстремума функционала
в задаче Больца
Первое необходимое условие экстремума состоит из:
• правила множителей Лагранжа;
• уравнений Эйлера–Лагранжа;
• условий Эрдмана–Вейерштрасса;
• условий трансверсальности.
Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по
)
(t
x&
) ва- риации
)
(
)
(
)
(
),
(
)
(
)
(
t
t
t
t
t
t
x
x
x
x
x
x
&
&
&
−
=
δ
−
=
δ
по любым совместимым со связями (118) направлениям в пространстве
n
n
X
X
∈
x
,
и функции
k
k
f
f
Φ
Φ,
,
,
обладают непрерывными производными до третьего порядка. Тогда необходимые ус- ловия экстремума формулируются следующим образом.
Правило множителей Лагранжа
: существуют функции
µ
0
,
µ
k
,
)
(t
j
λ
и функции
∑
∑
ρ
=
=
+
+
=
1 1
0
)
,
,
,
(
)
(
k
m
j
j
j
k
k
t
F
t
f
f
F
a
x
x
λ
µ
µ
&
; (121)
∑
ρ
=
Φ
+
Φ
=
1 1
1 0
0 1
1 0
0 0
)
),
(
,
),
(
,
(
)
),
(
,
),
(
,
(
k
k
k
t
t
t
t
t
t
t
t
L
a
x
x
µ
a
x
x
µ
(122) такие, что множители
k
µ
µ
,
0 0
≥
– постоянные и решение исходной задачи на условный экстремум лежит среди решений
задачи на безусловный экстремум для вспомогательного функционала
∫
+
=
1 0
t
t
Fdt
L
J
Всегда можно считать
1 0
=
µ
, за исключением особых (анормальных) случаев.
Уравнения Эйлера–Лагранжа
.
Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа:
t
n
i
x
i
F
F
x
F
dt
d
i
=
−
∑
=1
&
&
; (123)
)
,
1
(
0
n
i
F
dt
d
F
i
i
x
x
=
=
−
&
, (124) где
t
F
F
x
F
F
x
F
F
t
i
x
i
x
i
i
∂
∂
=
∂
∂
=
∂
∂
=
;
;
&
&
З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все
)
(t
x
i
обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу.
C
F
x
F
n
i
x
i
i
=
−
∑
=1
&
&
(125) в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
Условия Эрдмана–Вейерштрасса
.
Величины
∑
=
−
n
i
x
i
i
F
x
F
1
&
&
и
)
,
1
(
n
i
F
i
x
=
&
непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при
t
t
′
= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте
)
(t
x
i
имеет место разрыв (перво- го рода) в производной:
+
+
′
=
−
′
=
=
≠
=
i
t
t
i
t
t
i
i
x
dt
t
dx
dt
t
dx
x
&
&
0 0
)
(
)
(
, (126) то справедливы соотношения
)
,
1
(
n
i
F
x
F
x
F
F
i
i
i
i
i
i
x
x
x
i
x
x
i
x
=
=
∂
∂
=
∂
∂
=
+
=
=
+
&
&
&
&
&
&
&
&
(127) и
1 1
1 1
∑
∑
∑
∑
=
+
+
+
=
=
=
=
=
−
=
−
=
−
=
−
+
−
n
i
x
i
x
x
n
i
x
i
x
x
n
i
x
i
n
i
x
i
i
i
i
i
i
i
i
i
F
x
F
F
x
F
F
x
F
F
x
F
&
&
&
&
&
&
&
&
&
&
&
&
(128)
Здесь
)
,...,
(
;
)
,...,
,
(
;
)
,
,
,
(
;
)
,
,
,
(
2 1
2 1
T
n
T
n
x
x
x
x
x
x
t
F
F
t
F
F
−
−
−
−
+
+
+
+
=
+
=
−
=
=
=
=
=
+
−
&
&
&
&
&
&
&
&
&
&
&
&
&
&
x
x
a
x
x
a
x
x
x
x
x
x
Условие трансверсальности
.
Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство
∑∫
∑
∑
=
=
=
=
+
+
+
−
r
j
t
t
j
a
n
i
i
x
n
i
x
i
dt
da
F
dL
dx
F
dt
F
x
F
j
i
i
1 1
0 1
1 1
0 0
&
&
&
(129) выполняется тождественно для
j
i
i
i
i
da
t
dx
dx
t
dx
dx
dt
dt
),
(
),
(
,
,
1 1
0 0
1 0
=
=
(т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции
)
,
),
(
),
(
,
,
(
1 0
1 0
k
t
t
t
t
L
1 ... 7 8 9 10 11 12 13 14 15
η
u
ℵ
. (111)
Здесь
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
∂
∂
2 1
2 1
1 2
1 1
2 2
1 1
2 2
1 2
,
,
,
,
m
m
m
u
H
u
u
H
u
u
H
u
H
H
L
L
L
L
L
u
Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения
0 0
,
det
)
(
2 1
2
=
∂
∂
∂
∂
−
∂
∂
=
u
u
u
ℵ
ℵ
T
sE
H
s
D
. (112)
Неравенство нулю определителя матрицы
∂
∂
∂
∂
∂
∂
0 2
1 2
u
u
u
ℵ
ℵ
T
H
(113) во всех точках x
*
(t), u
*
(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u
*
(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы- вается невырожденной.
С л е д с т в и я . 1. Условия для открытого ядра области
)
,
( x
t
U
m
(условия (95) – (99)) означают, что во всех точках тра- ектории, в которых минимум H по u,
)
,
( t
U
m
x
u
∈
достигается при выполнении строгих неравенств
)
,
1
(
0
)
,
,
(
v
i
t
i
=
>
ℵ
u
x
(114)
(т.е. в так называемом открытом ядре области
)
,
( t
U
m
x
) справедлив принцип максимума (см. п. 4.3), не учитывающий нали- чие связей (89). Здесь все
)
,
1
(
0 1
v
i
i
=
=
β
и дифференциальные уравнения (95)–(96) при условии (99), дающем
)
,
,
(
λ
x
u
u
t
=
имеют единственное решение:
λ
λ
=
λ
λ
=
).
,
,
,
(
);
,
,
,
(
0 0
0 0
0 0
i
i
i
i
i
i
t
t
t
t
x
x
x
x
(115)
В этом случае
)
,
,
,
(
0 0
0
i
t
t
λ
=
x
u
u
(116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
, по крайней мере, непрерывно.
Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци- руемо по
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
2. Если
)
,
,
(
u
x
t
i
ℵ
не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае
)
,
( t
U
m
x
зависит лишь от t:
)
(t
U
U
m
m
=
3. Условия для границы области
)
,
( t
U
m
x
находятся следующим образом. Если при определении минимума H по u часть компонент вектора
ℵ
удовлетворяются в виде равенств, то недостающие множители
j
β
могут быть найдены из усло- вий (102). Если минимум H по u достигается во внутренней точке области
m
U
, то управление
j
u
и множители
j
β
нахо- дятся из условий (102) и тех из (89), которые выполняются в виде равенств
0
)
,
,
(
;
0
=
=
∂
∂
+
∂
∂
u
x
β
u
u
t
H
T
ℵ
ℵ
(117)
Из (117) находятся u и
β
. При этом
)
,
(
),
,
(
λ
x
β
β
λ
x
u
u
=
=
непрерывны в точке соединения, если только в ней нет раз- рыва в функции u(t).
Контрольные вопросы
1. Типы граничных условий.
2. Необходимые условия оптимальности.
3. Аналог необходимого условия Клебша.
Г л а в а 9
ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО
ИСЧИСЛЕНИЯ
Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав- нений первого порядка, разрешенных относительно производных)
*
, а управляющие функции u(t) явно не введены (и по ка- ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно- го исчисления.
Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен- но для такой системы разработаны эффективные алгоритмы численного интегрирования.
9.1. Задачи Больца, Майера, Лагранжа
Задача Больца
.
Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.
Пусть класс траекторий определяется:
1) кривыми x(t) c координатами
1 0
),
,
1
(
)
(
t
t
t
n
i
t
x
i
≤
≤
=
;
2) параметрами
)
,
1
(
r
j
a
j
=
Параметры
j
a можно рассматривать как некоторые постоянные координаты кривой С:
Y
t
t
)
),
(
(
)
(
a
x
z
=
в (n + r)-мерном пространстве,
T
r
n
a
a
x
x
x
z
)
...,
,
,
...,
,
,
(
1 2
1
=
Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида
)
,
1
(
0
)
,
,
,
(
n
m
j
t
F
j
<
=
=
=
a
x
x
&
(118) и условиям
)
,
1
(
0
)
,
,
,
(
)
),
(
,
),
(
,
(
1 0
1 1
0 0
ρ
=
=
+
Φ
=
∫
k
dt
t
f
t
t
t
t
I
t
t
k
k
k
a
x
x
a
x
x
&
, (119) где
T
n
x
x
dt
d
)
...,
,
(
1
&
&
&
=
=
x
x
Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал
∫
+
Φ
=
1 0
)
,
,
,
(
)
,
,
,
,
(
1 1
0 0
t
t
dt
t
f
t
t
J
a
x
x
a
x
x
&
. (120)
Задача Майера
.
Эта задача формально получается из задачи Больца при
)
,
1
(
0
,
0
ρ
=
≡
≡
k
f
f
k
. В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть
2 2
+
+
=
ρ
r
n
. Если фиксирован век- тор параметров а, то число степеней свободы
σ системы дифференциальных уравнений (118), равное разности между чис- лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно:
m
n
−
=
σ
Задача Лагранжа
.
Эта задача вытекает из задачи Больца при
ρ
=
≡
≡
Φ
,
1
,
0
,
0
k
f
k
Виды связей и граничных условий. Связи вида (119) при
)
(a
k
k
Φ
=
Φ
, т.е. при
∫
Φ
−
=
t
t
t
k
k
dt
t
f
0
)
(
)
,
,
,
(
a
a
x
x &
, где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если
0
≡
k
f
, то связи типа (119) задают под- вижные граничные условия. Если связи типа (119) имеют вид
,
,
0
);
,
1
(
0
)
(
);
,
1
(
0
)
(
10 1
2 2
00 0
1 2
2 1
1 1
0 0
2 2
2 1
1 1
t
t
t
t
n
k
x
t
x
n
k
x
t
x
n
n
k
k
k
k
k
k
−
≡
Φ
=
−
≡
Φ
=
=
−
≡
Φ
=
=
−
≡
Φ
+
+
где
10 0
...,
,
1
t
x
k
– заданные числа, то граничные условия называются закрепленными.
Если
0
;
0
;
,
1
;
,
1 10 1
00 0
1 2
1
=
−
=
−
<
=
=
t
t
t
t
n
n
k
n
k
, то
1
n
концов закреплено, а остальные условия называются свобод- ными граничными условиями.
Если граничные условия
0
)
,
,
,
(
1 0
1 0
=
Φ
x
x
t
t
k
при
)
,
1
,
0
(
ρ
=
=
k
f
k
можно разбить на две группы
0
)
,
(
0 0
1
=
Φ
x
t
k
;
0
)
,
(
1 1
2
=
Φ
x
t
k
;
n
k
k
<
ρ
ρ
+
ρ
=
ρ
=
1 1
2 1
1
,
...,
,
1
,
,
1
и если
)
,
(
)
,
(
0 0
1 1
x
x
t
h
t
q
−
≡
Φ
, то задача называется задачей с разделенными
условиями для концов.
Общие условия (119) называются смешанными граничными условиями.
9.2. Первое необходимое условие экстремума функционала
в задаче Больца
Первое необходимое условие экстремума состоит из:
• правила множителей Лагранжа;
• уравнений Эйлера–Лагранжа;
• условий Эрдмана–Вейерштрасса;
• условий трансверсальности.
Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по
)
(t
x&
) ва- риации
)
(
)
(
)
(
),
(
)
(
)
(
t
t
t
t
t
t
x
x
x
x
x
x
&
&
&
−
=
δ
−
=
δ
по любым совместимым со связями (118) направлениям в пространстве
n
n
X
X
∈
x
,
и функции
k
k
f
f
Φ
Φ,
,
,
обладают непрерывными производными до третьего порядка. Тогда необходимые ус- ловия экстремума формулируются следующим образом.
Правило множителей Лагранжа
: существуют функции
µ
0
,
µ
k
,
)
(t
j
λ
и функции
∑
∑
ρ
=
=
+
+
=
1 1
0
)
,
,
,
(
)
(
k
m
j
j
j
k
k
t
F
t
f
f
F
a
x
x
λ
µ
µ
&
; (121)
∑
ρ
=
Φ
+
Φ
=
1 1
1 0
0 1
1 0
0 0
)
),
(
,
),
(
,
(
)
),
(
,
),
(
,
(
k
k
k
t
t
t
t
t
t
t
t
L
a
x
x
µ
a
x
x
µ
(122) такие, что множители
k
µ
µ
,
0 0
≥
– постоянные и решение исходной задачи на условный экстремум лежит среди решений
задачи на безусловный экстремум для вспомогательного функционала
∫
+
=
1 0
t
t
Fdt
L
J
Всегда можно считать
1 0
=
µ
, за исключением особых (анормальных) случаев.
Уравнения Эйлера–Лагранжа
.
Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа:
t
n
i
x
i
F
F
x
F
dt
d
i
=
−
∑
=1
&
&
; (123)
)
,
1
(
0
n
i
F
dt
d
F
i
i
x
x
=
=
−
&
, (124) где
t
F
F
x
F
F
x
F
F
t
i
x
i
x
i
i
∂
∂
=
∂
∂
=
∂
∂
=
;
;
&
&
З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все
)
(t
x
i
обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу.
C
F
x
F
n
i
x
i
i
=
−
∑
=1
&
&
(125) в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
Условия Эрдмана–Вейерштрасса
.
Величины
∑
=
−
n
i
x
i
i
F
x
F
1
&
&
и
)
,
1
(
n
i
F
i
x
=
&
непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при
t
t
′
= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте
)
(t
x
i
имеет место разрыв (перво- го рода) в производной:
+
+
′
=
−
′
=
=
≠
=
i
t
t
i
t
t
i
i
x
dt
t
dx
dt
t
dx
x
&
&
0 0
)
(
)
(
, (126) то справедливы соотношения
)
,
1
(
n
i
F
x
F
x
F
F
i
i
i
i
i
i
x
x
x
i
x
x
i
x
=
=
∂
∂
=
∂
∂
=
+
=
=
+
&
&
&
&
&
&
&
&
(127) и
1 1
1 1
∑
∑
∑
∑
=
+
+
+
=
=
=
=
=
−
=
−
=
−
=
−
+
−
n
i
x
i
x
x
n
i
x
i
x
x
n
i
x
i
n
i
x
i
i
i
i
i
i
i
i
i
F
x
F
F
x
F
F
x
F
F
x
F
&
&
&
&
&
&
&
&
&
&
&
&
(128)
Здесь
)
,...,
(
;
)
,...,
,
(
;
)
,
,
,
(
;
)
,
,
,
(
2 1
2 1
T
n
T
n
x
x
x
x
x
x
t
F
F
t
F
F
−
−
−
−
+
+
+
+
=
+
=
−
=
=
=
=
=
+
−
&
&
&
&
&
&
&
&
&
&
&
&
&
&
x
x
a
x
x
a
x
x
x
x
x
x
Условие трансверсальности
.
Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство
∑∫
∑
∑
=
=
=
=
+
+
+
−
r
j
t
t
j
a
n
i
i
x
n
i
x
i
dt
da
F
dL
dx
F
dt
F
x
F
j
i
i
1 1
0 1
1 1
0 0
&
&
&
(129) выполняется тождественно для
j
i
i
i
i
da
t
dx
dx
t
dx
dx
dt
dt
),
(
),
(
,
,
1 1
0 0
1 0
=
=
(т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции
)
,
),
(
),
(
,
,
(
1 0
1 0
k
t
t
t
t
L
1 ... 7 8 9 10 11 12 13 14 15
u
ℵ
. (111)
Здесь
∂
∂
∂
∂
∂
∂
∂
∂
∂
∂
=
∂
∂
2 1
2 1
1 2
1 1
2 2
1 1
2 2
1 2
,
,
,
,
m
m
m
u
H
u
u
H
u
u
H
u
H
H
L
L
L
L
L
u
Условия (110) и (111) эквивалентны требованию положительности корней s характеристического уравнения
0 0
,
det
)
(
2 1
2
=
∂
∂
∂
∂
−
∂
∂
=
u
u
u
ℵ
ℵ
T
sE
H
s
D
. (112)
Неравенство нулю определителя матрицы
∂
∂
∂
∂
∂
∂
0 2
1 2
u
u
u
ℵ
ℵ
T
H
(113) во всех точках x
*
(t), u
*
(t) оптимальной траектории эквивалентно условию Гильберта (см. п. 9.4) и в данном случае означает непрерывность управления u
*
(t). Если указанный определитель отличен от нуля в каждой точке экстремали, то задача назы- вается невырожденной.
С л е д с т в и я . 1. Условия для открытого ядра области
)
,
( x
t
U
m
(условия (95) – (99)) означают, что во всех точках тра- ектории, в которых минимум H по u,
)
,
( t
U
m
x
u
∈
достигается при выполнении строгих неравенств
)
,
1
(
0
)
,
,
(
v
i
t
i
=
>
ℵ
u
x
(114)
(т.е. в так называемом открытом ядре области
)
,
( t
U
m
x
) справедлив принцип максимума (см. п. 4.3), не учитывающий нали- чие связей (89). Здесь все
)
,
1
(
0 1
v
i
i
=
=
β
и дифференциальные уравнения (95)–(96) при условии (99), дающем
)
,
,
(
λ
x
u
u
t
=
имеют единственное решение:
λ
λ
=
λ
λ
=
).
,
,
,
(
);
,
,
,
(
0 0
0 0
0 0
i
i
i
i
i
i
t
t
t
t
x
x
x
x
(115)
В этом случае
)
,
,
,
(
0 0
0
i
t
t
λ
=
x
u
u
(116) и решение задачи оптимизации погружено в (2n + 1) параметрическое семейство решений, причем решение (115) зависит от параметров
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
, по крайней мере, непрерывно.
Если же на траектории нет точек разрыва функции u(t), то решение, по крайней мере, дважды непрерывно дифференци- руемо по
)
,
,
,
(
0 0
0
i
i
x
t
t
λ
2. Если
)
,
,
(
u
x
t
i
ℵ
не зависит явно от x, то условия (95), (99) эквивалентны принципу максимума п. 4.3, так как в этом случае
)
,
( t
U
m
x
зависит лишь от t:
)
(t
U
U
m
m
=
3. Условия для границы области
)
,
( t
U
m
x
находятся следующим образом. Если при определении минимума H по u часть компонент вектора
ℵ
удовлетворяются в виде равенств, то недостающие множители
j
β
могут быть найдены из усло- вий (102). Если минимум H по u достигается во внутренней точке области
m
U
, то управление
j
u
и множители
j
β
нахо- дятся из условий (102) и тех из (89), которые выполняются в виде равенств
0
)
,
,
(
;
0
=
=
∂
∂
+
∂
∂
u
x
β
u
u
t
H
T
ℵ
ℵ
(117)
Из (117) находятся u и
β
. При этом
)
,
(
),
,
(
λ
x
β
β
λ
x
u
u
=
=
непрерывны в точке соединения, если только в ней нет раз- рыва в функции u(t).
Контрольные вопросы
1. Типы граничных условий.
2. Необходимые условия оптимальности.
3. Аналог необходимого условия Клебша.
Г л а в а 9
ЭЛЕМЕНТЫ КЛАССИЧЕСКОГО ВАРИАЦИОННОГО
ИСЧИСЛЕНИЯ
Задачи, в которых уравнения движения не приведены к форме Коши (т.е. не записаны в виде дифференциальных урав- нений первого порядка, разрешенных относительно производных)
*
, а управляющие функции u(t) явно не введены (и по ка- ким-либо причинам такое приведение невозможно или нежелательно), можно решать методами классического вариационно- го исчисления.
Отметим, что с точки зрения вычислений всегда желательно привести систему уравнений к форме Коши, так как имен- но для такой системы разработаны эффективные алгоритмы численного интегрирования.
9.1. Задачи Больца, Майера, Лагранжа
Задача Больца
.
Одна из наиболее общих формулировок для задач с однократными интегралами и дополнительными условиями заключается в следующем.
Пусть класс траекторий определяется:
1) кривыми x(t) c координатами
1 0
),
,
1
(
)
(
t
t
t
n
i
t
x
i
≤
≤
=
;
2) параметрами
)
,
1
(
r
j
a
j
=
Параметры
j
a можно рассматривать как некоторые постоянные координаты кривой С:
Y
t
t
)
),
(
(
)
(
a
x
z
=
в (n + r)-мерном пространстве,
T
r
n
a
a
x
x
x
z
)
...,
,
,
...,
,
,
(
1 2
1
=
Пусть кривые (x(t), a) удовлетворяют уравнениям движения (или уравнениям связей, вообще говоря, неинтегрируемым) вида
)
,
1
(
0
)
,
,
,
(
n
m
j
t
F
j
<
=
=
=
a
x
x
&
(118) и условиям
)
,
1
(
0
)
,
,
,
(
)
),
(
,
),
(
,
(
1 0
1 1
0 0
ρ
=
=
+
Φ
=
∫
k
dt
t
f
t
t
t
t
I
t
t
k
k
k
a
x
x
a
x
x
&
, (119) где
T
n
x
x
dt
d
)
...,
,
(
1
&
&
&
=
=
x
x
Необходимо найти кривую из указанного класса траекторий, которая минимизирует функционал
∫
+
Φ
=
1 0
)
,
,
,
(
)
,
,
,
,
(
1 1
0 0
t
t
dt
t
f
t
t
J
a
x
x
a
x
x
&
. (120)
Задача Майера
.
Эта задача формально получается из задачи Больца при
)
,
1
(
0
,
0
ρ
=
≡
≡
k
f
f
k
. В этом случае краевые условия (119) становятся общими граничными условиями, число которых должно быть
2 2
+
+
=
ρ
r
n
. Если фиксирован век- тор параметров а, то число степеней свободы
σ системы дифференциальных уравнений (118), равное разности между чис- лом зависимых переменных и числом независимых дифференциальных уравнений, для задачи Майера равно:
m
n
−
=
σ
Задача Лагранжа
.
Эта задача вытекает из задачи Больца при
ρ
=
≡
≡
Φ
,
1
,
0
,
0
k
f
k
Виды связей и граничных условий. Связи вида (119) при
)
(a
k
k
Φ
=
Φ
, т.е. при
∫
Φ
−
=
t
t
t
k
k
dt
t
f
0
)
(
)
,
,
,
(
a
a
x
x &
, где все или часть компонент вектора а фиксирована, называются изопериметрическими. Если
0
≡
k
f
, то связи типа (119) задают под- вижные граничные условия. Если связи типа (119) имеют вид
,
,
0
);
,
1
(
0
)
(
);
,
1
(
0
)
(
10 1
2 2
00 0
1 2
2 1
1 1
0 0
2 2
2 1
1 1
t
t
t
t
n
k
x
t
x
n
k
x
t
x
n
n
k
k
k
k
k
k
−
≡
Φ
=
−
≡
Φ
=
=
−
≡
Φ
=
=
−
≡
Φ
+
+
где
10 0
...,
,
1
t
x
k
– заданные числа, то граничные условия называются закрепленными.
Если
0
;
0
;
,
1
;
,
1 10 1
00 0
1 2
1
=
−
=
−
<
=
=
t
t
t
t
n
n
k
n
k
, то
1
n
концов закреплено, а остальные условия называются свобод- ными граничными условиями.
Если граничные условия
0
)
,
,
,
(
1 0
1 0
=
Φ
x
x
t
t
k
при
)
,
1
,
0
(
ρ
=
=
k
f
k
можно разбить на две группы
0
)
,
(
0 0
1
=
Φ
x
t
k
;
0
)
,
(
1 1
2
=
Φ
x
t
k
;
n
k
k
<
ρ
ρ
+
ρ
=
ρ
=
1 1
2 1
1
,
...,
,
1
,
,
1
и если
)
,
(
)
,
(
0 0
1 1
x
x
t
h
t
q
−
≡
Φ
, то задача называется задачей с разделенными
условиями для концов.
Общие условия (119) называются смешанными граничными условиями.
9.2. Первое необходимое условие экстремума функционала
в задаче Больца
Первое необходимое условие экстремума состоит из:
• правила множителей Лагранжа;
• уравнений Эйлера–Лагранжа;
• условий Эрдмана–Вейерштрасса;
• условий трансверсальности.
Пусть минимизирующая кривая С: {x = x(t), a} допускает в любой точке слабые (малые как по x(t), так и по
)
(t
x&
) ва- риации
)
(
)
(
)
(
),
(
)
(
)
(
t
t
t
t
t
t
x
x
x
x
x
x
&
&
&
−
=
δ
−
=
δ
по любым совместимым со связями (118) направлениям в пространстве
n
n
X
X
∈
x
,
и функции
k
k
f
f
Φ
Φ,
,
,
обладают непрерывными производными до третьего порядка. Тогда необходимые ус- ловия экстремума формулируются следующим образом.
Правило множителей Лагранжа
: существуют функции
µ
0
,
µ
k
,
)
(t
j
λ
и функции
∑
∑
ρ
=
=
+
+
=
1 1
0
)
,
,
,
(
)
(
k
m
j
j
j
k
k
t
F
t
f
f
F
a
x
x
λ
µ
µ
&
; (121)
∑
ρ
=
Φ
+
Φ
=
1 1
1 0
0 1
1 0
0 0
)
),
(
,
),
(
,
(
)
),
(
,
),
(
,
(
k
k
k
t
t
t
t
t
t
t
t
L
a
x
x
µ
a
x
x
µ
(122) такие, что множители
k
µ
µ
,
0 0
≥
– постоянные и решение исходной задачи на условный экстремум лежит среди решений
задачи на безусловный экстремум для вспомогательного функционала
∫
+
=
1 0
t
t
Fdt
L
J
Всегда можно считать
1 0
=
µ
, за исключением особых (анормальных) случаев.
Уравнения Эйлера–Лагранжа
.
Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа:
t
n
i
x
i
F
F
x
F
dt
d
i
=
−
∑
=1
&
&
; (123)
)
,
1
(
0
n
i
F
dt
d
F
i
i
x
x
=
=
−
&
, (124) где
t
F
F
x
F
F
x
F
F
t
i
x
i
x
i
i
∂
∂
=
∂
∂
=
∂
∂
=
;
;
&
&
З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все
)
(t
x
i
обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу.
C
F
x
F
n
i
x
i
i
=
−
∑
=1
&
&
(125) в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
Условия Эрдмана–Вейерштрасса
.
Величины
∑
=
−
n
i
x
i
i
F
x
F
1
&
&
и
)
,
1
(
n
i
F
i
x
=
&
непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при
t
t
′
= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте
)
(t
x
i
имеет место разрыв (перво- го рода) в производной:
+
+
′
=
−
′
=
=
≠
=
i
t
t
i
t
t
i
i
x
dt
t
dx
dt
t
dx
x
&
&
0 0
)
(
)
(
, (126) то справедливы соотношения
)
,
1
(
n
i
F
x
F
x
F
F
i
i
i
i
i
i
x
x
x
i
x
x
i
x
=
=
∂
∂
=
∂
∂
=
+
=
=
+
&
&
&
&
&
&
&
&
(127) и
1 1
1 1
∑
∑
∑
∑
=
+
+
+
=
=
=
=
=
−
=
−
=
−
=
−
+
−
n
i
x
i
x
x
n
i
x
i
x
x
n
i
x
i
n
i
x
i
i
i
i
i
i
i
i
i
F
x
F
F
x
F
F
x
F
F
x
F
&
&
&
&
&
&
&
&
&
&
&
&
(128)
Здесь
)
,...,
(
;
)
,...,
,
(
;
)
,
,
,
(
;
)
,
,
,
(
2 1
2 1
T
n
T
n
x
x
x
x
x
x
t
F
F
t
F
F
−
−
−
−
+
+
+
+
=
+
=
−
=
=
=
=
=
+
−
&
&
&
&
&
&
&
&
&
&
&
&
&
&
x
x
a
x
x
a
x
x
x
x
x
x
Условие трансверсальности
.
Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство
∑∫
∑
∑
=
=
=
=
+
+
+
−
r
j
t
t
j
a
n
i
i
x
n
i
x
i
dt
da
F
dL
dx
F
dt
F
x
F
j
i
i
1 1
0 1
1 1
0 0
&
&
&
(129) выполняется тождественно для
j
i
i
i
i
da
t
dx
dx
t
dx
dx
dt
dt
),
(
),
(
,
,
1 1
0 0
1 0
=
=
(т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции
)
,
),
(
),
(
,
,
(
1 0
1 0
k
t
t
t
t
L
∫
+
=
1 0
t
t
Fdt
L
J
Всегда можно считать
1 0
=
µ
, за исключением особых (анормальных) случаев.
Уравнения Эйлера–Лагранжа
.
Между угловыми точками (см. 126) минимизирующей кривой: C: {x = x(t), a} выполня- ются уравнения Эйлера–Лагранжа:
t
n
i
x
i
F
F
x
F
dt
d
i
=
−
∑
=1
&
&
; (123)
)
,
1
(
0
n
i
F
dt
d
F
i
i
x
x
=
=
−
&
, (124) где
t
F
F
x
F
F
x
F
F
t
i
x
i
x
i
i
∂
∂
=
∂
∂
=
∂
∂
=
;
;
&
&
З а м е ч а н и е . Уравнение (123) является следствием остальных (при условии, что все
)
(t
x
i
обладают вторыми произ- водными) и для функций F, не содержащих явно t, приводит к первому интегралу.
C
F
x
F
n
i
x
i
i
=
−
∑
=1
&
&
(125) в силу (127), (128), непрерывному при переходе через угловую точку.
Решения x(t) уравнения Эйлера–Лагранжа называются экстремалями независимо от того, являются ли они минимизи- рующими, максимизирующими или седловыми кривыми для функционала J со связями (118), (119).
Условия Эрдмана–Вейерштрасса
.
Величины
∑
=
−
n
i
x
i
i
F
x
F
1
&
&
и
)
,
1
(
n
i
F
i
x
=
&
непрерывны вдоль кривой С: {x = x(t), a}. В частности, если при
t
t
′
= кривая С имеет угловую точку, т.е. хотя бы по одной компоненте
)
(t
x
i
имеет место разрыв (перво- го рода) в производной:
+
+
′
=
−
′
=
=
≠
=
i
t
t
i
t
t
i
i
x
dt
t
dx
dt
t
dx
x
&
&
0 0
)
(
)
(
, (126) то справедливы соотношения
)
,
1
(
n
i
F
x
F
x
F
F
i
i
i
i
i
i
x
x
x
i
x
x
i
x
=
=
∂
∂
=
∂
∂
=
+
=
=
+
&
&
&
&
&
&
&
&
(127) и
1 1
1 1
∑
∑
∑
∑
=
+
+
+
=
=
=
=
=
−
=
−
=
−
=
−
+
−
n
i
x
i
x
x
n
i
x
i
x
x
n
i
x
i
n
i
x
i
i
i
i
i
i
i
i
i
F
x
F
F
x
F
F
x
F
F
x
F
&
&
&
&
&
&
&
&
&
&
&
&
(128)
Здесь
)
,...,
(
;
)
,...,
,
(
;
)
,
,
,
(
;
)
,
,
,
(
2 1
2 1
T
n
T
n
x
x
x
x
x
x
t
F
F
t
F
F
−
−
−
−
+
+
+
+
=
+
=
−
=
=
=
=
=
+
−
&
&
&
&
&
&
&
&
&
&
&
&
&
&
x
x
a
x
x
a
x
x
x
x
x
x
Условие трансверсальности
.
Концевые точки 0 и 1 кривой С: {x = x(t), a} таковы, что равенство
∑∫
∑
∑
=
=
=
=
+
+
+
−
r
j
t
t
j
a
n
i
i
x
n
i
x
i
dt
da
F
dL
dx
F
dt
F
x
F
j
i
i
1 1
0 1
1 1
0 0
&
&
&
(129) выполняется тождественно для
j
i
i
i
i
da
t
dx
dx
t
dx
dx
dt
dt
),
(
),
(
,
,
1 1
0 0
1 0
=
=
(т.е. для всех произвольных и независимых значений указанных вариаций концов траекторий и вариаций параметров). Здесь dL – полный дифференциал функции
)
,
),
(
),
(
,
,
(
1 0
1 0
k
t
t
t
t
L
1 ... 7 8 9 10 11 12 13 14 15