Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 214
Скачиваний: 1
§ 4] |
Градиент функционала |
дискретной |
системы. Условия оптимальности |
273 |
|||
(0) |
<у]= const) при |
условиях |
(40) дважды |
дифференцируем |
в |
||
£|r)j[/0, Л - Доказать, что |
если |
а , |
Р, у > 0, |
то |
J (и) при условиях |
||
(40) |
выпуклый, а если же а > |
0 , |
р, у > 0 , |
то |
сильно выпуклый в |
L p [ t 0, Т].
8 . Пусть требуется минимизировать функционал
|
/ ( « ) = ] “[(a (t), |
х) + |
Ь (t, и)] dt + |
(с, |
л (Т)) |
|
|
t . |
|
|
|
|
|
при условиях |
|
|
|
|
|
|
|
x = A ( t ) x + B(t, |
и), |
t0 < t < T \ |
x(t0) = x0, |
|
|
|
u(t)eu = {u = u(t)e Ыг) [t0, T]:u(t)ev |
|
||||
почти |
всюду при to^ts^iT}, где V— заданное |
множество из Е г, |
||||
A(i) |
— матрица порядка пХ п с кусочно-непрерывными |
элемен |
||||
тами, |
a(t) и B(t, и) — кусочно-непрерывные |
/г-мерные |
вектор- |
функции, b{t, и) — кусочно-непрерывная функция, х0, с — задан
ные векторы |
из |
моменты |
t0, |
Т заданы. |
Доказать, что для |
оптимальности пары (u(t), х(^)) |
необходимо и достаточно выпол |
||||
нения условия |
|
|
|
|
|
(ф(0 . B(t, |
u(t))) — b(t, и (i)) = |
max [(ф(^), |
B (t, u)) — b(t, и)], |
||
|
|
|
|
u£V |
|
где |
|
|
|
|
|
|
|
Ф = — A*(t)ty + |
a(t), ф(Т) = — с. |
У к а з а н и е . Заметить, что при этих условиях в формуле (18)
R= 0 .
§4. ГРАДИЕНТ ФУНКЦИОНАЛА, СВЯЗАННОГО С ДИСКРЕТНОЙ УПРАВЛЯЕМОЙ СИСТЕМОЙ. УСЛОВИЯ ОПТИМАЛЬНОСТИ
1.Рассмотрим следующую задачу оптимального управлени дискретным временем: минимизировать функционал1
1 (1“Л) = |
£ |
F ° (*£. |
“;) + |
Ф М |
|
|
( 1) |
||
при условиях |
|
£=0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi+i = Fi(xh |
щ), |
£ = |
0, |
1, |
. . . , |
N — 1; |
х0 = |
а, |
(2) |
[“;] = («о. •••. |
u n -\) : Щ е Vh |
i = |
|
|
— 1, |
(3) |
|||
где xt = {х\, . . . , х"), |
щ = |
(u\, . . . |
, |
u\), функции |
= |
( f } ........... F?), |
|||
F°, Ф. предполагаются |
известными, |
V£ — заданное |
множество |
из Er, |
|||||
натуральное число |
1 и начальная точка а заданы. |
|
|
274 МЕТОДЫ МИНИМИЗАЦИИ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ [Гл. й
Задача (1) — (3) уже изучалась нами выше. В § 4.1 с помощью динамического программирования исследовалась проблема синтеза для этой задачи, в § 5.3 рассматривались достаточные условия оптимальности. В настоящем параграфе сформулируем достаточ ные условия дифференцируемости, выпуклости функционала ( 1) при условиях (2 ), (3), а также выведем необходимые условия оптимальности. Будем пользоваться следующими обозначениями:
dFt
дх
1 • --о
дх .
|
dF\ |
|
ЗД! |
|
dF\ |
|
3F> ' |
|
дх1 |
’ |
дхп |
|
За1 ’ |
’ |
ди г |
|
|
|
|
1 |
|
|
|
|
6FЧ |
|
3F? |
ди |
8F? |
‘ |
3F1 |
|
|
|
|||||
_ |
За:1 |
’ |
дхп |
_ |
ди1 ’ |
" ' ’ |
диг |
/ |
ЗД° |
|
dF°i |
3F? |
/ 3F? |
|
3F? \ |
V За:1 |
’ |
За* |
ди |
\ За1 |
' ‘ ‘ ’ |
д и г / |
|
|
|
З Ф |
_ / З Ф |
З Ф \ |
|
|
|
|
|
д х |
V За:1 ’ |
’ д х п ) ’ |
|
|
Через LW [О, N] обозначим гильбертово пространство вектор-
функций дискретной переменной [«,] = |
(«о, Щ, ..., Ujv_ i) |
со скаляр |
||||||||
ным произведением |
|
|
|
|
|
|
|
|
||
|
|
|
ЛГ—1 |
|
|
|
|
|
||
|
|
(£“;]- ivi])L(r) = |
£ |
(“*• |
° i K |
|
|
|
||
|
|
|
|
1=0 |
|
|
|
|
|
|
и с нормой |
|
|
|
|
|
|
|
|
||
|
|
|
( = 0 |
|
|
|
|
|
|
|
Пусть U — множество всех дискретных управлений [ « J |
= |
(ы„, ■.. |
||||||||
... ,u N—i), удовлетворяющих условию |
(3); |
очевидно U CZ |
[0, N]. |
|||||||
|
Заметим, что функционал (1) представляет собой функцию Nr |
|||||||||
переменных и0, щ, ..., ujv- i. |
Если функции fi( x , и) непрерывны, а |
|||||||||
i7?, |
Ф |
полунепрерывны |
снизу |
по |
совокупности |
переменных |
||||
(x, |
u ) ^ E nx V i, множества |
Viy i —0, |
1, |
..., |
N— 1, замкнуты и огра |
|||||
ничены в Ет, то функция /([«г]) полунепрерывна снизу, |
и сущест |
|||||||||
вование |
оптимального управления |
[щ\, на котором |
функционал |
|||||||
( 1 ) |
достигает своей нижней грани при условиях (2 ), |
(3), |
следует |
|||||||
из теоремы 1.1 . |
|
|
|
|
|
|
|
|
||
|
Для |
приближенного, решения задачи |
(1) — (3) |
могут быть |
использованы методы гл. 2 , однако непосредственное применение этих методов может встретить затруднения из-за большого числа
§ 4] |
Градиент функционала дискретной системы. |
Условия оптимальности |
275 |
|||
переменных. |
При рассмотрении задачи |
(1) — (3) в пространстве |
||||
Ь Г [ О, N] |
будем иметь дело с N векторными переменными, и ме |
|||||
тоды § 2 |
здесь могут оказаться более удобными. |
|
||||
|
Выведем формулу градиента функционала (1) при условиях |
|||||
(2), |
(3) в пространстве |
[О, N], |
|
|
||
|
Т е о р е м а |
1. Пусть |
функции F°, F h |
Ф непрерывны по |
со |
вокупности своих аргументов вместе со своими частными производ
ными по переменным |
х, |
и |
при |
|
|
меУц-, |
i = 0, 1, ..., |
N— 1. |
|||||||
Кроме того, пусть |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|Д,(х + Дх, u + h) — F t (x, |
и)1ял < £ (| Д *| £/!-НЛ|£г) |
(4) |
||||||||||||
при всех х, х + Д х и всех и, u + h ^ V i, |
i=.О, |
1, |
..., |
N— 1. |
Тогда функ |
||||||||||
ционал ( 1) при условиях |
(2 ), |
(3) непрерывен и дифференцируем |
|||||||||||||
в норме Zir)[О, N], причем его градиент |
1'{[щ ]) в точке [ щ ^ и |
||||||||||||||
представим в виде |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
/'([Ц|])= |
|
|
|
|
,- |
/ = |
0, |
1 , . . . |
, |
Л ^ - 1 } б 4 г>[0, |
N], |
||||
где |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(б) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ht (x, |
ф, «) = |
- * ? ( * , |
«) + |
(Ф, |
F t (x, |
и)), |
|
= |
|
, |
д£ L ) , |
||||
|
(х0, х\, |
..., xn) |
|
|
|
|
|
|
|
|
|
|
|
|
(6) |
[л:,-] = |
— |
дискретная |
траектория |
задачи (2 ), |
соот |
||||||||||
ветствующая |
выбранному управлению |
|
|
|
а вектор-функция |
||||||||||
[фг] — (Ф-ь Фо, .... фя- i) |
определяется из условий |
|
|
|
|||||||||||
|
ф;- 1 |
dH i(xj, |
% , |
щ) |
|
i = |
0 , |
1 , |
|
N - 1; |
(7) |
||||
|
= |
дх |
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
Флг- |
i = |
|
дф (*jv> |
|
|
|
|
|
||||
|
|
|
------- ----- ■ |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
дх |
[u£] + ,[hi]^ U , |
|
|
||||
Д о к а з а т е л ь с т в о . |
Пусть [м,-], |
пусть |
[х,] и |
||||||||||||
[Xi] + [Дх£] — соответствующие |
этим |
управлениям |
дискретные |
||||||||||||
траектории задачи (2 ) } |
а |
/({«,-]) |
и |
/ ([«ij+ l^ J) = / ( [ « J ) +А/ — |
|||||||||||
соответствующие значения функционала (1). |
Из (2) следует, что |
||||||||||||||
приращение [Дх£] удовлетворяет условиям |
|
|
|
|
|
||||||||||
Дх£+1 = F t (х£ + Дхг, |
щ + |
ht) — F t (х£, |
щ) (i = |
0,. |
1, . . . |
, N — |
1); |
||||||||
Так как |
|
|
|
|
Дх0 = |
0 . |
|
|
|
|
|
(8 ) |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ф (х + Дх) — Ф (х) — ^ ЭФ(* + 9Ал:) , А х ) , 0 < 9 < 1 ,
2 7 6 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О Н АЛ ЬН Ы Х ПРОСТРАНСТВАХ \Гл. 6
то из ( 1) получаем |
|
|
|
|
|
|
|
|
|
||||
|
N—1 |
|
|
|
|
|
|
|
|
|
|
|
|
А/ = |
2 |
[ F U x i + |
Axl, щ + ht) — F°i (xh |
“£)I + |
( ^ |
p |
- , |
AxN) + R lt |
|||||
|
-4= 0 |
|
|
|
|
|
|
|
|
|
|
|
|
где |
|
|
|
|
|
|
|
|
|
|
|
|
О ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
д |
( |
дф |
+ Ш м) |
дФ(%) |
д |
\ |
( 10) |
|||
|
|
|
|
\ |
|
дх |
|
дх |
' |
|
У |
||
|
|
|
|
|
|
|
|
||||||
С учетом соотношений (7), |
(8 ) |
[имеем |
|
|
|
|
|
|
|||||
|
( |
дФ (Хш,) . |
\ |
|
|
|
^ |
|
|
|
|
||
|
|
X N |
|
|
|
|
|
|
|
|
|
|
|
|
( ------ ^ |
------. & X N J |
= — |
( % |
_ ь & X N ) = — |
^ |
[(Ф ;, |
A ^ i+ l) — |
|||||
|
|
|
|
|
|
|
|
|
i=0 |
|
|
|
|
|
|
|
|
|
N— \ |
|
|
|
|
|
|
|
|
— |
( ф (_ 1 , |
AjCj)] = |
— 2 |
(4*1. |
F i (X l + |
|
«£ |
+ Ю |
— |
P l ( * l , Щ ) ) + |
|||
|
|
|
|
|
£=0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
N — I |
|
|
|
|
|
|
|
|
|
|
|
|
+ |
S( |
|
|
■ A *,). |
|
|
|
||
|
|
|
|
|
i= 0 |
|
|
|
|
|
|
|
|
Подставляя |
полученное выражение в |
(9) |
и |
используя |
функцию |
Hi(x, ф, и), получим следующее представление для приращения функционала:
ЛГ—1 |
|
|
|
|
А / = - £ |
Г # ;(л:; + Ал:,, ф„ |
Uj + |
At) — Я £(*£, ф£( щ) — |
|
г=о L |
|
|
|
|
|
_ ( dHi(Xl' J h |
Щ) ■■ Ajc() ] |
+ /? i - |
|
Из формулы конечных приращений следует |
|
|||
Я г (* £ + Д*£) ф£, u£ + |
ht) = |
Я, (х£> |
ф£, ы£) + |
|
_|_ |
^ dfff f a + 6 tA*b Фь иг + |
бЛ ) |
Дд.^ |
i = 0, 1 , , N — 1.
Подставим это равенство в предыдущее представление для А/; будем иметь
§ 4\ |
Градиент функционала дискретной системы. Условия оптимальности |
277 |
||||||||||||
|
|
N- |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
A / - - S |
( dHi (\ %’ Ц‘° ■, |
+ |
R, |
R = Яг + Ъ + |
^8. |
(П> |
|||||||
|
|
i=0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
JV—1 |
|
|
|
|
|
|
|
|
|
|
|
|
„ |
_ |
y i |
/ |
( З Я , ( Х [ + S f A x / , T fe , ц / + 9 Л ) |
_ |
д Я Д ^ , % , щ ) |
* |
\ |
|
|||||
|
2 — |
iZj |
\ |
|
|
дж |
|
|
|
<3х |
|
’ |
V |
|
|
|
{=о |
|
|
|
|
|
|
|
|
|
|
|
( 12). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
л |
|
N- 1 |
/ dHi (Xi + 0/Д*/, %, Щ + |
Qihi) |
|
dHi(X{, |
%, щ) |
|
и \ |
|||||
|
VI |
|
|
|||||||||||
R» = - |
L |
( ----------------~ iu |
|
|
|
ы |
|
■ |
|
|
||||
|
|
j=o |
|
|
|
|
|
|
|
|
|
|
|
(13). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для оценки остаточного члена R формулы (11) |
нам понадобится |
|||||||||||||
одна лемма, представляющая собой дискретный |
аналог леммы. |
|||||||||||||
Гронуолла. |
|
|
|
|
|
|
|
|
|
N, |
|
|
||
|
Л е м м а |
1. |
Если некоторые величины ф*, / = 0 , |
1....... |
удов |
|||||||||
летворяют неравенствам |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
0 < Ф 0 < а , 0 < ф г+1 < а + b £ фт , i = 0, |
1, . . . , N — 1, |
|
|||||||||||
|
|
|
|
|
|
т = 0 |
|
|
|
|
|
|
(14> |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
то справедлива оценка |
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
0 < ф ; < а ( 1 |
+ by, |
i = 0 , l , . . - , |
N; |
|
|
|
(15> |
|||
если же |
|
|
|
N— 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
+ Ь |
i = 0, |
|
|
|
|
|
|
|
|
|
0<ф г_1 < а |
Л фт , |
1 , . . . , IV— 1; |
0 < ф ^ _ 1 < а , |
|||||||||||
|
|
|
|
|
m ~ i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(16). |
то верна |
оценка |
|
b)N~l~l, |
1 = |
0, |
1 , . . . , N |
- l . |
|
|
|
||||
|
|
0 |
< |
фг |
(1 + |
|
|
(17> |
||||||
|
Доказательство |
можно |
провести по индукции. |
При k = 0 |
по |
условию О ^ф о^й. Если неравенство О ^ ф т ^ а Ц + б) ”1 верно при.
всех тп = 0, 1, |
i, то из |
(14) |
следует |
0 < |
фг+i < |
а + 6 |
£ а (1 + 6 )т = а ( Г + 6 )*+*. |
|
|
|
т = 0 |
Аналогично можно убедиться, что из (16) вытекает оценка (17). Д»