Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 187
Скачиваний: 1
Г л а в а 9
Разностные аппроксимации задач оптимального управления
Численная реализация многих методов решения задач опти мального управления, связанных с системами обыкновенных диф ференциальных уравнений или уравнениями в частных производ ных, требует применения тех или иных методов приближенного вычисления встречающихся при этом интегралов, решений задач Коши, краевых задач. При этом часто исходная задача заменяет ся разностной задачей (например, так мы поступили в гл. 4), и возникает вопрос о сходимости решений разностной задачи оптими зации к решению исходной задачи. Вопросам изучения поведения разностных аппроксимаций для различных задач оптимального уп равления посвящены, например, работы [22, 28— 30, 32, 33, 58, 77, 78, 112, 259, 261]. Здесь мы ограничимся рассмотрением разност ных аппроксимаций для двух задач, изучавшихся в гл. 6.
§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ ДЛЯ ОДНОЙ ЗАДАЧИ МИНИМИЗАЦИИ КВАДРАТИЧНОГО ФУНКЦИОНАЛА
Пусть требуется минимизировать функционал
|
|
J{u) = |
\x(T, и) — у\2 |
f |
(1) |
|||
при условиях |
|
|
|
|
|
|
||
|
|
|
|
|
|
|
||
|
х = A ( t ) x + B ( t ) u + f ( t ) , |
t0 < C t < T ; x{t0) = |
x0, |
(2) |
||||
u = |
u(t)£ Ь{2 ] [/„, T], u(t) £ V |
почти всюду на t0 < |
t < T, |
(3) |
||||
где x — { x l, ..., xn), |
u = ( u l, ..., |
uT); |
V — |
заданное выпуклое замкну |
||||
тое ограниченное |
множество |
из |
Er\ A{t), B{t), f(t) |
— заданные |
||||
матрицы порядка пХп, пХг, « X I |
соответственно с кусочно-непре |
|||||||
рывными элементами при |
|
моменты to, Т и точки Хо, у^.Еп |
||||||
предполагаются известными (см. § 6.5). |
|
|
|
|
||||
Для |
приближенного решения |
этой |
задачи разобьем отрезок |
|||||
|
на N частей точками |
|
... |
< . tN= T и, приняв |
эти |
|||
точки в |
качестве |
узловых, уравнения |
(2) |
-заменим |
разностными |
уравнениями с помощью простейшей явной схемы Эйлера. Тогда придем, к следующей задаче: минимизировать функционал
М М ) = \ * n — У \ 2 |
(4 ) |
356РАЗНОСТНЫЕ А П П Р О КС И М А Ц И И ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 9
при условиях |
|
|
|
|
|
|
|
|
|
хш = |
Xi + |
Д*£ [ A lx l + В.щ + fi], |
i = |
0 , 1 |
, |
, N'— 1, |
(5) |
||
[«;] = |
(и0, ult . . . , uN- 1), щ 6 V, |
i = |
0, |
1, . . |
, N — 1: |
(6) |
|||
где |
|
|
|
|
|
|
|
|
|
hti = ti+1— ti, |
Л = •<4(^ + 0), |
Bi = B(ti + 0), |
= |
+ 0 ). |
|||||
При каждом |
фиксированном |
N^.1 |
задача |
(4) — (6) |
может |
быть решена, например, с помощью метода динамического про
граммирования |
(гл. |
4). Предположим, что при каждом N ^ . 1 |
и за |
||||||||
данном разбиении |
{0 }, |
|
< О г = Т |
получено |
дискретное |
||||||
управление [щ8^] = |
(UqN, ■••, |
|
дающее |
приближенное |
реше |
||||||
ние задачи (4) — (6) |
в следующем смысле: |
|
|
|
|
||||||
|
|
I n -<-0/([ы8а/]) |
|
|
+ Ель |
|
|
(7) |
|||
где /jv—нижняя |
грань |
функционала |
(4) |
при |
условиях |
(5), |
(6), а |
||||
последовательность |
{ejv} такова, что |
е ^ > 0 , |
ejy->-0 (N->-0 0 ). |
|
|||||||
Т е о р е м а |
1. |
Пусть при всех достаточно больших N точки |
|||||||||
разрыва матриц A{t), |
B(t), f(t) принадлежат множеству узловых |
||||||||||
точек {£,-} и пусть |
|
|
|
|
|
|
|
|
|
|
|
max |
= dN < — , |
С = const > 0 , |
N = 1, 2, . . . |
|
|||||||
0<£<W—1 |
|
N |
|
|
|
|
|
|
|
|
|
Тогда lim I*N = |
J ‘, где J* — нижняя |
грань функционала |
(1) при ус- |
||||||||
N-*30 |
|
|
того, |
последовательность |
кусочно-постоян |
||||||
ловиях (2)]— (3). Кроме |
|||||||||||
ных “управлений и'н (t), |
N = 1 , 2 , . . . , |
получаемых |
с помощью дис |
||||||||
кретных управлений |
[ц£е^] . из |
(7) |
по |
правилу |
(t) = u.*N при |
||||||
t[ ■<t]<^ti+i, i — 0, 1, •••, N — 1, минимизирует J{u), |
т. е. |
|
|
|
lim |
J (u aN\{t)) = |
J\ |
|
|
|
|
|
n-*oo |
|
|
|
|
|
|
Для доказательства этой теоремы прежде всего заметим, что: |
||||||
|
1) верна оценка |
|
|
|
|
|
|
|
|
l*(f, “)| < C lf f0 < f < 7 \ |
|
(8) |
|||
где Ci = co n st> 0 не зависит от t и выбора u(t) |
из (3). Эта оцен |
||||||
ка |
вытекает из |
неравенства |
(7.1.6) |
с |
учетом |
ограниченности |
|
И (ОН. 11-8(011. |
1/(01 и множества V] |
|
|
|
|
||
|
2) верна оценка |
|
|
|
|
|
|
|
\x{t, и) — х{%, ы)|.<С2|*— т|, |
0 < 0 т < 7 ’, |
(9) |
||||
где |
C2= c o n s t> 0 не зависит от t, т е [0 , |
Т] и выбора u(t) |
из (3). |
# Л |
Разностная аппроксимация для одной квадратичной задачи |
357 |
|
|
Для получения этой оценки достаточно почленно проинтегрировать уравнение (2) на отрезке [Л т ] :
|x(t, и) — х { т, и)\ = |j [j4(s) x (s , и) + B(s)u{s) + f(s)]ds |
и дальше воспользоваться неравенством треугольника, ограничен ностью ||/4(/) ||, ЦБ(£) ||, |/(0| и множества V, оценкой (8);
3) верна оценка
|
| х (О ы )-х (О ц )| < С 3 ( | | и ( 0 - « ( 0 1 2^ ) ,/,1 |
|
(10) |
|||||||
|
|
|
|
|
*0 |
|
|
|
|
|
где C 3 = c o n s t> 0 не зависит от t |
и выбора u(t), v(t) |
из (3). В |
са |
|||||||
мом деле, |
функция y ( t ) = x ( t , и)—x(i, |
п) является |
решением |
за |
||||||
дачи |
(2) |
при / ( 0 = 0 , х0= 0 с заменой |
и на u(t)— v(t), и оценка |
|||||||
(10) |
является следствием |
(7.1.6) |
(ср. с |
(7.1.7)); |
|
|
||||
4) функционал J (и) |
из .(1) |
при условиях (2) — (3) удовлетво |
||||||||
ряет условию Липшица |
|
|
|
|
|
|
||||
|
|
|
|/(ы) — У (п )|< С 4||ц(0 — w(0llLW, |
|
(П ) |
|||||
где C4= c o n s t> 0 не зависит от « ( 0 . о (0 |
из (3). Неравенство |
(11) |
||||||||
является простым следствием оценки (10) |
и вида функционала |
(1). |
||||||||
Впрочем, вместо (11) нам для |
дальнейшего достаточно было бы |
|||||||||
непрерывности J {и) |
в b ir) [t0, 7 ]. |
|
|
|
|
|
||||
Л е м м а 1. |
При |
выполнении условий теоремы |
1 для любого |
|||||||
управления u(t) |
из (3) и любого числа 6 > 0 найдется такой номер |
/Vi, что на всех сетках с номером N^.N\ существует дискретное управление [ы4] из (6), для которого
I/ ( « ) - / „ ([« ,])| < а .
Д о к а з а т е л ь с т в о . Прежде всего покажем, что для любого управления u(t) из (3) и любого числа у > 0 можно указать непре рывное управление v{t) из (3), для которого ||ы(/)— o(0llt (r) < Y-
Для этого воспользуемся теоремой Лузина {137], согласно которой для любого r i> 0 существует такое замкнутое множество
е[£о, Т] меры |
рТИп, что Т— 10— pMf^Cri и u(t) непрерывна на М |
|
Возьмем г )> 0 |
столь малым, чтобы т)D2^ y 2, где D = sup |
|и— v\-r- |
|
u.vS V |
|
диаметр множества V. Положим v ( t ) = u ( t ) при f e M n, |
а на каж |
дом дополнительном интервале, из которых составлено открытое множество СМп=[^о, Т\\Мц, функцию v(t) доопределим линейно между значениями функции u(t) на концах рассматриваемого ин тервала. Очевидно, функция v(t) непрерывна и, кроме того, удов
' 3 5 ^РАЗНОСТНЫЕ АП П Р О КС И М А Ц И И ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Г а. 9
летворяет условиям (3) д |
силу определения v(t) и выпуклости V. |
Далее |
|
|И 0 — »(0|£<г)= |
| I “ (0 !— v(t)\2dt^D°~ •11 < Y 2- |
2 |
|
В силу условия ;(11) можем у > 0 считать столь малой, что
Возьмем произвольное разбиение {£,} отрезка (Y0, Л. удовлет
воряющее условиям теоремы |
1, и положим [« ;]= |
(«о, «ь •••, |
m,v- i) |
||||||||
с Ui=v(U), |
i = 0 , |
1, |
N— 1. |
Пусть М = (д ;о , |
xN) — решение |
||||||
задачи |
(5), |
соответствующее |
выбранному [ы,-], x(t, |
v) — решение |
|||||||
задачи |
(2) при u = v ( t ) . Покажем, что |
|
|
|
|
||||||
|
|
|
|
|
шах |х£ — х (th v) I -» О |
|
|
|
|||
|
|
|
|
0<i<jV |
|
|
|
|
|
|
|
при N-+oo. Из |
(2), |
(5) |
имеем |
|
|
|
|
|
|||
|
|
|
|
i |
‘ k + |
l |
|
|
|
|
|
х {ti+l, о) = -v0 + £ |
j |
[А (т) * (t , i >) + |
В (т) v (t ) + |
/ (t )] dr, |
|
||||||
|
|
|
|
k=0tk |
|
|
|
|
|
|
|
|
|
i |
**+l |
И Л + Bkv (tk) + fk] dr, |
i = 0,\, |
. .. , N — 1. |
|
||||
= |
*o + |
£ |
f |
(12) |
Отсюда
^ft-rl
\x(ti+u v) — xl+i I < £ |
j |
(\A(r)x(r,v) — Akxk \ |
|
|
|
|
*=° *k |
|
|
|
|
+ \B{r)v{x) — Bkv(tk) I + \f(r) — fk \)dr. |
|
|
|||
Пользуясь неравенством треугольника, ограниченностью и ку |
|||||
сочной непрерывностью A{t), B(t), f(t), определением |
Аи В и fu |
||||
непрерывностью v(t) |
и оценками |
(8) — (9), из предыдущего |
нера |
||
венства нетрудно получить |
|
|
|
|
|
\x{ti^-\,v) |
|^ dfjAmax |
I "Ь |
(1), |
(13) |
|
|
|
|
/г—0 |
|
|
где Атах ■- sup ||Л(011, Олг( 1 ) > 0 |
не зависит от t и о^ (1)->-0 (W ->oo). |
||||
?0<«Г |
|
|
|
|
|
§ П |
Разностная аппроксимация для одной квадратичной задачи |
359 |
||||||||
Из (13) |
и леммы 6.4.1 при cpft= | x ( 4 , v)—Хй|, a = o N(l), b = d NAm&x |
|||||||||
имеем оценку |
|
|
|
|
|
|
|
|||
• |
\x(th v) — x£| < o w(l) (1 + d NAmaxy, i = 0,\, . . . ,N. |
|
||||||||
Ho dN< |
— |
по условию, |
поэтому (1 + dNAmaxY < |
exp (CAmax) и |
|
|||||
|
N |
|
|
|
|
|
|
|
|
|
|
|
Ix (ti, v) — xi \ ^ o N{l) exp {CAmax}, i = 0 , |
l, . . . ,N, |
(14) |
||||||
так что max |
\'x(th v)— хг |->0, |
(N-*-oo). |
Из |
(1), |
(4) следует, |
что |
||||
|
0 < K N |
|
|
|
|
|
|
|
|
|
J {v) — I N ([щ]) |
0 при N-y-oo, |
поэтому |
|'Jr(r>) — /лг([иг])| < — |
при |
||||||
|
|
|
|
|
|
|
|
|
g |
|
всех УУ>Л^. Окончательно с учетом оценки |J |
{и) — J (о) |■< — |
име |
||||||||
ем |/(«) — /лг([«г])| < 8 при всех N > N ±. А |
|
|
|
|||||||
Л е м м а |
2. |
Пусть выполнены условия теоремы 1, пусть [« ,]= |
||||||||
— (uo, ..., |
Un-\) |
удовлетворяет условиям |
(6) |
и «jvt(0— ыг ПРИ |
|
|||||
^t-<.ti+u |
/ = 0 , |
1, ..., N— 1. Тогда для любого б > 0 найдется такой |
||||||||
номер N2, что |
|
|
|
|
|
|
|
|||
|
|
|
|
| J(Uw( 0 ) - / W( N ) | < 6 |
|
|
|
|||
при всех N ^ .N 2. |
|
|
|
|
xN) — решение зада |
|||||
Д о к а з а т е л ь с т в о . |
Пусть [х ,]= (х0, |
|||||||||
чи (5), |
соответствующее |
[«*], |
x(t, uN) — решение задачи (2) |
при |
u ~ u N(t). Из (2) и определения uN(t) имеем
£lk+i
|
х (tl+u uN) = х0+ |
£ |
J |
[А (т) х (т, Uff) + В (т) uk + 7 |
(т)] dx. |
|
|||||||
|
|
|
k=0 tk |
|
|
|
|
|
|
|
|
|
|
Вычтем отсюда почленно равенство (12) |
и после простых преобра |
||||||||||||
зований по аналогии с (14) получим |
|
|
|
|
|
|
|
||||||
|
|
хг 1 < М 1 ) |
exp (CAmax), |
i = 0, |
1, |
. . . |
,N, |
(15) |
|||||
где |
oN( l ) - y + О ( |
N |
оо). |
|
|
|
|
|
|
|
|
|
|
|
В частности, |
отсюда |
при |
i = N имеем, что |
\х(Т, |
uN) —xw|->- |
|||||||
—>“0 |
{N-y-0 0 ), а тогда |
из |
(1), |
(4) следует |
\J { u N(t)) — /jv([«i]) | |
||||||||
при всех N ^ N 2. А |
|
|
т е о р е м ы |
1. |
Возьмем |
произвольное |
|||||||
|
Д о к а з а т е л ь с т в о |
||||||||||||
е > 0 . По определению I* |
— нижней грани /(и) |
при условиях |
(2), |
||||||||||
( 3 ) — найдется ue (t), удовлетворяющее |
условиям |
(3) |
и / *< ; |
||||||||||
^ / ( и 8(У ))^ / *+ е/ 2 |
(здесь, |
например, можно взять иа’ (t) = « * (t) , |
|||||||||||
на |
котором J (и* (t)) = / * ; |
существование |
оптимального |
и * (t) |
см. |