Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 187

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г л а в а 9

Разностные аппроксимации задач оптимального управления

Численная реализация многих методов решения задач опти­ мального управления, связанных с системами обыкновенных диф­ ференциальных уравнений или уравнениями в частных производ­ ных, требует применения тех или иных методов приближенного вычисления встречающихся при этом интегралов, решений задач Коши, краевых задач. При этом часто исходная задача заменяет­ ся разностной задачей (например, так мы поступили в гл. 4), и возникает вопрос о сходимости решений разностной задачи оптими­ зации к решению исходной задачи. Вопросам изучения поведения разностных аппроксимаций для различных задач оптимального уп­ равления посвящены, например, работы [22, 28— 30, 32, 33, 58, 77, 78, 112, 259, 261]. Здесь мы ограничимся рассмотрением разност­ ных аппроксимаций для двух задач, изучавшихся в гл. 6.

§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ ДЛЯ ОДНОЙ ЗАДАЧИ МИНИМИЗАЦИИ КВАДРАТИЧНОГО ФУНКЦИОНАЛА

Пусть требуется минимизировать функционал

 

 

J{u) =

\x(T, и) — у\2

f

(1)

при условиях

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х = A ( t ) x + B ( t ) u + f ( t ) ,

t0 < C t < T ; x{t0) =

x0,

(2)

u =

u(t)£ Ь{2 ] [/„, T], u(t) £ V

почти всюду на t0 <

t < T,

(3)

где x — { x l, ..., xn),

u = ( u l, ...,

uT);

V

заданное выпуклое замкну­

тое ограниченное

множество

из

Er\ A{t), B{t), f(t)

— заданные

матрицы порядка пХп, пХг, « X I

соответственно с кусочно-непре­

рывными элементами при

 

моменты to, Т и точки Хо, у^.Еп

предполагаются известными (см. § 6.5).

 

 

 

 

Для

приближенного решения

этой

задачи разобьем отрезок

 

на N частей точками

 

...

< . tN= T и, приняв

эти

точки в

качестве

узловых, уравнения

(2)

-заменим

разностными

уравнениями с помощью простейшей явной схемы Эйлера. Тогда придем, к следующей задаче: минимизировать функционал

М М ) = \ * n — У \ 2

(4 )


356РАЗНОСТНЫЕ А П П Р О КС И М А Ц И И ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 9

при условиях

 

 

 

 

 

 

 

 

 

хш =

Xi +

Д*£ [ A lx l + В.щ + fi],

i =

0 , 1

,

, N'— 1,

(5)

[«;] =

(и0, ult . . . , uN- 1), щ 6 V,

i =

0,

1, . .

, N — 1:

(6)

где

 

 

 

 

 

 

 

 

 

hti = ti+1— ti,

Л = •<4(^ + 0),

Bi = B(ti + 0),

=

+ 0 ).

При каждом

фиксированном

N^.1

задача

(4) — (6)

может

быть решена, например, с помощью метода динамического про­

граммирования

(гл.

4). Предположим, что при каждом N ^ . 1

и за ­

данном разбиении

{0 },

 

< О г = Т

получено

дискретное

управление [щ8^] =

(UqN, ■••,

 

дающее

приближенное

реше­

ние задачи (4) — (6)

в следующем смысле:

 

 

 

 

 

 

I n -<-0/([ы8а/])

 

 

+ Ель

 

 

(7)

где /jv—нижняя

грань

функционала

(4)

при

условиях

(5),

(6), а

последовательность

{ejv} такова, что

е ^ > 0 ,

ejy->-0 (N->-0 0 ).

 

Т е о р е м а

1.

Пусть при всех достаточно больших N точки

разрыва матриц A{t),

B(t), f(t) принадлежат множеству узловых

точек {£,-} и пусть

 

 

 

 

 

 

 

 

 

 

max

= dN < — ,

С = const > 0 ,

N = 1, 2, . . .

 

0<£<W—1

 

N

 

 

 

 

 

 

 

 

Тогда lim I*N =

J ‘, где J* — нижняя

грань функционала

(1) при ус-

N-*30

 

 

того,

последовательность

кусочно-постоян­

ловиях (2)]— (3). Кроме

ных “управлений и'н (t),

N = 1 , 2 , . . . ,

получаемых

с помощью дис­

кретных управлений

[ц£е^] . из

(7)

по

правилу

(t) = u.*N при

t[ ■<t]<^ti+i, i — 0, 1, •••, N — 1, минимизирует J{u),

т. е.

 

 

 

lim

J (u aN\{t)) =

J\

 

 

 

 

n-*oo

 

 

 

 

 

Для доказательства этой теоремы прежде всего заметим, что:

 

1) верна оценка

 

 

 

 

 

 

 

l*(f, “)| < C lf f0 < f < 7 \

 

(8)

где Ci = co n st> 0 не зависит от t и выбора u(t)

из (3). Эта оцен­

ка

вытекает из

неравенства

(7.1.6)

с

учетом

ограниченности

И (ОН. 11-8(011.

1/(01 и множества V]

 

 

 

 

 

2) верна оценка

 

 

 

 

 

 

\x{t, и) — х{%, ы)|.<С2|*— т|,

0 < 0 т < 7 ’,

(9)

где

C2= c o n s t> 0 не зависит от t, т е [0 ,

Т] и выбора u(t)

из (3).


# Л

Разностная аппроксимация для одной квадратичной задачи

357

 

 

Для получения этой оценки достаточно почленно проинтегрировать уравнение (2) на отрезке [Л т ] :

|x(t, и) — х { т, и)\ = |j [j4(s) x (s , и) + B(s)u{s) + f(s)]ds |

и дальше воспользоваться неравенством треугольника, ограничен­ ностью ||/4(/) ||, ЦБ(£) ||, |/(0| и множества V, оценкой (8);

3) верна оценка

 

| х (О ы )-х (О ц )| < С 3 ( | | и ( 0 - « ( 0 1 2^ ) ,/,1

 

(10)

 

 

 

 

 

*0

 

 

 

 

 

где C 3 = c o n s t> 0 не зависит от t

и выбора u(t), v(t)

из (3). В

са­

мом деле,

функция y ( t ) = x ( t , и)x(i,

п) является

решением

за­

дачи

(2)

при / ( 0 = 0 , х0= 0 с заменой

и на u(t)v(t), и оценка

(10)

является следствием

(7.1.6)

(ср. с

(7.1.7));

 

 

4) функционал J (и)

из .(1)

при условиях (2) — (3) удовлетво­

ряет условию Липшица

 

 

 

 

 

 

 

 

 

|/(ы) — У (п )|< С 4||ц(0 — w(0llLW,

 

(П )

где C4= c o n s t> 0 не зависит от « ( 0 . о (0

из (3). Неравенство

(11)

является простым следствием оценки (10)

и вида функционала

(1).

Впрочем, вместо (11) нам для

дальнейшего достаточно было бы

непрерывности J {и)

в b ir) [t0, 7 ].

 

 

 

 

 

Л е м м а 1.

При

выполнении условий теоремы

1 для любого

управления u(t)

из (3) и любого числа 6 > 0 найдется такой номер

/Vi, что на всех сетках с номером N^.N\ существует дискретное управление [ы4] из (6), для которого

I/ ( « ) - / „ ([« ,])| < а .

Д о к а з а т е л ь с т в о . Прежде всего покажем, что для любого управления u(t) из (3) и любого числа у > 0 можно указать непре­ рывное управление v{t) из (3), для которого ||ы(/)— o(0llt (r) < Y-

Для этого воспользуемся теоремой Лузина {137], согласно которой для любого r i> 0 существует такое замкнутое множество

е[£о, Т] меры

рТИп, что Т10— pMf^Cri и u(t) непрерывна на М

Возьмем г )> 0

столь малым, чтобы т)D2^ y 2, где D = sup

v\-r-

 

u.vS V

 

диаметр множества V. Положим v ( t ) = u ( t ) при f e M n,

а на каж­

дом дополнительном интервале, из которых составлено открытое множество СМп=[^о, Т\\Мц, функцию v(t) доопределим линейно между значениями функции u(t) на концах рассматриваемого ин­ тервала. Очевидно, функция v(t) непрерывна и, кроме того, удов­


' 3 5 ^РАЗНОСТНЫЕ АП П Р О КС И М А Ц И И ЗАДАЧ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ а. 9

летворяет условиям (3) д

силу определения v(t) и выпуклости V.

Далее

 

|И 0 — »(0|£<г)=

| I “ (0 !— v(t)\2dt^D°~ •11 < Y 2-

2

 

В силу условия ;(11) можем у > 0 считать столь малой, что

Возьмем произвольное разбиение {£,} отрезка (Y0, Л. удовлет­

воряющее условиям теоремы

1, и положим [« ;]=

(«о, «ь •••,

m,v- i)

с Ui=v(U),

i = 0 ,

1,

N— 1.

Пусть М = (д ;о ,

xN) — решение

задачи

(5),

соответствующее

выбранному [ы,-], x(t,

v) — решение

задачи

(2) при u = v ( t ) . Покажем, что

 

 

 

 

 

 

 

 

 

шах |х£ — х (th v) I -» О

 

 

 

 

 

 

 

0<i<jV

 

 

 

 

 

 

при N-+oo. Из

(2),

(5)

имеем

 

 

 

 

 

 

 

 

 

i

‘ k +

l

 

 

 

 

 

х {ti+l, о) = -v0 + £

j

(т) * (t , i >) +

В (т) v (t ) +

/ (t )] dr,

 

 

 

 

 

k=0tk

 

 

 

 

 

 

 

 

i

**+l

И Л + Bkv (tk) + fk] dr,

i = 0,\,

. .. , N — 1.

 

=

*o +

£

f

(12)

Отсюда

^ft-rl

\x(ti+u v) — xl+i I < £

j

(\A(r)x(r,v) — Akxk \

 

 

 

*=° *k

 

 

 

+ \B{r)v{x) — Bkv(tk) I + \f(r) — fk \)dr.

 

 

Пользуясь неравенством треугольника, ограниченностью и ку­

сочной непрерывностью A{t), B(t), f(t), определением

Аи В и fu

непрерывностью v(t)

и оценками

(8) — (9), из предыдущего

нера­

венства нетрудно получить

 

 

 

 

\x{ti^-\,v)

|^ dfjAmax

I "Ь

(1),

(13)

 

 

 

/г—0

 

 

где Атах ■- sup ||Л(011, Олг( 1 ) > 0

не зависит от t и о^ (1)->-0 (W ->oo).

?0<«Г

 

 

 

 

 


§ П

Разностная аппроксимация для одной квадратичной задачи

359

Из (13)

и леммы 6.4.1 при cpft= | x ( 4 , v)—Хй|, a = o N(l), b = d NAm&x

имеем оценку

 

 

 

 

 

 

 

\x(th v) — x£| < o w(l) (1 + d NAmaxy, i = 0,\, . . . ,N.

 

Ho dN<

по условию,

поэтому (1 + dNAmaxY <

exp (CAmax) и

 

 

N

 

 

 

 

 

 

 

 

 

 

Ix (ti, v) — xi \ ^ o N{l) exp {CAmax}, i = 0 ,

l, . . . ,N,

(14)

так что max

\'x(th v)— хг |->0,

(N-*-oo).

Из

(1),

(4) следует,

что

 

0 < K N

 

 

 

 

 

 

 

 

J {v) — I N ([щ])

0 при N-y-oo,

поэтому

|'Jr(r>) — /лг([иг])| < —

при

 

 

 

 

 

 

 

 

 

g

 

всех УУ>Л^. Окончательно с учетом оценки |J

{и) — J (о) |■< —

име­

ем |/(«) — /лг([«г])| < 8 при всех N > N ±. А

 

 

 

Л е м м а

2.

Пусть выполнены условия теоремы 1, пусть [« ,]=

— (uo, ...,

Un-\)

удовлетворяет условиям

(6)

и «jvt(0— ыг ПРИ

 

^t-<.ti+u

/ = 0 ,

1, ..., N— 1. Тогда для любого б > 0 найдется такой

номер N2, что

 

 

 

 

 

 

 

 

 

 

 

| J(Uw( 0 ) - / W( N ) | < 6

 

 

 

при всех N ^ .N 2.

 

 

 

 

xN) — решение зада­

Д о к а з а т е л ь с т в о .

Пусть [х ,]= (х0,

чи (5),

соответствующее

[«*],

x(t, uN) — решение задачи (2)

при

u ~ u N(t). Из (2) и определения uN(t) имеем

£lk+i

 

х (tl+u uN) = х0+

£

J

(т) х (т, Uff) + В (т) uk + 7

(т)] dx.

 

 

 

 

k=0 tk

 

 

 

 

 

 

 

 

 

Вычтем отсюда почленно равенство (12)

и после простых преобра­

зований по аналогии с (14) получим

 

 

 

 

 

 

 

 

 

хг 1 < М 1 )

exp (CAmax),

i = 0,

1,

. . .

,N,

(15)

где

oN( l ) - y + О (

N

оо).

 

 

 

 

 

 

 

 

 

 

 

В частности,

отсюда

при

i = N имеем, что

\х(Т,

uN) —xw|->-

—>“0

{N-y-0 0 ), а тогда

из

(1),

(4) следует

\J { u N(t)) — /jv([«i]) |

при всех N ^ N 2. А

 

 

т е о р е м ы

1.

Возьмем

произвольное

 

Д о к а з а т е л ь с т в о

е > 0 . По определению I*

— нижней грани /(и)

при условиях

(2),

( 3 ) — найдется ue (t), удовлетворяющее

условиям

(3)

и / *< ;

^ / ( и 8(У ))^ / *+ е/ 2

(здесь,

например, можно взять иа’ (t) = « * (t) ,

на

котором J (и* (t)) = / * ;

существование

оптимального

и * (t)

см.