Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 214

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 4]

Градиент функционала

дискретной

системы. Условия оптимальности

273

(0)

<у]= const) при

условиях

(40) дважды

дифференцируем

в

£|r)j[/0, Л - Доказать, что

если

а ,

Р, у > 0,

то

J (и) при условиях

(40)

выпуклый, а если же а >

0 ,

р, у > 0 ,

то

сильно выпуклый в

L p [ t 0, Т].

8 . Пусть требуется минимизировать функционал

 

/ ( « ) = ] “[(a (t),

х) +

Ь (t, и)] dt +

(с,

л (Т))

 

 

t .

 

 

 

 

 

при условиях

 

 

 

 

 

 

x = A ( t ) x + B(t,

и),

t0 < t < T \

x(t0) = x0,

 

 

u(t)eu = {u = u(t)e Ыг) [t0, T]:u(t)ev

 

почти

всюду при to^ts^iT}, где V— заданное

множество из Е г,

A(i)

— матрица порядка пХ п с кусочно-непрерывными

элемен­

тами,

a(t) и B(t, и) — кусочно-непрерывные

/г-мерные

вектор-

функции, b{t, и) — кусочно-непрерывная функция, х0, с — задан­

ные векторы

из

моменты

t0,

Т заданы.

Доказать, что для

оптимальности пары (u(t), х(^))

необходимо и достаточно выпол­

нения условия

 

 

 

 

(ф(0 . B(t,

u(t))) b(t, и (i)) =

max [(ф(^),

B (t, u)) — b(t, и)],

 

 

 

 

u£V

 

где

 

 

 

 

 

 

 

Ф = — A*(t)ty +

a(t), ф(Т) = — с.

У к а з а н и е . Заметить, что при этих условиях в формуле (18)

R= 0 .

§4. ГРАДИЕНТ ФУНКЦИОНАЛА, СВЯЗАННОГО С ДИСКРЕТНОЙ УПРАВЛЯЕМОЙ СИСТЕМОЙ. УСЛОВИЯ ОПТИМАЛЬНОСТИ

1.Рассмотрим следующую задачу оптимального управлени дискретным временем: минимизировать функционал1

1 (1“Л) =

£

F ° (*£.

“;) +

Ф М

 

 

( 1)

при условиях

 

£=0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi+i = Fi(xh

щ),

£ =

0,

1,

. . . ,

N — 1;

х0 =

а,

(2)

[“;] = («о. •••.

u n -\) : Щ е Vh

i =

 

 

1,

(3)

где xt = {х\, . . . , х"),

щ =

(u\, . . .

,

u\), функции

=

( f } ........... F?),

F°, Ф. предполагаются

известными,

V£ — заданное

множество

из Er,

натуральное число

1 и начальная точка а заданы.

 

 


274 МЕТОДЫ МИНИМИЗАЦИИ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ [Гл. й

Задача (1) — (3) уже изучалась нами выше. В § 4.1 с помощью динамического программирования исследовалась проблема синтеза для этой задачи, в § 5.3 рассматривались достаточные условия оптимальности. В настоящем параграфе сформулируем достаточ­ ные условия дифференцируемости, выпуклости функционала ( 1) при условиях (2 ), (3), а также выведем необходимые условия оптимальности. Будем пользоваться следующими обозначениями:

dFt

дх

1 --о

дх .

 

dF\

 

ЗД!

 

dF\

 

3F> '

 

дх1

дхп

 

За1 ’

ди г

 

 

 

 

1

 

 

 

 

6FЧ

 

3F?

ди

8F?

3F1

 

 

 

_

За:1

дхп

_

ди1

" ' ’

диг

/

ЗД°

 

dF°i

3F?

/ 3F?

 

3F? \

V За:1

За*

ди

\ За1

' ‘ ‘ ’

д и г /

 

 

З Ф

_ / З Ф

З Ф \

 

 

 

 

д х

V За:1 ’

д х п )

 

 

Через LW [О, N] обозначим гильбертово пространство вектор-

функций дискретной переменной [«,] =

(«о, Щ, ..., Ujv_ i)

со скаляр­

ным произведением

 

 

 

 

 

 

 

 

 

 

 

ЛГ—1

 

 

 

 

 

 

 

(£“;]- ivi])L(r) =

£

(“*•

° i K

 

 

 

 

 

 

 

1=0

 

 

 

 

 

 

и с нормой

 

 

 

 

 

 

 

 

 

 

 

( = 0

 

 

 

 

 

 

 

Пусть U — множество всех дискретных управлений [ « J

=

(ы„, ■..

... ,u N—i), удовлетворяющих условию

(3);

очевидно U CZ

[0, N].

 

Заметим, что функционал (1) представляет собой функцию Nr

переменных и0, щ, ..., ujv- i.

Если функции fi( x , и) непрерывны, а

i7?,

Ф

полунепрерывны

снизу

по

совокупности

переменных

(x,

u ) ^ E nx V i, множества

Viy i —0,

1,

...,

N— 1, замкнуты и огра­

ничены в Ет, то функция /([«г]) полунепрерывна снизу,

и сущест­

вование

оптимального управления

[щ\, на котором

функционал

( 1 )

достигает своей нижней грани при условиях (2 ),

(3),

следует

из теоремы 1.1 .

 

 

 

 

 

 

 

 

 

Для

приближенного, решения задачи

(1) — (3)

могут быть

использованы методы гл. 2 , однако непосредственное применение этих методов может встретить затруднения из-за большого числа


§ 4]

Градиент функционала дискретной системы.

Условия оптимальности

275

переменных.

При рассмотрении задачи

(1) — (3) в пространстве

Ь Г [ О, N]

будем иметь дело с N векторными переменными, и ме­

тоды § 2

здесь могут оказаться более удобными.

 

 

Выведем формулу градиента функционала (1) при условиях

(2),

(3) в пространстве

[О, N],

 

 

 

Т е о р е м а

1. Пусть

функции F°, F h

Ф непрерывны по

со­

вокупности своих аргументов вместе со своими частными производ­

ными по переменным

х,

и

при

 

 

меУц-,

i = 0, 1, ...,

N— 1.

Кроме того, пусть

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|Д,(х + Дх, u + h) F t (x,

и)1ял < £ (| Д *| £/!-НЛ|£г)

(4)

при всех х, х + Д х и всех и, u + h ^ V i,

i=.О,

1,

...,

N— 1.

Тогда функ­

ционал ( 1) при условиях

(2 ),

(3) непрерывен и дифференцируем

в норме Zir)[О, N], причем его градиент

1'{[щ ]) в точке [ щ ^ и

представим в виде

 

 

 

 

 

 

 

 

 

 

 

 

 

/'([Ц|])=

 

 

 

 

,-

/ =

0,

1 , . . .

,

Л ^ - 1 } б 4 г>[0,

N],

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(б)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ht (x,

ф, «) =

- * ? ( * ,

«) +

(Ф,

F t (x,

и)),

 

=

 

,

д£ L ) ,

 

(х0, х\,

..., xn)

 

 

 

 

 

 

 

 

 

 

 

 

(6)

[л:,-] =

дискретная

траектория

задачи (2 ),

соот­

ветствующая

выбранному управлению

 

 

 

а вектор-функция

[фг] — (Ф-ь Фо, .... фя- i)

определяется из условий

 

 

 

 

ф;- 1

dH i(xj,

% ,

щ)

 

i =

0 ,

1 ,

 

N - 1;

(7)

 

=

дх

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Флг-

i =

 

дф (*jv>

 

 

 

 

 

 

 

 

------- ----- ■

 

 

 

 

 

 

 

 

 

 

 

 

 

дх

[u£] + ,[hi]^ U ,

 

 

Д о к а з а т е л ь с т в о .

Пусть [м,-],

пусть

[х,] и

[Xi] + [Дх£] — соответствующие

этим

управлениям

дискретные

траектории задачи (2 ) }

а

/({«,-])

и

/ ([«ij+ l^ J) = / ( [ « J ) +А/ —

соответствующие значения функционала (1).

Из (2) следует, что

приращение [Дх£] удовлетворяет условиям

 

 

 

 

 

Дх£+1 = F t (х£ + Дхг,

щ +

ht) F t (х£,

щ) (i =

0,.

1, . . .

, N

1);

Так как

 

 

 

 

Дх0 =

0 .

 

 

 

 

 

(8 )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ф (х + Дх) — Ф (х) — ^ ЭФ(* + 9Ал:) , А х ) , 0 < 9 < 1 ,


2 7 6 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О Н АЛ ЬН Ы Х ПРОСТРАНСТВАХ \Гл. 6

то из ( 1) получаем

 

 

 

 

 

 

 

 

 

 

N1

 

 

 

 

 

 

 

 

 

 

 

А/ =

2

[ F U x i +

Axl, щ + ht) F°i (xh

“£)I +

( ^

p

- ,

AxN) + R lt

 

-4= 0

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

О )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

д

(

дф

+ Ш м)

дФ(%)

д

\

( 10)

 

 

 

 

\

 

дх

 

дх

'

 

У

 

 

 

 

 

 

 

 

С учетом соотношений (7),

(8 )

[имеем

 

 

 

 

 

 

 

(

дФ (Хш,) .

\

 

 

 

^

 

 

 

 

 

 

X N

 

 

 

 

 

 

 

 

 

 

 

( ------ ^

------. & X N J

= —

( %

_ ь & X N ) = —

^

[(Ф ;,

A ^ i+ l) —

 

 

 

 

 

 

 

 

 

i=0

 

 

 

 

 

 

 

 

N— \

 

 

 

 

 

 

 

 

( ф (_ 1 ,

AjCj)] =

— 2

(4*1.

F i (X l +

 

«£

+ Ю

P l ( * l , Щ ) ) +

 

 

 

 

 

£=0

 

 

 

 

 

 

 

 

 

 

 

 

 

N — I

 

 

 

 

 

 

 

 

 

 

 

 

+

S(

 

 

■ A *,).

 

 

 

 

 

 

 

 

i= 0

 

 

 

 

 

 

 

 

Подставляя

полученное выражение в

(9)

и

используя

функцию

Hi(x, ф, и), получим следующее представление для приращения функционала:

ЛГ—1

 

 

 

А / = - £

Г # ;(л:; + Ал:,, ф„

Uj +

At) — Я £(*£, ф£( щ) —

г=о L

 

 

 

 

_ ( dHi(Xl' J h

Щ) ■■ Ajc() ]

+ /? i -

Из формулы конечных приращений следует

 

Я г (* £ + Д*£) ф£, u£ +

ht) =

Я, (х£>

ф£, ы£) +

_|_

^ dfff f a + 6 tA*b Фь иг +

бЛ )

Дд.^

i = 0, 1 , , N — 1.

Подставим это равенство в предыдущее представление для А/; будем иметь


§ 4\

Градиент функционала дискретной системы. Условия оптимальности

277

 

 

N-

1

 

 

 

 

 

 

 

 

 

 

 

A / - - S

( dHi (\ %’ Ц‘° ■,

+

R,

R = Яг + Ъ +

^8.

(П>

 

 

i=0

 

 

 

 

 

 

 

 

 

 

 

 

 

JV—1

 

 

 

 

 

 

 

 

 

 

 

_

y i

/

( З Я , ( Х [ + S f A x / , T fe , ц / + 9 Л )

_

д Я Д ^ , % , щ )

*

\

 

 

2

iZj

\

 

 

дж

 

 

 

<3х

 

V

 

 

{=о

 

 

 

 

 

 

 

 

 

 

 

( 12).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

л

 

N- 1

/ dHi (Xi + 0/Д*/, %, Щ +

Qihi)

 

dHi(X{,

%, щ)

 

и \

 

VI

 

 

R» = -

L

( ----------------~ iu

 

 

 

ы

 

 

 

 

 

j=o

 

 

 

 

 

 

 

 

 

 

 

(13).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для оценки остаточного члена R формулы (11)

нам понадобится

одна лемма, представляющая собой дискретный

аналог леммы.

Гронуолла.

 

 

 

 

 

 

 

 

 

N,

 

 

 

Л е м м а

1.

Если некоторые величины ф*, / = 0 ,

1.......

удов­

летворяют неравенствам

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

0 < Ф 0 < а , 0 < ф г+1 < а + b £ фт , i = 0,

1, . . . , N — 1,

 

 

 

 

 

 

 

т = 0

 

 

 

 

 

 

(14>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

то справедлива оценка

 

 

 

 

 

 

 

 

 

 

 

 

 

0 < ф ; < а ( 1

+ by,

i = 0 , l , . . - ,

N;

 

 

 

(15>

если же

 

 

 

N— 1

 

 

 

 

 

 

 

 

 

 

 

 

 

+ Ь

i = 0,

 

 

 

 

 

 

 

 

0<ф г_1 < а

Л фт ,

1 , . . . , IV— 1;

0 < ф ^ _ 1 < а ,

 

 

 

 

 

m ~ i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(16).

то верна

оценка

 

b)N~l~l,

1 =

0,

1 , . . . , N

- l .

 

 

 

 

 

0

<

фг

(1 +

 

 

(17>

 

Доказательство

можно

провести по индукции.

При k = 0

по

условию О ^ф о^й. Если неравенство О ^ ф т ^ а Ц + б) ”1 верно при.

всех тп = 0, 1,

i, то из

(14)

следует

0 <

фг+i <

а + 6

£ а (1 + 6 )т = а ( Г + 6 )*+*.

 

 

 

т = 0

Аналогично можно убедиться, что из (16) вытекает оценка (17). Д»