Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 213

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

278

МЕТОДЫ

М И Н И М И З А Ц И И В

Ф У НКЦ И О НАЛ ЬНЫ Х

ПРОСТРАНСТВАХ [Гл. в

Продолжим

доказательство

теоремы 1.

Из

соотношений

(8 )

для

[A^i]

с учетом условия

(4)

имеем

 

 

 

 

 

 

 

 

 

 

 

 

£ .

 

 

 

 

г i

 

 

 

 

 

 

 

I А х ‘+ 1 1 =

(Ax'n+i — Л*т) |<

£

|Ах,пI +

 

 

 

 

 

 

 

 

т= 0

 

 

 

 

т=О

 

 

 

 

+

L

£

(|Д*т |+

|Ат | )< (1

+ L )

J

|Алгт |+ L

 

\hm\.

 

 

 

 

т =0

 

 

 

 

т = 0

 

 

т — О

 

 

Полагая

в

(14), (15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

а = L £ |^ |, А = 1 + L, Фг = |

|,

 

 

 

 

 

 

 

 

£=0

 

 

 

 

 

 

 

 

 

получим оценку

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N—1

 

 

 

 

 

 

 

 

 

 

 

| A * i l < C i

£ \h}\, ^

= 1 (2 +

7.)",

t =

0, 1, . . .

,N .

(18)

 

 

 

 

 

£=0

 

 

 

 

 

 

 

 

 

 

Из

условий

теоремы

следует

 

непрерывность

функций

дФ

dHi

 

dHi

по совокупности своих аргументов. Тогда с уче-

-------,

—— ,

——

\дх

дх

 

ди

 

 

 

 

 

 

 

 

 

 

 

том оценки (18) из выражений

(10),

(12),

(13)

заключаем,

что

остаточный член R в формуле

(11)

имеет порядок о (|| [Л;] ||).

Та­

ким образом, в формуле ( 1 1 ) для приращения функционала пер­

вое слагаемое является линейным ограниченным

функционалом

относительно [А,-]

на L P [ 0, ЛГ], а второе слагаемое имеет порядок

о (II [At] II).

Это значит, что функционал

(1) при условиях (2), (3)

дифференцируем и его градиент имеет вид (5). Д

 

2 .

Зная

формулу

градиента,

нетрудно

расписать мето

пп. 1— 5 -§

2 применительно

к задаче

(1) — (3). Например, метод

проекции градиента здесь приводит к построению. последователь­

ности •[«,•]п—'(иоп,

uN- i , n) по формулам

 

 

 

 

ui,n+\ =

Pvt(щ,п +

an

dHi (xin,

 

uin)

0,

1,

. . . , N -

1,

du

 

 

 

 

 

n = 0 ,

1 , . . . ,

 

 

 

 

где a„ > 0

выбирается как в п. 2

§

2 , [ * i ] n = :(*on,

.... x N , n ) ,

[фг]п —

— (ф_1, п,

..., ajjjv-i, п)

решения

задач (2) и

(7) соответственно

при [Mi] =|[«г]„-

Приведем достаточные условия для того, чтобы градиент функ­ ционала ( 1 ) при ограничениях (2 ), (3) удовлетворял условию Липшица.


§ 4] Градиент функционала дискретной системы. Условия оптимальности 279

Т е о р е м а 2. Пусть

выполнены

все

условия теоремы 1 и

пусть функции

 

 

 

 

'дФ

d fj

dF°t

щ

 

дх ’

дх ’

дх ’

ди ’

ди

удовлетворяют условию Липшица по совокупности (х,

u ) ^ E nx V i 7

i = 0 , 1,

N— 1,

с константой L >

0

(эти условия полностью анало­

гичны условиям

(3.5— 9), и поэтому подробно выписывать их здесь

не будем). Пусть, кроме того,

 

 

 

 

 

 

 

 

 

 

\Fl (x, ы ) | < Л + 4 М >

Л . Л = const> 0

 

 

 

(19)

при всех х ^ Е п, u<=V\-,

и множества

Vi, i —0,

1, ..., N— 1,

из

(3)

замкнуты и ограничены в Ет. Тогда

градиент

функционала

(1)

при ограничениях (2), (3) удовлетворяет условию Липшица.

 

Доказательство этой теоремы полностью аналогично

доказа­

тельству

теоремы 3.2;

предлагаем

читателю

провести

его

само­

стоятельно.

 

 

 

 

 

 

 

 

 

 

 

 

3.

Перейдем

к выводу необходимых

условий

оптимальнос

для задачи ( 1 ) — (3).

 

 

 

 

 

 

 

 

 

 

 

Т е о р е м а

3. Пусть выполнены все условия теоремы

1.

Пусть

[ui] — оптимальное управление,

[xj]

 

— соответствующая

ему тра­

ектория системы (2 ),

т. е. I ([«*]) =

inf / ([«<]),

 

где нижняя грань

берется по всем

[и*]

из условий

(2) , (3). Пусть

[фг]

решение

задачи (7), соответствующее управлению [«»]• Тогда необходимо выполняются неравенства

dHi (**, ф*. к*)

N — 1

(20)

Щ — Ui < 0 , i = 0 , 1 ,

; ди

 

 

при всех «г^Уг, для которых’« { ] + а («4 — «’) € F f

при любых

а,

0:£3а;?:1, причем если

ut

* —i внутренняя точка множества

Vu то

 

 

dHi X**. Ф* ■“*)

 

(21)

 

 

 

ди

 

 

 

 

 

 

функции Н[(х, ф, и) определяются равенствами (6 ).

 

Д о к а з а т е л ь с т в о .

Положим в формуле (11) xt ='х1, ф, = ф^

= и}; получим

 

 

 

 

д /

N—1

дНш(х*п , ф; , ит)

 

( )

2

 

 

 

ди

К + °№ ]ID -

22

т = 0



280 МЕТОДЫ М И Н И М И З А Ц И И В Ф У НКЦ И О НАЛ ЬНЫ Х ПРОСТРАНСТВАХ [Гл. 6

Пусть Ui — произвольная точка из Vit для которой и\ + а (и ( и{) £ 6 V/ при всех а, 0 ^ | а ^ 1 . Возьмем в (22)

Ы= (0 , . . . , 0 , А, = а (щ — и}), 0, . . . , 0 ).

Очевидно, при таком выборе

[Лт ]

управление [uj*] +

и

тогда в силу оптимальности

[ы*г] из

(2 2 )

получим

 

( dHi(x\, ob!, и,)

, a(u( -

, \

+о(а||[Л/]||),

0 < а < , 1 .

0 <

А/ = — ^------ - - - - -

Ul)J

Поделив обе части этого неравенства на а > 0 и перейдя к пределу

при а-»-+0, сразу придем

к неравенству (20). Если

щ — внут­

ренняя точка Уъ тй в (2 0 )

можно положить

 

 

dHjjx* , tp*, и\)

 

Щ = Щ + 8

 

 

д и

 

•eV,- при некотором е > 0 ,

что сразу приведет к равенству (2 1 ). Д

Если Vi — выпуклое множество, то условие (20),

очевидно,

выполнено для любого u ^ V i.

Если Vi выпуклы при всех t = 0, 1,‘ ...

..., N— 1, то неравенства (20)

в силу формулы (5) равносильны

•одному неравенству

(/'([«*]), К ] - К £] | Ы > о

l 2

ври всех [ui\e.U, что совпадает с условием оптимальности (2 .1.1 0 ) теоремы 2.1.3.

Таким образом, согласно теореме 3

оптимальным может быть

.лишь управление

[и*] 6 U,

удовлетворяющее

условиям

(20).

Од-

«ако условия (2 0 ) не дают ответа на вопрос,

как связано управле­

ние [щ] с

экстремальными

точками

функции Ht (x),

ф*, и)

на

множестве

V*. В

частности,

нельзя ли по аналогии с

системами

•с непрерывным временем утверждать, что оптимальное управление '\Щ\ удовлетворяет принципу максимума

{х\, % , и]) = шах Ht (х\, ф,, и), i = 0, 1, . . . , N — 1?

(23)

Ведь необходимое условие оптимальности тем ценнее, чем меньше

•управлений, подозрительных на оптимальность, оно выделяет. В этом смысле условие (23) явно имело бы преимущество перед

условиями

(2 0 ), так

как неравенства

(2 0 )

могут

выполняться не

только в тех точках,

где имеет место

(23),

но и в

других точках,

© которых,

например,

дЩ {х\, ф ,. и;)

 

К сожалению, оказы-

-----------------------= 0 .

ди


§ 4] Градиент функционала дискретной системы. Условия оптимальности 281

вается, что в управляемых системах с дискретным временем прин­ цип максимума, вообще говоря, не имеет места: на оптимальном

управлении

функция Я £(х{, ф£, и)

может

и не достигать

своего

абсолютного максимума по u eF,-.

 

 

 

 

 

 

 

 

 

 

 

 

П р и м е р

1.

([231], стр.

170). Пусть фазовое состояние си­

стемы описывается уравнением

 

 

 

 

 

 

 

 

 

 

 

 

Xj-j-i = х1+

2u t ,

y t + 1

= х\ +

y t

+

и? ( i =

0,

1);

x0 =

3;

y 0

= 0.

Требуется минимизировать функционал 1(и0,

щ ) = у2=ф(хг, Уч)

при условии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

[щ]

=

К ,

«х) е и = {(«о. «х): I щ I < 5 (1 =

0;

1)}.

 

 

Нетрудно вычислить явное выражение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I

(и0, «х) =

3 (ы0 + 2)2 — ы? +

6.

 

 

 

 

 

 

Откуда следует,

что оптимальное

управление («о. Mi)

 

имеет вид

« о = — 2, и* — 5

(возможность

щ =

— 5

предоставляем

читателю

рассмотреть самостоятельно), а оптимальная траектория

 

 

*о =

3,

х[== — 1, х2 9;

уй=

0; у\ = — 5;

у\ =

— 19;

 

минимальное значение функционала равно / *= — 19.

 

 

 

 

Составим функцию

 

 

 

 

 

 

 

 

 

 

 

 

 

Я £ (xt, yit фх„ ф2£) =

Фхг (х{ + 2 uL) +

ф2£ (— х* +

 

У(4 - и?)

(i =

0 , 1).

Система (7)

имеет вид фщ- i =

Фх£ — 2ф2£х {, ф2)£- 1

=

ф2£

(i =

1; 0);

 

 

 

фхх =

----- -— =

0 , ф2х =

-------—

=

 

1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0Уг

 

 

 

 

 

 

 

 

Подставив

 

сюда

 

оптимальные

(х£, г/*),

получим фп =

0, ф’ 0 = 2;

Ф21 = 1;

фго = 1.

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Я 0 (xj, i/о, ф’о, Фго,

м) =

(м +

2 ) 2 — 7.

 

 

 

 

 

Как видим,

на оптимальном управлении и=ио = — 2 функция

Но (х0, t/о,

Ф10 , фго,

м)

достигает своего

абсолютного

минимума, в

то время

как

ее максимальное значение при

 

|м|^5

 

достигается

в точке и= 5.

Таким образом, для управляемых систем с дискретным време­ нем принцип максимума, вообще говоря, не имеет места.

Другие необходимые условия оптимальности для дискретных управляемых систем см. в работах [26, 59, 196] и др.; связь между необходимыми условиями для непрерывных систем и их разност­ ный аналогов изучалась в работе [58].