Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 233

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

182 ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА

Г

 

 

 

N—1

 

 

 

 

 

Л> ( * .

М о) =

2

(*;>

Щ) +

ф (Хц),

(5)

 

 

 

(=0

 

 

 

 

Ft(xlt «,) =

/°(хь ut,

/<)(ti+l — /J

 

при условиях

 

 

 

 

 

 

 

 

■^■i+1

(х,',

«,)--- ^i) f i.xit Uh

^i),

 

(6)

t = 0, 1

, ,

N — 1, a-0 = a' 6 G 0 ,

 

x.ea^G^),

i = o,

l

,

, tv,

(7)

 

 

 

 

 

 

 

. . ,

t f - 1 .

 

 

 

 

 

 

 

 

(8)

-Заметим, что задача

(5):— (8)

имеет также и самостоятельный

интерес и возникает при описании управляемых импульсных систем.

 

Если задать какие-либо дискретное управление

[ц ,]о = («о , «ь

....

uN-\) и начальное условие x0= x ^ G 0, то система

(6) однознач­

но определяет соответствующую дискретную

траекторию [ау] 0=

=

(х0= х , л'ь ..., xN). Зафиксируем некоторое

x e G 0

и через Д0(х)

обозначим множество управлений [«Jo, таких, что: 1) выполнены условия (8); 2) дискретная траектория X*Jo, соответствующая уп­ равлению [ы,]о и выбранному начальному условию х0= х , удов­ летворяет фазовым ограничениям (7). Управление [«Jo^Ao(x) и

соответствующую

траекторию [x j0

будем

называть

допустимыми

для выбранного начального состояния х.

Множество До{х) может

быть пустым или непустым. Если

До( х ) = 0

при всех A eG 0,

то

условия

(6) — (8)

несовместны и функционал (5)

определен

на

пустом

множестве.

Поэтому, чтобы задача (5) — (8)

имела смысл,

естественно требовать существования хотя бы одной

точки x e G 0,

для

которой

До(х )^ = 0 . Обозначим Х 0= .'{х ; x e G 0, До(х )^ = 0 }.

Тогда задача

(5) — (8)

может быть

сформулирована

совсем крат­

ко:

минимизировать

функционал

I0(x,

[«Jo)

при

[«JoeA 0(x)

и

х ^ Х 0. В результате мы пришли к уже известной нам задаче мини­ мизации функции n-\-Nr переменных х, «0, щ, ..., «w-i, и для ее решения можно использовать методы из гл. 2. Однако в практиче­ ских задачах число n-\-Nr обычно бывает столь большим, что не­ посредственное использование методов гл. 2, вообще говоря, силь-

.но осложняется. Вызывает трудности также и то обстоятельство, что множества Д0(х) и Х0, на которых минимизируется 10(ас, [« Jo), заданы неявно. Для преодоления этих трудностей используют ме­ тод динамического программирования, позволяющий свести задачу

(5) — (8) к последовательному решению более простых задач ми­ нимизации функций меньшего числа переменных.

2. Для изложения метода динамического программирован нам понадобятся следующие вспомогательные задачи: минимизи­ ровать функционал


§ п Схема Р. Веллмана. Проблема синтеза для дискретных систем 183

 

 

h

(х,

I« ,U

-

s ' F° (xh

щ) + Ф (XN)

 

 

(9)

при условиях

 

 

1

 

i = k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xc+l = F l (xl,

Ui),

i = k ,

k

+ \ ,

, N — 1,

xk =

x £ G k,

(10)

 

 

 

XieGt,

i =

k,

k + \

, . . . , N ,

 

 

 

 

(11)

[щ]к = (ик,

uk+u . . .

uN- i),

UieVi,

i = k , k

+

\ , . . . ,

N — 1,

 

 

 

 

 

 

 

 

 

 

 

 

 

( 12)

где

точка x

и целое

число k

фиксированы,

х

 

 

 

— 1.

Через Ak(x)

обозначим множество всех управлений

[iii]k, таких,

что: 1) выполнены условия (12); 2) соответствующая

траектория

[* » ] * = ( * * = * ,

xh+1,

xN)

из

(10) удовлетворяет фазовым ограни­

чениям (11). Нетрудно видеть,

что если ХоФ 0 ,

то Ак( х ) ф 0

хотя

бы при одном XI= Gk. Введем функцию

inf

I k (.х, [u jfe) = Bk (x),

k = 0 ,

1, ..., N— l называемую функцией Веллмана задачи

(5) — (8).

Покажем, что функция Веллмана удовлетворяет следующим рекуррентным соотношениям, называемым уравнением Веллмана:

Вк (*) = inf

[F°k (х, и) +

Bk+l {Fk (x, u))],

k = 0, 1, . . . , А/— 1,

 

“&Dk(x)

 

 

 

 

 

 

 

 

 

 

BN( x ) ^ Ф(х),

 

 

 

(13)

где Dh (х) — множество всех тех

для

которых существует

хотя бы одно управление [Ui]fe=

(uh, uk+u

...,

u^_i) е Д й(х) с ком­

понентой ик— и. Очевидно,

что множество Dk (x) и ДА(х)

оба пусты

или непусты одновременно,

и поскольку xk+l= F k (x,u),

то для не-

пустоты

этих множеств

необходимо

и

достаточно, ' чтобы

Ah+i (Fh(x, и ) ) ф 0 .

 

 

 

 

 

 

 

 

Справедливость

соотношения

(13) при k — N — 1

очевидным об­

разом

вытекает

из условия

 

B n (х ) з= ф (х)

и

представления

I n - i (x ,

[« Jat_ i) =

^ _ 1 ( х ,

и )

+ Ф (FN- i (х,

и ) ) , верного для любого

и £ D n —1 ( х ) = A ^ _ i ( х ) = { и : и £ V n u x n — F n i ( х , и ) £ G n , х £ G n i } .

Докажем

(13) при k,

0 ^ k < £ N — 1.

Для этого сначала убедимся в

том, что

 

 

 

 

 

 

 

B k (х) <

inf [F°(x,

и) +

Bk+l (Fk (х, а))].

(14)

 

 

“£Dk(x)

 

 

 

Возьмем.

произвольное

u £ D k {х)

(разумеется, предполагаем,

что

А г(х) Ф

0 ) . Тогда xk+i — F k (x, и) и Afe+i(xft+i)=£ 0 . По определе­

нию Ди- i(хк+1) = inf

7ft+i(xfc+1,

[u jft+i), для любого е > 0 найдет-

ся управление i«f]fc+16 A ft+i^+i),

такое, что Вк+1 (хш ) < / fc+1 (xfe+1,


184

ДИНАМ И ЧЕСКО Е

ПРОГРАММИРОВАНИЕ.

ПРОБЛЕМА

СИНТЕЗА

 

[Гл.

4

[ufjfc+1)'<

Bk+i (хк+1) + е. Поскольку [u jft =

(и, иЕк+и . . .

, u^-i) 6 Вк(х),

то Вк (х) <

4

(х, [и,]Л) =

F l {х,

и) + 4+1

(JCfc+1.

I«fjfe+i) <F°k(x,

и) +

+ Bk+l(xk+i) +

e, =

F°k(x,

и) +

Bk+i (Fk (x,

u)) + e. В силу произволь­

ности u £ D k {x)

и величины е > 0

отсюда

следует

 

неравенство

(14).

 

Теперь

покажем, что в (14) на самом деле знак

неравенства мож­

но заменить знаком равенства. По определению inf

1к (х,

[и*]*) =

 

Вк(х),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4 м

 

 

 

 

 

 

 

для

каждого

е > 0

найдется

такое

управление

 

[yf]fe 6.Д* (х),

что,

Но

 

 

 

 

 

Вк(х) 'С 4 (х > [^-’i ]*) ^

Вк (х) -f- е.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

поэтому

 

 

[ui]fe+i =

(wfe+i . •••. ^ - i )

6 Afc+i {Fk (x,

vk)),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ВI {x, v t ) - r B k+i(F k (x, ft)) <

F k (x, vt) +

4 + i (Fk (x, vk),

[uf]ft+i) =

 

 

 

 

 

 

 

 

— 4

(x >

 

 

'C Bk (x) + 8.

 

 

 

 

 

 

 

Так

как vk 6 Dk (x), то отсюда имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

inf

[Fk (x,

u )+ B k+i(F k{x,

u ))]< B A(x) + e ,

 

 

 

 

 

 

 

 

u € D k (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

в силу

произвольности е > 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

inf

[Fft (х,

и) +

В к+1 (F k (х,

и))] < Вк (х).

 

 

( 1 5 )

 

 

 

 

u £ D k (x)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

>

Из

(14) — (15)

немедленно следует соотношение

(13).

 

 

 

 

 

Пользуясь уравнением Веллмана

(13), можно последовательно

определить

 

функции

В к (х)

 

и

их

 

области

определения

Хк,

k = N , N— 1,

...,

1,

0.

А именно B N(x) =

Ф (х ),

XNs=GN— известны.

Если известны Вк+i(x)

и Afc+i

( k ^ N — 1),

то

для

определения

Вк (х) нужно решить

задачу

минимизации

функции

ср (х,

 

и)

=

= F l(x ,u )+ B k+\{Fk (x,u)) переменных

и— (и1,...,

иг)

на известном

множестве

 

Dk (x) =

: « е 14,

Fk (x, и) e

4 +i},

Для

этого

могут

быть использованы методы глав 1, 2. Очевидно, функция

В к (х)

определена

в точке

х тогда

и

только

 

тогда,

когда

Dk (x) ф 0 .

Таким образом, при определении значений

В к(х)

одновременно

находится и область ее определения

 

 

 

 

 

 

 

 

 

 

 

 

X k =

{ x : x e G k, Dk (х) =£ 0 }

= { х : х 6 С?*, Ак ( х ) Ф 0 } .'

 

 

 

Так

как

Ак ( х ) ф 0

х о т я бы при одном

x e G *,

то ХкФ 0 ,

k = N ,

N - 1, ....

1„0.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Заметим, что для широкого класса задач оптимального управ­

ления знак inf в правой

части

(13)

можно

заменить на min. Об

этом говорит

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


§ Л

 

Схема Р.

Веллмана.

Проблема

 

синтеза для

дискретных систем

185

Т е о р е м а

1.

Пусть

множества Gk,

k = 0 , 1.......

N, замкнуты,

множества Vk, k =

0,

1...... N— l, замкнуты и ограничены,

и функции

Fk(x, и),

 

F k (x,u)

непрерывны по совокупности аргументов

(х, и)

при

xeG ft,

u<=Vk, 1г— 0,

1,

...,

N— 1,

Ф (х) — полунепрерывна

снизу

на множестве GN. Тогда:

1)

множества Xk, k = 0 ,

1, ...,

N, замкнуты,

множества Dk (x), 1г= 0,

1,

...,

N— 1,

замкнуты и ограничены равно­

мерно по х ^ Х к\2)

нижняя грань в правой части (13)

достигается

хотя бы при одном u— uk (x)<=Dk (x); 3)

функция В к (х)

полунепре­

рывна снизу на Хк,

k = 0,

1, ..., uV (см. определение 2.5.3).

 

 

 

 

Д о к а з а т е л ь с т в о .

По условию

GN= X N замкнуто, Ф (х) =

= B N(x)

полунепрерывна

снизу

 

на XN.

Сделаем

индуктивное

предположение:

пусть

 

Xk+i

 

замкнуто,

В к+\(х)

полунепрерывна

снизу на Xk+i при некотором

/г, O ^ k ^ N - l . Докажем,

что тогда

Хк замкнуто и на Хк справедливы все утверждения теоремы.

 

 

 

Так как Dh(х) =

: u e Vh, F h{x ,u )^ X h+i}sF / t,

a

Vh ограни­

чено, то Dh(x) ограничено равномерно по х ^ Х к.

 

 

 

 

 

 

Докажем замкнутость Dk (х) при любом фиксированном

х £ Xk

Пусть vme D k {x)

 

(m =

 

1,

2 , . . . ) , vm-+v(m ->оо).

Это

 

значит,

что.

vmEVk, F k (x, vm)£ X k+ i(m =

l, 2 , . . . ) . Из замкнутости

Vk,

X k+1 и

непрерывности F k (x,

v)

сразу имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v e Vk,

lim F k (x, v j

=

F k (x,

v) 6 Xk+i,

 

 

 

 

 

 

 

 

 

 

 

 

Г71— >oo

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t . e.

vE Dk (x). Замкнутость Dk (x)

доказана.

 

 

 

 

 

 

 

 

Покажем

замкнутость

 

Х к — { х : х 6 Gk,

Dk (х) Ф 0 ) .

Пусть

Ут£ Хк { т =

1, 2,

. . . ) ,

 

 

 

 

y(m -+ oo). Из

замкнутости

Gk следует,

что у £G k.

Если

 

мы еще

покажем,

что

Dk ( у )ф 0 ,

то

это

будет

означать,

что у в Хк,

и

замкнутость Хк будет доказана.

Так

как

Dk (У,п) Ф 0 . то

существует

 

такое

 

vmEVk,

что F k (ym,

vm) 6 X k+\

( m =

1,

2 , . . . ) .

В

силу

 

компактности

Vk из

последовательности

{цт }

можно

выбрать подпоследовательность {vmJ - ^ v ( z Vk (/г->-оо). По­

скольку

Xfc+i замкнуто,

Fk (х,

и) непрерывна,

то

lim F k (г/

 

vm ) =

= F k {у,

v) 6 Xk+i

т.

е.

v 6 Dk (у). Таким образом,

Г1-»оо

 

 

Л 1

'

П

Dk ( у ) ф 0 .

 

 

 

Далее, функция ср (х,

u) =

F°k (x, и) +

Bk+ i(F k (x, и))

при каждом

фиксированном х £ ,Х к

полунепрерывна

снизу по и £ Dk (х).

Это

сле­

дует из непрерывности Р°к (х,

и), F k (x,

и)

и полунепрерывное™ сни­

зу Вк+1 (х).

Поскольку

Dk (x) — замкнутое

ограниченное

множество,

то ср (х, и) при каждом

фиксированном х 6 Х к достигает

своей ниж­

ней грани на Dk (х) хотя

бы

в одной точке и = ик (х) 6 Dk (х) (см. уп­

ражнение 2.5.11,

теорему 6.1.1). Таким образом,

Вк (х) =

inf

ср(х, и) =

ср (х, ик (х)) в

силу

уравнения Веллмана

(13).

u £ D k (x)

 

 

 

 

 

 

 

 

 

Остается еще доказать полунепрерывность снизу Вк (х)

на Х к.

Пусть limB*. (г) =

lim Вк (ym),

г, х,

уп £ Х к у,п- > х ( т о о ) , Вк(ут) =

г-*х


186

Д ИНАМ И ЧЕ СКО Е ПРОГРАММИРОВАНИЕ.

ПРОБЛЕМА

СИНТЕЗА

[Гл. 4

=

Ф (Ут, uk (у,п))- Так *как

uk (ym) 6 Dk (ут) 6 Vk, то

в

силу

компакт­

ности Vk

последовательность {uk (ут)} (rn = 1, 2,

. . . )

имеет хотя бы

одну предельную точку v EVk. Можем считать,

что сама последова­

тельность

{uk (ym)}^ - v (т-4-оо). Поскольку F k (x,

 

и)

непрерывна,

X k+i

замкнуто и, кроме

того,

F k (ym, uk (ут)) 6

 

 

то lim F k [ут,

«ft (ym))=

Fk (*>v) € ^fe+1.

Это

значит,

что

и 6 Dk (х).

Тогда

 

 

 

 

 

 

 

■»

 

 

 

 

 

 

 

НшВ* (х) =

Пш Bk (ут) =

lim ф (ут, uk (ут)) >

ф (х,

v) >

 

 

z-*x

 

т->оо

 

m->oo

 

 

 

 

 

 

>

inf

ф (х, и) =

Bk (x). Полунепрерывность Вк (x)

на

 

доказана. А

u£.Dk (x )'

Приведенное доказательство сохраняет силу, если от Р°(х,и) потребовать лишь ее полунепрерывность снизу по (х, и ).

3.Предположим, что нам удалось найти функции Bk(x)

условий (13)

и, кроме того, пусть

также

известны функции

« i(x )E flfi(x ),

x&Xfc, k = 0 , 1,..., JV— 1,

на

которых достигается

нижняя грань в правой части (13). Тогда, оказывается, решение

задач

(5) — (8) и (9) — (12) выписываются

совсем просто. А имен­

но оптимальное управление

[ы{]0

и соответствующая траектория

[х{]0

для задачи

(5) — (8)

определяются следующим

образом:

сначала из условия

 

 

 

 

 

 

 

 

 

 

inf В0(х) =

В0(хо)

 

 

 

 

(16)

 

 

х € Х 0

 

 

 

 

 

 

 

находят х0 € Х 0, затем последовательно полагают

 

 

 

 

и о = и„ (хо), х , = F 0(х0, Wq),

= и х ( x l ) ,

Ха = F x ( х * ,

и \ ) , . . .

 

 

%ы ~

F h— 1(хм— i, Uni)

 

 

 

(17)

Оптимальное управление

и траектория

\x\\k

для

задачи

(9) —■

(12)

определяются аналогично

 

 

 

 

 

 

 

Xft — х, Uk ик (xk) , x^_j_i — F к (Xk, Uk) , •••

xN ~

F ni (xn—\,

Un—\).

 

 

 

 

 

 

 

 

 

(18)

Для доказательства .этих утверждений

введем вспомогательные

функции

 

 

 

 

 

 

 

 

Ri(x,

u) = 5 i+i(F i(x ,

u)) — B i (x )+ F ° (x , и),

i =

0,

1 , . . . ,

N — 1.

 

 

 

 

 

 

 

 

 

(19)

Очевидно, уравнение Веллмана (13)

тогда можно переписать в экви­

валентном виде