Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.04.2024
Просмотров: 233
Скачиваний: 1
182 ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА
Г
|
|
|
N—1 |
|
|
|
|
|
Л> ( * . |
М о) = |
2 |
(*;> |
Щ) + |
ф (Хц), |
(5) |
||
|
|
|
(=0 |
|
|
|
|
|
Ft(xlt «,) = |
/°(хь ut, |
/<)(ti+l — /J |
|
|||||
при условиях |
|
|
|
|
|
|
|
|
■^■i+1 |
(х,', |
«,)--- ^i) f i.xit Uh |
^i), |
|
(6) |
|||
t = 0, 1 |
, , |
N — 1, a-0 = a' 6 G 0 , |
|
|||||
x.ea^G^), |
i = o, |
l |
, |
, tv, |
(7) |
|||
|
|
|
|
|
|
|
. . , |
t f - 1 . |
|
|
|
|
|
|
|
|
(8) |
-Заметим, что задача |
(5):— (8) |
имеет также и самостоятельный |
интерес и возникает при описании управляемых импульсных систем.
|
Если задать какие-либо дискретное управление |
[ц ,]о = («о , «ь |
|
.... |
uN-\) и начальное условие x0= x ^ G 0, то система |
(6) однознач |
|
но определяет соответствующую дискретную |
траекторию [ау] 0= |
||
= |
(х0= х , л'ь ..., xN). Зафиксируем некоторое |
x e G 0 |
и через Д0(х) |
обозначим множество управлений [«Jo, таких, что: 1) выполнены условия (8); 2) дискретная траектория X*Jo, соответствующая уп равлению [ы,]о и выбранному начальному условию х0= х , удов летворяет фазовым ограничениям (7). Управление [«Jo^Ao(x) и
соответствующую |
траекторию [x j0 |
будем |
называть |
допустимыми |
||||||
для выбранного начального состояния х. |
Множество До{х) может |
|||||||||
быть пустым или непустым. Если |
До( х ) = 0 |
при всех A eG 0, |
то |
|||||||
условия |
(6) — (8) |
несовместны и функционал (5) |
определен |
на |
||||||
пустом |
множестве. |
Поэтому, чтобы задача (5) — (8) |
имела смысл, |
|||||||
естественно требовать существования хотя бы одной |
точки x e G 0, |
|||||||||
для |
которой |
До(х )^ = 0 . Обозначим Х 0= .'{х ; x e G 0, До(х )^ = 0 }. |
||||||||
Тогда задача |
(5) — (8) |
может быть |
сформулирована |
совсем крат |
||||||
ко: |
минимизировать |
функционал |
I0(x, |
[«Jo) |
при |
[«JoeA 0(x) |
и |
х ^ Х 0. В результате мы пришли к уже известной нам задаче мини мизации функции n-\-Nr переменных х, «0, щ, ..., «w-i, и для ее решения можно использовать методы из гл. 2. Однако в практиче ских задачах число n-\-Nr обычно бывает столь большим, что не посредственное использование методов гл. 2, вообще говоря, силь-
.но осложняется. Вызывает трудности также и то обстоятельство, что множества Д0(х) и Х0, на которых минимизируется 10(ас, [« Jo), заданы неявно. Для преодоления этих трудностей используют ме тод динамического программирования, позволяющий свести задачу
(5) — (8) к последовательному решению более простых задач ми нимизации функций меньшего числа переменных.
2. Для изложения метода динамического программирован нам понадобятся следующие вспомогательные задачи: минимизи ровать функционал
§ п Схема Р. Веллмана. Проблема синтеза для дискретных систем 183
|
|
h |
(х, |
I« ,U |
- |
s ' F° (xh |
щ) + Ф (XN) |
|
|
(9) |
|||
при условиях |
|
|
1 |
|
i = k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
xc+l = F l (xl, |
Ui), |
i = k , |
k |
+ \ , |
, N — 1, |
xk = |
x £ G k, |
(10) |
||||
|
|
|
XieGt, |
i = |
k, |
k + \ |
, . . . , N , |
|
|
|
|
(11) |
|
[щ]к = (ик, |
uk+u . . . |
uN- i), |
UieVi, |
i = k , k |
+ |
\ , . . . , |
N — 1, |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
( 12) |
где |
точка x |
и целое |
число k |
фиксированы, |
х |
|
|
|
— 1. |
||||
Через Ak(x) |
обозначим множество всех управлений |
[iii]k, таких, |
|||||||||||
что: 1) выполнены условия (12); 2) соответствующая |
траектория |
||||||||||||
[* » ] * = ( * * = * , |
xh+1, |
xN) |
из |
(10) удовлетворяет фазовым ограни |
|||||||||
чениям (11). Нетрудно видеть, |
что если ХоФ 0 , |
то Ак( х ) ф 0 |
хотя |
||||||||||
бы при одном XI= Gk. Введем функцию |
inf |
I k (.х, [u jfe) = Bk (x), |
|||||||||||
k = 0 , |
1, ..., N— l называемую функцией Веллмана задачи |
(5) — (8). |
Покажем, что функция Веллмана удовлетворяет следующим рекуррентным соотношениям, называемым уравнением Веллмана:
Вк (*) = inf |
[F°k (х, и) + |
Bk+l {Fk (x, u))], |
k = 0, 1, . . . , А/— 1, |
||||||
|
“&Dk(x) |
|
|
|
|
|
|
|
|
|
|
BN( x ) ^ Ф(х), |
|
|
|
(13) |
|||
где Dh (х) — множество всех тех |
для |
которых существует |
|||||||
хотя бы одно управление [Ui]fe= |
(uh, uk+u |
..., |
u^_i) е Д й(х) с ком |
||||||
понентой ик— и. Очевидно, |
что множество Dk (x) и ДА(х) |
оба пусты |
|||||||
или непусты одновременно, |
и поскольку xk+l= F k (x,u), |
то для не- |
|||||||
пустоты |
этих множеств |
необходимо |
и |
достаточно, ' чтобы |
|||||
Ah+i (Fh(x, и ) ) ф 0 . |
|
|
|
|
|
|
|
|
|
Справедливость |
соотношения |
(13) при k — N — 1 |
очевидным об |
||||||
разом |
вытекает |
из условия |
|
B n (х ) з= ф (х) |
и |
представления |
|||
I n - i (x , |
[« Jat_ i) = |
^ _ 1 ( х , |
и ) |
+ Ф (FN- i (х, |
и ) ) , верного для любого |
и £ D n —1 ( х ) = A ^ _ i ( х ) = { и : и £ V n — u x n — F n —i ( х , и ) £ G n , х £ G n — i } .
Докажем |
(13) при k, |
0 ^ k < £ N — 1. |
Для этого сначала убедимся в |
|||
том, что |
|
|
|
|
|
|
|
B k (х) < |
inf [F°(x, |
и) + |
Bk+l (Fk (х, а))]. |
(14) |
|
|
|
“£Dk(x) |
|
|
|
|
Возьмем. |
произвольное |
u £ D k {х) |
(разумеется, предполагаем, |
что |
||
А г(х) Ф |
0 ) . Тогда xk+i — F k (x, и) и Afe+i(xft+i)=£ 0 . По определе |
|||||
нию Ди- i(хк+1) = inf |
7ft+i(xfc+1, |
[u jft+i), для любого е > 0 найдет- |
||||
ся управление i«f]fc+16 A ft+i^+i), |
такое, что Вк+1 (хш ) < / fc+1 (xfe+1, |
184 |
ДИНАМ И ЧЕСКО Е |
ПРОГРАММИРОВАНИЕ. |
ПРОБЛЕМА |
СИНТЕЗА |
|
[Гл. |
4 |
|||||||||||||||
[ufjfc+1)'< |
Bk+i (хк+1) + е. Поскольку [u jft = |
(и, иЕк+и . . . |
, u^-i) 6 Вк(х), |
|||||||||||||||||||
то Вк (х) < |
4 |
(х, [и,]Л) = |
F l {х, |
и) + 4+1 |
(JCfc+1. |
I«fjfe+i) <F°k(x, |
и) + |
|||||||||||||||
+ Bk+l(xk+i) + |
e, = |
F°k(x, |
и) + |
Bk+i (Fk (x, |
u)) + e. В силу произволь |
|||||||||||||||||
ности u £ D k {x) |
и величины е > 0 |
отсюда |
следует |
|
неравенство |
(14). |
||||||||||||||||
|
Теперь |
покажем, что в (14) на самом деле знак |
неравенства мож |
|||||||||||||||||||
но заменить знаком равенства. По определению inf |
1к (х, |
[и*]*) = |
|
Вк(х), |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 м |
|
|
|
|
|
|
|
|
для |
каждого |
е > 0 |
найдется |
такое |
управление |
|
[yf]fe 6.Д* (х), |
что, |
||||||||||||||
Но |
|
|
|
|
|
Вк(х) 'С 4 (х > [^-’i ]*) ^ |
Вк (х) -f- е. |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
поэтому |
|
|
[ui]fe+i = |
(wfe+i . •••. ^ - i ) |
6 Afc+i {Fk (x, |
vk)), |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
ВI {x, v t ) - r B k+i(F k (x, ft)) < |
F k (x, vt) + |
4 + i (Fk (x, vk), |
[uf]ft+i) = |
|
||||||||||||||||||
|
|
|
|
|
|
|
— 4 |
(x > |
|
|
'C Bk (x) + 8. |
|
|
|
|
|
|
|
||||
Так |
как vk 6 Dk (x), то отсюда имеем |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
inf |
[Fk (x, |
u )+ B k+i(F k{x, |
u ))]< B A(x) + e , |
|
|
|
|
|||||||||||
|
|
|
|
u € D k (x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
или |
в силу |
произвольности е > 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
inf |
[Fft (х, |
и) + |
В к+1 (F k (х, |
и))] < Вк (х). |
|
|
( 1 5 ) |
|||||||||||
|
|
|
|
u £ D k (x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
> |
|
Из |
(14) — (15) |
немедленно следует соотношение |
(13). |
|
|
|
|
|||||||||||||||
|
Пользуясь уравнением Веллмана |
(13), можно последовательно |
||||||||||||||||||||
определить |
|
функции |
В к (х) |
|
и |
их |
|
области |
определения |
Хк, |
||||||||||||
k = N , N— 1, |
..., |
1, |
0. |
А именно B N(x) = |
Ф (х ), |
XNs=GN— известны. |
||||||||||||||||
Если известны Вк+i(x) |
и Afc+i |
( k ^ N — 1), |
то |
для |
определения |
|||||||||||||||||
Вк (х) нужно решить |
задачу |
минимизации |
функции |
ср (х, |
|
и) |
= |
|||||||||||||||
= F l(x ,u )+ B k+\{Fk (x,u)) переменных |
и— (и1,..., |
иг) |
на известном |
|||||||||||||||||||
множестве |
|
Dk (x) = |
{и : « е 14, |
Fk (x, и) e |
4 +i}, |
Для |
этого |
могут |
||||||||||||||
быть использованы методы глав 1, 2. Очевидно, функция |
В к (х) |
|||||||||||||||||||||
определена |
в точке |
х тогда |
и |
только |
|
тогда, |
когда |
Dk (x) ф 0 . |
||||||||||||||
Таким образом, при определении значений |
В к(х) |
одновременно |
||||||||||||||||||||
находится и область ее определения |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
X k = |
{ x : x e G k, Dk (х) =£ 0 } |
= { х : х 6 С?*, Ак ( х ) Ф 0 } .' |
|
|
|
||||||||||||||||
Так |
как |
Ак ( х ) ф 0 |
х о т я бы при одном |
x e G *, |
то ХкФ 0 , |
k = N , |
||||||||||||||||
N - 1, .... |
1„0. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Заметим, что для широкого класса задач оптимального управ |
|||||||||||||||||||||
ления знак inf в правой |
части |
(13) |
можно |
заменить на min. Об |
||||||||||||||||||
этом говорит |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
§ Л |
|
Схема Р. |
Веллмана. |
Проблема |
|
синтеза для |
дискретных систем |
185 |
||||||||||||||||
Т е о р е м а |
1. |
Пусть |
множества Gk, |
k = 0 , 1....... |
N, замкнуты, |
|||||||||||||||||||
множества Vk, k = |
0, |
1...... N— l, замкнуты и ограничены, |
и функции |
|||||||||||||||||||||
Fk(x, и), |
|
F k (x,u) |
непрерывны по совокупности аргументов |
(х, и) |
||||||||||||||||||||
при |
xeG ft, |
u<=Vk, 1г— 0, |
1, |
..., |
N— 1, |
Ф (х) — полунепрерывна |
снизу |
|||||||||||||||||
на множестве GN. Тогда: |
1) |
множества Xk, k = 0 , |
1, ..., |
N, замкнуты, |
||||||||||||||||||||
множества Dk (x), 1г= 0, |
1, |
..., |
N— 1, |
замкнуты и ограничены равно |
||||||||||||||||||||
мерно по х ^ Х к\2) |
нижняя грань в правой части (13) |
достигается |
||||||||||||||||||||||
хотя бы при одном u— uk (x)<=Dk (x); 3) |
функция В к (х) |
полунепре |
||||||||||||||||||||||
рывна снизу на Хк, |
k = 0, |
1, ..., uV (см. определение 2.5.3). |
|
|
|
|||||||||||||||||||
|
Д о к а з а т е л ь с т в о . |
По условию |
GN= X N замкнуто, Ф (х) = |
|||||||||||||||||||||
= B N(x) |
полунепрерывна |
снизу |
|
на XN. |
Сделаем |
индуктивное |
||||||||||||||||||
предположение: |
пусть |
|
Xk+i |
|
замкнуто, |
В к+\(х) |
полунепрерывна |
|||||||||||||||||
снизу на Xk+i при некотором |
/г, O ^ k ^ N - l . Докажем, |
что тогда |
||||||||||||||||||||||
Хк замкнуто и на Хк справедливы все утверждения теоремы. |
|
|
||||||||||||||||||||||
|
Так как Dh(х) = |
{и : u e Vh, F h{x ,u )^ X h+i}sF / t, |
a |
Vh ограни |
||||||||||||||||||||
чено, то Dh(x) ограничено равномерно по х ^ Х к. |
|
|
|
|
|
|||||||||||||||||||
|
Докажем замкнутость Dk (х) при любом фиксированном |
х £ Xk |
||||||||||||||||||||||
Пусть vme D k {x) |
|
(m = |
|
1, |
2 , . . . ) , vm-+v(m ->оо). |
Это |
|
значит, |
что. |
|||||||||||||||
vmEVk, F k (x, vm)£ X k+ i(m = |
l, 2 , . . . ) . Из замкнутости |
Vk, |
X k+1 и |
|||||||||||||||||||||
непрерывности F k (x, |
v) |
сразу имеем |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
v e Vk, |
lim F k (x, v j |
= |
F k (x, |
v) 6 Xk+i, |
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
Г71— >oo |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
t . e. |
vE Dk (x). Замкнутость Dk (x) |
доказана. |
|
|
|
|
|
|
|
|||||||||||||||
|
Покажем |
замкнутость |
|
Х к — { х : х 6 Gk, |
Dk (х) Ф 0 ) . |
Пусть |
||||||||||||||||||
Ут£ Хк { т = |
1, 2, |
. . . ) , |
|
|
|
|
y(m -+ oo). Из |
замкнутости |
Gk следует, |
|||||||||||||||
что у £G k. |
Если |
|
мы еще |
покажем, |
что |
Dk ( у )ф 0 , |
то |
это |
будет |
|||||||||||||||
означать, |
что у в Хк, |
и |
замкнутость Хк будет доказана. |
Так |
как |
|||||||||||||||||||
Dk (У,п) Ф 0 . то |
существует |
|
такое |
|
vmEVk, |
что F k (ym, |
vm) 6 X k+\ |
|||||||||||||||||
( m = |
1, |
2 , . . . ) . |
В |
силу |
|
компактности |
Vk из |
последовательности |
||||||||||||||||
{цт } |
можно |
выбрать подпоследовательность {vmJ - ^ v ( z Vk (/г->-оо). По |
||||||||||||||||||||||
скольку |
Xfc+i замкнуто, |
Fk (х, |
и) непрерывна, |
то |
lim F k (г/ |
|
vm ) = |
|||||||||||||||||
= F k {у, |
v) 6 Xk+i |
т. |
е. |
v 6 Dk (у). Таким образом, |
Г1-»оо |
|
|
Л 1 |
' |
П |
||||||||||||||
Dk ( у ) ф 0 . |
|
|
||||||||||||||||||||||
|
Далее, функция ср (х, |
u) = |
F°k (x, и) + |
Bk+ i(F k (x, и)) |
при каждом |
|||||||||||||||||||
фиксированном х £ ,Х к |
полунепрерывна |
снизу по и £ Dk (х). |
Это |
сле |
||||||||||||||||||||
дует из непрерывности Р°к (х, |
и), F k (x, |
и) |
и полунепрерывное™ сни |
|||||||||||||||||||||
зу Вк+1 (х). |
Поскольку |
Dk (x) — замкнутое |
ограниченное |
множество, |
||||||||||||||||||||
то ср (х, и) при каждом |
фиксированном х 6 Х к достигает |
своей ниж |
||||||||||||||||||||||
ней грани на Dk (х) хотя |
бы |
в одной точке и = ик (х) 6 Dk (х) (см. уп |
||||||||||||||||||||||
ражнение 2.5.11, |
теорему 6.1.1). Таким образом, |
Вк (х) = |
inf |
ср(х, и) = |
||||||||||||||||||||
— ср (х, ик (х)) в |
силу |
уравнения Веллмана |
(13). |
u £ D k (x) |
|
|
||||||||||||||||||
|
|
|
|
|
|
|||||||||||||||||||
|
Остается еще доказать полунепрерывность снизу Вк (х) |
на Х к. |
||||||||||||||||||||||
Пусть limB*. (г) = |
lim Вк (ym), |
г, х, |
уп £ Х к у,п- > х ( т о о ) , Вк(ут) = |
г-*х
186 |
Д ИНАМ И ЧЕ СКО Е ПРОГРАММИРОВАНИЕ. |
ПРОБЛЕМА |
СИНТЕЗА |
[Гл. 4 |
||||||||
= |
Ф (Ут, uk (у,п))- Так *как |
uk (ym) 6 Dk (ут) 6 Vk, то |
в |
силу |
компакт |
|||||||
ности Vk |
последовательность {uk (ут)} (rn = 1, 2, |
. . . ) |
имеет хотя бы |
|||||||||
одну предельную точку v EVk. Можем считать, |
что сама последова |
|||||||||||
тельность |
{uk (ym)}^ - v (т-4-оо). Поскольку F k (x, |
|
и) |
непрерывна, |
||||||||
X k+i |
замкнуто и, кроме |
того, |
F k (ym, uk (ут)) 6 |
|
|
то lim F k [ут, |
||||||
«ft (ym))= |
Fk (*>v) € ^fe+1. |
Это |
значит, |
что |
и 6 Dk (х). |
Тогда |
||||||
|
|
|
|
|
|
|
■» |
|
|
|
|
|
|
|
НшВ* (х) = |
Пш Bk (ут) = |
lim ф (ут, uk (ут)) > |
ф (х, |
v) > |
||||||
|
|
z-*x |
|
т->оо |
|
m->oo |
|
|
|
|
|
|
> |
inf |
ф (х, и) = |
Bk (x). Полунепрерывность Вк (x) |
на |
|
доказана. А |
u£.Dk (x )'
Приведенное доказательство сохраняет силу, если от Р°(х,и) потребовать лишь ее полунепрерывность снизу по (х, и ).
3.Предположим, что нам удалось найти функции Bk(x)
условий (13) |
и, кроме того, пусть |
также |
известны функции |
« i(x )E flfi(x ), |
x&Xfc, k = 0 , 1,..., JV— 1, |
на |
которых достигается |
нижняя грань в правой части (13). Тогда, оказывается, решение
задач |
(5) — (8) и (9) — (12) выписываются |
совсем просто. А имен |
|||||||
но оптимальное управление |
[ы{]0 |
и соответствующая траектория |
|||||||
[х{]0 |
для задачи |
(5) — (8) |
определяются следующим |
образом: |
|||||
сначала из условия |
|
|
|
|
|
|
|
|
|
|
|
inf В0(х) = |
В0(хо) |
|
|
|
|
(16) |
|
|
|
х € Х 0 |
|
|
|
|
|
|
|
находят х0 € Х 0, затем последовательно полагают |
|
|
|
|
|||||
и о = и„ (хо), х , = F 0(х0, Wq), |
= и х ( x l ) , |
Ха = F x ( х * , |
и \ ) , . . . |
||||||
|
|
%ы ~ |
F h— 1(хм— i, Un—i) |
|
|
|
(17) |
||
Оптимальное управление |
и траектория |
\x\\k |
для |
задачи |
(9) —■ |
||||
(12) |
определяются аналогично |
|
|
|
|
|
|
|
|
Xft — х, Uk — ик (xk) , x^_j_i — F к (Xk, Uk) , ••• |
xN ~ |
F n—i (xn—\, |
Un—\). |
||||||
|
|
|
|
|
|
|
|
|
(18) |
Для доказательства .этих утверждений |
введем вспомогательные |
||||||||
функции |
|
|
|
|
|
|
|
|
|
Ri(x, |
u) = 5 i+i(F i(x , |
u)) — B i (x )+ F ° (x , и), |
i = |
0, |
1 , . . . , |
N — 1. |
|||
|
|
|
|
|
|
|
|
|
(19) |
Очевидно, уравнение Веллмана (13) |
тогда можно переписать в экви |
||||||||
валентном виде |
|
|
|
|
|
|
|
|