Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

Скачать файл (13,51Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 233

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

182 ДИНАМ И ЧЕСКО Е ПРОГРАММИРОВАНИЕ. ПРОБЛЕМА СИНТЕЗА

			N—1
Л> ( * .	М о) =		2	(*;>	Щ) +		ф (Хц),	(5)
			(=0					(5)
Ft(xlt «,) =			/°(хь ut,		/<)(ti+l — /J
при условиях
■^■i+1	(х,',	«,)--- ^i) f i.xit Uh				^i),		(6)
t = 0, 1		, ,	N — 1, a-0 = a' 6 G 0 ,
x.ea^G^),				i = o,	l	,	, tv,	(7)
							. . ,	t f - 1 .
								(8)
-Заметим, что задача		(5):— (8)		имеет также и самостоятельный

интерес и возникает при описании управляемых импульсных систем.

	Если задать какие-либо дискретное управление		[ц ,]о = («о , «ь
....	uN-\) и начальное условие x0= x ^ G 0, то система		(6) однознач
но определяет соответствующую дискретную		траекторию [ау] 0=
=	(х0= х , л'ь ..., xN). Зафиксируем некоторое	x e G 0	и через Д0(х)

обозначим множество управлений [«Jo, таких, что: 1) выполнены условия (8); 2) дискретная траектория X*Jo, соответствующая уп равлению [ы,]о и выбранному начальному условию х0= х , удов летворяет фазовым ограничениям (7). Управление [«Jo^Ao(x) и


соответствующую				траекторию [x j0		будем	называть		допустимыми
для выбранного начального состояния х.							Множество До{х) может
быть пустым или непустым. Если						До( х ) = 0		при всех A eG 0,		то
условия		(6) — (8)		несовместны и функционал (5)					определен	на
пустом		множестве.		Поэтому, чтобы задача (5) — (8)					имела смысл,
естественно требовать существования хотя бы одной									точки x e G 0,
для	которой		До(х )^ = 0 . Обозначим Х 0= .'{х ; x e G 0, До(х )^ = 0 }.
Тогда задача			(5) — (8)		может быть	сформулирована			совсем крат
ко:	минимизировать				функционал	I0(x,	[«Jo)	при	[«JoeA 0(x)	и

х ^ Х 0. В результате мы пришли к уже известной нам задаче мини мизации функции n-\-Nr переменных х, «0, щ, ..., «w-i, и для ее решения можно использовать методы из гл. 2. Однако в практиче ских задачах число n-\-Nr обычно бывает столь большим, что не посредственное использование методов гл. 2, вообще говоря, силь-

.но осложняется. Вызывает трудности также и то обстоятельство, что множества Д0(х) и Х0, на которых минимизируется 10(ас, [« Jo), заданы неявно. Для преодоления этих трудностей используют ме тод динамического программирования, позволяющий свести задачу

(5) — (8) к последовательному решению более простых задач ми нимизации функций меньшего числа переменных.

2. Для изложения метода динамического программирован нам понадобятся следующие вспомогательные задачи: минимизи ровать функционал

§ п Схема Р. Веллмана. Проблема синтеза для дискретных систем 183

(х,

I« ,U

s ' F° (xh

щ) + Ф (XN)

(9)

при условиях

i = k

xc+l = F l (xl,

Ui),

i = k ,

+ \ ,

, N — 1,

xk =

x £ G k,

(10)

XieGt,

i =

k + \

, . . . , N ,

(11)

[щ]к = (ик,

uk+u . . .

uN- i),

UieVi,

i = k , k

\ , . . . ,

N — 1,

( 12)

где

точка x

и целое

число k

фиксированы,

— 1.

Через Ak(x)

обозначим множество всех управлений

[iii]k, таких,

что: 1) выполнены условия (12); 2) соответствующая

траектория

[* » ] * = ( * * = * ,

xh+1,

xN)

из

(10) удовлетворяет фазовым ограни

чениям (11). Нетрудно видеть,

что если ХоФ 0 ,

то Ак( х ) ф 0

хотя

бы при одном XI= Gk. Введем функцию

inf

I k (.х, [u jfe) = Bk (x),

k = 0 ,

1, ..., N— l называемую функцией Веллмана задачи

(5) — (8).

Покажем, что функция Веллмана удовлетворяет следующим рекуррентным соотношениям, называемым уравнением Веллмана:

Вк (*) = inf		[F°k (х, и) +		Bk+l {Fk (x, u))],			k = 0, 1, . . . , А/— 1,
	“&Dk(x)
		BN( x ) ^ Ф(х),							(13)
где Dh (х) — множество всех тех					для		которых существует
хотя бы одно управление [Ui]fe=					(uh, uk+u	...,	u^_i) е Д й(х) с ком
понентой ик— и. Очевидно,			что множество Dk (x) и ДА(х)						оба пусты
или непусты одновременно,			и поскольку xk+l= F k (x,u),						то для не-
пустоты	этих множеств			необходимо		и	достаточно, ' чтобы
Ah+i (Fh(x, и ) ) ф 0 .
Справедливость		соотношения			(13) при k — N — 1			очевидным об
разом	вытекает	из условия			B n (х ) з= ф (х)		и	представления
I n - i (x ,	[« Jat_ i) =	^ _ 1 ( х ,	и )	+ Ф (FN- i (х,		и ) ) , верного для любого

и £ D n —1 ( х ) = A ^ _ i ( х ) = { и : и £ V n — u x n — F n —i ( х , и ) £ G n , х £ G n — i } .

Докажем	(13) при k,	0 ^ k < £ N — 1.			Для этого сначала убедимся в
том, что
	B k (х) <	inf [F°(x,		и) +	Bk+l (Fk (х, а))].	(14)
		“£Dk(x)
Возьмем.	произвольное		u £ D k {х)	(разумеется, предполагаем,		что
А г(х) Ф	0 ) . Тогда xk+i — F k (x, и) и Afe+i(xft+i)=£ 0 . По определе
нию Ди- i(хк+1) = inf			7ft+i(xfc+1,	[u jft+i), для любого е > 0 найдет-
ся управление i«f]fc+16 A ft+i^+i),				такое, что Вк+1 (хш ) < / fc+1 (xfe+1,

184

ДИНАМ И ЧЕСКО Е

ПРОГРАММИРОВАНИЕ.

ПРОБЛЕМА

СИНТЕЗА

[Гл.

[ufjfc+1)'<

Bk+i (хк+1) + е. Поскольку [u jft =

(и, иЕк+и . . .

, u^-i) 6 Вк(х),

то Вк (х) <

(х, [и,]Л) =

F l {х,

и) + 4+1

(JCfc+1.

I«fjfe+i) <F°k(x,

и) +

+ Bk+l(xk+i) +

e, =

F°k(x,

и) +

Bk+i (Fk (x,

u)) + e. В силу произволь

ности u £ D k {x)

и величины е > 0

отсюда

следует

неравенство

(14).

Теперь

покажем, что в (14) на самом деле знак

неравенства мож

но заменить знаком равенства. По определению inf

1к (х,

[и*]*) =

Вк(х),

4 м

для

каждого

е > 0

найдется

такое

управление

[yf]fe 6.Д* (х),

что,

Но

Вк(х) 'С 4 (х > [^-’i ]*) ^

Вк (х) -f- е.

поэтому

[ui]fe+i =

(wfe+i . •••. ^ - i )

6 Afc+i {Fk (x,

vk)),

ВI {x, v t ) - r B k+i(F k (x, ft)) <

F k (x, vt) +

4 + i (Fk (x, vk),

[uf]ft+i) =

— 4

(x >

'C Bk (x) + 8.

Так

как vk 6 Dk (x), то отсюда имеем

inf

[Fk (x,

u )+ B k+i(F k{x,

u ))]< B A(x) + e ,

u € D k (x)

или

в силу

произвольности е > 0

inf

[Fft (х,

и) +

В к+1 (F k (х,

и))] < Вк (х).

( 1 5 )

u £ D k (x)

Из

(14) — (15)

немедленно следует соотношение

(13).

Пользуясь уравнением Веллмана

(13), можно последовательно

определить

функции

В к (х)

их

области

определения

Хк,

k = N , N— 1,

...,

А именно B N(x) =

Ф (х ),

XNs=GN— известны.

Если известны Вк+i(x)

и Afc+i

( k ^ N — 1),

то

для

определения

Вк (х) нужно решить

задачу

минимизации

функции

ср (х,

и)

= F l(x ,u )+ B k+\{Fk (x,u)) переменных

и— (и1,...,

иг)

на известном

множестве

Dk (x) =

{и : « е 14,

Fk (x, и) e

4 +i},

Для

этого

могут

быть использованы методы глав 1, 2. Очевидно, функция

В к (х)

определена

в точке

х тогда

только

тогда,

когда

Dk (x) ф 0 .

Таким образом, при определении значений

В к(х)

одновременно

находится и область ее определения

X k =

{ x : x e G k, Dk (х) =£ 0 }

= { х : х 6 С?*, Ак ( х ) Ф 0 } .'

Так

как

Ак ( х ) ф 0

х о т я бы при одном

x e G *,

то ХкФ 0 ,

k = N ,

N - 1, ....

1„0.

Заметим, что для широкого класса задач оптимального управ

ления знак inf в правой

части

(13)

можно

заменить на min. Об

этом говорит

§ Л

Схема Р.

Веллмана.

Проблема

синтеза для

дискретных систем

185

Т е о р е м а

Пусть

множества Gk,

k = 0 , 1.......

N, замкнуты,

множества Vk, k =

1...... N— l, замкнуты и ограничены,

и функции

Fk(x, и),

F k (x,u)

непрерывны по совокупности аргументов

(х, и)

при

xeG ft,

u<=Vk, 1г— 0,

...,

N— 1,

Ф (х) — полунепрерывна

снизу

на множестве GN. Тогда:

множества Xk, k = 0 ,

1, ...,

N, замкнуты,

множества Dk (x), 1г= 0,

...,

N— 1,

замкнуты и ограничены равно

мерно по х ^ Х к\2)

нижняя грань в правой части (13)

достигается

хотя бы при одном u— uk (x)<=Dk (x); 3)

функция В к (х)

полунепре

рывна снизу на Хк,

k = 0,

1, ..., uV (см. определение 2.5.3).

Д о к а з а т е л ь с т в о .

По условию

GN= X N замкнуто, Ф (х) =

= B N(x)

полунепрерывна

снизу

на XN.

Сделаем

индуктивное

предположение:

пусть

Xk+i

замкнуто,

В к+\(х)

полунепрерывна

снизу на Xk+i при некотором

/г, O ^ k ^ N - l . Докажем,

что тогда

Хк замкнуто и на Хк справедливы все утверждения теоремы.

Так как Dh(х) =

{и : u e Vh, F h{x ,u )^ X h+i}sF / t,

Vh ограни

чено, то Dh(x) ограничено равномерно по х ^ Х к.

Докажем замкнутость Dk (х) при любом фиксированном

х £ Xk

Пусть vme D k {x)

(m =

2 , . . . ) , vm-+v(m ->оо).

Это

значит,

что.

vmEVk, F k (x, vm)£ X k+ i(m =

l, 2 , . . . ) . Из замкнутости

Vk,

X k+1 и

непрерывности F k (x,

сразу имеем

v e Vk,

lim F k (x, v j

F k (x,

v) 6 Xk+i,

Г71— >oo

t . e.

vE Dk (x). Замкнутость Dk (x)

доказана.

Покажем

замкнутость

Х к — { х : х 6 Gk,

Dk (х) Ф 0 ) .

Пусть

Ут£ Хк { т =

1, 2,

. . . ) ,

y(m -+ oo). Из

замкнутости

Gk следует,

что у £G k.

Если

мы еще

покажем,

что

Dk ( у )ф 0 ,

то

это

будет

означать,

что у в Хк,

замкнутость Хк будет доказана.

Так

как

Dk (У,п) Ф 0 . то

существует

такое

vmEVk,

что F k (ym,

vm) 6 X k+\

( m =

2 , . . . ) .

силу

компактности

Vk из

последовательности

{цт }

можно

выбрать подпоследовательность {vmJ - ^ v ( z Vk (/г->-оо). По

скольку

Xfc+i замкнуто,

Fk (х,

и) непрерывна,

то

lim F k (г/

vm ) =

= F k {у,

v) 6 Xk+i

т.

е.

v 6 Dk (у). Таким образом,

Г1-»оо

Л 1

Dk ( у ) ф 0 .

Далее, функция ср (х,

u) =

F°k (x, и) +

Bk+ i(F k (x, и))

при каждом

фиксированном х £ ,Х к

полунепрерывна

снизу по и £ Dk (х).

Это

сле

дует из непрерывности Р°к (х,

и), F k (x,

и)

и полунепрерывное™ сни

зу Вк+1 (х).

Поскольку

Dk (x) — замкнутое

ограниченное

множество,

то ср (х, и) при каждом

фиксированном х 6 Х к достигает

своей ниж

ней грани на Dk (х) хотя

бы

в одной точке и = ик (х) 6 Dk (х) (см. уп

ражнение 2.5.11,

теорему 6.1.1). Таким образом,

Вк (х) =

inf

ср(х, и) =

— ср (х, ик (х)) в

силу

уравнения Веллмана

(13).

u £ D k (x)

Остается еще доказать полунепрерывность снизу Вк (х)

на Х к.

Пусть limB*. (г) =

lim Вк (ym),

г, х,

уп £ Х к у,п- > х ( т о о ) , Вк(ут) =

г-*х

186

Д ИНАМ И ЧЕ СКО Е ПРОГРАММИРОВАНИЕ.

ПРОБЛЕМА

СИНТЕЗА

[Гл. 4

Ф (Ут, uk (у,п))- Так *как

uk (ym) 6 Dk (ут) 6 Vk, то

силу

компакт

ности Vk

последовательность {uk (ут)} (rn = 1, 2,

. . . )

имеет хотя бы

одну предельную точку v EVk. Можем считать,

что сама последова

тельность

{uk (ym)}^ - v (т-4-оо). Поскольку F k (x,

и)

непрерывна,

X k+i

замкнуто и, кроме

того,

F k (ym, uk (ут)) 6

то lim F k [ут,

«ft (ym))=

Fk (*>v) € ^fe+1.

Это

значит,

что

и 6 Dk (х).

Тогда

■»

НшВ* (х) =

Пш Bk (ут) =

lim ф (ут, uk (ут)) >

ф (х,

v) >

z-*x

т->оо

m->oo

inf

ф (х, и) =

Bk (x). Полунепрерывность Вк (x)

на

доказана. А

u£.Dk (x )'

Приведенное доказательство сохраняет силу, если от Р°(х,и) потребовать лишь ее полунепрерывность снизу по (х, и ).

3.Предположим, что нам удалось найти функции Bk(x)

условий (13)	и, кроме того, пусть	также	известны функции
« i(x )E flfi(x ),	x&Xfc, k = 0 , 1,..., JV— 1,	на	которых достигается

нижняя грань в правой части (13). Тогда, оказывается, решение

задач	(5) — (8) и (9) — (12) выписываются				совсем просто. А имен
но оптимальное управление			[ы{]0	и соответствующая траектория
[х{]0	для задачи	(5) — (8)	определяются следующим					образом:
сначала из условия
		inf В0(х) =		В0(хо)					(16)
		х € Х 0
находят х0 € Х 0, затем последовательно полагают
и о = и„ (хо), х , = F 0(х0, Wq),				= и х ( x l ) ,	Ха = F x ( х * ,			и \ ) , . . .
		%ы ~	F h— 1(хм— i, Un—i)						(17)
Оптимальное управление			и траектория		\x\\k	для	задачи		(9) —■
(12)	определяются аналогично
Xft — х, Uk — ик (xk) , x^_j_i — F к (Xk, Uk) , •••					xN ~	F n—i (xn—\,			Un—\).
									(18)
Для доказательства .этих утверждений					введем вспомогательные
функции
Ri(x,	u) = 5 i+i(F i(x ,	u)) — B i (x )+ F ° (x , и),			i =	0,	1 , . . . ,		N — 1.
									(19)
Очевидно, уравнение Веллмана (13)				тогда можно переписать в экви
валентном виде

Смотрите также файлы

Курсовая работа тепловой расчет спирального теплообменника для конденсации насыщенного пара бензола (.docx

Контрольная работа По курсу История хореографического искусства.docx

Жк тасымалдау дегеніміз.docx

9, 11ші сыныпоушыларынорытындыаттестаттауадайындаужмысыныжоспарынбекітутуралы Білім туралы.docx

Этикет приветствий в русском и иностранных языках.docx

Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно