Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 225

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

228

 

ДОСТАТОЧНЫЕ

УСЛОВИЯ

ОПТИМАЛЬНОСТИ

\Гл. 5

при условиях

 

 

 

 

0, 1, 2 , . . . , N - 1,

 

 

 

X{+i — Fi (Xj, U;),

£

(2)

 

 

xt 6 Gi,

щ 6 Vit

£ =

0 , 1 , 2 , .

N,

(3)

где

 

 

 

 

 

 

 

 

 

 

-

x, =

(x[,

Xi, . . . , Xi),

Fi =

(Ft,

. . .

, F i),

щ =

(«i..........,

uri): mho-

жества

GiCZEm, ViCZEr, £ =

0,

1,

. . . , N, заданы; функции F{ (х, и)

определены при (х,

u )^ G iX V {,

£ = 0 , 1,

N,

/ = 0 , 1,

п\ функ­

ции Ф0(х) и ФДх)

определены при х е О 0

и x e G lV соответственно;

£— дискретное время,

£ = 0 ,

>1,

 

N, момент N будем считать из­

вестным;

 

 

 

 

 

 

 

 

 

 

Как мы убедились в §

4.1, к таким задачам приводит разност­

ная

аппроксимация

задачи

оптимального управления с

непрерыв­

ным временем. Задача (1) — (3) имеет также и самостоятельный интерес и возникает при описании управляемых систем с дискрет­

ным временем ([6, 26, 59, 119, 196,

231, 234] и др.).

 

 

 

 

 

Если задать управление [и ,]=

(ц0,

«ь •••,

uN) и начальное усло­

вие х0— а, то из уравнений

(2) однозначно

определяется дискрет­

ная

траектория [хг] = (ха, х и

..., хк).

Пару

([xf],

[цг])

назовем до ­

пустимой, если она удовлетворяет условиям

(2),

(3).

Множество

всех

допустимых

пар обозначим

через D.

Допустимую

пару

( [ * ] ,

[«*]) назовем оптимальной,

если

I ([«Л) = inf / ([«,-]) = !*■ П°~

следовательность

допустимых пар

 

 

 

D

 

 

назо­

([лег,*], [г^,Л),

/г= 1,

2,

...,

вем

оптимальной,

если она

минимизирует

функционал

(1),

т. е.

 

 

П т / ( К Л ) =

/ * .

 

 

 

 

 

 

 

 

k-*oo

 

 

 

 

 

 

 

 

2.В пространстве. Е пх Е г введем множество D, точек (х,

следующим образом:

(х,

u)^ D i,

если существует допустимая пара

([хт ], Ы е й

, такая,

что Xi =

x,

щ = и. Далее,

через Xi обозначим

множество всех

тех x e G i, для

которых существует

хотя бы

одно

и^. Vi такое,

что

(я, u)^D i.

 

 

 

при x ^ X it i — 0,

 

Возьмем

функцию К Д х),

определенную

1, ...,

..., АТи положим

 

 

 

 

 

 

 

 

 

 

 

R t (х, и) = К с+1 (Е; (х,

и)) — Ki {х) +

F°i{x, и),

£

=

0,

1, . . . , N — 1,

Г0(х) = Ко (х) -(- Ф0 (х),

Г2 (X,

и) =

К.И (х) 4-

Фх (х)

-j- F^j (х,

и).

 

 

 

 

 

 

 

 

 

 

 

 

(4)

С помощью э т т

функций значение функционала

(1)

на любой до­

пустимой паре можно представить в виде

 

 

 

 

 

 

 

N —1

 

 

 

 

 

 

 

 

 

 

I ([«Л) =

£

Яг (Xj,

Щ) + Гх (xN, uN) +

rQ(х0).

( 5 )

1=0


§

3]

 

Дискретные управляемые

системы.

Оценка

погрешности

229

В

самом деле,

 

 

 

 

 

 

 

 

 

 

 

 

 

£

 

( * t, “ ;)

=

£

I K i+ i (A'i+i) —

K i

( * ;) ]

+

£

F ?

(x £, u t) =

 

1=0

 

 

 

i=0

 

 

 

 

 

£=0

 

 

 

 

 

 

 

Ко( x o) " T

JV—1

 

 

 

 

 

Гl ( X j V ,

 

 

 

— /^ . W (-*-j v )

 

/ * £ ( - ' - i ,

W ; ) — / ( [ ^ i ] )

 

^ v ) '

/ о ( ^ o ) ,

 

 

 

 

 

 

 

t= 0

 

 

 

 

 

 

 

 

 

что равносильно

(5).

 

 

 

 

 

 

 

 

 

 

 

Т е о р е м а 1. Для оптимальности последовательности допусти­

мых пар

([x£ift], [«г, d ),

k — \, 2,

достаточно существования функ­

ции Ki(x),

i = 0 , 1,

 

N, такой,

что:

 

 

 

 

 

 

 

 

1)

lim Ri(xik,

uik) = R imin=

inf Rt (x, u),

i =

0,

1 , . . . , Л/-— I;

 

 

f t - » o o

 

 

 

 

{ x , u ) £ D ^

 

 

 

 

 

 

 

 

2)

lim /y^fc,

uNk) ' = r lmln=

inf

гх (х,

u)\

 

 

 

 

 

f t - » o o

 

 

 

 

 

( Л , u ) £ D n

 

 

 

 

 

 

 

 

lim r0 (xok) =

r0mln =t inf r0 (x).

 

 

 

 

 

 

 

 

 

k -*o o

 

 

 

 

x £ X 0

 

 

 

 

 

 

 

 

{ Для

получения

формулировки

достаточного

условия оптимально­

сти для

фиксированной пары

([х*],

[«*])££)

здесь

надо

принять

 

 

 

 

Хц,

=

х\,

uik =

и\,

i =

0,

 

, N,

 

 

и все предельные переходы заменить равенствами.)

 

 

 

Д о к а з а т е л ь с т в о .

Возьмем

произвольную допустимую па­

ру ({*,•], [«г]). С помощью формулы (5) имеем

 

 

 

 

 

 

 

 

 

 

N —I

 

 

 

 

 

 

 

 

 

 

^ ([“ (•])

 

^ ([Uift]) =

^ [Ri(Xi,

«;)—

R i ( x ik,

U,-ft)I+

гг (xN,

UN)

 

 

 

 

 

 

i=0

 

 

 

 

 

 

 

 

 

 

 

 

rx (xNk,

uNk) +

r0 (x0) — r0 (x0lft) ,

k = 1,

2, . . .

 

В этом равенстве можно переходить к пределу при k-^-oo, так как правая часть по условию имеет предел. Получим

/ ([££;]) — lim / ([uik]) =

N — I

[Ri (xh щ) Rtmin] +

V

fcM0

i=0

 

 

-f- 1 \ (XjV,

U ]\i) 1 \ min ~T

! o (X a)

r 0 min ^ 0 •

Следовательно,

 

 

 

 

 

/* = inf / ([u£]) >

lim

/([«i,ft]).

 

D

 

k-bOQ

 

Однако / ([«г,*]) > Г ,

k — \, 2, . . .

 

,

поэтому lim /([uift]) = Г .

k - *o a



230

 

ДОСТАТОЧНЫЕ

УСЛОВИИ

ОПТИМАЛЬНОСТИ

 

[ Г л . а

3.

 

О п р е д е л е н и е

1. Функцией Кротова задачи

(1) — (3),

ответствующей

допустимой

паре

([*(],

[«;]) € D или

последова­

тельности

пар

([xih\,[Uih])<^D,k=l,2,...,

назовем всякую

функцию-

Ki(x),

l0, 1,

N, удовлетворяющую условиям теоремы

1.

Заметим, что если существует хотя бы одна функция Кротова

K i(x);

i = 0, 1,

N, то

функция

K i( x )+ a i

при любых au i —

= 0 , 1,

 

N, также является, функцией Кротова. Поэтому без ог­

раничения

общности чв

теореме

1 можем принять i?tmin=0, i =

= 0 , 1 ,

.... N— l, rImln= 0 ,

ибо в противном случае функцию K i{x}

заменим новой функцией Кг {х) + а ь

где .

 

 

 

 

N — 1

 

 

 

 

 

 

 

 

 

~

^

R j min Т O rn ln -

i =

0 ,

 

R

^

"1

П min­

 

imi

 

 

 

 

 

 

 

 

 

Таким образом, функция Кротова для допустимой пары ([■«*], Wi])

или последовательности

([х{й], [и^]), k — l, 2,

...,

согласно теореме 1

удовлетворяет условиям

 

 

 

 

 

 

 

 

 

 

 

Кг (X,

и) =

Ki+l (Fi (X,

и)) -

Ki (X) +

F°i (X,

и) >

0,

(X, и) 6 Dh

 

 

 

 

t = 0,

1.......... N

- 1,

 

_

 

 

'

(6>

г х ( х ,

и ) = — K n { X ) - Г ф х ( * ) + F n (х , и ) > 0 ,

 

( х ,

и ) е D m ,

 

 

 

 

Г 0 С*") = *0 С*") “Ь Ф() (•*")

Г 0 mini

 

 

 

 

 

причем неравенства

здесь

должны

обратиться

в

равенства

при

х = х\,

и = и*, или при x — Xiu, u— Uih в пределе,

когда £-voo,

i —

= 0 , 1,

..., N.

 

 

 

 

 

 

 

 

 

 

 

 

 

Возможно определение функции Кротова из условий

 

 

 

inf

[Ki+i (Ft (х,

и)) + F? (х,

и)\ - K t (x) =

0,

* 6 X t,

 

 

ueo.-w

 

i = 0,

 

, N — 1,

 

 

 

 

 

(7У

 

 

 

 

1,

 

 

 

 

 

 

 

inf n (x,

u) KN (x) +

 

(x) = 0,

x € XN,

 

 

 

 

u £ V „

 

 

 

 

 

 

 

 

 

 

 

 

где Di (x) — множество всех тех u e K , для которых

(х, и)<=Ои i —

= 0, 1,

..., N - 1.

 

 

 

 

 

 

 

 

 

 

 

 

Сравнение условий (6), (7) с уравнением Веллмана (4.1.13)-

показывает, что функция Кротова Ki(x)

является более широким,

понятием, чем функция Веллмана Bi(x).

 

 

 

 

 

 

 

Определение функции Ki(x), удовлетворяющей

условиям

(7),.

и управления и = щ ( х ) ,

на

которой

реализуется

нижняя

грань в-

левой части уравнений (7), равносильно решению задачи

(1) — (3)

и соответствующей ей проблемы синтеза

(при Ф0= 0 ) . Это утверж­

дение доказывается так же, как аналогичные теоремы 4.1.2— 5.

За­


$ 3]

Дискретные управляемые системы. Оценка погрешности

231

метим, что при некоторых ограничениях на данные задачи

(1) — (3)

существование функции Кротова Кг(х), удовлетворяющей условиям (7), является необходимым условием оптимальности [142] >(см., на­

пример, теорему 4.1.1).

 

 

взяли некоторую функцию Ki(x) и

4.

Допустим, что мы

равление u.=Ui(x), x e l,- ,

удовлетворяющее условию

inf

Ri(x, u) = Ri (x,

щ(х)),

inf Гу(х, и) = Гу(х, uN(x)),

u&D^x)

 

 

 

 

«6Кjy

 

где функции Ri, r\ взяты из

(4).

Пусть траектория [хг]=|(л;0, .... xN)

удовлетворяет условиям

(2), (3)

при щ = щ (Х {) и некотором х0=

— х0^ Х 0.

Примем пару

({*,•], [щ=щ{хг)\)

в качестве приближен­

ного решения задачи (1) — (3)

и оценим

получающуюся при этом

погрешность /([й,])— /*. С помощью формулы (5) для любых ( И ,

Juj]) ^ D имеем

 

 

 

 

 

 

 

-

 

N~ 1

_

-

_

_

- '( Ы ) — ^([«<]) =

2

№ (*/,

“d — Ri(X[, U t)]+ rL(xN, «лг) —

 

 

£=0

 

 

 

 

 

rl (XN, Un) +

 

 

 

N~ 1

_

_

го(•'-о)

Г0(Хо)

[ Rl min -+ Ri {xi,

Wf)] -j-

 

 

 

 

 

£=0

 

 

-)- Гу {Xf i,

Uflf)

Гу mjn

 

r 0 m]n -f- Г 0 (Xq) ^

8 ([W f]),

 

откуда

 

 

 

 

 

 

 

 

1

([“Л) — inf1

 

([«Л) < 8 (Ы ) •

 

(8)

 

 

 

D

 

 

 

 

Как видим, эта оценка будет тем лучше, чем' точнее удовлетворя­ ются условия- (6)' (или условия <(7) и г0(л:о)== in fr0(;e)). Оценка

*€Х о

(8) может быть полезна при решении задач оптимального управ­ ления с использованием тех или иных вариантов динамического программирования, описанных выше.

Упражнение. Вывести условия оптимальности для задачи -ми­ нимизации функционала

^ ([“*]) =

Ка£> хд +

(ut-)] -f'(c,

xN)

 

i—1

 

 

 

 

 

при условиях xi+i =

Atxt +

B c(ut),

ut e v it

i =

0,

1 , . . . , N — 1;

x0 = а, где Д- — матрица

порядка

n x tv,

B t, a h

с, a — я-мерные

векторы, bi(u)

скалярная функция

переменной

u ^ V i^ E T, i =

=0 , 1...... N - l .

Ук а з а н и е . Функцию Кг (x ) искать в виде многочлена первой степени по х: Ki (я) = (фг, х ) , пользуясь условиями (7).