Файл: Васильев Ф.П. Лекции по методам решения экстремальных задач.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 203

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

§ 2]

Критерии управляемости

и оптимальности

319

 

Теперь перейдем к исследованию

непрерывности М(с, t),

р (t)

по переменной t. Здесь уже существенно будет использована связь множества Xt с управляемым объектом

 

 

 

{х{х, и), u e u t,

t > t 0),

 

 

 

удовлетворяющим условиям I—V II.

 

 

 

 

 

Т е о р е м а

4. Пусть управляемый объект

 

 

 

 

 

 

{х(т, и), и е и „ *> *„ }

 

 

 

удовлетворяет условиям

I—V II. Тогда функционалы M (c,.t), р (t)

непрерывны по t при всех t ^ t Q.

 

 

 

 

 

 

Д о к а з а т е л ь с т в о .

Возьмем произвольное t^>tQ и

условимся

рассматривать лишь те т > / 0, для

которых

11— т|< — ,

где

А =

= const > 0

взята из условия III.

Пусть

 

 

 

 

 

 

 

 

 

А

 

 

 

 

 

М (с, t ) = ( c , x(t,

uc,t) — y),

М (с, т) =

(с, х(т,

ис,х)-~ у).

 

Согласно условию III

управления uc,t £ U t и uCtX6 Ux

можем

продол­

жить на отрезок

Г^0, t +

— 1 и, сохраняя за [продолженными управ-

лениями их

 

L

 

2 J

 

учетом условия

IV,

можем

прежние

обозначения с

считать, что х(т, iic,t) 6 Хх, х (t, ис,х) Xt. Тогда)

 

 

 

М (с,

Г) <

(с, х (t, ис,х) — у ) , М (с, т) <

(с, х (т,

ис,,) — у),

 

поэтому

 

 

 

 

 

 

 

 

 

 

 

(с, X (t, ис, t) — х (т, ис,ч)) < М ( с , t) — M (с, т) <

 

 

<(с, X (t, иСЛ) — х{%, ис,х)).

Сучетом условия VII отсюда имеем

\М(с, t) — M(c, т)К||с||. sup ||x(f, и) — х(т, и)||<

 

 

и6С/(+д/2

 

 

 

<||с||е,+;д/2(|г;— т|, f) - » 0

 

при

Непрерывность М(с, t) по t при каждом t > t 0 доказана*

Если же t = to, то сразу имеем

 

 

I М (с, t0) — М (с,х) |= |(с, Х0 Х (т, ис,х) |<

1 с 1 ||X(/„, Ue,t) ~

 

— X(т, исд) II <

II с 1 е,о+д/2 (| Т — 101, t0) 0

при т-»-/0 + 0.

 

Теперь докажем

непрерывность p(t) при t ^ t Q. Пусть сначала

t > t 0. Воспользуемся формулой (3) p (0 = ll*t— г^Н, где xt= x(t, щ) — проекция у на Xt. Продолжая при необходимости управление



320

МЕТОДЫ

РЕШ ЕНИ Я ЗАДАЧ БЫСТРОДЕЙСТВИЯ

 

 

 

\Гл. 7

u.t— Ut{x)^U t на

[£,

£+А ],

можем считать,

 

что х(х,

н , ) е ! х

при

всех т, 11—т| ^ Д/2. Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

р(т)<||л'(т, ut) — y\\K\\x(t, щ )— у\ + 1х(и ut) — x {х, ы,)||<

 

и поэтому

 

 

<

Р (0 +

е<+д/2 (|£— т|, £),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пш р (т) < р (£).

 

 

 

 

 

 

 

 

 

 

 

 

 

X~>t

 

 

 

 

 

 

 

 

 

 

 

 

С другой

стороны,

пусть

р (£)= М (сг,

£),

C jeG .

 

Тогда

р ( т )^

^ Л 1 (с 4, т)

и, пользуясь непрерывностью

 

М(с, t)

по

£,

отсюда

имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ишр(т)

> M ( c t, t) =

p(t).

 

 

 

 

 

 

Таким образом,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim р (т) =

Пш р (т) =

р (£),

 

 

 

 

 

 

что равносильно непрерывности р(£) при t>to- Если

же

£ = £о»

 

то

Р(£0) =

К

У\= \\х(£0, щ) — г/1| и |р (/) — р (£„) I =

 

 

= III'V'(£0. “Л —Ув —И *. Щ) — #||1 <IW^,

 

 

 

«;)!<

 

 

< е/0+д/2 (|£ — £0|, £0) - > ° при £ -П 0 +

0.

А

 

 

 

Т е о р е м а 5.

Пусть управляемый объект {х(т,

и),

u ^ U t, t > t 0}

удовлетворяет условиям I— VII и (у, Т) -управляем при каком-либо

Т, io < T < + oo. Тогда задача

быстродействия имеет решение.

 

Д о к а з а т е л ь с т в о .

При

выполнении

условий

теоремы р(£)

непрерывна на отрезке £ о ^ £ ^ Т и р (Г )= 0 .

Тогда

найдется един­

ственная точка Т*,

to<T*s£ZT, такая, что

р (7 '*)= 0 ,

р (£ )> 0

при

4 ^ £ < Т * .

В силу

теоремы 2

тогда

Т* —

оптимальное

время,

а управление ц *е£/ т .,

для

которого

||х(Г*, и *)у\\ = р(Т*) = 0,

будет оптимальным.

Д

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При отыскании

Т*

можно использовать различные методы ре­

шения нелинейных уравнений, как например, метод деления отрез­ ка пополам, метод хорд, метод Ньютона и др. [19]. На одном ин­ тересном обобщении метода Ньютона [66], приспособленном для отыскания ближайшего к начальной точке нуля функции, остано­ вимся в § 4. В следующем параграфе будет изложен другой метод нахождения оптимального времени Г*.

Упражнения. 1. Выяснить геометрический смысл теорем 1, 2, считая Х = Е 2.

2. Если выполнены условия I, V, VI, то функционал [—М (с, является выпуклым по с при любом t ^ to и для любого / еХ су­ ществует


§ 3]

 

р-Метод

 

 

 

 

 

321

 

 

 

 

 

 

 

 

dM (с, t) _ Um

M (c-h si, i) M (c,

t)

min

(l,

x

tj),

 

dl

e-»+o

e

 

 

 

“£Xc,t

 

 

 

где * c, i — множество всех тех xc, и для которых М (с,

t) =

(с, хс, t

у). Доказать.

 

 

 

 

 

 

 

3. Пусть требуется наибыстрейшим

образом

перевести

точку

х = ( х 1, х2)

из. положения (1, 0) в начало координат

(0, 0) при ус­

ловии, что движение точки подчиняется уравнениям х ' = х 2,

х2= и ,

т ^ О и управление

 

 

 

 

 

 

 

и =

и (т) 6 £/, =

(т) 6 4 2J0, *]: |а (т) |< 1,

Q < т <

t).

 

Проверить выполнение условий I—V II для этой задачи; вычислить явное выражение для функций М(с, t), р(t).

§3. р-МЕТОД

1.В излагаемом нцже методе важную роль играет функция p{t), введенная в предыдущем параграфе. Поэтому этот метод бу­ дем называть р-методом.

Будем предполагать, что управляемый объект {х(т, и), u<^Ut, t > t Q} удовлетворяет всем условиям I— V II и (у, Г)-управляем при каком-либо Т, 4 < Т < + °о. Тогда согласно теореме 2.5 задача быстродействия имеет решение. Для отыскания ее решения пред­ лагается следующий итерационный процесс.

В

качестве

начального

приближения

возьмем 4 ,

х0, с0—

=\{х0—У) 11*о—yll-1 (естественно

считать, что х0ф у ,

иначе

t0— оп­

тимальное время);

р (4) = И*о— г/П> 0 . Пусть известно

(k — 1)-е при-

ближение ( й ^ 1 ),т .

е.

 

 

 

 

 

 

 

 

 

 

 

4 - i ; JCfe—1 6

 

;

ck- 1 =

(ха- i у) ||xA_, — y\\~\

 

такие,

что

 

 

 

 

 

 

 

 

 

 

 

 

при

p ( 4 - i ) =

M (c*_i,

4 - i)

=

||xk-\ у ||,

p (t) >

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t0 <

t <

4 —ii

4

4

 

^

^ 4 —i

T •

 

 

Так как функционал M (cft_ b

t)

непрерывен no

t,

причем

 

 

P (4 - i) =

M{ck-_i,

4 _ i)> 0 ,

M {ck-1,

T ) < 0

 

(см. теорему 2.1), то найдется момент 4 .

такой,

что

 

 

 

4 - i < t k < T ,

Af(с*_,,

4) = 0,

ЛГ(сА_ь 4 > 0

 

при 4 _ ! < ^ < 4 . Далее вычисляется

 

 

 

 

 

 

 

 

 

р (4 ) =

тах М (с ,

4 )

 

 

 

 


322

МЕТОДЫ Р ЕШ ЕНИ Я

ЗАДАЧ

БЫСТРОДЕЙСТВИЯ

[Г л . 7

и определяются

такие

 

 

 

 

 

 

 

 

 

*4 6 Ufk'

~

X(tk,

4i) 6 ^tk'

(-к^. Gi

 

ЧТО

 

 

 

 

 

 

 

 

 

 

 

 

P (tk) = M ( c k,

tk) =

\xk — y\.

 

 

Так как p (^ )> 0

при

f0 < f < 4 _ i

по-предположению,

 

 

p ( t) > M (c k- u t ) > 0

при

4 _ i < f < 4

 

в силу выбора

th, то

p ( i ) > 0 при

4 s S ^ < 4 .

Может

случиться,

что р (4 ) = 0 . В

силу теоремы 2.2 тогда 4 = Т * — оптимальное вре­

мя, Uk— u* — оптимальное управление,

и итерационный процесс на

этом заканчивается. Если же р (/*) =

||x/t—у||>0, то, имея

U ,x k e X ik,

ск = (хк— У)\\Хк — у\\-',

р (tk) - M ( c k, tk),

р (0 > 0

при 4 = S ^ ^ 4 < T ,

—< tfc < 7 ’, процесс продолжаем дальше.

р-Метод описан полностью.

 

 

 

объект {х(т, и),

u ^ U t, t >

Т е о р е м а

1. Пусть управляемый

> 4 } удовлетворяет всем условиям

I— VII

и (у,

Т)-управляем при

каком-либо Т, to<zT<z-\-oo. Тогда решение задачи быстродействия может быть получено как предел последовательностей, полученных

с помощью описанного выше p-метода, а именно: 1) lim tk = T*

к-+эо

оптимальное время; 2) любая слабая предельная точка и* после­

довательности {uk},

uk ^Uiki является оптимальным управлением, а

х{%, и*), t o ^ y ^ T *

— оптимальной траекторией.

Д о к а з а т е л ь с т в о . Так

как последовательность {4 } моно­

тонно возрастает и ограничена

сверху величиной Т, то существует

П ш 4 = Т* (здесь, естественно, предполагаем, что итерационный

f t — »оо

процесс не заканчивается за конечное число шагов, иначе теорема

становится

тривиальной).

Из

непрерывности

p(i‘)

следует, что

р (4 )-^ р (Т *) -»-оо).

 

 

 

 

 

 

Покажем, что р ( Т * ) = 0 . В дальнейшем нам

будет достаточно

рассмотреть только такие k ^ k 0,

для

которых Г *— 4<^Л,

где Д==

= c o n s t X )

взята из 'условия III.

Можем считать, что все управ­

ления к = и ( т ) е !/ ( при

0 < Г * —

продолжены

на

отрезок

[U, Г*], и за продолженными управлениями сохраним их прежние обозначения. Пусть управление ик+\ 6 Uik+\ такое, что

M(ck, tk+l) = (ck, x{tk+ь uk+i) — y).

Тогда в силу условий II, IV ла(4, £4+i) e X * ft и с учетом равен­ ства М (ск, tk-ы) = 0 и условия V II имеем

- 0 < p { t k) = M (ck, tk)-^ M {ck, 4+i) < (ск, x(tk, uk+\) — у) —