Файл: Балакришнан, А. Введение в теорию оптимизации в гильбертовом пространстве.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 24.10.2024

Просмотров: 110

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Выпуклые множества в гильбертовых пространствах

Т е о р е м а 2.9. (Фаркаш.) Пусть А обозначает (тУ^п)- матрицу с вещественными элементами, а у векторстолбец из евклидова пространства Еп, для которого

[г/, лг]^0,

если

А х ^ О

 

(2.18)

(неравенство А х ^ О

означает,

что все компоненты век­

тора Ах неотрицательны). Тогда у имеет вид

 

 

 

У = А ' г

 

 

 

для некоторого г е

Е,п,

0.

 

 

 

Д о к а з а т е л ь с т в о .

Прежде чем приступать

к до­

казательству, заметим, что если у — A*z, z е

Em, z ^ 0,

то условие (2.18) автоматически выполняется.

Для

каж­

дого m > 0 обозначим через Рт конус векторов из Ет с неотрицательными компонентами. Обозначим через С выпуклое множество

{ А * х : X е P J .

Потом мы докажем, что множество С замкнуто, а пока примем это на веру.

Предположим, что у не принадлежит С. Обозначим

через уо проекцию

вектора у на С. Тогда

в силу тео­

ремы 1.2 для каждого 2 ^ 0

 

 

[ у — Уо, Уо

А " г ] > 0,

 

или

 

 

 

 

[Уа — У, У ь \ < [ У ъ — У ’ А * г ] .

 

Другими словами,

для каждого z е

Рт

 

[Уо -

У> Уо] <

[А {Уо -

У), 4

(2.19)

Перебирая по очереди векторы 2 , у которых все ком­ поненты, кроме оДной, равны нулю, получаем, что все компоненты вектора А{у0 — у) неотрицательны:

А{у0 — У ) > 0-

Но тогда в силу (2.18)

[У,Уо — у]>0-

(2.20)

С другой стороны, полагая в неравенстве (2.19) 2 = 0, получаем [г/0 — у, г/0] ^ 0. Так как мы предположили,


90

Глава 2

что у не принадлежит С, то [г/0 — у, у0 — у]> 0, откуда

0 > {уа У, г/0] > \Уа ~ У, У],

что противоречит неравенству (2.20). Итак, у е С. Докажем теперь замкнутость множества С. Положим

у = lim A'zn, zn <=Pm.

Если последовательность {zn} содержит ограниченную подпоследовательность, то доказательство легко закон­ чить. Поэтому предположим, что

І1 II —> ОО.

Пространство Еп допускает ортогональное разложение Еп= множество значений оператора Л* +

+ (нуль-пространство оператора А),

так что вектор у молено представить в виде

y — A'q-\-x, Ах = 0.

Но из равенства Ах = 0 следует, что

0 = [у, X]= [A’q, х] + [х, х] = [х, х],

откуда х = 0 и, значит, A'q — у. Воспользуемся ортого­ нальным разложением

Ет= (нуль-пространство оператора Л’) +

+(множество значений оператора А)

изапишем

у= А'Ах0

для некоторого х0 из Еп.

Обозначим через Q мнолеество значений оператора А. Покажем, что

А Axq s А Рт .

Предположим, что Q пересекается с внутренностью ко­ нуса Рт, т. е. существует такой вектор и > 0, что при некотором X

Ах = V.

Выпуклые

множества в гильбертовых пространствах

91

Тогда

[у, х] = lim [z„, Ах] = lim [z„, v],

 

оо >

 

что невозможно, поскольку ||z„||—>оо.

Итак, Q не пересекается с внутренностью конуса Рт. Но тогда по теореме 2.2 найдется ненулевой вектор ѵ, для которого

sup [v, q] < inf [v, р].

Отсюда сразу следует, что о е Р я и [u, Q] = 0, т. е.

v<=Pm[\QL.

Рассмотрим сначала крайний случай

Qf]Pm = {0},

(2.21)

где Ѳ— нулевой вектор. Предположим, что Qx не пере­ секается с внутренностью конуса Рт. Тогда, как и раньше, можно найти ненулевой вектор р е Рт, для которого [р, Q-1] = 0, т. е. p ^ Q [ \ P m, что противо­ речит (2.21). Поэтому найдется вектор p e Q 1, все ком­ поненты которого положительны. Тогда все компоненты вектора Ах0 + Мр при достаточно большом N также положительны. Поскольку Qx совпадает с нуль-про­ странством оператора А \ имеем

А'*{Ах0) = А* {Ах0+ Np),

и теорема для рассматриваемого случая доказана. Распространить это утверждение на общий случай

нетрудно: для этого достаточно скомбинировать крайние случаи. Обозначим через р+ вектор из РтП Q с наи­

большим числом положительных компонент (пусть их k). Для удобства запишем (изменив, если необходимо, порядок компонент)

Pk

 

®ft <

P k е

 

 

Р+ = Ѳт

P fo

 

где 0m_Ä— нулевой

вектор в Em_k,

а

Ѳ4 — нулевой

вектор в Ek. Отсюда,

в частности,

следует,

что каждый

вектор из Q1 должен иметь вид

 

 

 

Г в,

 

am—k ^

Ет—ь.

 

 

. Пт—ft. 1

 

 


92 Глава 2

Тогда для любого ѵ из Pk

. ®m—k е (Q1)1 = Q-

 

V

( 2.22)

 

Далее,

 

]Лх0, Р+] = Um [zn, р ] = lim[z„, р+],

 

П

 

где

 

{%n)k

 

Ѳт—k .

 

(через (z„)fe обозначен вектор, образованный первыми k компонентами вектора zn).

Таким образом, последовательность {||z„||} ограни­ чена: беря ее сходящуюся подпоследовательность, получаем

[Ах0, р+] = [20, р+],

где zQимеет вид

z

20 = . ®m—k , z<=Pk.

Согласно (2.22),

{Ax0)k = z<=Pk,

где (Ax0)k — вектор, образованный первыми /г компо­ нентами вектора Ах0. Зададим преобразование Т, ото­ бражающее Q в Em- k, формулой

T(q) = (q)m-k, q ^ Q ,

где (q)m-k — вектор, образованный последними m — k компонентами вектора q. Тогда Т (Q) — линейное под­ пространство в Em-k и

т (Q ) П P m - k — ® m -k -

Поэтому;- как и в случае (2.21), в Em- k должен найтись такой положительный вектор pm_ft > Ѳ,„_А, что pOT_ft s

^(T(Q))'l . Тогда вектор

[Ѳ*

. P m—k .

Выпуклые множества в гильбертовых пространствах

93

принадлежит Q1 и, следовательно, для достаточно

больших N

А* {Ах0+ Nr) А* {Ах0),

Теорема, наконец, доказана.

Дифференциальные игры

По сути дела дифференциальная игра — это игра,

исход которой определяется поведением некоторой упра­ вляемой динамической системы. Например, в игре двух

лиц могут участвовать „преследователь“

и

„пресле­

дуемый“, а также динамическая система,

описываемая

уравнением

. .

 

 

x(t) = F (t, X(t), и (t), ü (t)),

X(t)

En,

 

причем начальное условие x(0) считается заданным.

Преследователь должен выбрать управление u(t),

изме­

римое по Лебегу

и удовлетворяющее заданным

ограг

ничениям. Здесь

мы будем предполагать, что u (t) ^ K u

почти всюду,

Ки — замкнутое

ограниченное множество

в евклидовом

пространстве

Е,п. Все такие управления

мы будем в дальнейшем называть просто допустимыми. Аналогично преследуемый может выбирать управле­ ния v{t), которые тоже должны быть измеримыми по Лебегу и должны удовлетворять ограничёнию ѵ(t) е Кѵ почти всюду, Ка— замкнутое ограниченное множество в евклидовом пространстве Ер. Эти управления мы тоже

будем называть допустимыми.

Считается, что игру можно завершить за время Т,

если независимо от того, какое управление выбрал преследуемый, у преследователя всегда найдется соот­ ветствующее управление, для которого Иях (Г) |KJd, где я — оператор проектирования из Еп на Ek, а с?—фикси­

рованная неотрицательная

постоянная. Очевидно, что

в общем случае время Т

должно зависеть от началь­

ного состояния х(0). Как легко видеть, для того чтобы

можно было .завершить игру за время Т,

необходимо,

чтобы

 

(2.23)

sup inf Ипх{Т) II

.

О(-). «.{■)

.. т-


94 Глава 2

Действительно, поскольку игра может быть завершена в этом случае независимо от выбора допустимого упра­ вления о(-). ПРИ любом фиксированном ѵ( - ) должно выполняться неравенство

inf II яд: (Г) II ^ .d , «(■>

а отсюда следует условие (2.23). Заметим, что условие (2.23) к тому же будет и достаточным, если для лю­ бого ѵ( ■) найдется такое (допустимое) управление и( •), что

II яхи(Т) || = inf Кял (Г) II. «(■)

Однако не столь ясны оставшиеся вопросы существо­ вания седловых точек (оптимальных стратегий) и пере­ становочности операций inf и sup. Мы рассмотрим лишь второй, более простой вопрос. И даже для него пра­ вильнее называть задачу не дифференциальной игрой, а просто задачей погони.

Линейные игры с выпуклыми ограничениями

Рассмотрим линейную задачу, т. е. задачу, в которой определяющая динамическая система линейна. Положим

X (t) — Ах (t) -f Ви (t) + Сѵ (t),

где для простоты матрицы А, В и С считаются по­ стоянными. Тогда, естественно,

г

ях(Т) = яФ (Т) х(0) -f я J* Ф (Т — s) Bu(s) ds +

о

г

 

 

+ я J Ф (Т — s) Сѵ (s) ds,

 

о

и мы будем пользоваться обозначением ял (Т) = Z {Т, и (•), V(•), л (0)).

Выше через Ф(/) мы обозначили матрицу фундамен­ тальных решений линейного уравнения, выписанного

 

Выпуклые множества в

гильбертовых

пространствах

95

в начале раздела,

 

 

 

 

 

Ф (0 = АФ (/),

Ф (0) =

/,

 

где I — единичная матрица.

 

 

 

Предположим также,

что множества Ки и К0 вы­

пуклы.

Обозначим через

множество

 

^ц —

| я ФJ (Т — s) Bu(s)ds: и (t) е Ка почти всюду | .

Аналогично положим

 

 

 

 

П» =

J Ф(Т — s)Cv (s) ds:

и ( t ) ^ K D почти всюду j .

Оба множества ограничены и выпуклы. Более того, они замкнуты. Действительно, пусть

г

г/„= я ] Ф(Т — s)ßun(s)ds,

о

а так как множество Ди ограничено, то можно выбрать последовательность {«„( •)}, слабо сходящуюся в L2{О, Г) к некоторому элементу, скажем и0. Ясно, что и0(і) также принадлежит Ки почти всюду и

т

у0= lim уп = п j Ф (Т — s) Ви0(s)ds.

о

Аналогично можно убедиться в замкнутости множе­ ства Обозначим через fu(•) и /0 (•) опорные функ­ ционалы множеств Q„ и Q0 соответственно. Теперь мы подготовлены к тому, чтобы сформулировать необхо­ димые и достаточные условия возможности завершения игры за время Т.

Т е о р е м а

2.10. Для

того чтобы можно было завер­

шить игру

к

моменту

Т,

начиная из состояния *(0)

в нулевой

момент времени,

необходимо и достаточно,