Файл: Ларин В.Б. Синтез оптимальных линейных систем с обратной связью.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 13.07.2024

Просмотров: 151

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Г Л А В А 5

ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ

 

ИГРЫ

ПРЕСЛЕДОВАНИЯ — УКЛОНЕ­

 

НИЯ С

КВАДРАТИЧНЫМ ФУНКЦИО­

 

НАЛОМ

ПЛАТЕЖА. УЧЕТ ЗАПАЗДЫ­

 

ВАНИЯ

 

Содержание первых четырех глав настоящей монографии составляет изложение спектральных методов синтеза, яв­ ляющихся результатом использования идей Винера — Кол­ могорова к синтезу систем с обратной связью, и решение ряда традиционных задач теории автоматического регули­ рования. В настоящей главе будет показано, что при незна­ чительной модификации эти методы могут оказаться эффек­ тивными и при решении некоторых задач теории дифферен­ циальных игр.

Многие задачи теории дифференциальных игр по по­ становке близки к задачам синтеза оптимальных систем с обратной связью в теории автоматического регулирования. По-видимому, в связи с этим вариационные методы, эффек­ тивные при решении задач синтеза, оказываются эффектив­ ными II при решении соответствующих (близких по поста­ новке) задач теории дифференциальных игр. Действительно, математический аппарат классического вариационного ис­ числения (уравнения Эйлера—Лагранжа) позволил решить как задачу аналитического конструирования регуляторов [18], так и задачу линейной дифференциальной игры пре­ следования — уклонения [33]. Современные вариацион­ ные методы, связанные с именем Л. С. Понтрягина, Р. Велл­ мана, Н. Н. Красовского, возникшие при решении ряда задач автоматического управления, успешно используются и при решении соответствующих задач дифференциальных игр. Можно надеяться, что и изложенные выше вариацион­ ные методы синтеза, математическим аппаратом которых являются уравнения Винера-Хопфа, окажутся полезны­ ми при решении некоторых задач теории дифференциаль­ ных игр.

121

§ 1. « К О Н Ф Л И К ТН Ы Е С И ТУ А Ц И И » В З А Д А Ч Е А Н А ­

Л И ТИ Ч Е С К О ГО К О Н С ТР У И Р О В А Н И Я Р Е ГУ Л Я ­ ТО Р О В

При решении задач синтеза линейных систем с обратной связью в предыдущих главах, как и в [11, 18], предпола­ галось, что квадратичная форма функционала качества является определенно положительной. Однако можно ука­ зать класс задач, в которых это предположение не реали­ зуется [31]. Для иллюстрации этого утверждения иссле­

дуем с

несколько иных позиций пример, рассмотренный

в [20,

19].

 

 

Пусть движение объекта описывается уравнением

 

X = Ьх +

ти,

(5.1)

где X — координата объекта,

и — управляющее

воздей­

ствие,

b = const и т — const.

 

= Д (х)

Требуется определить законы управления ut

и «2 =

/2 (х) так> чтобы функционал

 

 

оо

 

 

 

/ = j

xhlt

(5.2)

 

о

 

 

достигал минимума (наилучший регулятор их = Д (х)) или максимума (наихудший регулятор и2 = /2 (х)) при

я 3

(1

о

і

 

 

f u2dt =

к.

о

 

 

(5.3)

(5.4)

Сформулированная изопериметрическая задача сводится к исследованию стационарной точки функционала

 

 

со

 

 

 

 

/ 0 =

J

(X2 +

Іи2) dt

(5.5)

 

 

о

 

 

 

(X — множитель

Лагранжа).

 

 

Как показано в [19,

20], закон управления, при котором

6 /0 = 0, имеет

вид

 

b + k

 

 

 

и =

X,

(5.6)

 

— -—

 

 

 

т

 

122


г д е

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(5.7)

т. е.

 

 

 

 

 

 

 

 

 

 

 

 

 

х =

х0е~к1,

 

(5.8)

 

 

 

 

 

и =

Ь+ k

ы

 

 

 

 

 

— ^— хпе~ы.

 

Подставив

 

(5.8)

 

в

(5.4),

получим

 

 

 

 

 

со

 

 

 

 

 

 

 

 

 

 

 

 

(5.9)

или

 

 

 

 

 

 

 

 

 

 

 

k2

2

b\k-\-b2 — 0.

(5.10)

Отсюда

,

 

 

 

 

А ,

 

 

,

=

( кт2

f wn2 I um2

26),

 

 

 

 

ь) + У ^ ( —

,

 

,

 

( xm2

, \

Г у.т2 I xm2

2b),

 

 

 

 

 

 

 

 

причем задача имеет решение, если

 

 

 

 

 

 

у.т2 — 2Ь >

0.

 

Экстремальные значения функционала (5.2), согласно (5.8), определятся равенством

(5.11)

т. е.

7 т я х — 2k,m in

7 т in ---- 2k„

которым соответствуют уравнения наилучшего и наихудшего регуляторов:

ь + К ■X, щ = b + Äm in -X.

123


Покажем, что %> О, если управление и минимизирует функционал (5.2), и К < 0, если и максимизирует этот функ­ ционал.

Известно [2], что Л = — а, согласно (5.11),

 

ді

 

 

 

_dk_

 

 

дх

 

 

2kа

дк

'

 

Из (5.10)

находим

 

 

 

 

 

 

 

dk

__

тг

 

2/г2

 

 

 

дк

~

"77"

/г3 — Ьг '

 

 

 

 

•'о

 

 

 

 

т. е.

 

 

 

 

 

 

 

 

ді

_

 

 

nf-

 

(5.12)

 

дх ~

 

И' — Р

 

 

 

 

 

П О С К О Л Ь К У

Ь Ämin * ^max»

ТО

^

^

^m in ’ ^m ax И

при А = Amin А2 — b2<

0,

 

 

0, при А =

Атах А2 — А2>

Следовательно, если управление и, стесненное изопериметрическим ограничением (5.4), минимизирует функцио­

нал

(5.2), то множитель Лагранжа К >

0, если же функцио­

нал

(5.2) максимизируется, то А <

0.

 

Таким образом, на простейшем примере показано, что

при минимизации функционала

(5.2)

квадратичная форма

в (5.5) является определенно положительной, при макси­ мизации — де является определенно положительной.

К аналогичному выводу можно прийти и в более общем случае, когда движение системы происходит под действием нескольких управлений, стесненных ограничениями типа (5.4), причем одни управления стремятся минимизировать, а другие — максимизировать функционал типа (5.2). Этот случай можно трактовать как дифференциальную игру двух игроков, один из которых стремится минимизировать, а дру­ гой — максимизировать функционал типа (5.2). Решение подобных задач сводится к исследованию стационарных то­ чек функционала типа (5.5), в котором квадратичная форма не является определенно положительной из-за наличия от­ рицательных множителей Лагранжа.

Отметим, что в предыдущих главах решение задач син­ теза оптимальных регуляторов также сводилось к отыска­

124


нию стационарных точек минимизируемых функционалов, но, в отличие от дифференциальных игр, квадратичная форма в этих функционалах всегда предполагалась опре­ деленно положительной. Таким образом, для решения задач линейных дифференциальных игр с квадратичным функцио­ налом платежа, по-видимому, можно использовать изложен­ ные выше методы синтеза оптимальных регуляторов, если эти методы модифицировать так, чтобы область их приме­ нимости не ограничивалась только определенно положи­ тельной квадратичной формой в функционале качества.

§ I .

Р Е Ш Е Н И Е Л И Н Е Й Н Ы Х Д И Ф Ф Е Р Е Н Ц И А Л Ь Н Ы Х

 

И ГР С К В А Д Р А ТИ Ч Н Ы М Ф У Н К Ц И О Н А Л О М

 

П Л А ТЕ Ж А

Рассмотрим динамическую систему, которая состоит из двух управляемых объектов. Дифференциальные уравне­ ния, описывающие движение системы под действием управ­ ляющих воздействий ил и и2, выбором которых располагают соответственно первый и второй игроки, имеют вид

+ л*і«і + 'Фі. Г

(5.13)

х2 = А2х2 + М2и2+ ф2. I

Размерности векторов л^, х2, их и и2 равны пх, п2, тх и т2 соответственно, и ф2 — пх- и п2-мерные стационарные случайные процессы (внешние возмущения) с нулевыми ма­ тематическими ожиданиями и дробно-рациональными мат­ рицами спектральных плотностей S u (со) и 52а (со), Ах, А2, Мх и М2 — постоянные матрицы пх X пх, п2 х п2, пх х тх и п2 X /По соответственно. Задача заключается в определении законов управления

их = Wxx,

(5.14)

и2 = W2x

(х — [х'і, х2У) таких, чтобы динамическая система, описы­ ваемая уравнениями (5.13), (5.14), была физически1

1 Здесь и далее дифференциальные уравнения, описывающие дви­ жение системы, записываются в канонической форме. Это позволяет отож­ дествить решение задачи синтеза для системы (5.13), когда % — слу­ чайные возмущения с постоянной спектральной плотностью, с решением детерминированной (ф; = 0) задачи синтеза при ненулевых начальных условиях (см. гл. 2).

125


реализуема1, причем в установившемся режиме первый игрок стремится минимизировать, а второй — максимизировать функционал

 

e0 =

(z'R0z)

(5.15)

при ограничениях (и?) = х{

= 1, 2, . . . , т;

т /n2 -f

+ щ)-

) — знак математического ожидания,

R 0 — по­

Здесь (

стоянная

весовая матрица,

г — Lxxx Ь2х2,

L1 = [£П11;

0] — матрица п0 X пх, Ь2 =

[ЕПо\ 0] — матрица п0 X п2,

т. е. е0 — среднеквадратическая взвешенная разность между первыми п0 координатами объектов.

Сформулированная задача сводится к исследованию ста­

ционарных точек функционала

 

е — (z'R0z) + (Uj^A^) + (и2А2и2)

(5.16)

(Aj и Л2 — диагональные матрицы, элементы которых —

-множители Лагранжа, причем все элементы матрицы Ах неотрицательны, а Л2 — неположительны) на классе физи­ чески реализуемых динамических систем.

Введем обозначения и = [нь и2У, Ф = [фь Ф^', ti = пх

+ П2,

Р =

 

 

 

 

s a ( С О )

S12(со)

 

е п , р -

а 2\ ’

 

о ) ~ ß zi (®)

S22(со)

о

 

5 ф ( с

 

м =

Мх

0

 

 

 

 

0

М2 ,

W =

IWV w ty,

 

 

Лх

о

 

L\

 

 

А =

о

л .

R =

'i

R oi^i’

Т,2].

— L'

 

Тогда уравнения (5.13), (5.14) и функционал (5.16) за­ пишутся так:

Рх + Ми ф- ф,

(5-17)

u = Wx,

(5.18)

е = (x'Rx) + (и’Аи),

(5.19)1

1 Под физической реализуемостью линейной системы, как и ранее, понимается равенство нулю ее весовой функции при t < 0. Примени­

тельно к игровой задаче это соответствует ситуации, когда каждый игрок при выработке стратегии в каждый момент времени может использовать только текущие и прошлые значения фазовых координат системы.

126