Файл: Ларин В.Б. Синтез оптимальных линейных систем с обратной связью.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 13.07.2024
Просмотров: 151
Скачиваний: 0
Г Л А В А 5 |
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ |
|
|
ИГРЫ |
ПРЕСЛЕДОВАНИЯ — УКЛОНЕ |
|
НИЯ С |
КВАДРАТИЧНЫМ ФУНКЦИО |
|
НАЛОМ |
ПЛАТЕЖА. УЧЕТ ЗАПАЗДЫ |
|
ВАНИЯ |
|
Содержание первых четырех глав настоящей монографии составляет изложение спектральных методов синтеза, яв ляющихся результатом использования идей Винера — Кол могорова к синтезу систем с обратной связью, и решение ряда традиционных задач теории автоматического регули рования. В настоящей главе будет показано, что при незна чительной модификации эти методы могут оказаться эффек тивными и при решении некоторых задач теории дифферен циальных игр.
Многие задачи теории дифференциальных игр по по становке близки к задачам синтеза оптимальных систем с обратной связью в теории автоматического регулирования. По-видимому, в связи с этим вариационные методы, эффек тивные при решении задач синтеза, оказываются эффектив ными II при решении соответствующих (близких по поста новке) задач теории дифференциальных игр. Действительно, математический аппарат классического вариационного ис числения (уравнения Эйлера—Лагранжа) позволил решить как задачу аналитического конструирования регуляторов [18], так и задачу линейной дифференциальной игры пре следования — уклонения [33]. Современные вариацион ные методы, связанные с именем Л. С. Понтрягина, Р. Велл мана, Н. Н. Красовского, возникшие при решении ряда задач автоматического управления, успешно используются и при решении соответствующих задач дифференциальных игр. Можно надеяться, что и изложенные выше вариацион ные методы синтеза, математическим аппаратом которых являются уравнения Винера-Хопфа, окажутся полезны ми при решении некоторых задач теории дифференциаль ных игр.
121
§ 1. « К О Н Ф Л И К ТН Ы Е С И ТУ А Ц И И » В З А Д А Ч Е А Н А
Л И ТИ Ч Е С К О ГО К О Н С ТР У И Р О В А Н И Я Р Е ГУ Л Я ТО Р О В
При решении задач синтеза линейных систем с обратной связью в предыдущих главах, как и в [11, 18], предпола галось, что квадратичная форма функционала качества является определенно положительной. Однако можно ука зать класс задач, в которых это предположение не реали зуется [31]. Для иллюстрации этого утверждения иссле
дуем с |
несколько иных позиций пример, рассмотренный |
||
в [20, |
19]. |
|
|
Пусть движение объекта описывается уравнением |
|||
|
X = Ьх + |
ти, |
(5.1) |
где X — координата объекта, |
и — управляющее |
воздей |
|
ствие, |
b = const и т — const. |
|
= Д (х) |
Требуется определить законы управления ut |
|||
и «2 = |
/2 (х) так> чтобы функционал |
|
|
|
оо |
|
|
|
/ = j |
xhlt |
(5.2) |
|
о |
|
|
достигал минимума (наилучший регулятор их = Д (х)) или максимума (наихудший регулятор и2 = /2 (х)) при
я 3 |
(1 |
о |
і |
|
|
f u2dt = |
к. |
|
о |
|
|
(5.3)
(5.4)
Сформулированная изопериметрическая задача сводится к исследованию стационарной точки функционала
|
|
со |
|
|
|
|
/ 0 = |
J |
(X2 + |
Іи2) dt |
(5.5) |
|
|
о |
|
|
|
(X — множитель |
Лагранжа). |
|
|
||
Как показано в [19, |
20], закон управления, при котором |
||||
6 /0 = 0, имеет |
вид |
|
b + k |
|
|
|
и = |
X, |
(5.6) |
||
|
— -— |
||||
|
|
|
т |
• |
|
122
г д е |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(5.7) |
т. е. |
|
|
|
|
|
|
|
|
|
|
|
|
|
х = |
х0е~к1, |
|
(5.8) |
|
|
|
|
|
и = |
Ь+ k |
ы |
|
|
|
|
|
|
— ^— хпе~ы. |
|
||
Подставив |
|
(5.8) |
|
в |
(5.4), |
получим |
|
|
|
|
|
|
со |
|
|
|
|
|
|
|
|
|
|
|
|
(5.9) |
или |
|
|
|
|
|
|
|
|
|
|
|
k2— |
2 |
b\k-\-b2 — 0. |
(5.10) |
||
Отсюда |
, |
|
|
|
|
А , |
|
|
, |
= |
( кт2 |
f wn2 I um2 |
26), |
||||
|
|
|
|
ь) + У ^ ( — |
||||
, |
|
, |
|
( xm2 |
, \ |
Г у.т2 I xm2 |
2b), |
|
|
|
|
|
|
|
|
|
|
причем задача имеет решение, если |
|
|||||||
|
|
|
|
|
у.т2 — 2Ь > |
0. |
|
Экстремальные значения функционала (5.2), согласно (5.8), определятся равенством
(5.11)
т. е.
7 т я х — 2k,m in |
7 т in ---- 2k„ |
которым соответствуют уравнения наилучшего и наихудшего регуляторов:
ь + К ■X, щ = b + Äm in -X.
123
Покажем, что %> О, если управление и минимизирует функционал (5.2), и К < 0, если и максимизирует этот функ ционал.
Известно [2], что Л = — а, согласно (5.11),
|
ді |
|
|
|
_dk_ |
|
|
|
дх |
|
|
2kа |
дк |
' |
|
Из (5.10) |
находим |
|
|
|
|
|
|
|
dk |
__ |
тг |
|
2/г2 |
|
|
|
дк |
~ |
"77" |
/г3 — Ьг ' |
|
||
|
|
|
•'о |
|
|
|
|
т. е. |
|
|
|
|
|
|
|
|
ді |
_ |
|
|
nf- |
|
(5.12) |
|
дх ~ |
|
И' — Р |
|
|||
|
|
|
|
||||
П О С К О Л Ь К У |
Ь — Ämin * ^max» |
ТО |
^ |
^ |
^m in ’ ^m ax И |
||
при А = Amin А2 — b2< |
0, |
|
|
0, при А = |
Атах А2 — А2> |
Следовательно, если управление и, стесненное изопериметрическим ограничением (5.4), минимизирует функцио
нал |
(5.2), то множитель Лагранжа К > |
0, если же функцио |
|
нал |
(5.2) максимизируется, то А < |
0. |
|
Таким образом, на простейшем примере показано, что |
|||
при минимизации функционала |
(5.2) |
квадратичная форма |
в (5.5) является определенно положительной, при макси мизации — де является определенно положительной.
К аналогичному выводу можно прийти и в более общем случае, когда движение системы происходит под действием нескольких управлений, стесненных ограничениями типа (5.4), причем одни управления стремятся минимизировать, а другие — максимизировать функционал типа (5.2). Этот случай можно трактовать как дифференциальную игру двух игроков, один из которых стремится минимизировать, а дру гой — максимизировать функционал типа (5.2). Решение подобных задач сводится к исследованию стационарных то чек функционала типа (5.5), в котором квадратичная форма не является определенно положительной из-за наличия от рицательных множителей Лагранжа.
Отметим, что в предыдущих главах решение задач син теза оптимальных регуляторов также сводилось к отыска
124
нию стационарных точек минимизируемых функционалов, но, в отличие от дифференциальных игр, квадратичная форма в этих функционалах всегда предполагалась опре деленно положительной. Таким образом, для решения задач линейных дифференциальных игр с квадратичным функцио налом платежа, по-видимому, можно использовать изложен ные выше методы синтеза оптимальных регуляторов, если эти методы модифицировать так, чтобы область их приме нимости не ограничивалась только определенно положи тельной квадратичной формой в функционале качества.
§ I . |
Р Е Ш Е Н И Е Л И Н Е Й Н Ы Х Д И Ф Ф Е Р Е Н Ц И А Л Ь Н Ы Х |
|
И ГР С К В А Д Р А ТИ Ч Н Ы М Ф У Н К Ц И О Н А Л О М |
|
П Л А ТЕ Ж А |
Рассмотрим динамическую систему, которая состоит из двух управляемых объектов. Дифференциальные уравне ния, описывающие движение системы под действием управ ляющих воздействий ил и и2, выбором которых располагают соответственно первый и второй игроки, имеют вид
+ л*і«і + 'Фі. Г
(5.13)
х2 = А2х2 + М2и2+ ф2. I
Размерности векторов л^, х2, их и и2 равны пх, п2, тх и т2 соответственно, и ф2 — пх- и п2-мерные стационарные случайные процессы (внешние возмущения) с нулевыми ма тематическими ожиданиями и дробно-рациональными мат рицами спектральных плотностей S u (со) и 52а (со), Ах, А2, Мх и М2 — постоянные матрицы пх X пх, п2 х п2, пх х тх и п2 X /По соответственно. Задача заключается в определении законов управления
их = Wxx,
(5.14)
и2 = W2x
(х — [х'і, х2У) таких, чтобы динамическая система, описы ваемая уравнениями (5.13), (5.14), была физически1
1 Здесь и далее дифференциальные уравнения, описывающие дви жение системы, записываются в канонической форме. Это позволяет отож дествить решение задачи синтеза для системы (5.13), когда % — слу чайные возмущения с постоянной спектральной плотностью, с решением детерминированной (ф; = 0) задачи синтеза при ненулевых начальных условиях (см. гл. 2).
125
реализуема1, причем в установившемся режиме первый игрок стремится минимизировать, а второй — максимизировать функционал
|
e0 = |
(z'R0z) |
(5.15) |
при ограничениях (и?) = х{ |
(і = 1, 2, . . . , т; |
т — /n2 -f |
|
+ щ)- |
) — знак математического ожидания, |
R 0 — по |
|
Здесь ( |
|||
стоянная |
весовая матрица, |
г — Lxxx — Ь2х2, |
L1 = [£П11; |
0] — матрица п0 X пх, Ь2 = |
[ЕПо\ 0] — матрица п0 X п2, |
т. е. е0 — среднеквадратическая взвешенная разность между первыми п0 координатами объектов.
Сформулированная задача сводится к исследованию ста
ционарных точек функционала |
|
е — (z'R0z) + (Uj^A^) + (и2А2и2) |
(5.16) |
(Aj и Л2 — диагональные матрицы, элементы которых —
-множители Лагранжа, причем все элементы матрицы Ах неотрицательны, а Л2 — неположительны) на классе физи чески реализуемых динамических систем.
Введем обозначения и = [нь и2У, Ф = [фь Ф^', ti = пх
+ П2,
Р = |
|
|
|
|
s a ( С О ) |
S12(со) |
|
|
е п , р - |
а 2\ ’ |
|
о ) ~ ß zi (®) |
S22(со) |
||
о |
|
5 ф ( с |
|||||
|
м = |
Мх |
0 |
|
|
|
|
|
0 |
М2 , |
W = |
IWV w ty, |
|
||
|
Лх |
о |
|
L\ |
|
|
|
А = |
о |
л . |
R = |
'i |
R oi^i’ |
Т,2]. |
|
— L' |
|||||||
|
Тогда уравнения (5.13), (5.14) и функционал (5.16) за пишутся так:
Рх + Ми ф- ф, |
(5-17) |
u = Wx, |
(5.18) |
е = (x'Rx) + (и’Аи), |
(5.19)1 |
1 Под физической реализуемостью линейной системы, как и ранее, понимается равенство нулю ее весовой функции при t < 0. Примени
тельно к игровой задаче это соответствует ситуации, когда каждый игрок при выработке стратегии в каждый момент времени может использовать только текущие и прошлые значения фазовых координат системы.
126