Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 78

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Предполагая, что для учета ограничений рассматриваемого типа применим метод множителей Лагранжа, приведем задачу минимизации функционала (510) для ограничения (511) к задаче минимизации:

/ і = М [F [х {Т)]\ + ф0М [х0 (Т) ],

где фо — неопределенный постоянный коэффициент. Вариация функционала І г может быть представлена в виде

 

бІХ= М

SF [X (Т)]

 

 

ді[х'о(Т)]

 

 

 

 

6 х ( Т ) + ф о

дх'о (Т)

Sxo(T),

 

 

 

 

дх (Т)

 

 

 

 

где использовано определение (516).

 

 

 

 

 

Так как на вариацию 8хо (Т) не наложено ограничений,

она

является произвольной и условие 8 / ч >

0 может быть обеспечено

при

 

 

 

 

 

 

 

 

 

 

 

 

 

К

(Г)] = 0.

 

 

 

(517)

 

 

 

дх'о(Т)

 

 

 

 

 

 

Для рассматриваемой задачи выражение для стохастической

функции Гамильтона остается

аналогичным формуле (474),

т. е.

 

 

 

 

 

 

П

 

 

 

 

Н (ф, X, и, t) = ф*/ (х, и, I, /) = Е ф (X, и, I, О,

 

 

 

 

 

 

 

 

і=о

 

 

 

 

где х 0 удовлетворяет уравнению (513),

и условие оптимальности

для рассматриваемой задачи определяется выражением

 

 

 

 

max М

Н (х,

ф,

и, і)

=

0.

 

 

(518)

 

 

u(ZU

 

 

 

у' о

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Из

условия

(517) следует,

что

если

условие

(514) не

нару-

шается

д% 1Д (Г )]

 

формуле

(516)

не

равно

нулю,

и — Ц----- - согласно

 

дх0 (Т)

 

 

 

 

 

 

 

 

то фо =

0. Поэтому в этом случае при решении задачи ограничение

(514) не должно приниматься во внимание.

 

 

 

 

Если же условие (514) нарушается, то в соответствии с форму-

-

/сісч

dxUol7’)]

Л ,

/С1_Ч

лои

(516)

---- Ц-----— =

0 и фо в выражении (517) является про-

дх0 (Т)

извольной величиной. В этом случае в функцию Я (х, ф, ы, і)

добавляется слагаемое ф0/ 0 (*. и. 0- Таким образом, решение задачи минимизации функционала

(510) с ограничением типа неравенства (511) сводится к решению задачи без ограничения и проверки условия (511). Если оно не нарушается, по полученное управление и является решением задачи. Если условие (511) нарушается, задача решается снова

14 *

211


с введенным в функцию Н (х , и, ф, і) слагаемым ф0 / 0 (х, и, t)

иг[э 0 определяется из условия

М1х0 (Т) ] = см.

Применим изложенную методику к определению оптимального управления линейным объектом

Н Y

. = Ах + Ви + I, X (0) = х°,

обеспечивающего минимум функционала

I = М [х* (Т) Ах (Г) ]

при ограничениях на управление и (t) 6 U и

(0 J (0 и {t) dt < Сj a ,

(519)

где Л — положительная, a J (t) — положительно определенная матрица.

Заметим, что без учета ограничения (519) оптимальное управ­ ление, определенное в предыдущем параграфе, является релей­ ным и в одномерном непрерывном случае равно

и (t) = — U (t) sign B*S (Т, t) X (t)

в соответствии с формулой (509).

При этом

 

 

1

1

 

М J и* J

(t) u{t) dt = { / (t) и 2 (t) dt.

(520)

Очевидно, что если

 

 

1

t

 

J J

(t) U2 (t) dt <3 cM,

 

условие (519) может не учитываться, поскольку уравнение (520) определяет максимальный «расход» управления на интер­ вале (0, Т). Более того, рассматриваемая задача с учетом огра­ ничения (519) не имеет физического смысла, так как оно никогда не нарушается.

Поэтому поставленная задача имеет смысл только в том случае, когда

т

J J (t) U2 ( 0 dt > см.

о

212


При этом в соответствии с изложенной методикой ограниче­ ние (519) может быть заменено изопериметрическим ограничением со знаком равенства:

и* (t) J (t) и (t) dt см.

Функция Я (X, ф, и, f) в рассматриваемой задаче имеет вид

Я (х, ф, и, t) = г))0u*Ju + ф* (Ах + Ви -f \ (t))

или

 

Я (х, ф, и, 0 = Фо "* + і ч

 

X

 

 

 

 

 

 

 

X J

 

1

J-XB (t) + ip*Ах -щ- г)?BJ-lB*\p

(521)

 

 

2ф0

 

 

 

 

Подставляя выражение (521) в формулу (518) и замечая, что

ф0 << О при /о (х,

и,

t) >■ 0, получим, что оптимальное управле­

ние должно обеспечивать максимум квадратичной формы

 

шах М фо

 

 

2ф0

Ѵ -^ ’ф 0о}.

(522)

u(-U

(

 

 

 

 

При условии, что область U представляет собой (/-мерный па­ раллелепипед, такой, что

\ut \ ^ U

lt

і = 1, 2...........q,

 

составляющие вектора

и размерности

[q,

1 ] определяются неза­

висимо одна от другой.

Введем формальное представление нели­

нейного преобразования

векторов а

и

ß размерности [q, 1 ]:

 

а

=

sg ß,

 

 

(523)

которое означает, что

 

 

 

 

 

 

f

Pi

при |ß( | <

Ut;

(524)

 

 

 

 

 

 

Isign-ß, при I ßt-1> Ut.

С учетом представления (523) управление и (t), обеспечивающее максимум (522), определяется выражением

« (0 = ~ s g ^ - y - 1W ( 0 ,

где, как и ранее обозначено:

Ф (f) = М [ф ( * ) №

213


Для определения оценки ф (t) запишем систему дифферен­ циальных уравнений, аналогичную уравнениям (504) и (505):

^= — А*ф + D ^C *#"1 (у — сх);

dt

ѵ

**

7

(525)

Ф (Т) = - 2 Ajc (Г);

 

~ = А х - В sg 2^

J-'B (t) +

Dxxc*R^ (у -

сх);

*(0) =

М1х°].

(526)

Применим к решению этой системы уравнений приближенный способ, основанный на методе статистической линеаризации.

Для этого при решении системы уравнений (525) и (526) при­ мем, что

u(t)

где К — диагональная матрица размерности [q, q ] коэффициен­ тов статистической линеаризации

ki = kt (mi, D~)

для элементов (524) типа линеной зоны с насыщением, где mit D~

математическое ожидание и дисперсия оценки х. При этом система уравнений (525), 526) линеаризуется, и ее решение имеет вид

 

ф (*)

= - 5 (Г, t) X (t),

где

 

 

dt

+ SA +

A*S + S B - ^ - B * S = 0

 

"тО

с конечными условиями

5 (Г, Т) = 2А.

При этом оценка х (t) удовлетворяет уравнению

% = ( А + В 1^ - B * s ) x + DXXC*R-' (у - Сх), (527)

X (0) = М х \

Для определения дисперсии оценки D~ при нулевом математи­ ческом ожидании

М [х ( 0 1 = 0

214


имеем

 

D~ = М [х (t)x* (t)].

(528)

Дифференцируя уравнение (528) no f и используя формулу (527), получим

dD-~~ (t)

.

к i~i

\

 

- г -

= ( Л +

в ж

и ) " - (|) +

 

+ D: (t) (Л + В ^

ß*s)* + DC*R-'CD,

(529)

где D = M [(xx) (x x)*]

определяется уравнением

(497).

При получении уравнения (529) было использовано свойство опти­ мальных оценок X, по которому

М[{х х) X* ] = 0;

М[х (х х)* ] = 0,

равенство

у = Сх + т|,

где т] (t) — белый шум,, а также

М {[С (х — X) + т) ] X*} = - L CD.

Таким образом, приближенно закон оптимального управления определяется выражением

U(t) = + s g ^ - B * S ( T , t)x(t),

где фо <c 0 определяется из ограничения на интеграл от квадра­ тичной формы управления (519).

5.Условия оптимальности в игровой задаче

снеточными измерениями

Предположим, что объект управления описывается векторным дифференциальным уравнением

= / (*, и, ѵ, £, t), X (t0) = х°,

где X — вектор фазовых координат размерности п\ \ — вектор случайных возмущений размерности п\ и и ѵ —векторы упра­ влений объектом, имеющие различные цели управления.

Пусть управление и (t) стремится-минимизировать функционал

/ = М {J [и, и]}

(530)

-

\

215