Файл: Методы оптимизации в статистических задачах управления..pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 21.10.2024

Просмотров: 76

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

на основе измерений вектора

У и У а (%, П и ) ,

а управление ѵ (t) стремится максимизировать функционал (530) на основе измерений

 

У ѵ ~ У ѵ (■ *-> Ла)>

 

где т]„, г]0 — случайные

векторы ошибок измерений

с извест­

ными статистическими

характеристиками.

двух лиц

Рассматриваемая задача является задачей игры

с неполной информацией. Существенно, что в общем случае игроки используют для управления различную информацию. В связи с этим даже при противоположных интересах игроки различным образом оценивают результат игры, и поэтому в общем случае игра имеет ненулевую сумму.

Будем считать, что управление

“ = и (Уи„ і)

оптимально и равно и0, если для оптимального управления ѵ = = ѵ0, где

V = V (Ущ, t),

другого игрока для всех t интервала управления справедливо неравенство

М [J [т, ко] К ,) [и, ко] I <}■ (531)

Аналогично для управления v (f), максимизирующего функци­ онал (530), можно записать:

М {J [ио, v \\ y tj

{J [uo, ко] Iyl,]-

(532)

Из выражений (531) и (532) следует, что условия оптимально­ сти для каждого управления могут быть выражены аналогично выражению (463) в форме стохастического принципа максимума при имеющейся в его распоряжении информации.

Таким образом, для управления и в соответствии с формулой

(479) имеем:

max М [Н (х,

ф,

и,

v0, t) | УІ0] = 0.

(533)

u(ZU

 

 

 

 

Аналогично для управления

ѵ

 

 

min М [Н (х,

ф, «о,

к, t)\yia] — 0.

(534)

Уравнения (533) и (534) образуют систему уравнений, совмест­ ное решение которых определяет оптимальные законы управления (стратегии) и0 и ѵ0.

216



Рассмотрим более подробно случай линейного объекта, опи­ сываемого уравнением

 

X = Ах + Вии +

Виѵ + I,

X (0)

= х 0,

 

(535)

где А,

Ви, Вѵ— известные

матрицы;

g (t) — случайные

воз­

мущения, представляющие векторный «белый» шум.

 

 

Критерий игры примем в виде

 

 

 

 

 

(

 

т

 

 

1

 

 

/ = М |х*

(Т) Кх (Т) + I (u*Juu +

v*Jvv) dt |,

 

 

1

 

 

 

 

)

 

где Л и

J и— положительно определенные матрицы;

Jv — отри­

цательно определенная матрица.

 

 

 

 

Управление и основано на измерении

 

 

 

 

 

 

Уи =

Сих + т]„ (t),

 

 

(53б)

а управление ѵ — на измерении

 

 

 

 

 

 

Уѵ

Сѵх -(- т)0 (і) •

 

 

 

Статические характеристики х°, g (t), у\а (t) и

цѵ (t)

пред­

полагаются известными обоим игрокам.

 

 

 

 

В рассматриваемом случае в соответствии с формулой (474)

можно

записать:

 

 

 

 

 

 

 

Я (ф, X,

и, V, t)

= фо (u*Juu +

v*J0v) +

 

 

+

ф* (Ах +

Вии + Вѵѵ +

g);

 

 

=Ф, ф (Г) = -2 Л * (7),

фо = — 1.

Подставляя уравнение (536) в формулу (533) и дифференцируя полученное выражение по и (t), получим по аналогии с выраже­ нием (488)

и (0 = В*Ли (t),

где ф„ (f) означает оценку ъектора ф (t) на основании информа­ ции yu (t).

Аналогично из

уравнений

(534) получаем

 

V (t) =

ВІф0 (t),

 

где ф„ (t)— оценка

ф (t) по

информации

yv (t).

Для объекта, описываемого уравнения

(535), и системы урав­

нений для вектора ф (t) аналогично формулам (504) и (505) полу-

217


чаем систему уравнений для оценок фц, ф0, хц, х0, где индексы и, V обозначают наблюдаемые процессы уи и уѵ, по которым опре­ деляются оценки:

~df~ == Ахи-f- Ваи -f- Bvvu-j- DUXXCURU \^Уи — Cuxuj',

= Axy -f- Buuv -|- BuV -f- DVXXCVRU I УѵCvxvJ,

^ =

- Л*$„ + D ^ C l R - 1

[yu - C u X u ] ;

~

А "фг, —}- DVtyXCvRv

\yv Cvxv\•

Здесь через vu и иѵ обозначены оценки управлений н и м при наблюдениях zu и гѵ соответственно, а через Duxx, DvXX, Du^x, Dzrtyx— дисперсионные матрицы оценок по информации уи, уѵ.

Трудности в решении этой задачи заключаются в предвари­

тельном определении оценок управлений противника ѵи и иѵ. Иногда виды этих оценок могут определяться в условиях за­ дачи [7].

6. Оптимальное управление линейным объектом со случайными коэффициентами типа «белый» шум

Вопросам оптимального управления объектами со случайными свойствами посвящены работы ряда авторов [7, 49, 52, 65, 125, 130, 146, 150, 157]. В этих работах принимаются различные предположения относительно свойств стохастического объекта и применяются различные методы синтеза системы управления. В этом параграфе рассматривается задача оптимального управ­ ления линейным объектом со случайными коэффициентами типа «белый» шум:

X = А гх + А ги + / х,

где X — вектор п измерений; А х и А 2 — матрицы случайных коэф­ фициентов типа «белый» шум размерности [п, п] и [п, q] соот­ ветственно; и — вектор управляющего воздействия q измерений, зависящий от t их; / г — п-мерное входное воздействие, содержа­ щее неслучайную составляющую и случайные отклонения типа «белый» шум. Наличие мультипликативной помехи в канале уп­ равления может быть вызвано неточностью реализации блока управления, особенностями канала связи и другими факторами.

Предполагается, что фазовые координаты объекта измеряются точно, поэтому управляющее воздействие зависит от перемен-

218


ных t их . Оно является оптимальным, если достигается минимум функционала

I т

I = М I J [х* (т) V (т) X (т) + и* (т) J (т) и (т) dx -|-

Іо

 

+ х * ( Т ) А х ( Т ) ^

(537)

где / (т), V (т) и Л — симметричные положительно

определен­

ные матрицы.

 

Используя обозначение для второй начальной моментной

функции Г (t) = М [х (t) л;* (/)] фазовых координат,

функционал

(537) можно записать в следующем виде:

 

т

 

/ = J [tr (Г (т) V (т)) + и* (т) J (т) и (г)] dx + tr (Г (Г) Л). (538)

о

 

Если удается построить дифференциальное уравнение конеч­

ного порядка, которому удовлетворяет матрица Г (і),

0 < t < Т,

то исходная стохастическая задача оптимального управления мо­ жет быть сведена к эквивалентной детерминированной задаче. Существенно, что дифференциальное уравнение должно однозначно определять ДГ (t) = Г (t + Д) — Г (f) при фиксированных зна­ чениях Г (t) = Г и u (t, х) = и. Для нахождения дифференциаль­ ного уравнения относительно Г (t) воспользуемся приемом, опи­ санным в п. 3 гл. II. Вектор коэффициентов сноса марковского процесса х (t), который нетрудно рассчитать по формуле (203), оказывается зависящим от переменных t, х, и, и'х, где матрица их

имеет элементы , г = 1 , 2 , . . ., q, j = 1, 2, . . ., п.

Матрица коэффициентов диффузии зависит от t, х, и. Вы­ числения показывают, что дифференциальные уравнения для Г (t) содержат, кроме текущего значения управляющего воздействия и, его производные ѵ = и'х. Таким образом, известные значения и ч Т в момент времени t не определяют однозначно АГ (t). Величина ДГ (t) вычисляется при известных значениях и, ѵ, Г в момент t. Это означает, что должны оптимизироваться совместно функции

и (t,

х) и

V (t, х),

которые взаимозависимы, что влечет суще­

ственные

трудности

при

решении

задачи оптимизации.

В

поставленной

выше

задаче

оптимального

управления на

и (t,

х) не наложено ограничений. Сузим класс возможных управ­

лений, ограничивая их линейными управлениями вида

 

 

и (ßi х) = ßo (0

+ ßi (0 X,

(539)

где ß0 (t) — вектор

переменных

коэффициентов

q измерений;

ßx (t) — матрица переменных коэффициентов размерности [q, п\.

Тогда

синтез оптимальной системы сводится к определению

ßo (0,

ßa (t).

219