общностью, какой обладает класс критериев Качества, рассмотренный в задачах оценки, он имеет ряд особен ностей, делающих его полезным для приложений. Эта задача в случае как дискретного, так и непрерывного времени называется задачей стохастического линейного
|
регулятора. |
Здесь |
исследуется |
|
|
|
|
|
случай |
дискретного |
времени, |
|
|
|
|
|
а в гл. 10 — случай |
непрерыв |
|
|
|
3 |
|
ного времени. |
|
|
подробная |
|
|
|
-АI |
|
В § 9-1 дается |
|
|
|
|
|
|
формулировка |
задачи |
дискрет |
|
|
|
I |
|
ного стохастического |
линейно |
|
|
|
|
|
|
|
|
|
го регулятора. |
Затем |
в § 9-2 |
Рис. 9-1. Структурная схе |
|
излагается |
принцип |
оптималь |
|
ма, |
иллюстрирующая |
прин |
|
ности [Л. 9-1]. Там же |
он ис |
цип |
разделения. |
|
|
пользуется для решения детер |
/ — объект; |
2 — процесс |
и з м е |
|
минированной |
задачи |
в пред |
рения; 3 — статистически |
опти |
|
мальная |
система управления;; |
|
положении, |
что |
возмущение |
мальный |
регулятор; 5 — опти |
|
|
|
|
|
|
|
|
4 — детерминированный |
о п т и |
|
системы |
отсутствует |
и все пе |
мальный фильтр. |
|
|
ременные |
состояния |
|
системы |
|
|
|
|
могут быть точно измерены. Решение детерминированной задачи рассматривается здесь по двум причинам: во-пер вых, в качестве относительно простого введения в мето дику, используемую в дальнейшем при решении стохасти ческой задачи, и, во-вторых, с целью получить важный результат, играющий существенную роль при интерпре тации решения этой задачи.
Задача дискретного стохастического линейного регу
лятора решается в |
§ 9-3 |
и результат решения |
интер |
претируется |
в свете |
результатов § 9-2, |
что приводит |
к принципу |
разделения, |
утверждающему, |
что |
система |
оптимального управления состоит из последовательно соединенных оптимального фильтра и детерминирован ного оптимального регулятора, рассмотренного в § 9-2. Этот результат схематически изображен на рис. 9-1.
9-1. ФОРМУЛИРОВКА З А Д А Ч И
Модель системы
Рассматриваемая здесь модель системы описывает ся соотношениями
* ( А + 1 ) = Ф ( А + 1, k)x{k)+r(k+l, |
k)w(k) + |
+ W(k+\, |
k)u(k); |
(9-1) |
z(k+\)=H{k+l)x(k+l)+v{k+l) |
(9-2) |
|
|
|
|
|
|
|
|
|
|
|
|
|
Для k = Ö, 1 . . . Эта |
модель была предложена |
в § 4-2 и |
для нее в гл. 5 и 6 была решена |
задача |
оптимальной |
оценки |
в |
предположении |
u(k)=0 |
для |
всех k = 0, |
1 . . . |
Для удобства ссылок приведем еще раз определение |
всех членов, входящих |
в уравнения |
(9-1) и (9-2): |
х—п- |
вектор |
(состояния); |
|
и—r-вектор |
(управления); |
w—р- |
вектор |
(возмущения); |
z—m-вектор |
(измерения); |
ѵ—т- |
вектор |
(ошибки |
измерения); |
Ф — переходная |
матрица |
состояния |
размера |
пХп; |
Г — переходная |
матрица |
воз |
мущения |
размера пХр; |
|
— переходная |
матрица управ |
ления |
размера |
пХг; |
|
И — матрица |
измерения |
размера |
тХп; |
х(0)—гауссовский |
|
случайный гс-вектор с нуле |
вым средним и неотрицательно |
определенной корреляци |
онной |
матрицей |
Р(0); |
{w(k); |
k = 0, I...} |
|
— гауссовская |
белая последовательность, независимая от х(0), с нуле вым средним и неотрицательно определенной корреля
ционной |
матрицей |
Q(k); |
/г = 0, |
1 ... ; |
{v(k+l); |
k = Q, |
I...} |
— гауссовская |
белая |
последовательность, |
независи |
мая |
от х(0) |
и |
{w(k); k — 0, |
1...}, |
с |
нулевым |
средним и |
неотрицательно |
определенной |
корреляционной |
матрицей |
R(k+\); |
|
~k = 0, |
1 . . . ; {u(k), |
|
k — 0, I...} |
— последователь |
ность управления |
(в зависимости |
от условий задачи ли |
бо известная заранее, либо ее следует определить). |
Напомним из § 4-2 следующие свойства модели си |
стемы, |
которые |
потребуются |
в |
дальнейшем: |
|
|
1. |
{х(і), |
і = 0, |
1 . . . } — гауссовская |
марковская после |
довательность с нулевым средним. |
|
|
|
|
|
2. |
х(і) |
|
и |
w(i) |
|
статистически |
независимы |
для |
всех |
/=0, |
1 ... [см. также уравнение |
(5-25)]. |
|
|
|
3. |
z(i) |
|
и |
w(j) |
|
статистически |
независимы |
для |
всех |
j^ï, |
і = 1 , |
2 . . . |
[см. также |
уравнение |
(5-26)]. |
|
|
|
Критерий |
качества |
|
|
|
|
|
|
|
|
|
Рассмотрим задачу управления состоянием х систе |
мы вида (9-1) |
на |
некотором конечном интервале времени |
[О, N] |
где |
|
N — положительное |
целое |
число, посредством |
формирования |
последовательности |
управления |
{u(k)}\ |
k = 0, |
|
i,...,N—1}, |
|
|
минимизирующей |
критерий |
качества |
|
|
( |
N |
[*' (ОА |
(О X (0 + |
»' (І - |
Оß |
(» — 1) « (» — 1)1 |
JN = |
Е |
{ S |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(9-3) |
В |
уравнении |
(9-3) |
А(і) и |
В(і—1) — симметрические |
неотрицательно |
определенные |
матрицы размера пХп и |
rXr, |
а Е обозначает |
операцию |
математического ожи |
дания. |
|
|
|
|
Заметим, что |
выбор критерия |
качества управления |
вида (9-3) накладывает на задачу весьма существенные ограничения. Одной из причин такого выбора является то, что в теории стохастического управления нет общего результата, аналогичного результату Шермана (теорема
5-1) |
в теории |
оценок. |
Поэтому |
приходится |
рассматри |
вать |
частные критерии |
качества [например, (9-3)]. |
Из уравнения (9-3) |
ясно, что |
/ я представляет собой |
математическое |
ожидание неотрицательно |
определенной |
квадратичной формы от векторов состояния и управле ния. Поскольку речь идет о случайном процессе, исполь зуется операция математического ожидания. Следова тельно, как и в задаче оценки, здесь оценивается каче ство ансамбля систем. Для того чтобы учесть поведение как вектора состояния, так и вектора управления на рассматриваемом интервале времени, квадратичные фор мы от этих двух векторов суммируются. Значения ин дексов выбираются таким образом, чтобы в JN вошли только поддающиеся изменению векторы состояния и только те векторы управления, которые могут их изме
нять. |
Поэтому в |
него |
не |
входит начальное |
состояние |
л:(0), |
так |
как |
его |
значение нельзя |
изменить |
никаким |
управлением, |
в то время как управление и(0) |
включено |
в выражение, |
поскольку |
оно |
влияет |
на х(\), |
х(2),... |
...,x(N). |
|
Из |
тех |
же |
соображений |
последним |
входным |
сигналом |
управления |
является |
u(N—1), |
он воздействует |
только на конечное состояние |
x(N). |
|
|
|
Обычно JN |
интерпретируют |
как |
критерий |
качества |
вида «ошибка системы плюс управляющее усилие». Эта интерпретация следует из квадратичности критерия, по
скольку для |
всех i=\, 2,...,N |
оба слагаемых |
под |
зна |
ком суммы |
в (9-3) — монотонно |
неубывающие |
функции |
x и и. В первом слагаемом тем |
больше вклад |
состояний |
x в JN, чем больше их отклонение от нуля. То же |
спра |
ведливо и для управлений и. |
|
|
|
|
Иными словами, в первом |
слагаемом подразумевает |
ся, что желаемое состояние системы — нулевое, т. е. на чало координат n-мерного евклидова пространства, так как если х(і)=0, і = 1 , 2,.,..,N, то вклад этого слагаемо го в JN равен нулю при любом А(і). Если в каждый мо-
мент времени і желаемое состояние системы представ
ляет |
собой некоторый произвольный вектор |
xd(i), |
то |
х(і) |
в уравнении (9-3) можно заменить на |
х(і)—xd(i). |
Для удобства предположим, что при любом і желаемое состояние xd(i)=0. Заметим, что в силу квадратичности этого члена мерой ошибки здесь является квадрат ошиб ки или, в более общем случае, взвешенный квадрат ошибки, поскольку имеется свобода в выборе матрицы
Mi)- Обычно матрицы А(і) выбирают диагональными. Например, в системе второго порядка первое слагаемое в правой части уравнения (9-3) обычно имеет вид:
где |
выбор значения |
ан(і) относительно a22{i) |
определя |
ет |
вес ошибки Х\{і) |
сравнительно с ошибкой |
х2(і). |
|
Так как второе слагаемое под знаком суммы в (9 - 3) |
есть монотонно неубывающая функция и для |
любого і, |
и суммирование проводится по і, то оно характеризует меру «интенсивности» управления, которое является входным сигналом системы. Эту интенсивность обычно называют управляющим усилием или энергией управле ния. Последнее название возникло вследствие квадра тичного характера этого слагаемого. Как и в случае первого слагаемого, говорят о «взвешенном управляю щем усилии» 'по причине произвола при выборе элемен
тов В(і—1). |
Так же как и в первом слагаемом, матри |
цы В(і—1) |
обычно диагональны. |
Рассматривая сумму этих двух слагаемых, можно видеть, что JN представляет собой компромиссный кри терий качества между ошибкой системы и управляющим усилием. Относительная важность этих двух членов вы ражается выбором матриц А(і) и В(і—1). Однако неза висимо от этого выбора заметим, что JN назначает штраф как за чрезмзрные ошибки, так и за излишнее управление. Поскольку JN является монотонно неубы вающей функцией как х, так и и, требуется выбрать по следовательность управления {и(і—1), і=1, 2, ...,№}, минимизирующую JN.