Выбор А(і) и В (I—1) допускает значительную свобо ду, так что критерий рассматриваемого вида может быть определен для многих физических задач. Например, предположим, что в частной задаче управления учиты вается только конечная ошибка в момент времени N и требуется минимизировать эту ошибку, затрачивая лю бые управляющие усилия. Тогда, очевидно, следует вы
брать |
А(і)=0 |
для і = 1 , 2, ...,УѴ—1 |
и |
В(і—1)=0 |
для |
і = 1, 2,... |
N И получить: |
|
|
|
|
|
|
|
|
JN=E[x'{N)A{N)x{N)}. |
|
|
|
(9-4) |
Дальнейшее |
упрощение |
возможно, |
если |
предполо |
жить, |
что |
A(N)—единичная |
матрица |
размера |
пХп. |
В этом случае J N является математическим |
ожиданием |
квадрата |
модуля вектора |
ошибок в |
конечный момент. |
Продолжая исследование этого примера, предполо жим, что в задаче играет роль только отклонение пер
вых двух компонент вектора конечного |
состояния |
x(N) |
от |
нуля. Тогда можно выбрать |
матрицу |
вида |
|
|
\ а и |
0 |
0 . |
|
|
|
0 |
д г г |
0 . |
|
|
|
А (ЛО = |
I о о |
о. |
|
|
где |
С ц и Ü22 положительны. |
|
|
|
|
Из очевидных соображений задачи такого типа на |
зывают задачами конечной |
ошибки. |
|
|
|
Если минимизация критерия |
качества |
вида (9-4) |
вы |
зывает чрезмерный расход ресурсов управления, то вво дится штраф вида
x' (N) x (N) + a J] u ' (i - 1) и (t - 1)
« = i
где а — положительная постоянная. В этом случае JN является мерой конечной ошибки и управляющего уси лия, причем их относительный вес определяется коэффи циентом а. Из общих соображений во втором примере следует ожидать затраты меньших управляющих уси лий за счет большей конечной ошибки.
Физически |
реализуемое |
управление |
|
К |
настоящему моменту читателю должно быть яс |
но, что |
задача |
сводится к определению |
последовательно |
сти управления {u(k) ; k — 0,1,..., N—1}, |
минимизирующей |
|
|
|
/JV, причем соотношение между u(k) и x(k-\-\) |
опреде |
ляется уравнением |
(9-1). Однако решение задачи, по |
ставленной таким образом, может привести к управляю щей последовательности, не реализуемой на практике, т. е. к управляющей последовательности, требующей фи зически недоступных входных данных. Более того, по скольку цель управления заключается в изменении со стояния системы, желательно, чтобы управляющая по следовательность зависела от известной информации о состоянии системы, т. е. от результатов измерений. Тог да управляющая последовательность формируется с ис
пользованием обратной связи. В дальнейшем |
рассмат |
риваются |
управляющие последовательности, |
|
которые |
в любой момент времени зависят |
только от |
информации |
о состоянии системы, |
физически |
доступной |
для обработ |
ки в этот |
момент. |
|
|
|
|
|
|
|
|
|
|
|
Очевидно, что для любого значения |
ß = 0 , |
\,...,N—1 |
известные данные о состоянии системы |
имеют |
вид |
по |
следовательности измерений (z(l), z ( 2 ) , . . . , z ( k ) } |
и |
ма |
тематического |
ожидания |
х ( 0 ) |
начального |
состояния |
х(0). |
Поэтому |
вектор |
управления |
в момент |
времени k |
можно записать в виде |
|
|
|
|
|
|
|
|
|
|
|
|
и(к)=цк[г*(к), |
|
|
я |
(0)1, |
|
|
|
(9-5) |
|
|
|
|
|
|
|
|
|
|
где |
z* (k) |
— mß-мерный вектор |
вида |
|
|
|
|
|
|
|
|
|
|
|
|
|
(1) |
|
|
|
|
|
|
|
|
|
|
|
z*(k) |
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z |
(k) |
|
|
|
|
|
|
|
a jLift — r-мерная |
вектор-функция |
указанных |
переменных. |
Заметим, что функцию |
\хи следует определить так, чтобы |
минимизировать |
/ ^ , |
причем |
она |
не |
обязательно |
должна |
иметь одну и ту же |
форму |
для |
всех |
k. Кроме |
того, |
хотя |
в рассматриваемой |
модели системы |
вектор |
|
х ( 0 ) = 0 , |
здесь в целях повышения общности результатов он бу дет предполагаться произвольным.
Поскольку вектор управления, определяемый урав
|
|
|
|
|
|
|
|
|
нением (9-5), зависит только от |
физически |
доступных |
данных, |
он называется физически |
реализуемым |
управле |
нием, |
а |
функция |
ни, k — 0, |
1, ..., |
—1 |
определяет |
физи |
чески |
реализуемый |
закон |
управления. |
Заметим, что |
для |
k = 0 |
u(Ù) |
может |
быть |
только функцией |
х(0). |
Также |
ясно, |
что |
если функция |
\ih |
ne зависит от |
{г(1), ... , |
z(k)} |
для всех k, то u(k) |
является |
управлением |
по |
разомкну |
тому |
контуру. |
|
|
|
|
|
|
|
|
|
|
Теперь рассматриваемую задачу можно сформулиро |
вать следующим |
образом. |
|
|
|
|
|
|
|
|
Постановка |
задачи |
|
|
|
|
|
|
|
|
|
Определить |
физически |
|
реализуемый |
закон |
|
управ |
ления вида (9-5) |
|
для системы (9-1), (9-2), |
минимизи |
рующий критерий |
качества (9-3). |
|
|
|
|
|
Такой закон управления называют оптимальным |
уп |
равлением, |
а саму |
задачу |
называют |
задачей |
дискретно |
го стохастического |
линейного |
регулятора. |
Это |
|
название |
возникает |
из-за |
первого |
слагаемого |
J N , |
которое |
пред |
ставляет собой меру качества регулирования полученной
замкнутой системы. |
|
|
В связи с поставленной задачей следует иметь |
в |
ви |
ду три важных момента. Во-первых, это задача |
с |
за |
крепленным временем. Иными словами, в ней требуется описать закон управления на заранее заданном интер вале времени, в отличие от задач со свободным конеч ным временем, где оно явно участвует в оптимизации. Классическим примером подобных задач является зада ча управления с оптимальным быстродействием, в кото рой требуется достигнуть некоторой определенной цели за минимальное время.
Во-вторых, на компоненты вектора управления не на кладывается ограничений по амплитуде. Такие ограни чения являются желательными, если известно, что си стема (9-1) имеет насыщение по входному сигналу. Од нако второе слагаемое JN, как уже отмечалось, накла дывает штраф за чрезмерные значения вектора управ ления. Это свойство может быть использовано, чтобы ограничить стремление системы к насыщению.
В-третьих, состояние системы в конечный момент вре мени может быть свободным, т. е. на него не наклады вается никаких специальных ограничений. Легко, одна ко, найти ситуации, где подобные ограничения являются желательными. Например, можно потребовать миними зации функционала
при условий E[x'(N)x(N)]£^ß, где fi — Положительная постоянная. Задачи такого типа в рамках данной книги можно решать только косвенно, пользуясь тем, что x ( N ) входит в критерий качества.
9-2. ДЕТЕРМИНИРОВАННАЯ З А Д А Ч А
Как указывалось ранее, вначале будет полезно рас смотреть идеализированный вариант стохастического ли нейного регулятора, в котором отсутствуют возмущения системы и все переменные состояния могут быть точно измерены. В этом случае уравнения (9-1), (9-3) и (9-5) принимают вид:
я ( £ + 1 ) = |
Ф ( * + l,k)x(k) |
+ W(k + |
Uk)u(k), |
(9-6) |
h = ï |
[•*' (ОA (0 •* (0 + |
W (i -l)B(i-l)u |
(i - |
1)] |
(9-7) |
i=i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(9-8) |
где ft = 0, |
l,...,N—1, |
a |
x* (k)— |
n {k + 1)-мерный |
вектор |
вида |
|
|
|
|
|
|
|
|x(0)
x* (k)
X (k)
Заметим, что в функционал JN не входят математи ческие ожидания, так как здесь рассматривается детер минированный процесс, а уравнение измерения отсутст вует, поскольку z= x . В силу того что переменные со стояния могут быть измерены точно, также отсутствует неопределенность, связанная с начальным состоянием jc(0), и х(0) в уравнении (9-5) заменяется на истинное значение начального состояния. Задача детерминирован ного линейного регулятора формулируется следующим
.образом.
Постановка |
задачи |
|
|
|
|
Определить |
закон управления |
вида |
(9-8) для |
си |
стемы (9-6), минимизирующий |
критерий |
качества |
(9-7). |
Структурная схема системы, полученной в резуль тате решения этой задачи, изображена в общем виде на
|
рис. 9-2. Задача |
заключается |
в опи |
u(k) |
|
x(k) |
|
сании |
такого |
регулятора, |
воздей |
1 |
|
|
|
ствующего |
на |
состояние |
динамиче |
|
|
|
|
|
|
|
ской |
системы, |
чтобы формируемый |
|
|
|
|
в нем вектор управления |
минимизи |
|
|
|
|
ровал |
заданный критерий |
качества. |
|
|
|
|
Следует заметить, что условие фи |
|
|
|
|
зической |
реализуемости |
(9-8) тре |
Рис. |
9-2. Структур- |
|
бует, чтобы в общем случае резуль |
|
ная |
схема |
замкну- |
|
тирующий |
закон управления |
учиты |
той |
детерминирован- |
|
вал с помощью обратной связи зна |
ной |
автоматической |
|
чения |
всех |
предшествующих |
состоя |
системы. |
|
|
ний системы. |
|
|
|
/ — объект; |
регу- |
|
|
|
|
лятор. |
|
|
|
Принцип |
оптимальности |
|
|
|
|
|
Поставленную здесь |
задачу, |
так же |
как |
задачу |
§ 9-1, можно решать с использованием принципа опти мальности, принадлежащего Беллману (Л. 9-1].
Теорема |
9-1. При |
любом начальном состоянии и оп |
тимальном |
начальном |
управлении |
последующее |
управле |
ние должно |
быть оптимальным |
относительно |
состояния, |
|
|
|
|
|
|
|
|
|
возникшего в результате |
начального |
управления. |
|
Д о к а з а т е л ь с т в о . |
Доказательство |
проводится |
от |
противного в сравнительно общем виде. |
|
|
|
Рассмотрим |
на |
некотором |
интервале |
времени |
А ^ |
^t^it2 |
систему |
5 |
с вектором |
управления |
и и вектором |
состояния x. Как на х, так и на и могут быть наложены ограничения; ti и t2 могут быть закрепленными или сво бодными в зависимости от исходных предпосылок; t мо жет обозначать дискретное или непрерывное время на интервале [tlt і2]. Пусть / — некоторый критерий качест ва, который следует оптимизировать на интервале [tu t2] (минимизировать или максимизировать). Для опреде ленности положим, что u(t) следует выбрать так, чтобы минимизировать /. Доказательство для максимизации / проводится аналогично.
Предположим, что существует по меньшей мере одно управление u(t), удовлетворяющее всем ограничениям и