Файл: Медич Д. Статистически оптимальные линейные оценки и управление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.04.2024

Просмотров: 301

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Выбор А(і) и В (I1) допускает значительную свобо­ ду, так что критерий рассматриваемого вида может быть определен для многих физических задач. Например, предположим, что в частной задаче управления учиты­ вается только конечная ошибка в момент времени N и требуется минимизировать эту ошибку, затрачивая лю­ бые управляющие усилия. Тогда, очевидно, следует вы­

брать

А(і)=0

для і = 1 , 2, ...,УѴ—1

и

В(і—1)=0

для

і = 1, 2,...

N И получить:

 

 

 

 

 

 

 

 

JN=E[x'{N)A{N)x{N)}.

 

 

 

(9-4)

Дальнейшее

упрощение

возможно,

если

предполо­

жить,

что

A(N)—единичная

матрица

размера

пХп.

В этом случае J N является математическим

ожиданием

квадрата

модуля вектора

ошибок в

конечный момент.

Продолжая исследование этого примера, предполо­ жим, что в задаче играет роль только отклонение пер­

вых двух компонент вектора конечного

состояния

x(N)

от

нуля. Тогда можно выбрать

матрицу

вида

 

 

\ а и

0

0 .

 

 

 

0

д г г

0 .

 

 

 

А (ЛО =

I о о

о.

 

 

где

С ц и Ü22 положительны.

 

 

 

 

Из очевидных соображений задачи такого типа на­

зывают задачами конечной

ошибки.

 

 

 

Если минимизация критерия

качества

вида (9-4)

вы­

зывает чрезмерный расход ресурсов управления, то вво­ дится штраф вида

x' (N) x (N) + a J] u ' (i - 1) и (t - 1)

« = i

где а — положительная постоянная. В этом случае JN является мерой конечной ошибки и управляющего уси­ лия, причем их относительный вес определяется коэффи­ циентом а. Из общих соображений во втором примере следует ожидать затраты меньших управляющих уси­ лий за счет большей конечной ошибки.

Физически

реализуемое

управление

 

К

настоящему моменту читателю должно быть яс­

но, что

задача

сводится к определению

последовательно­

сти управления {u(k) ; k — 0,1,..., N1},

минимизирующей

373


/JV, причем соотношение между u(k) и x(k-\-\)

опреде­

ляется уравнением

(9-1). Однако решение задачи, по­

ставленной таким образом, может привести к управляю­ щей последовательности, не реализуемой на практике, т. е. к управляющей последовательности, требующей фи­ зически недоступных входных данных. Более того, по­ скольку цель управления заключается в изменении со­ стояния системы, желательно, чтобы управляющая по­ следовательность зависела от известной информации о состоянии системы, т. е. от результатов измерений. Тог­ да управляющая последовательность формируется с ис­

пользованием обратной связи. В дальнейшем

рассмат­

риваются

управляющие последовательности,

 

которые

в любой момент времени зависят

только от

информации

о состоянии системы,

физически

доступной

для обработ­

ки в этот

момент.

 

 

 

 

 

 

 

 

 

 

 

Очевидно, что для любого значения

ß = 0 ,

\,...,N1

известные данные о состоянии системы

имеют

вид

по­

следовательности измерений (z(l), z ( 2 ) , . . . , z ( k ) }

и

ма­

тематического

ожидания

х ( 0 )

начального

состояния

х(0).

Поэтому

вектор

управления

в момент

времени k

можно записать в виде

 

 

 

 

 

 

 

 

 

 

 

 

и(к)=цк[г*(к),

 

 

я

(0)1,

 

 

 

(9-5)

 

 

 

 

 

 

 

 

 

 

где

z* (k)

— mß-мерный вектор

вида

 

 

 

 

 

 

 

 

 

 

 

 

 

(1)

 

 

 

 

 

 

 

 

 

 

 

z*(k)

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

(k)

 

 

 

 

 

 

 

a jLift r-мерная

вектор-функция

указанных

переменных.

Заметим, что функцию

\хи следует определить так, чтобы

минимизировать

/ ^ ,

причем

она

не

обязательно

должна

иметь одну и ту же

форму

для

всех

k. Кроме

того,

хотя

в рассматриваемой

модели системы

вектор

 

х ( 0 ) = 0 ,

здесь в целях повышения общности результатов он бу­ дет предполагаться произвольным.

Поскольку вектор управления, определяемый урав­

нением (9-5), зависит только от

физически

доступных

данных,

он называется физически

реализуемым

управле­

нием,

а

функция

ни, k — 0,

1, ...,

—1

определяет

физи­

чески

реализуемый

закон

управления.

Заметим, что

для

374


k = 0

u(Ù)

может

быть

только функцией

х(0).

Также

ясно,

что

если функция

\ih

ne зависит от

{г(1), ... ,

z(k)}

для всех k, то u(k)

является

управлением

по

разомкну­

тому

контуру.

 

 

 

 

 

 

 

 

 

 

Теперь рассматриваемую задачу можно сформулиро­

вать следующим

образом.

 

 

 

 

 

 

 

 

Постановка

задачи

 

 

 

 

 

 

 

 

 

Определить

физически

 

реализуемый

закон

 

управ­

ления вида (9-5)

 

для системы (9-1), (9-2),

минимизи­

рующий критерий

качества (9-3).

 

 

 

 

 

Такой закон управления называют оптимальным

уп­

равлением,

а саму

задачу

называют

задачей

дискретно­

го стохастического

линейного

регулятора.

Это

 

название

возникает

из-за

первого

слагаемого

J N ,

которое

пред­

ставляет собой меру качества регулирования полученной

замкнутой системы.

 

 

В связи с поставленной задачей следует иметь

в

ви­

ду три важных момента. Во-первых, это задача

с

за­

крепленным временем. Иными словами, в ней требуется описать закон управления на заранее заданном интер­ вале времени, в отличие от задач со свободным конеч­ ным временем, где оно явно участвует в оптимизации. Классическим примером подобных задач является зада­ ча управления с оптимальным быстродействием, в кото­ рой требуется достигнуть некоторой определенной цели за минимальное время.

Во-вторых, на компоненты вектора управления не на­ кладывается ограничений по амплитуде. Такие ограни­ чения являются желательными, если известно, что си­ стема (9-1) имеет насыщение по входному сигналу. Од­ нако второе слагаемое JN, как уже отмечалось, накла­ дывает штраф за чрезмерные значения вектора управ­ ления. Это свойство может быть использовано, чтобы ограничить стремление системы к насыщению.

В-третьих, состояние системы в конечный момент вре­ мени может быть свободным, т. е. на него не наклады­ вается никаких специальных ограничений. Легко, одна­ ко, найти ситуации, где подобные ограничения являются желательными. Например, можно потребовать миними­ зации функционала

N

 

2 u'{i— l)B{i)u(i-

1)

375


при условий E[x'(N)x(N)]£^ß, где fi — Положительная постоянная. Задачи такого типа в рамках данной книги можно решать только косвенно, пользуясь тем, что x ( N ) входит в критерий качества.

9-2. ДЕТЕРМИНИРОВАННАЯ З А Д А Ч А

Как указывалось ранее, вначале будет полезно рас­ смотреть идеализированный вариант стохастического ли­ нейного регулятора, в котором отсутствуют возмущения системы и все переменные состояния могут быть точно измерены. В этом случае уравнения (9-1), (9-3) и (9-5) принимают вид:

я ( £ + 1 ) =

Ф ( * + l,k)x(k)

+ W(k +

Uk)u(k),

(9-6)

h = ï

[•*' (ОA (0 •* (0 +

W (i -l)B(i-l)u

(i -

1)]

(9-7)

i=i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(9-8)

где ft = 0,

l,...,N1,

a

x* (k)—

n {k + 1)-мерный

вектор

вида

 

 

 

 

 

 

 

|x(0)

x* (k)

X (k)

Заметим, что в функционал JN не входят математи­ ческие ожидания, так как здесь рассматривается детер­ минированный процесс, а уравнение измерения отсутст­ вует, поскольку z= x . В силу того что переменные со­ стояния могут быть измерены точно, также отсутствует неопределенность, связанная с начальным состоянием jc(0), и х(0) в уравнении (9-5) заменяется на истинное значение начального состояния. Задача детерминирован­ ного линейного регулятора формулируется следующим

.образом.

:376


Постановка

задачи

 

 

 

 

Определить

закон управления

вида

(9-8) для

си­

стемы (9-6), минимизирующий

критерий

качества

(9-7).

Структурная схема системы, полученной в резуль­ тате решения этой задачи, изображена в общем виде на

рис. 9-2. Задача

заключается

в опи­

u(k)

 

x(k)

сании

такого

регулятора,

воздей­

1

 

ствующего

на

состояние

динамиче­

 

 

 

 

 

ской

системы,

чтобы формируемый

 

 

 

в нем вектор управления

минимизи­

 

 

 

ровал

заданный критерий

качества.

 

 

 

Следует заметить, что условие фи­

 

 

 

зической

реализуемости

(9-8) тре­

Рис.

9-2. Структур-

бует, чтобы в общем случае резуль­

ная

схема

замкну-

тирующий

закон управления

учиты­

той

детерминирован-

вал с помощью обратной связи зна­

ной

автоматической

чения

всех

предшествующих

состоя­

системы.

 

ний системы.

 

 

 

/ — объект;

регу-

 

 

 

лятор.

 

 

Принцип

оптимальности

 

 

 

 

Поставленную здесь

задачу,

так же

как

задачу

§ 9-1, можно решать с использованием принципа опти­ мальности, принадлежащего Беллману (Л. 9-1].

Теорема

9-1. При

любом начальном состоянии и оп­

тимальном

начальном

управлении

последующее

управле­

ние должно

быть оптимальным

относительно

состояния,

возникшего в результате

начального

управления.

 

Д о к а з а т е л ь с т в о .

Доказательство

проводится

от

противного в сравнительно общем виде.

 

 

 

Рассмотрим

на

некотором

интервале

времени

А ^

^t^it2

систему

5

с вектором

управления

и и вектором

состояния x. Как на х, так и на и могут быть наложены ограничения; ti и t2 могут быть закрепленными или сво­ бодными в зависимости от исходных предпосылок; t мо­ жет обозначать дискретное или непрерывное время на интервале [tlt і2]. Пусть / — некоторый критерий качест­ ва, который следует оптимизировать на интервале [tu t2] (минимизировать или максимизировать). Для опреде­ ленности положим, что u(t) следует выбрать так, чтобы минимизировать /. Доказательство для максимизации / проводится аналогично.

Предположим, что существует по меньшей мере одно управление u(t), удовлетворяющее всем ограничениям и

377