Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 75

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1.1. 3. Оператор объекта задан в виде уравнений

вчастных разностях

В этом случае применение описанной выше методики не­ возможно без предварительного решения уравнений с уче­ том начальных и граничных условий. Оправдан поэтому и иной подход [1. 10]. Изложим метод синтеза управляющего устройства для управления распределенными объектами, ко­ торые описываются уравнениями в «частных» разностях

qKs=q[K,s]=F(\i,q[K— \,s],u[K,s],y.KS,q[K+l,s],g[K,s]) (1-

42}

с граничными условиями

 

 

ф . 5]= <7о*(н-.«[о,5],ф[5],£[о,5]),

(1.

43)

 

и некоторыми начальными условиями. Здесь F — однознач­

ная, вообще говоря, нелинейная функция, и[к, s]

— распре­

деленное управление. Переменные в к-й точке

и в s-й мо­

мент времени отмечены соответствующими индексами. Кван­

тование по уровню отсутствует. В уравнении (1. 42)

kks

учи­

тывает зависимость q [к, s] от всех значений q[i, /],

0

I

/,

/ s—1 и граничных воздействий u[o,s], ср, ...;

<?[к:—1,

s],

7[к+1, s] могут не входить в правую часть уравнения (1. 42). Для простоты считаем, что q[K, s] — скаляр. При обобщении

для случая, когда

q[K, s] — вектор, не возникает принцнпи

альных трудностей. Значения помехи g[K, s] для

различных

/ с и э и случайные

параметры р статистически

независимы.

Плотности вероятности P(g), Р(р) случайных воздействий g

и параметров р известны. Вначале считаем, что помехи h в

измерительных

устройствах отсутствуют,

т. е.

у[к, s] =

= Я[к, 5].

 

на

указанный

Обобщим теорию дуального управления

класс задач управления распределенными объектами.

Предполагая, что алгоритм работы управляющего устрой­

ства случайный,

запишем выражение для удельного риска в

s-м такте при известных q*[K,s] = q*K; 6[s]:

 

 

i

 

 

 

Rs==

U[k s],q[K,s])dQ,

(1. 44)

ic--= 0

 

 

 

и [/C,S], q

[K,sD

 

 

52


где й(-)—- область

изменения аргументов,

a dQ— ее бес­

конечно малый элемент.

Буквами

о [к,5]

и

и [k,s] обозна­

чена совокупность

q[ic,s]

и

[ k ,s ]

д л я

scex

к

и s типа

 

q[o,i]

-

q[0,s]

 

 

 

 

q [k,s] =

?[«.!]-

 

I!

Q !••• Qs II •

 

 

 

 

 

 

 

?[/.!]•

 

 

 

 

 

Преобразуем

совместную

плотность

вероятности

Р(р, и [«.s], q

учитывая

статистическую

независимость

V-,g и известное начальное состояние Q0=

|| ^[о,о]...^[/,о] || т

P(|j.,« [k,s], g[K ,s])=P^) X

(1- 45)

X f [ x [ P ( Q y 1*'UJ~U

I V i.Q ;- i) ] -

/—I

Последнее выражение справедливо, поскольку УУ вырабаты­ вает воздействия в /-м такте лишь на основании информа­ ции, полученной измерениями в предыдущих тактах, а зави­

симость управления от р. проявляется только через

Qj-i. Рассмотрим условную плотность вероятности P(Qy \ р,

Uj, Qj-i). Используя уравнение объекта и предполагая, что д[к, j] не зависит от q[i, j], где i>K, получим

1

P{Qj \ V-,Uj,Qj-i)= f ] P(qlk,j]

| v-,4 jMk,j],qlk -/,/]). (1.46)

K=1

последних

сомножителей

Перейдем к рассмотрению

в (1. 45):

 

 

 

 

P(U j \ U j-u Q j-i)= P (u [l,j] | и

[ 0

,

1,/], Uj-i, Qj-i) X

X — XP(u[k,j-] I и[0,/].....и[к—1,/],

U j - u Q j - O X -X

47)

 

 

 

(1.

53


 

 

 

I

 

 

Х

- Р ( и

[ 0 ,U/ j]-|i,Q j-x)

— J -

1 Г

ку ,

 

 

 

/с=0

 

 

где Гку - стратегия

управляющего

устройства, причем

Здесь учтена

 

Гку>0-

 

q[fс,

у] в уравнении:

возможная зависимость

(1. 42), следовательно, и оптимального управления и[к, у] от управлений, прикладываемых в тот же момент времени в точках объекта 0, 1, .... к—1. Нужно указать на принципиаль­ ное различие зависимостей и[к, у] от u[i, j], где t'C/c, и уп­ равлений в предыдущие такты. В первом случае связь между управляющими воздействиями определяется лишь операто­ ром объекта (1. 42). Во втором — зависимость возникает не только за счет распределенности и наличия памяти в объек­ те, но обусловлена эффектом накопления информации о не­

известных параметрах.

Поставив (1. 46) и (1. 47) в (1. 45),

а результат — в (1. 44), находим

I

1 s

к

П П

'

 

 

к—0 1=1

 

 

 

Q ( u [ k , s] , q [ k ,s — 1/)

 

(1.

48)

где

l

 

 

 

s —1

 

 

 

J ~ J

m [

* - W 1 W

. x“ [ * V ] )

j= 1

/= 0

 

 

 

Q(fv?/0s/...qfr.Ф

 

 

 

 

k

 

 

 

 

X

I (М [г-М ]>у-/5.*Ф'.Л)^-

(1.

49)

/=0

 

 

 

 

Можно показать, что и стратегия Г/,„_ь и все Гк^ вырождаются

в дельта-функции-

Оптимальные управляющие

воздействия

«*[«,«] находятся из условия минимума по

и

[/c,s] функ­

ции 7кs, которая строится по следующему правилу:

l K S — a K s ' lT l ' i:K + l , s

П р и К ф 1 ,

S < / t

Т/s= a/s+

j* TfVs-H^

при s<n.

 

(1- 50)

Q(Qj

T ln—aln

54


В частности, для

определения управляющего

воздействия

«[о, s] по границе используется соотношение

 

 

 

T*os= min K 5+T*iS)-

0-

51)

 

u[o,s]

 

 

 

Если на границе приложено только

возмущение яр [s],

во

всех уравнениях

следует принять и[о,

s ]= 0 . В другом слу­

чае может оказаться, что возмущение распределено по длине объекта, а управлять можно лишь по границе, т. е. и[к, s]= 0 , к= 1 ..., /—1. Задача синтеза оптимального алгоритма УУ сводится к исследованию выражений вида (1. 51).

Если в измерительных устройствах кроме помех g имеют­ ся случайные помехи h, т. е. состояние объекта измеряется со случайными погрешностями, задача управления усложняется, но общий подход к ее решению остается прежним. Приведем без вывода формулу полного риска:

п 1

 

 

s

i

 

 

R —

 

aKs

| |

j- 1 EijdQ ,

(1.

52)

s= lK= 0Q(y;i>^._l)/ = 1 г'=°

 

 

причем для объектов типа

(1-

46)

равняется

 

 

 

s - l

/

 

 

 

« « = j U V (,0P (Q 0)

 

Y \

[ “[

\р Ш ] I Ф Я ) Х

 

 

 

 

i= i

i=o

 

 

 

X P(q[i,j] I \h-'-ij, Ф',Л)}Х

 

 

К

 

 

 

 

 

 

x (~] P(q[i,s]

I

p,x/;,K[/,s])fl?Q.

(1.

53)

i =0

Применение метода динамического программирования приво­ дит к выражениям, аналогичным (1. 50), для вычисления уп­ равлений и* [к, s].

Пример.

:

Пусть объект описывается разностным уравнением

q[K,s]=Aq[K— l,s]+5g[M,s—l]-f-C.7[/c—l.,s —1] +

 

55


+a[K,s] + |t+£[K,s], «=1,2,...,/,

(1. 54)

9[0,s] = ^[s],

которое является дискретным аналогом уравнения гиперболи­ ческого типа

~дШ "*~а (Эх

+

О- 55)

Случайная величина р распределена по нормальному закону с нулевым математическим ожиданием и дисперсией а2^ • По­

меха g[/c, s] — гауссова центрированная с независимыми зна­ чениями и дисперсией a2g; А, В, С — постоянные коэффи­ циенты.

О означи м

1,s]+ 5?[k,s—1] + Cq[K— l,s—1],

(1. 56)

Начальное состояние q[K, о] может быть измерено и счита­ ется известным. По границе на объект действует контроли­ руемое возмущение ф[$]. Функция потерь квадратичная

(I- 57))

Воспользуемся изложенной выше методикой для нахождения оптимального управления и* [к, s]. После некоторых преобра­ зований получаем

tt*[l,s]=!7*[l]—Л’Ь[5]—C6[s—1 ] ,s—1]— (1- 53

h*[/c,s]=(1—Л)<7*[/с]Bq[i<,s—1] -Cq[K— \,s— \] —ms,

«=2,3,...,/

s—1 l

т$=-ш----- ------

2 ( Ч Ш ] -АФ ’1— l]—C q [ c - \,i - \} —

4 + ^ - , ) / = , i / = i

Интересно отметить, что задача дуального управления распалась на две самостоятельных задачи: стохастического управления при известном р и определения оценки m s пара­ метра р.

56

1.2. МЕТОД И Н Ф О РМ А Ц И О Н Н Ы Х КООРДИ НАТ

Развитый ниже подход при сохранении основной идеологии дуального управления приводит к существенному уменьше­ нию вычислительных трудностей [1. 11].

Пусть объект управления описывается уравнением

о 0

< ^ <

7 ’, 5= 1,2,

59)

q&{q),

q0£&{q),

(1.

рбП(р), ф ]еП («),

 

где u[s] — вектор управляющих воздействий на границе рас­ пределенного объекта в момент времени s;

ц — вектор случайных параметров; ф ц , х ) — векторная функция, определяющая начальное

состояние;

Q(-) — область изменения аргументов;

х — пространственная координата, t — непрерывное время;

s — дискретное время, п —

Т

 

 

 

 

 

 

—, A t > t $Д ф О ;

 

 

/4i(-J —

некоторый непрерывный на

£ ф ,

р,

и)

оператор,

•определяющий связь начального состояния,

входных сигна­

лов и текущих значений выхода q(x, t)

и

характеризующий

динамику

распределенного

объекта,

причем

Л] = 7 о(р,,

х)

при /= 0 .

 

 

устройства

имеет

вид

 

Уравнение измерительного

 

 

y(xK.ts)=y[K,s] =H(q[K,s],h[K,s]),

 

 

 

где

х к= к А х ,

ts= sA t,

к=0,1,■•■,/;

 

 

 

 

Ах, At — интервалы квантования по х и t\

 

 

точке

в

q[K, s] — значения

функции

состояния q в к-й

s-й момент времени;

h\tc, s] — случайная помеха с независимыми в различные моменты времени значениями;

Я — непрерывная взаимнооднозначная известная функ­ ция аргументов q, h.

Таким образом, предполагаем, что управление и меняется ■скачкообразно в моменты времени t s, а информация с объек­ та снимается лишь в фиксированных точках хк.

57