Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 75
Скачиваний: 0
1.1. 3. Оператор объекта задан в виде уравнений
вчастных разностях
В этом случае применение описанной выше методики не возможно без предварительного решения уравнений с уче том начальных и граничных условий. Оправдан поэтому и иной подход [1. 10]. Изложим метод синтеза управляющего устройства для управления распределенными объектами, ко торые описываются уравнениями в «частных» разностях
qKs=q[K,s]=F(\i,q[K— \,s],u[K,s],y.KS,q[K+l,s],g[K,s]) (1- |
42} |
|
с граничными условиями |
|
|
ф . 5]= <7о*(н-.«[о,5],ф[5],£[о,5]), |
(1. |
43) |
|
||
и некоторыми начальными условиями. Здесь F — однознач |
||
ная, вообще говоря, нелинейная функция, и[к, s] |
— распре |
|
деленное управление. Переменные в к-й точке |
и в s-й мо |
мент времени отмечены соответствующими индексами. Кван
тование по уровню отсутствует. В уравнении (1. 42) |
kks |
учи |
|
тывает зависимость q [к, s] от всех значений q[i, /], |
0 |
I |
/, |
/ s—1 и граничных воздействий u[o,s], ср, ...; |
<?[к:—1, |
s], |
7[к+1, s] могут не входить в правую часть уравнения (1. 42). Для простоты считаем, что q[K, s] — скаляр. При обобщении
для случая, когда |
q[K, s] — вектор, не возникает принцнпи |
|
альных трудностей. Значения помехи g[K, s] для |
различных |
|
/ с и э и случайные |
параметры р статистически |
независимы. |
Плотности вероятности P(g), Р(р) случайных воздействий g |
и параметров р известны. Вначале считаем, что помехи h в
измерительных |
устройствах отсутствуют, |
т. е. |
у[к, s] = |
= Я[к, 5]. |
|
на |
указанный |
Обобщим теорию дуального управления |
|||
класс задач управления распределенными объектами. |
|||
Предполагая, что алгоритм работы управляющего устрой |
|||
ства случайный, |
запишем выражение для удельного риска в |
||
s-м такте при известных q*[K,s] = q*K; 6[s]: |
|
|
|
i |
|
|
|
Rs== |
U[k s],q[K,s])dQ, |
(1. 44) |
|
ic--= 0 |
|
|
|
и [/C,S], q |
[K,sD |
|
|
52
где й(-)—- область |
изменения аргументов, |
a dQ— ее бес |
|||||
конечно малый элемент. |
Буквами |
о [к,5] |
и |
и [k,s] обозна |
|||
чена совокупность |
q[ic,s] |
и |
[ k ,s ] |
д л я |
scex |
к |
и s типа |
|
q[o,i] |
- |
q[0,s] |
|
|
|
|
q [k,s] = |
?[«.!]- |
|
I! |
Q !••• Qs II • |
|||
|
|
|
|
|
|
||
|
?[/.!]• |
|
|
|
|
|
|
Преобразуем |
совместную |
плотность |
вероятности |
||||
Р(р, и [«.s], q |
учитывая |
статистическую |
независимость |
||||
V-,g и известное начальное состояние Q0= |
|| ^[о,о]...^[/,о] || т |
P(|j.,« [k,s], g[K ,s])=P^) X
(1- 45)
X f [ x [ P ( Q y 1*'UJ~U |
I V i.Q ;- i) ] - |
/—I
Последнее выражение справедливо, поскольку УУ вырабаты вает воздействия в /-м такте лишь на основании информа ции, полученной измерениями в предыдущих тактах, а зави
симость управления от р. проявляется только через
Qj-i. Рассмотрим условную плотность вероятности P(Qy \ р,
Uj, Qj-i). Используя уравнение объекта и предполагая, что д[к, j] не зависит от q[i, j], где i>K, получим
1
P{Qj \ V-,Uj,Qj-i)= f ] P(qlk,j] |
| v-,4 jMk,j],qlk -/,/]). (1.46) |
|||
K=1 |
последних |
сомножителей |
||
Перейдем к рассмотрению |
||||
в (1. 45): |
|
|
|
|
P(U j \ U j-u Q j-i)= P (u [l,j] | и |
[ 0 |
, |
1,/], Uj-i, Qj-i) X |
|
X — XP(u[k,j-] I и[0,/].....и[к—1,/], |
U j - u Q j - O X -X |
47) |
||
|
|
|
(1. |
53
|
|
|
I |
|
|
Х |
- Р ( и |
[ 0 ,U/ j]-|i,Q j-x) |
— J - |
1 Г |
ку , |
|
|
|
/с=0 |
|
|
где Гку - стратегия |
управляющего |
устройства, причем |
|||
Здесь учтена |
|
Гку>0- |
|
q[fс, |
у] в уравнении: |
возможная зависимость |
(1. 42), следовательно, и оптимального управления и[к, у] от управлений, прикладываемых в тот же момент времени в точках объекта 0, 1, .... к—1. Нужно указать на принципиаль ное различие зависимостей и[к, у] от u[i, j], где t'C/c, и уп равлений в предыдущие такты. В первом случае связь между управляющими воздействиями определяется лишь операто ром объекта (1. 42). Во втором — зависимость возникает не только за счет распределенности и наличия памяти в объек те, но обусловлена эффектом накопления информации о не
известных параметрах. |
Поставив (1. 46) и (1. 47) в (1. 45), |
а результат — в (1. 44), находим |
|
I |
1 s |
к=О |
П П |
' |
|
|
к—0 1=1 |
|
|
|
|
Q ( u [ k , s] , q [ k ,s — 1/) |
|
(1. |
48) |
|
где |
l |
|
|
|
s —1 |
|
|
|
|
J ~ J |
m [ |
* - W 1 W |
. x“ [ * V ] ) |
|
j= 1 |
/= 0 |
|
|
|
Q(fv?/0s/...qfr.Ф |
|
|
|
|
k |
|
|
|
|
X |
I (М [г-М ]>у-/5.*Ф'.Л)^- |
(1. |
49) |
|
/=0 |
|
|
|
|
Можно показать, что и стратегия Г/,„_ь и все Гк^ вырождаются
в дельта-функции- |
Оптимальные управляющие |
воздействия |
||
«*[«,«] находятся из условия минимума по |
и |
[/c,s] функ |
||
ции 7кs, которая строится по следующему правилу: |
||||
l K S — a K s ' lT l ' i:K + l , s |
П р и К ф 1 , |
S < / t |
||
Т/s= a/s+ |
j* TfVs-H^ |
при s<n. |
|
(1- 50) |
Q(Qj
T ln—aln
54
В частности, для |
определения управляющего |
воздействия |
||
«[о, s] по границе используется соотношение |
|
|
||
|
T*os= min K 5+T*iS)- |
0- |
51) |
|
|
u[o,s] |
|
|
|
Если на границе приложено только |
возмущение яр [s], |
во |
||
всех уравнениях |
следует принять и[о, |
s ]= 0 . В другом слу |
чае может оказаться, что возмущение распределено по длине объекта, а управлять можно лишь по границе, т. е. и[к, s]= 0 , к= 1 ..., /—1. Задача синтеза оптимального алгоритма УУ сводится к исследованию выражений вида (1. 51).
Если в измерительных устройствах кроме помех g имеют ся случайные помехи h, т. е. состояние объекта измеряется со случайными погрешностями, задача управления усложняется, но общий подход к ее решению остается прежним. Приведем без вывода формулу полного риска:
п 1 |
|
|
s |
i |
|
|
R — |
|
aKs |
| | |
j- 1 EijdQ , |
(1. |
52) |
s= lK= 0Q(y;i>^._l)/ = 1 г'=° |
|
|
||||
причем для объектов типа |
(1- |
46) |
равняется |
|
|
|
|
s - l |
/ |
|
|
|
|
« « = j U V (,0P (Q 0) |
|
Y \ |
[ “[ |
\р Ш ] I Ф Я ) Х |
|
|
|
|
i= i |
i=o |
|
|
|
X P(q[i,j] I \h-'-ij, Ф',Л)}Х |
|
|
||||
К |
|
|
|
|
|
|
x (~] P(q[i,s] |
I |
p,x/;,K[/,s])fl?Q. |
(1. |
53) |
i =0
Применение метода динамического программирования приво дит к выражениям, аналогичным (1. 50), для вычисления уп равлений и* [к, s].
Пример. |
: |
Пусть объект описывается разностным уравнением |
|
q[K,s]=Aq[K— l,s]+5g[M,s—l]-f-C.7[/c—l.,s —1] + |
|
55
+a[K,s] + |t+£[K,s], «=1,2,...,/, |
(1. 54) |
9[0,s] = ^[s],
которое является дискретным аналогом уравнения гиперболи ческого типа
~дШ "*~а (Эх |
+ |
О- 55) |
Случайная величина р распределена по нормальному закону с нулевым математическим ожиданием и дисперсией а2^ • По
меха g[/c, s] — гауссова центрированная с независимыми зна чениями и дисперсией a2g; А, В, С — постоянные коэффи циенты.
О означи м
1,s]+ 5?[k,s—1] + Cq[K— l,s—1], |
(1. 56) |
Начальное состояние q[K, о] может быть измерено и счита ется известным. По границе на объект действует контроли руемое возмущение ф[$]. Функция потерь квадратичная
(I- 57))
Воспользуемся изложенной выше методикой для нахождения оптимального управления и* [к, s]. После некоторых преобра зований получаем
tt*[l,s]=!7*[l]—Л’Ь[5]—C6[s—1 ] ,s—1]— (1- 53
h*[/c,s]=(1—Л)<7*[/с] — Bq[i<,s—1] -Cq[K— \,s— \] —ms,
«=2,3,...,/
s—1 l
т$=-ш----- ------ |
2 ( Ч Ш ] -АФ ’1— l]—C q [ c - \,i - \} — |
4 + ^ - , ) / = , i / = i
Интересно отметить, что задача дуального управления распалась на две самостоятельных задачи: стохастического управления при известном р и определения оценки m s пара метра р.
56
1.2. МЕТОД И Н Ф О РМ А Ц И О Н Н Ы Х КООРДИ НАТ
Развитый ниже подход при сохранении основной идеологии дуального управления приводит к существенному уменьше нию вычислительных трудностей [1. 11].
Пусть объект управления описывается уравнением
о 0 |
< ^ < |
7 ’, 5= 1,2, |
59) |
q&{q), |
q0£&{q), |
(1. |
|
рбП(р), ф ]еП («), |
|
где u[s] — вектор управляющих воздействий на границе рас пределенного объекта в момент времени s;
ц — вектор случайных параметров; ф ц , х ) — векторная функция, определяющая начальное
состояние;
Q(-) — область изменения аргументов;
х — пространственная координата, t — непрерывное время;
s — дискретное время, п — |
Т |
|
|
|
|
|
|
|||
—, A t > t —$Д ф О ; |
|
|
||||||||
/4i(-J — |
некоторый непрерывный на |
£ ф , |
р, |
и) |
оператор, |
|||||
•определяющий связь начального состояния, |
входных сигна |
|||||||||
лов и текущих значений выхода q(x, t) |
и |
характеризующий |
||||||||
динамику |
распределенного |
объекта, |
причем |
Л] = 7 о(р,, |
х) |
|||||
при /= 0 . |
|
|
устройства |
имеет |
вид |
|
||||
Уравнение измерительного |
|
|||||||||
|
y(xK.ts)=y[K,s] =H(q[K,s],h[K,s]), |
|
|
|
||||||
где |
х к= к А х , |
ts= sA t, |
к=0,1,■•■,/; |
|
|
|
|
|||
Ах, At — интервалы квантования по х и t\ |
|
|
точке |
в |
||||||
q[K, s] — значения |
функции |
состояния q в к-й |
s-й момент времени;
h\tc, s] — случайная помеха с независимыми в различные моменты времени значениями;
Я — непрерывная взаимнооднозначная известная функ ция аргументов q, h.
Таким образом, предполагаем, что управление и меняется ■скачкообразно в моменты времени t s, а информация с объек та снимается лишь в фиксированных точках хк.
57