Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 78
Скачиваний: 0
Критерий оптимальности (условный риск) задается в виде
Ти
S (‘s, т) =М |
dt |
W[q*,q(x,t),x,t,a[i\\dx\ a[s],y[fc,j] |
, |
||
ts+At О |
/ = s + l ,■■■,«■ |
(1. |
60) |
||
|
|
|
|||
Если качество |
процессов |
управления определяется состоя |
|||
нием объекта |
q(x,t) |
во всех точках хе[о,/я] |
и на интервале |
||
времени [^+ А / . Г ] |
или |
в виде |
|
|
|
|
п |
I |
|
|
|
R(s,n)= м { X |
X |
*Ф']) |
ф ] . y[/c,s] j |
, |
|
/'=5+1 К=0 |
|
(1- |
61) |
||
|
|
|
|
если проектировщика интересует лишь состояние объекта в точках х к и в дискретные моменты времени. В последнем слу чае вместо (1. 59) достаточно иметь следующую математиче скую модель:
|
^г[л,5] = Л3(н-, U[s])- |
(1. G2) |
|
Предполагаем заданными |
априорную плотность |
вероятности |
|
Р0(р) вектора |
случайных |
параметров р и плотности вероят |
|
ности помех. |
Следовательно, можно определить условную |
плотность вероятности Р(у[к, s] |р, u[s]). Процесс накопле ния информации об объекте проявляется в редукции плотно сти вероятности Ро(р), в замене априорной плотности апосте риорной Я^(р). Рассмотрим класс самовоспроизводящихся законов распределения [1. 12, В. 23]. Если существует раз ложение Ps (р) на множители
I |
“[S],y [х,5])=Я(р ‘ |
f\s)f(U И , у [/c,s]), |
(1. 63) |
то вектор |
7ls= 7Js( и [s]. у [/с,s]) |
является вектором |
достаточ |
ных координат, достаточных статистик [1. 13]. Иногда исполь зуют термин «информационные координаты» [1. 12] или ин формационные образы [1. 14].
Мы под информационными координатами будем понимать, совокупность применяемых в алгоритме управления доста точных статистик (всех или части) и фазовых координат (если
58
неопределенность состояния объекта обусловлена не толькослучайными параметрами, но и действием на объект помех). В общем случае размерность вектора информационных коор динат может быть больше, равной пли меньшей размерности достаточных статистик, определяющих плотность Рз (М).
Определение.
Конечномерный вектор ws_i = /?zs_i( и. [s—1], y[/r,s]) |
бу |
|
дем называть |
вектором информационных координат, |
если- |
полный риск |
Rm при управлении «[s]=«(m s_i,s) удовлет |
воряет условию
Rpn> R m>R*n>
Rm- R * n<Z,
где RPn и R*n— полные риски в разомкнутой системе (при. программном управлении «[s] и при оптимальном управле
нии |
m*[s]= и*(з, h[s—1], y[«:,s—1]) соответственно, 8— напе |
ред |
заданная достаточно малая величина- |
Если существует конечномерный вектор достаточных
статистик vjs_j и /7zs_ i= t)s_ 1( то R*n= R m, |
8=0. |
Достаточ |
||||
ные статистики У 5_ 1, не зависящие от (г ф —l],y[/r,s]), |
т. е. |
|||||
от фактического состояния объекта, а зависящие |
лишь от |
|||||
времени s, к информационным координатам относить |
не |
|||||
будем. В задаче, поставленной в данном |
подразделе, |
ин |
||||
формационные координаты формируются только |
из |
доста |
||||
точных статистик, |
характеризующих |
апостериорную |
плот |
|||
ность вероятности |
Р ф )- С учетом (1- |
63; |
запишем |
функ |
||
цию риска: |
|
|
|
|
|
|
Ти
s (ts,T)= fs{u \s]>y [«,«]) |
J J di ]^dxWP(ii | ms)dQ, |
(1. |
64} |
|||
|
Q((x) ^+дго |
|
|
|
||
|
|
n |
l |
|
|
|
R(s,n)=fs ( « [s ], |
у [ K,S ] |
Г |
S w *i( Ф ' ] ) р ^ |
I ms)dQ, |
|
|
|
|
Q(H-) l=s + 1k=0 |
(1. |
65} |
||
где Q(-)— область изменения аргумента; |
||||||
|
|
|||||
dQ— ее |
бесконечно малый |
элемент. |
|
|
59.
Когда информационные координаты марковские, они удов- -летворяют рекуррентному соотношению
mi = /n [s]= /7(m[s—1],tt’[s],y[s]), |
(1- 66^ |
причем т0 определяется по Ро(р). В общем случае
wi[s] = /n*(a[s],y [/c,s]).
-Оптимальное управление u*[i] ищем в классе регулярных не рандомизированных стратегий:
u*[i]=u*(i,mi-1). |
(1- 67) |
Задача синтеза формулируется следующим образом. Требу ется найти такую последовательность! w*[s] ) управляющих воздействий, чтобы функция риска S(o,T) или R(\in) принимала
минимальное значение при ограничениях (1. 59), (1. 66) и, со ответственно, (1. 62), (1. 66). Укажем два частных случая, которые вытекают из этой постановки задачи.
I. Пусть помеха h очень велика, либо в системе отсутству ет обратная связь, т. е. накапливать информацию нельзя и управление осуществляется по априорной информации, содер
жащейся в Я0(р)- |
t= 1, |
..., п. Задача сводится |
|
Из (1. 66) |
получаем /п /= m 0, |
||
к синтезу оптимальной в среднем |
управляющей прог |
||
раммы [1. 15] |
|
|
|
|
u*[L] = u*(i,m0)=Fi{i,PQ(v.)). |
||
II. Пусть |
Я0(р )= 6 (р —ц*), |
где |
б — дельта-функция, |
р* — истинное значение вектора параметра р. Приходим к задаче детерминированного управления [В. 29—В. 30].
Обозначим R* значение риска R при оптимальном управлении. Для нахождения алгоритма управления восполь зуемся методом динамического программирования. Оптималь ные управляющие воздействия u*[s]=u* (s, m s—i ) опреде ляются из функционального уравнения
min [rs+ M {/?*(Sfn)(m,) | u[s]€£y«)
l
min
Q i |J-) k=0
'60
+ |
R*(s,n)(ms)P(MS I OTs_i)dQ , |
(1. |
68).. |
Q ( l) |
|
|
|
причем^(Л7г)*= 0. |
Аналогичное уравнение |
получаем |
для, |
S*(ts~At,T). |
|
|
|
Если известен вид (Pftj. | /ws_i), P(ms | ms- 1), W7,^, то принципиально можно последовательно определить все управления u.*(s,ms-i), начиная с последнего такта и кончая u(s=1, Р0(р.)). Укажем последовательность операций для, получения P(ix | /л,).
1- |
Используя уравнения объекта, находим Р(У /| ц,«[/])-. |
2- |
Вычисляем Р/(|а) по формуле |
P(V- I /n,-t)P(yf 1|*,ц[/])
P /(!x)=P(li |тн ,и [1'],У ,) =
Р(р. | wz-_i) Р(У/)ц, и [s])dQ
Q(h-)
(1. 69)..
3- Представляем Р/(ц) в виде
PiM = P(v- I т ()Р2(лг/_,,У[г],и[/]).
Из последнего соотношения выводится уравнение (1. 66). Условную плотность P(ms \ ms^i) в выражении (1. 68) находим по уравнению (1. 66) с учетом соотношения
Р(У5 | m,-i,«[s]) = J p (y , | w [ s ] ) P b I ms_i)dQ. |
(1. 70> |
Вотдельных задачах (например, для нейтральных систем,
сзапаздыванием) уравнение (1. 68)существенно упрощается,, и оптимальные управляющие воздействия находятся из ус ловия минимума только функций удельного риска rs .
Заметим, что в общем случае в системах с запаздыванием и распределенными параметрами информационные координаты не обладают свойством марковости, что существенно услож
няет вычисления. В частности, при наличии различных запаз дываний в параллельных каналах измерения с гауссовыми
61
помехами достаточные статистики являются немарковскими. Однако и для таких систем иногда могут быть предложены рекуррентные процедуры вычисления информационных коор динат.
Изложенные общие методы синтеза применены в нижесле дующих подразделах для нахождения точных аналитических решений нескольких более частных задач оптимального дур ального управления.
1. 3. ДУАЛЬНОЕ УПРАВЛЕНИЕ РАСПРЕДЕЛЕННЫМ ОБЪЕКТОМ ПЕРВОГО ПОРЯДКА (ОБЪЕКТОМ С ЗАПАЗДЫВАНИЕМ)
Запаздывание в распределенных объектах |
определяется |
||||||
временем, необходимым для перемещения |
обрабатываемого |
||||||
материала (среды и т. д.) |
из |
одной пространственной точки |
|||||
в другую, т. е. из точки, |
где прикладывается |
управляющее |
|||||
воздействие, к месту установки датчика. |
|
(см. |
подраздел |
||||
Пусть объект описывается |
уравнением |
||||||
В. 2. 1) |
|
|
|
|
|
|
|
|
|
|
|
|
|
(1. |
71) |
•с граничным условием |
|
|
|
|
|
|
|
<?(0,Jf)=/[“(0.1‘] - f ( 0 |
|
|
|
(1. |
72) |
||
и некоторыми начальными условиями. |
Здесь / |
непрерывная |
|||||
монотонная функция u(t) |
и |
р; |
— |
выход |
объекта; |
q(x, t) — функция текущего состояния объекта; u(t) — уп равление, р — возмущение (.случайная-величина); v характе ризует скорость перемещения материала. В устройствах, изме
ряющих выходной сигнал, действуют |
случайные помехи h |
|
с независимыми значениями. |
|
|
Решение уравнения (1. 71) при О |
— имеет вид |
|
<7(*,0= f(t—**)> |
(1. |
73) |
q(i-H>t)—f(t тя) 1 |
(1. |
74) |
тде |
|
|
<62