Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 78

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Критерий оптимальности (условный риск) задается в виде

Ти

S (‘s, т)

dt

W[q*,q(x,t),x,t,a[i\\dx\ a[s],y[fc,j]

,

ts+At О

/ = s + l ,■■■,«■

(1.

60)

 

 

 

Если качество

процессов

управления определяется состоя­

нием объекта

q(x,t)

во всех точках хе[о,/я]

и на интервале

времени [^+ А / . Г ]

или

в виде

 

 

 

п

I

 

 

 

R(s,n)= м { X

X

*Ф'])

ф ] . y[/c,s] j

,

/'=5+1 К=0

 

(1-

61)

 

 

 

 

если проектировщика интересует лишь состояние объекта в точках х к и в дискретные моменты времени. В последнем слу­ чае вместо (1. 59) достаточно иметь следующую математиче­ скую модель:

 

^г[л,5] = Л3(н-, U[s])-

(1. G2)

Предполагаем заданными

априорную плотность

вероятности

Р0(р) вектора

случайных

параметров р и плотности вероят­

ности помех.

Следовательно, можно определить условную

плотность вероятности Р(у[к, s] |р, u[s]). Процесс накопле­ ния информации об объекте проявляется в редукции плотно­ сти вероятности Ро(р), в замене априорной плотности апосте­ риорной Я^(р). Рассмотрим класс самовоспроизводящихся законов распределения [1. 12, В. 23]. Если существует раз­ ложение Ps (р) на множители

I

“[S],y [х,5])=Я(р ‘

f\s)f(U И , у [/c,s]),

(1. 63)

то вектор

7ls= 7Js( и [s]. у [/с,s])

является вектором

достаточ­

ных координат, достаточных статистик [1. 13]. Иногда исполь­ зуют термин «информационные координаты» [1. 12] или ин­ формационные образы [1. 14].

Мы под информационными координатами будем понимать, совокупность применяемых в алгоритме управления доста­ точных статистик (всех или части) и фазовых координат (если

58


неопределенность состояния объекта обусловлена не толькослучайными параметрами, но и действием на объект помех). В общем случае размерность вектора информационных коор­ динат может быть больше, равной пли меньшей размерности достаточных статистик, определяющих плотность Рз (М).

Определение.

Конечномерный вектор ws_i = /?zs_i( и. [s—1], y[/r,s])

бу­

дем называть

вектором информационных координат,

если-

полный риск

Rm при управлении «[s]=«(m s_i,s) удовлет­

воряет условию

Rpn> R m>R*n>

Rm- R * n<Z,

где RPn и R*n— полные риски в разомкнутой системе (при. программном управлении «[s] и при оптимальном управле­

нии

m*[s]= и*(з, h[s—1], y[«:,s—1]) соответственно, 8— напе­

ред

заданная достаточно малая величина-

Если существует конечномерный вектор достаточных

статистик vjs_j и /7zs_ i= t)s_ 1( то R*n= R m,

8=0.

Достаточ­

ные статистики У 5_ 1, не зависящие от (г ф —l],y[/r,s]),

т. е.

от фактического состояния объекта, а зависящие

лишь от

времени s, к информационным координатам относить

не

будем. В задаче, поставленной в данном

подразделе,

ин­

формационные координаты формируются только

из

доста­

точных статистик,

характеризующих

апостериорную

плот­

ность вероятности

Р ф )- С учетом (1-

63;

запишем

функ­

цию риска:

 

 

 

 

 

 

Ти

s (ts,T)= fs{u \s]>y [«,«])

J J di ]^dxWP(ii | ms)dQ,

(1.

64}

 

Q((x) ^+дго

 

 

 

 

 

n

l

 

 

R(s,n)=fs ( « [s ],

у [ K,S ]

Г

S w *i( Ф ' ] ) р ^

I ms)dQ,

 

 

 

Q(H-) l=s + 1k=0

(1.

65}

где Q(-)— область изменения аргумента;

 

 

dQ— ее

бесконечно малый

элемент.

 

 

59.



Когда информационные координаты марковские, они удов- -летворяют рекуррентному соотношению

mi = /n [s]= /7(m[s—1],tt’[s],y[s]),

(1- 66^

причем т0 определяется по Ро(р). В общем случае

wi[s] = /n*(a[s],y [/c,s]).

-Оптимальное управление u*[i] ищем в классе регулярных не­ рандомизированных стратегий:

u*[i]=u*(i,mi-1).

(1- 67)

Задача синтеза формулируется следующим образом. Требу­ ется найти такую последовательность! w*[s] ) управляющих воздействий, чтобы функция риска S(o,T) или R(\in) принимала

минимальное значение при ограничениях (1. 59), (1. 66) и, со­ ответственно, (1. 62), (1. 66). Укажем два частных случая, которые вытекают из этой постановки задачи.

I. Пусть помеха h очень велика, либо в системе отсутству­ ет обратная связь, т. е. накапливать информацию нельзя и управление осуществляется по априорной информации, содер­

жащейся в Я0(р)-

t= 1,

..., п. Задача сводится

Из (1. 66)

получаем /п /= m 0,

к синтезу оптимальной в среднем

управляющей прог­

раммы [1. 15]

 

 

 

 

u*[L] = u*(i,m0)=Fi{i,PQ(v.)).

II. Пусть

Я0(р )= 6 (р —ц*),

где

б — дельта-функция,

р* — истинное значение вектора параметра р. Приходим к задаче детерминированного управления [В. 29—В. 30].

Обозначим R* значение риска R при оптимальном управлении. Для нахождения алгоритма управления восполь­ зуемся методом динамического программирования. Оптималь­ ные управляющие воздействия u*[s]=u* (s, m s—i ) опреде­ ляются из функционального уравнения

min [rs+ M {/?*(Sfn)(m,) | u[s]€£y«)

l

min

Q i |J-) k=0

'60


+

R*(s,n)(ms)P(MS I OTs_i)dQ ,

(1.

68)..

Q ( l)

 

 

 

причем^(Л7г)*= 0.

Аналогичное уравнение

получаем

для,

S*(ts~At,T).

 

 

 

Если известен вид (Pftj. | /ws_i), P(ms | ms- 1), W7,^, то принципиально можно последовательно определить все управления u.*(s,ms-i), начиная с последнего такта и кончая u(s=1, Р0(р.)). Укажем последовательность операций для, получения P(ix | /л,).

1-

Используя уравнения объекта, находим Р(У /| ц,«[/])-.

2-

Вычисляем Р/(|а) по формуле

P(V- I /n,-t)P(yf 1|*,ц[/])

P /(!x)=P(li |тн ,и [1'],У ,) =

Р(р. | wz-_i) Р(У/)ц, и [s])dQ

Q(h-)

(1. 69)..

3- Представляем Р/(ц) в виде

PiM = P(v- I т ()Р2(лг/_,,У[г],и[/]).

Из последнего соотношения выводится уравнение (1. 66). Условную плотность P(ms \ ms^i) в выражении (1. 68) находим по уравнению (1. 66) с учетом соотношения

Р(У5 | m,-i,«[s]) = J p (y , | w [ s ] ) P b I ms_i)dQ.

(1. 70>

Вотдельных задачах (например, для нейтральных систем,

сзапаздыванием) уравнение (1. 68)существенно упрощается,, и оптимальные управляющие воздействия находятся из ус­ ловия минимума только функций удельного риска rs .

Заметим, что в общем случае в системах с запаздыванием и распределенными параметрами информационные координаты не обладают свойством марковости, что существенно услож­

няет вычисления. В частности, при наличии различных запаз­ дываний в параллельных каналах измерения с гауссовыми

61

помехами достаточные статистики являются немарковскими. Однако и для таких систем иногда могут быть предложены рекуррентные процедуры вычисления информационных коор­ динат.

Изложенные общие методы синтеза применены в нижесле­ дующих подразделах для нахождения точных аналитических решений нескольких более частных задач оптимального дур­ ального управления.

1. 3. ДУАЛЬНОЕ УПРАВЛЕНИЕ РАСПРЕДЕЛЕННЫМ ОБЪЕКТОМ ПЕРВОГО ПОРЯДКА (ОБЪЕКТОМ С ЗАПАЗДЫВАНИЕМ)

Запаздывание в распределенных объектах

определяется

временем, необходимым для перемещения

обрабатываемого

материала (среды и т. д.)

из

одной пространственной точки

в другую, т. е. из точки,

где прикладывается

управляющее

воздействие, к месту установки датчика.

 

(см.

подраздел

Пусть объект описывается

уравнением

В. 2. 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

(1.

71)

•с граничным условием

 

 

 

 

 

 

 

<?(0,Jf)=/[“(0.1‘] - f ( 0

 

 

 

(1.

72)

и некоторыми начальными условиями.

Здесь /

непрерывная

монотонная функция u(t)

и

р;

выход

объекта;

q(x, t) — функция текущего состояния объекта; u(t) — уп­ равление, р — возмущение (.случайная-величина); v характе­ ризует скорость перемещения материала. В устройствах, изме­

ряющих выходной сигнал, действуют

случайные помехи h

с независимыми значениями.

 

 

Решение уравнения (1. 71) при О

— имеет вид

 

<7(*,0= f(t—**)>

(1.

73)

q(i-H>t)—f(t тя) 1

(1.

74)

тде

 

 

<62