Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 92
Скачиваний: 0
где
/я5_хЫ = Ж {|i[s]// s_i} =pms_i;
Qn,i—l ld = Q ff[l—QgpCQp.s—i +pTQs-p)_ 1pTQS']—
= Qgp(QM - i + ptQ^p)_1Q^,s- |
i p-1- |
|
||
При выводе также учтено равенство |
|
|
||
QfJ.,S—1 ~Q|A,S—1 (QfX.S—1 + p TQgp) 1Q(JI,5—1 |
= p TQgp(Q(x,S—1 |
+ |
||
+ ptQ^p)-1Q!x>s_ i • |
|
|
||
Аналогично получаем, |
что |
P(p-[s+ t]/ rns-i,Qli S_i),%= 1,2,..,. |
||
подчиняется нормальному закону, причем |
|
|
||
|
|
Т~Ь 1 |
|
|
/ras_i[s+t]=M {p.[s-H \f$—i^= P ^ ms—1 з |
|
|||
a Qs- J s+ t] вычисляется по рекуррентной формуле. |
|
|||
Оценки ms_Js-t-T] |
используются при |
формировании оп |
||
тимального управления (1 . |
184). Информационные коорди |
|||
наты, входящие в ( 1 . |
184), равны |
|
|
|
ms_ .K_ i |
|
T/C-J-l |
|
|
Ы = р |
ms- x. |
(1. |
195)- |
Для их нахождения обратимся к выражению (1. 193). Первую условную плотность получаем из известной P(h[s]).
имодели объекта
Я(уЫ/р.Ы,?мЫ) = ex p j—-i(y[s]—G?M[sl—
- G C p iM W B - 'Y Q b B - i (у Ы -О ^ Ы -О С ^ уЫ)}- |
d- |
196) |
|||||||
Подставив |
(1. |
196) |
и |
(1. |
194) |
в |
формулу |
(1. |
193),. |
убеждаемся, |
что и |
плотность |
P(p.[s]//ns,Qas) подчиняется |
||||||
нормальному |
закону. |
Достаточные |
статистики ms= m s[s],. |
||||||
Qixs= Q^ls] определяются уравнениями: |
|
|
|
||||||
—1 |
|
|
|
—1 |
|
—1 |
|
|
|
т8 — Qps [Qfzs—iklpms_i4 -(B |
GCp )T QhB' |
(yls]—Gquls])]= |
|||||||
—l |
|
|
|
|
|
|
—1 |
|
|
= Q (IS Qgp(Q^s—1 d'P7' Qg-p) |
^Qfis—lms-\+ QjlS (B |
)Tx |
10»
XQnB-'iyis]—GqMls]), 5=» 1.2,..., /я0 = 0, |
(1. |
197) |
Q ^ = Q ^ - lW + ( 5 - 1GC(, VQhB-'GC^ = |
|
|
= Q ^ ( Q (AS_ i + P r Q^P)-1Q;aS_ lP- 1+ ( 5 - 1G Cti ) T Q h B - ^ G C p . |
||
|
(1. |
198) |
Таким образом, во всех рассмотренных случаях оптималь ные алгоритмы вычисления информационных координат и уп равления линейные, причем для марковского многомерного объекта с различными запаздываниями по каналам управле ния стратегия и структура управляющего устройства зада ются формулами (1. 184), (1. 195), (1. 197).
Упрощенная блок-схема системы приведена на рис. 1. 11. ■Система включает модель части объекта Oi, управляющий блок УБ с алгоритмом функционирования (1. 184) и вычис лительное устройство ВУ, определяющее информационные координаты т.
Все полученные алгоритмы легко могут быть реализованы «а цифровой управляющей вычислительной машине.
Р а з д е л 2
СИНТЕЗ АЛГОРИТМОВ С ПАССИВНЫМ НАКОПЛЕНИЕМ
ИНФОРМАЦИИ ДЛЯ АСУ ТП С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ
2. 1. РАЗДЕЛЕНИЕ ЗАДАЧ НАКОПЛЕНИЯ ИНФОРМАЦИИ И УПРАВЛЕНИЯ
Как отмечалось в разделе I, при исследовании ряда задач дуального управления линейными объектами с квадратичны ми критериями качества было замечено, что алгоритмы уп равления можно разделить на две части: вычисление оценок и управление по оценкам. Указанное обстоятельство позво лило высказать предположение [2 . 1—2 . 3], что и в других системах возможно разделение задач синтеза на две: синтез алгоритмов управления в предположении, что параметры р заданы, и синтез алгоритмов вычисления текущих статистиче ских оценок т параметров р с целью последующего их ис пользования в алгоритме управления. В соответствии с двумя выполняемыми функциями (управление и изучение объекта) представим управляющее устройство УУ (рис. 2. 1) в виде совокупности двух связанных блоков: собственно управляю щего блока УБ и вычислительного устройства ВУ, вычисляю щего оценки т.
Укажем следующие пути синтеза алгоритмов:
1)Независимый синтез УБ и ВУ [2. 1, 2. 2, В. 16].
2)Поэтапный синтез. Вначале находится алгоритм УБ, затем проводится синтез ВУ с учетом того, как оценки т ис пользуются для управления [2. 2, В. 16].
Оптимальные текущие оценки m*s (для дискретного вре мени) определяются, например, методом, изложенным в [2. 4], из условия минимума по р математического ожидания функции потерь
111
W$=Vfr$[()*fStCjitsiPtl-ls)] |
Q*)]- |
Особенность состоит в том, что оценки т* находятся из ус ловия близости действительного и предсказанного выходов объекта, а не из близости оценок и параметров.
3)Поэтапный синтез. Вначале решается задача иден
тификации (находится алгоритм ВУ), затем синтезируется УБ, причем задача второго этапа сводится к задаче стохасти ческого управления обычно уже нелинейной системой, вклю чающей объект и вычислительное устройство ВУ. Указанные два этапа выделяет И. А. Богусловский [2. 7] при исследова нии стохастического оптимального управления инерционны ми объектами с сосредоточенными параметрами. На первом: этапе выводятся уравнения для достаточных координат, а на втором — используются рекуррентные уравнения Веллмана, независимыми переменными в которых служат достаточные координаты. По существу, этой же идеологии мы придержи вались при изложении в подразделе 1 . 2 метода информаци онных координат для распределенных систем с запазды ванием.
Наиболее простым является путь полностью независимого синтеза УБ и ВУ. Такой подход оказался конструктивным и позволил получить ряд помехоустойчивых алгоритмов для типовых объектов с запаздыванием [2. 6]. В частности, бы ла решена задача синтеза близких статистически оптимальных систем управления [2. 6, В. 16]. Однако во многих случаях это путь приближенного решения, и полученные таким об разом алгоритмы требуют дополнительного исследования.
Позднее были сделаны шаги в направлении строгого ре шения проблемы разделения задач управления и накопления информации. Важный вклад был внесен В. И. Иваненко [2. 7, 2. 8], который установил достаточные условия приво димости систем к разомкнутым для одного класса стационар ных случайных объектов с конечной памятью (в общем слу чае нелинейных), а также условия распада функционала ка чества, при которых допустима одношаговая оптимизация, Условия разделения задач для линейных динамических объ ектов с аддитивными возмущениями и помехами измерения даны в [2. 9]. Хорошо известен также полученный в послед ние годы в теории стохастического оптимального управления результат решения линейно-квадратических задач — так на зываемая теорема разделения [2 . 10—2 . 12 ]. Было. установ-
112
лено, что для линейных систем, описываемых обыкновенны ми дифференциальными (или разностными) уравнениями, при аддитивных гауссовых помехах оптимальное по квадратиче скому критерию качества управление представляет собой де терминированное управление по оценкам фазовых координат.
Ниже описаны достаточные условия разделимости задач накопления информации для более общих математических моделей объектов, в том числе для нелинейных нестационар ных объектов с чистым запаздыванием и распределенными параметрами, для объектов, описание которых задано услов ными плотностями вероятности, а также для негауссовых за конов распределения и для неаддитивных помех. Предвари тельно сделаем два замечания.
Замечание 1. Полный рискР^т^при оптимальном управле
нии и* (v) на оставшемся интервале времени (непрерывного или дискретного) vs [f, Т] зависит от состояния объекта q{x, t) в момент t, в общем случае от предыстории управления, w(Tl)/7Je [0, 2] и от объема информации о неизвестных пара метрах р, которая накоплена к моменту t и содержится в апо
стериорной плотности вероятности РДр.) или Ps.(p-),s
ДР
8 |
2247 |
.113 |
Дефицит, полезной информации при задании плотности Р*(|а) будем измерять разностью
Д /,=Я (,>Г)[д(т)),
|
|
|
|
(2. 1) |
—R^,T)Hfl)MO,t],q(x,t,Y.),Pt (!x )= 8(1A-ix HCT)], |
||||
где рист— истинное значение параметра jj-- |
|
ией(д),тг]е[0,21], |
||
Если Pt(\L) инвариантна относительно «(■/)), |
||||
то имеем |
систему с пассивным |
накоплением |
информации |
|
или без накопления информации. |
так и q, |
то |
управление |
|
Если от и зависит как Р((р), |
||||
имеет двойственный (дуальный) характер |
и |
выбирается в |
||
результате |
компромисса между |
управлением |
при Р{р) = |
|
t=8(p— и-Ист) |
и уточнением РДр). |
|
|
|
Замечание 2 . Из зависимости .РДц.) от и еще не следует дуальность управления. Можно привести пример, когда Я/(р) зависит от и и вместе с тем дуального управления нет, необ ходимость в накоплении информации с точки зрения задан ного критерия отсутствует.
Пусть объект задан уравнением
? ( 0 = [Ч О -н (0 1г'Н-+Л(0 .
где р — случайная величина;
h(t) — центрированная помеха с независимыми значе ниями;
%,{t) — контролируемый вход;
Wt=q{t).
Плотность Р} (р) зависит от и, в частности, с ростом ошибки
г — Гк—и( дисперсия |
/^ ( р ) |
уменьшается. |
Однако |
выбрав |
|
u*(t)=A,(0 , находим |
Af{№ri; } = 0 при любом |
конечном р. |
|||
При этом дефицит полезной |
информации |
Д// = |
0 |
и R(t,T)ин' |
вариантен относительно Pt (р). Согласно принятой в [В. 16] терминологии, р в данном примере относится к несуществен ным неизвестным параметрам. Если же X — неконтролируемая случайная величина, оптимальное управление является ду альным. То же самое имеет место при некоторых другие функциях потерь.
Таким образом, при рассмотрении вопроса о разделении задач накопления информации (идентификации, оценки функ-
114;