Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 92

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

где

5_хЫ = Ж {|i[s]// s_i} =pms_i;

Qn,i—l ld = Q ff[l—QgpCQp.s—i +pTQs-p)_ 1pTQS']—

= Qgp(QM - i + ptQ^p)_1Q^,s-

i p-1-

 

При выводе также учтено равенство

 

 

QfJ.,S—1 ~Q|A,S—1 (QfX.S—1 + p TQgp) 1Q(JI,5—1

= p TQgp(Q(x,S—1

+

+ ptQ^p)-1Q!x>s_ i

 

 

Аналогично получаем,

что

P(p-[s+ t]/ rns-i,Qli S_i),%= 1,2,..,.

подчиняется нормальному закону, причем

 

 

 

 

Т~Ь 1

 

/ras_i[s+t]=M {p.[s-H \f$—i^= P ^ ms—1 з

 

a Qs- J s+ t] вычисляется по рекуррентной формуле.

 

Оценки ms_Js-t-T]

используются при

формировании оп­

тимального управления (1 .

184). Информационные коорди­

наты, входящие в ( 1 .

184), равны

 

 

ms_ .K_ i

 

T/C-J-l

 

 

Ы = р

ms- x.

(1.

195)-

Для их нахождения обратимся к выражению (1. 193). Первую условную плотность получаем из известной P(h[s]).

имодели объекта

Я(уЫ/р.Ы,?мЫ) = ex p j—-i(y[s]—G?M[sl—

- G C p iM W B - 'Y Q b B - i (у Ы ^ Ы С ^ уЫ)}-

d-

196)

Подставив

(1.

196)

и

(1.

194)

в

формулу

(1.

193),.

убеждаемся,

что и

плотность

P(p.[s]//ns,Qas) подчиняется

нормальному

закону.

Достаточные

статистики ms= m s[s],.

Qixs= Q^ls] определяются уравнениями:

 

 

 

—1

 

 

 

—1

 

—1

 

 

т8 — Qps [Qfzs—iklpms_i4 -(B

GCp )T QhB'

(yls]—Gquls])]=

—l

 

 

 

 

 

 

—1

 

 

= Q (IS Qgp(Q^s—1 d'P7' Qg-p)

^Qfis—lms-\+ QjlS (B

)Tx

10»



XQnB-'iyis]—GqMls]), 5=» 1.2,..., /я0 = 0,

(1.

197)

Q ^ = Q ^ - lW + ( 5 - 1GC(, VQhB-'GC^ =

 

 

= Q ^ ( Q (AS_ i + P r Q^P)-1Q;aS_ lP- 1+ ( 5 - 1G Cti ) T Q h B - ^ G C p .

 

(1.

198)

Таким образом, во всех рассмотренных случаях оптималь­ ные алгоритмы вычисления информационных координат и уп­ равления линейные, причем для марковского многомерного объекта с различными запаздываниями по каналам управле­ ния стратегия и структура управляющего устройства зада­ ются формулами (1. 184), (1. 195), (1. 197).

Упрощенная блок-схема системы приведена на рис. 1. 11. ■Система включает модель части объекта Oi, управляющий блок УБ с алгоритмом функционирования (1. 184) и вычис­ лительное устройство ВУ, определяющее информационные координаты т.

Все полученные алгоритмы легко могут быть реализованы «а цифровой управляющей вычислительной машине.

Р а з д е л 2

СИНТЕЗ АЛГОРИТМОВ С ПАССИВНЫМ НАКОПЛЕНИЕМ

ИНФОРМАЦИИ ДЛЯ АСУ ТП С РАСПРЕДЕЛЕННЫМИ ПАРАМЕТРАМИ

2. 1. РАЗДЕЛЕНИЕ ЗАДАЧ НАКОПЛЕНИЯ ИНФОРМАЦИИ И УПРАВЛЕНИЯ

Как отмечалось в разделе I, при исследовании ряда задач дуального управления линейными объектами с квадратичны­ ми критериями качества было замечено, что алгоритмы уп­ равления можно разделить на две части: вычисление оценок и управление по оценкам. Указанное обстоятельство позво­ лило высказать предположение [2 . 12 . 3], что и в других системах возможно разделение задач синтеза на две: синтез алгоритмов управления в предположении, что параметры р заданы, и синтез алгоритмов вычисления текущих статистиче­ ских оценок т параметров р с целью последующего их ис­ пользования в алгоритме управления. В соответствии с двумя выполняемыми функциями (управление и изучение объекта) представим управляющее устройство УУ (рис. 2. 1) в виде совокупности двух связанных блоков: собственно управляю­ щего блока УБ и вычислительного устройства ВУ, вычисляю­ щего оценки т.

Укажем следующие пути синтеза алгоритмов:

1)Независимый синтез УБ и ВУ [2. 1, 2. 2, В. 16].

2)Поэтапный синтез. Вначале находится алгоритм УБ, затем проводится синтез ВУ с учетом того, как оценки т ис­ пользуются для управления [2. 2, В. 16].

Оптимальные текущие оценки m*s (для дискретного вре­ мени) определяются, например, методом, изложенным в [2. 4], из условия минимума по р математического ожидания функции потерь

111


W$=Vfr$[()*fStCjitsiPtl-ls)]

Q*)]-

Особенность состоит в том, что оценки т* находятся из ус­ ловия близости действительного и предсказанного выходов объекта, а не из близости оценок и параметров.

3)Поэтапный синтез. Вначале решается задача иден­

тификации (находится алгоритм ВУ), затем синтезируется УБ, причем задача второго этапа сводится к задаче стохасти­ ческого управления обычно уже нелинейной системой, вклю­ чающей объект и вычислительное устройство ВУ. Указанные два этапа выделяет И. А. Богусловский [2. 7] при исследова­ нии стохастического оптимального управления инерционны­ ми объектами с сосредоточенными параметрами. На первом: этапе выводятся уравнения для достаточных координат, а на втором — используются рекуррентные уравнения Веллмана, независимыми переменными в которых служат достаточные координаты. По существу, этой же идеологии мы придержи­ вались при изложении в подразделе 1 . 2 метода информаци­ онных координат для распределенных систем с запазды­ ванием.

Наиболее простым является путь полностью независимого синтеза УБ и ВУ. Такой подход оказался конструктивным и позволил получить ряд помехоустойчивых алгоритмов для типовых объектов с запаздыванием [2. 6]. В частности, бы­ ла решена задача синтеза близких статистически оптимальных систем управления [2. 6, В. 16]. Однако во многих случаях это путь приближенного решения, и полученные таким об­ разом алгоритмы требуют дополнительного исследования.

Позднее были сделаны шаги в направлении строгого ре­ шения проблемы разделения задач управления и накопления информации. Важный вклад был внесен В. И. Иваненко [2. 7, 2. 8], который установил достаточные условия приво­ димости систем к разомкнутым для одного класса стационар­ ных случайных объектов с конечной памятью (в общем слу­ чае нелинейных), а также условия распада функционала ка­ чества, при которых допустима одношаговая оптимизация, Условия разделения задач для линейных динамических объ­ ектов с аддитивными возмущениями и помехами измерения даны в [2. 9]. Хорошо известен также полученный в послед­ ние годы в теории стохастического оптимального управления результат решения линейно-квадратических задач — так на­ зываемая теорема разделения [2 . 10—2 . 12 ]. Было. установ-

112


лено, что для линейных систем, описываемых обыкновенны­ ми дифференциальными (или разностными) уравнениями, при аддитивных гауссовых помехах оптимальное по квадратиче­ скому критерию качества управление представляет собой де­ терминированное управление по оценкам фазовых координат.

Ниже описаны достаточные условия разделимости задач накопления информации для более общих математических моделей объектов, в том числе для нелинейных нестационар­ ных объектов с чистым запаздыванием и распределенными параметрами, для объектов, описание которых задано услов­ ными плотностями вероятности, а также для негауссовых за­ конов распределения и для неаддитивных помех. Предвари­ тельно сделаем два замечания.

Замечание 1. Полный рискР^т^при оптимальном управле­

нии и* (v) на оставшемся интервале времени (непрерывного или дискретного) vs [f, Т] зависит от состояния объекта q{x, t) в момент t, в общем случае от предыстории управления, w(Tl)/7Je [0, 2] и от объема информации о неизвестных пара­ метрах р, которая накоплена к моменту t и содержится в апо­

стериорной плотности вероятности РДр.) или Ps.(p-),s

ДР

8

2247

.113

Дефицит, полезной информации при задании плотности Р*(|а) будем измерять разностью

Д /,=Я (,>Г)[д(т)),

 

 

 

 

(2. 1)

—R^,T)Hfl)MO,t],q(x,t,Y.),Pt (!x )= 8(1A-ix HCT)],

где рист— истинное значение параметра jj--

 

ией(д),тг]е[0,21],

Если Pt(\L) инвариантна относительно «(■/)),

то имеем

систему с пассивным

накоплением

информации

или без накопления информации.

так и q,

то

управление

Если от и зависит как Р((р),

имеет двойственный (дуальный) характер

и

выбирается в

результате

компромисса между

управлением

при Р{р) =

t=8(p— и-Ист)

и уточнением РДр).

 

 

 

Замечание 2 . Из зависимости .РДц.) от и еще не следует дуальность управления. Можно привести пример, когда Я/(р) зависит от и и вместе с тем дуального управления нет, необ­ ходимость в накоплении информации с точки зрения задан­ ного критерия отсутствует.

Пусть объект задан уравнением

? ( 0 = [Ч О -н (0 1г'Н-+Л(0 .

где р — случайная величина;

h(t) — центрированная помеха с независимыми значе­ ниями;

%,{t) — контролируемый вход;

Wt=q{t).

Плотность Р} (р) зависит от и, в частности, с ростом ошибки

г — Гки( дисперсия

/^ ( р )

уменьшается.

Однако

выбрав

u*(t)=A,(0 , находим

Af{№ri; } = 0 при любом

конечном р.

При этом дефицит полезной

информации

Д// =

0

и R(t,T)ин'

вариантен относительно Pt (р). Согласно принятой в [В. 16] терминологии, р в данном примере относится к несуществен­ ным неизвестным параметрам. Если же X — неконтролируемая случайная величина, оптимальное управление является ду­ альным. То же самое имеет место при некоторых другие функциях потерь.

Таким образом, при рассмотрении вопроса о разделении задач накопления информации (идентификации, оценки функ-

114;