Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 23.10.2024
Просмотров: 71
Скачиваний: 0
нятия «алгоритм» и «решающее правило». Стратегии бывают случайными (иногда их называют рандомизированными) и регулярными, или детерминированными (нерандомизированс ными). Если стратегия случайная, то управляющее устройст
во содержит некоторый случайный механизм выбора решения
—►
и описывается условной плотностью вероятности P(w[s]|w[s—1],
у[s—1], g*[sl=rs |
выбора |
управления |
ц[$] при фиксиро- |
|
|
—* |
|
ванных временных векторах “ Is—l],y[s—1], <7*[s]'. Предпола |
|||
гаем, что функция потерь имеет вид (1.4) |
или (1.5). |
||
Стратегия Г$ |
должна |
удовлетворять |
естественным: усло |
виям: |
|
|
|
r s> и, |
j r srfS = l. |
(1. б) |
|
|
Q(u[sJ) . |
|
Здесь П(-) — область изменения аргументов, a dQ — ее бес конечно малый элемент.
Задачу синтеза оптимального управляющего устройства можно сформулировать как задачу нахождения такой ре шающей функции Г5 ,при которой полный риск минимален.
Вначале рассмотрим простую задачу и на ней изучим неко торые принципиальные положения общей теории дуального
управления. |
является |
нелинейным статическим с чис |
||
Пусть объект |
||||
тым запаздыванием на время |
-гн= тД t и характеристики его |
|||
(так же, как |
и |
УУ) |
заданы условными плотностями |
|
P(<7[s-H]|«[s]),P(y[s + |
т]|и[5)). |
Предположим, что стратегия |
УУ r s случайная. Задание считаем известным и постоянным: Запишем выражение для удельного риска
в(s + t) - m такте.
y7(^*,<7[s+T])P(«[s],^[s-fx],y[s— l]|<7*)d2. |
(1. 7) |
|||
2(«[s], <7.[s+xi, y[s—11) |
|
|
|
|
Преобразуем |
плотность вероятности |
P(«[s], q[s + |
x], у ;[s—• |
|
— 1)9*). Для |
упрощения записи зависимость .ее от |
q* опу |
||
стим: |
г - . : : ' |
' ■ " |
'. |
|
36
|
P(«[s], g'[s+'c],y[s— l]) = P(^[s+,5] \ иЫ, |
|
|
1], |
|
|||||||||
|
|
|
y[s— 1])P(u Ы|й [s— H .^ s + t— l],y[s— 1])X |
|
||||||||||
|
X P ()'[ s - 1] |
I ~u[s—Ur^ts-b-c— 1 ]), 3’[s— 2])P(«[s — |
1], |
|||||||||||
|
|
|
|
|
q[s+t — l],y[s—2l). |
|
|
|
|
П- 8) |
||||
Поскольку объект без памяти, в первом |
множителе |
выра |
||||||||||||
жения (1. |
8) |
переменные m[s—1], ^[s-j-x—l],>»[s—1] |
можно |
|||||||||||
опустить. |
Действительно, |
при |
фиксированном |
иЫ |
плот |
|||||||||
ность вероятности |
gts-Hl |
не изменится, если |
зафиксировать |
|||||||||||
еще |
и перечисленные |
переменные. По той |
же |
причине в |
||||||||||
условной |
плотности |
P(y[s—1] | «[s— 1], <7k + -и—1], y[s—2]) |
||||||||||||
следует |
опустить |
все |
переменные справа |
от |
в |
вертикальной |
||||||||
черты, |
кроме k[s—х—1 ]. Второй множитель |
(1- 8) |
пред |
|||||||||||
ставляет |
собой стратегию |
Г5 |
управляющего |
устройства в |
||||||||||
s-M |
такте. |
По определению Г5 ищем в классе |
условных |
|||||||||||
плотностей вероятности иЫ, зависящих |
лишь |
от |
реализа |
|||||||||||
ций управления u(s—1) (в данном частном случае Г8 |
зави- |
|||||||||||||
сит |
только от «[s—т—1]) и контролируемых |
выходов объ |
||||||||||||
екта |
y[s—1] в предыдущие моменты времени. |
8): |
|
|||||||||||
С учетом сказанного упростим выражение |
|
(1. |
|
|||||||||||
P(«[s], <7[s+T],y[s—1])= Р(<7к+т]|йЫ)ГsP(yls—l]|w[s—т—1]) X |
||||||||||||||
X P (« k — 1], qls+ x — 1], y[s—2]) = р |р (^ [г'+ т ] |н[г'])Х |
||||||||||||||
|
|
|
|
|
|
|
|
|
/=1 |
|
|
|
|
|
|
|
|
|
5—1 |
|
S—1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(1- 9) |
|
|
|
|
i= 1 |
/=1 |
|
|
|
|
|
|
|
Считаем известными значения u[j] при < 0 .
Подставив (1. 9) в (1. 7) и проинтегрировав по q[s+x—1] , получим
37
5—1
|
|
(1. |
10) |
|
i= 1 |
|
|
2(a[s — 1 ]yts—1 ]) |
|
|
|
где |
|
|
|
*'*+* = j ^(9*,?[s+-c])rsP(<7[s+ |
|
|
|
2 ( m [s ],<?[s + |
x]) |
|
|
5—1 |
|
|
|
+*] I k[s]) |
| u\i—x])dQ. |
(1. |
11) |
i=l |
|
|
|
Последовательность |
оптимальных рещающих |
правил |
|
|Г5) находим, начиная с последнего Г„_т, из условия |
ми |
нимума суммы удельных рисков R's+t по известной в.
теории |
дуального |
управления |
[В. |
15] процедуре. |
Для |
|||||||
отыскания стратегии Гя_ т достаточно |
минимизировать |
по |
||||||||||
Гл_ т функцию ■*!п с учетом соответствующих |
ограничений |
|||||||||||
на управление. Проанализируем формулу (1. 11). |
|
|
точно, |
|||||||||
а . |
|
Пусть все |
плотности |
вероятности |
известны |
|||||||
функция |
потерь выпукла. |
В теории |
статистических |
реше |
||||||||
ний |
[1.1, |
1.3] доказывается, |
что |
оптимальная |
стратегия |
|||||||
является нерандомизированной, т. е. плотность вероятности |
||||||||||||
Г„_т (аналогично и другие) |
вырождается |
в |
дельта |
|||||||||
функцию |
|
|
|
|
|
|
|
|
|
|
||
|
|
|
Tn_ z=o(u[n—т]—и*1п—х]). |
|
(1. |
12) |
||||||
В данном |
случае и*— неслучайная |
величина, |
не зависящая |
|||||||||
*4 |
|
—> |
|
Действительно, |
поскольку |
в |
||||||
от |
и\п—х—1], у[п—х—1 ]. |
|||||||||||
плотности P{y\i) | u [ i~ т]) |
не входят |
переменные |
интегри |
|||||||||
рования, то их можно вынести за знак интеграла. Запишем |
||||||||||||
х' для |
s = n —т: |
|
|
|
|
|
|
|
|
|
||
|
|
*—1 |
|
|
|
|
|
|
|
|
|
|
x,*+t= I X /3(yll’l I •«!*—' |
Jw(7*,^[s4-c])rsP(^[s-fx]ja[s])rf.Q . |
|||||||||||
|
|
1=1 |
|
Q(ufsJ,q[s+~.J) |
|
|
(1. |
13) |
||||
|
|
|
|
|
|
|
|
|
|
38
Так как все Р(-)!>0 и в |
функцию, стоящую |
перед |
знаком |
||||
интеграла, не входит и[$], то минимум |
достигается |
||||||
при минимуме по m[s ] интеграла, и обратная |
связь |
в |
си |
||||
стеме не нужна, накопление информации об |
объекте |
от |
|||||
сутствует (оно и не нужно, так как |
априори |
задана |
мак |
||||
симальная информация в терминологии А. А. Фельдбаума— |
|||||||
условные плотности известны точно). Управление |
и* явля |
||||||
ется детерминированным управлением, оптимальным в сред |
|||||||
нем. Дуальное управление в системе отсутствует |
и |
нет в |
|||||
этом |
необходимости. |
|
|
|
|
|
|
б. |
Допустим теперь, что априори отсутствует полная ин |
||||||
формация об условных |
плотностях |
вероятности |
в |
(1. |
11). |
||
При этом недостающую информацию УУ должно |
накапли |
||||||
вать в процессе работы. |
|
|
|
|
|
|
Возможны различные подходы, приводящие к различным формулировкам задач и способам их решения: параметриче скому и непараметрическому. В первом случае представляем (аппроксимируем) плотности вероятности известными функ циями с неизвестными (случайными) параметрами; во вто ром для восстановления неизвестных условных плотностей применяем методы непараметрической статистики. Эти воп росы освещены в [3. 11]. Здесь же подробнее остановимся на обсуждении первого подхода, связанного с параметризацией задачи.
Представим условные плотности вероятности, описываю
щие объект в |
виде |
|
^ |
[ s+ t] | n[s])=P0(?[s-M|[*, |
й[5]), |
/>№ +*] | a[s])=P0(y]s+t]|p, |
( Ь И ) |
|
n[s]), |
где Ро(-) — известные функции; р — вектор априори неизвестных параметров.
Накопление информации об объекте сводится к нахожде нию текущих статистических оценок m[s] параметров р. Ин декс «нуль» в (1. 14) ниже будем опускать.
Рассмотрим байесову задачу. |
Параметры р считаем слу |
|||
чайными величинами |
с |
известной |
плотностью |
вероятности |
Р(р). Функциих'5 |_х |
и |
R' s |_x в |
соответствии |
с формулами |
(1. 10), (1. 11) и (1. 14) также являются случайными. Проведя усреднение по р, получим
39