Файл: Живоглядов, В. П. Адаптация в автоматизированных системах управления технологическими процессами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.10.2024

Просмотров: 71

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

нятия «алгоритм» и «решающее правило». Стратегии бывают случайными (иногда их называют рандомизированными) и регулярными, или детерминированными (нерандомизированс ными). Если стратегия случайная, то управляющее устройст­

во содержит некоторый случайный механизм выбора решения

—►

и описывается условной плотностью вероятности P(w[s]|w[s—1],

у[s—1], g*[sl=rs

выбора

управления

ц[$] при фиксиро-

 

 

—*

 

ванных временных векторах “ Is—l],y[s—1], <7*[s]'. Предпола­

гаем, что функция потерь имеет вид (1.4)

или (1.5).

Стратегия Г$

должна

удовлетворять

естественным: усло­

виям:

 

 

 

r s> и,

j r srfS = l.

(1. б)

 

Q(u[sJ) .

 

Здесь П(-) — область изменения аргументов, a dQ — ее бес­ конечно малый элемент.

Задачу синтеза оптимального управляющего устройства можно сформулировать как задачу нахождения такой ре­ шающей функции Г5 ,при которой полный риск минимален.

Вначале рассмотрим простую задачу и на ней изучим неко­ торые принципиальные положения общей теории дуального

управления.

является

нелинейным статическим с чис­

Пусть объект

тым запаздыванием на время

-гн= тД t и характеристики его

(так же, как

и

УУ)

заданы условными плотностями

P(<7[s-H]|«[s]),P(y[s +

т]|и[5)).

Предположим, что стратегия

УУ r s случайная. Задание считаем известным и постоянным: Запишем выражение для удельного риска

в(s + t) - m такте.

y7(^*,<7[s+T])P(«[s],^[s-fx],y[s— l]|<7*)d2.

(1. 7)

2(«[s], <7.[s+xi, y[s—11)

 

 

 

Преобразуем

плотность вероятности

P(«[s], q[s +

x], у ;[s—•

— 1)9*). Для

упрощения записи зависимость .ее от

q* опу­

стим:

г - . : : '

' ■ "

'.

 

36


 

P(«[s], g'[s+'c],y[s— l]) = P(^[s+,5] \ иЫ,

 

 

1],

 

 

 

 

y[s— 1])P(u Ы|й [s— H .^ s + t— l],y[s— 1])X

 

 

X P ()'[ s - 1]

I ~u[s—Ur^ts-b-c— 1 ]), 3’[s— 2])P(«[s —

1],

 

 

 

 

 

q[s+t — l],y[s—2l).

 

 

 

 

П- 8)

Поскольку объект без памяти, в первом

множителе

выра­

жения (1.

8)

переменные m[s—1], ^[s-j-x—l],>»[s—1]

можно

опустить.

Действительно,

при

фиксированном

иЫ

плот­

ность вероятности

gts-Hl

не изменится, если

зафиксировать

еще

и перечисленные

переменные. По той

же

причине в

условной

плотности

P(y[s—1] | «[s— 1], <7k + -и—1], y[s—2])

следует

опустить

все

переменные справа

от

в

вертикальной

черты,

кроме k[s—х—1 ]. Второй множитель

(1- 8)

пред­

ставляет

собой стратегию

Г5

управляющего

устройства в

s-M

такте.

По определению Г5 ищем в классе

условных

плотностей вероятности иЫ, зависящих

лишь

от

реализа­

ций управления u(s—1) (в данном частном случае Г8

зави-

сит

только от «[s—т—1]) и контролируемых

выходов объ­

екта

y[s—1] в предыдущие моменты времени.

8):

 

С учетом сказанного упростим выражение

 

(1.

 

P(«[s], <7[s+T],y[s—1])= Р(<7к+т]|йЫ)ГsP(yls—l]|w[s—т—1]) X

X P (« k — 1], qls+ x — 1], y[s—2]) = р |р (^ [г'+ т ] |н[г'])Х

 

 

 

 

 

 

 

 

 

/=1

 

 

 

 

 

 

 

 

 

5—1

 

S—1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(1- 9)

 

 

 

 

i= 1

/=1

 

 

 

 

 

 

 

Считаем известными значения u[j] при < 0 .

Подставив (1. 9) в (1. 7) и проинтегрировав по q[s+x—1] , получим

37


5—1

 

 

(1.

10)

 

i= 1

 

 

2(a[s — 1 ]yts—1 ])

 

 

где

 

 

 

*'*+* = j ^(9*,?[s+-c])rsP(<7[s+

 

 

2 ( m [s ],<?[s +

x])

 

 

5—1

 

 

 

+*] I k[s])

| u\i—x])dQ.

(1.

11)

i=l

 

 

 

Последовательность

оптимальных рещающих

правил

|Г5) находим, начиная с последнего Г„_т, из условия

ми­

нимума суммы удельных рисков R's+t по известной в.

теории

дуального

управления

[В.

15] процедуре.

Для

отыскания стратегии Гя_ т достаточно

минимизировать

по

Гл_ т функцию ■*!п с учетом соответствующих

ограничений

на управление. Проанализируем формулу (1. 11).

 

 

точно,

а .

 

Пусть все

плотности

вероятности

известны

функция

потерь выпукла.

В теории

статистических

реше­

ний

[1.1,

1.3] доказывается,

что

оптимальная

стратегия

является нерандомизированной, т. е. плотность вероятности

Г„_т (аналогично и другие)

вырождается

в

дельта­

функцию

 

 

 

 

 

 

 

 

 

 

 

 

 

Tn_ z=o(u[n—т]—и*1п—х]).

 

(1.

12)

В данном

случае и*— неслучайная

величина,

не зависящая

*4

 

—>

 

Действительно,

поскольку

в

от

и\п—х—1], у[п—х—1 ].

плотности P{y\i) | u [ i~ т])

не входят

переменные

интегри­

рования, то их можно вынести за знак интеграла. Запишем

х' для

s = n —т:

 

 

 

 

 

 

 

 

 

 

 

*—1

 

 

 

 

 

 

 

 

 

x,*+t= I X /3(yll’l I •«!*—'

Jw(7*,^[s4-c])rsP(^[s-fx]ja[s])rf.Q .

 

 

1=1

 

Q(ufsJ,q[s+~.J)

 

 

(1.

13)

 

 

 

 

 

 

 

 

 

 

38


Так как все Р(-)!>0 и в

функцию, стоящую

перед

знаком

интеграла, не входит и[$], то минимум

достигается

при минимуме по m[s ] интеграла, и обратная

связь

в

си­

стеме не нужна, накопление информации об

объекте

от­

сутствует (оно и не нужно, так как

априори

задана

мак­

симальная информация в терминологии А. А. Фельдбаума—

условные плотности известны точно). Управление

и* явля­

ется детерминированным управлением, оптимальным в сред­

нем. Дуальное управление в системе отсутствует

и

нет в

этом

необходимости.

 

 

 

 

 

 

б.

Допустим теперь, что априори отсутствует полная ин­

формация об условных

плотностях

вероятности

в

(1.

11).

При этом недостающую информацию УУ должно

накапли­

вать в процессе работы.

 

 

 

 

 

 

Возможны различные подходы, приводящие к различным формулировкам задач и способам их решения: параметриче­ скому и непараметрическому. В первом случае представляем (аппроксимируем) плотности вероятности известными функ­ циями с неизвестными (случайными) параметрами; во вто­ ром для восстановления неизвестных условных плотностей применяем методы непараметрической статистики. Эти воп­ росы освещены в [3. 11]. Здесь же подробнее остановимся на обсуждении первого подхода, связанного с параметризацией задачи.

Представим условные плотности вероятности, описываю­

щие объект в

виде

 

^

[ s+ t] | n[s])=P0(?[s-M|[*,

й[5]),

/>№ +*] | a[s])=P0(y]s+t]|p,

( Ь И )

n[s]),

где Ро(-) — известные функции; р — вектор априори неизвестных параметров.

Накопление информации об объекте сводится к нахожде­ нию текущих статистических оценок m[s] параметров р. Ин­ декс «нуль» в (1. 14) ниже будем опускать.

Рассмотрим байесову задачу.

Параметры р считаем слу­

чайными величинами

с

известной

плотностью

вероятности

Р(р). Функциих'5 |_х

и

R' s |_x в

соответствии

с формулами

(1. 10), (1. 11) и (1. 14) также являются случайными. Проведя усреднение по р, получим

39