Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 115

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Аналогично игрок Y использует в качестве чистых стратегий точки

m-мерного параллелепипеда Sm: c^t/j^df, / = 1 т (III.215) и, как указывалось ранее, должен применять такие стратегии, кото­ рые давали бы максимально возможный выигрыш.

 

Игра

без

информации характерна тем, что, решая ее,

игрок Y

не

знает,

с

каким распределением F(X)

применяет

игрок

X свои

чистые стратегии из всех возможных, содержащихся

в Rh- Игрок Y

в

принципе

может применять свои чистые

стратегии

из Sm

любым

способом, например в соответствии с некоторой функцией распре­

деления G(Y). В таком

случае выигрыш игрока

У определится со­

отношением [64, 121, 146]

 

 

 

E(G,

F) =

j j K{X,

V)dO(Y)dF(X).

(III.219)

Но игроку Y нужно максимизировать свой выигрыш; ему пред­

стоит

применять

свои стратегии таким образом, чтобы величина

E(G

, F ) , подсчитанная

по формуле

(III.219),

была наибольшей.

Иначе говоря, задача состоит в определении оптимальной смешан­ ной стратегии G*(Y).

Можно показать [64, 146], что оптимальные стратегии игрока Y представляются в виде выпуклых линейных комбинаций чистых стратегий. Коэффициенты при этих стратегиях есть частоты, с ко­ торыми применяются чистые стратегии [269].

Следовательно, для того, чтобы игрок Y мог играть наилучшим

для себя

образом в ситуации, когда он не может получить инфор­

мации о

стратегии, примененной

природой, в

его

распоряжении

должен быть случайный механизм, вырабатывающий

оптимальное

распределение частот (Pj) применения чистых

стратегий, соответ­

ствующее функции распределения

G*(Y).

 

 

Известны несколько способов получения случайных чисел с за­ даваемыми по желанию законами распределения [75, 103, 122, 170]. Кроме того, в качестве случайного механизма в системе управления можно использовать и цифровую вычислительную машину [63, 70].

Возвращаясь к поставленной задаче, вспомним, что в разбирае­ мой игре одним из игроков является объект управления — природа,

а

вторым — оптимизирующая

система,

вырабатывающая

команды

на

управление регуляторами

подачи

реагентов

в соответствии

с распределением (Pj).

Причем, в данном случае

устройством вы­

работки управляющих

воздействий служит случайный

механизм.

Структурная схема системы управления разделительной уста­ новкой (технологическим контуром) для рассматриваемого случая чрезвычайно проста [121] (рис. III.33) и несколько необычна — для реализации алгоритма управления не нужна система контроля тех­ нологических параметров в темпе с процессом, а управляющая информация формируется случайным механизмом (например, в виде номера реагентного режима). Командное устройство в соот­ ветствии с номером стратегии формирует задание на регуляторы

190


подачи реагентов (стратегиями управления являются численные наборы параметров yf, yf, ..., гу«).

Система предполагает дискретное управление. Задание на регу­ ляторы остается постоянным на промежутке времени AT, равном минимальному из шагов квантования по времени функции xi(t), xz(t), . • -, xk(t).

Очевидно, точность регулирования процессов разделения при такой схеме управления зависит прежде всего от того, как точно отражает все возможные состояния системы платежная функция (III.216). Очевидно также, что в случае, когда технологический процесс выходит за нормы, установленные условиями управления (III.214), применение рассчитанной смешанной стратегии вероятнее всего неоптимально, хотя вполне возможны случаи удачно выбран­ ных чистых стратегий.

Рис. III.33. Структурная схема системы управления технологическим контуром при отсутствии текущей информации:

/ — о б ъ е к т у п р а в л е н и я ( т е х н о л о г и ч е с к и й к о н т у р ) ;

 

 

 

 

 

 

2 — с л у ч а й н ы й м е х а н и з м

о п т и м а л ь н о г о р а с п р е д е -

і

.

'

л е н и я ч а с т о т р е а г е н т н ы х

р е ж и м о в ; 3 — к о м а н д н о е

I

If.

 

1 J

 

I

у с т р о й с т в о ; 4 — р е г у л я т о р ы п о д а ч и р е а г е н т о в

I

 

I

1

 

I

Решение игры при известной смещенной стратегии природы.

Практически весьма важным случаем является тот, когда известно априорное распределение F(X) стратегий природы. Действительно, наличие в системе управления обогатительной фабрики развитой системы контроля и достаточно мощного вычислителя позволяет заблаговременно рассчитать применяемую смешанную стратегию F (X) природы.

Задача оптимизации, как и в предыдущем случае, состоит в мак­ симизации функции E(G, F ) , определяемой по уравнению (III.219) выбором оптимальной смешанной стратегии.

Для получения алгоритма решения игры при известной страте­ гии F (X) удобно пользоваться введением функции

 

 

J (Y)

JK(X,

Y)dF(X).

(111.220)

Тогда, учитывая

равенства

(III.220) и (III.214), можно записать

 

 

E(Q,

F)=

\j(Y)dQ{Y).

(III.221)

Функция

J(Y) непрерывна

на

замкнутом

параллелепипеде Sm

и достигает

своего

наибольшего

значения

в некоторой точке

Y = Y0:

 

 

 

 

 

 

 

 

max J (Y)=J (Y0)=a.

(III.222)

191


Таким образом, для равенства (III.222) имеет оценку

 

 

Е ( 0

, F )

=

j / ( Г ) й Ю ( К ) < | а ^ О ( К ) =

а,

(III.223)

так как по определению J" dG (У) = 1.

 

 

 

 

 

Кроме того,

 

 

 

 

 

 

 

 

 

 

E(JyDF)=$J(Y)dIy=J(Y0)

 

= «,

 

(ПІ.224)

где

/ у 0 — одноступенчатая

функция

распределения

со

скачком,

равным

единице, в точке У = Уо.

 

 

 

 

 

Сравнивая равенства

(III.223) и (III.224),

видим,

что

функция

E(G,

F)

максимизируется

при G ( F ) = / y 0 и

имеет место

соотно­

шение

 

 

 

 

 

 

 

 

 

a = m a x £ ( G ,

F)=E(IY<1,

 

F ) = m a x

[К(Х,

Y)dF(X).

 

(III.225)

 

 

о (Г)

 

 

y £ s

m J

 

 

 

Таким образом, решением игры будет стратегия У = Уо (чистая стратегия из всех возможных стратегий параллелепипеда Sm), применение которой дает игроку Y минимальный выигрыш, равный

maxE(G,

F).

 

 

 

 

 

 

 

 

G(Y)

 

 

 

 

 

 

 

 

 

Рассмотрим решение

игры

с

заданной

платежной

функцией

(III.218).

 

 

 

 

 

 

 

 

Подстановкой

формулы (III.218) в

формулу

(III.220)

получим

 

 

 

я

 

j Pt

 

 

 

 

 

J

(У)=

2 Qr

(У)

(X) dF(X).

 

(III.226)

Интегралы

 

 

 

 

 

 

 

 

 

 

b=\pT(X)dF(X);

 

r=\7~R

 

(Ш.227)

легко

вычисляются через моменты функции

распределения F(X).

В результате получаем J(Y)

в виде некоторого

полинома

 

 

•/00=2 Qr (>0rV

 

 

(1П-228)

Находя максимум функции /(У), получаем единственную опти­ мальную (чистую) стратегию У0==(г/°1> у°, ..., у°т), т. е. единст­ венный оптимальный реагентный режим. Отсюда ясно, что построение системы управления технологическим контуром в такой ситуации вообще теряет смысл, и при условии неизменности техно­ логических характеристик оборудования на длительных интервалах

192



времени практически обеспечивается статическая оптимизация тех­

нологического

процесса.

 

 

 

F(X),

 

 

 

Оценивая решение игры, при известной стратегии

видим,

что алгоритм ее чрезвычайно прост. И для случая платежной

функ­

ции К(Х,

Y)

в виде полинома второй степени, не

включающего

произведения различных аргументов из группы {у},

решение

со­

стоит в максимизации соответствующих квадратных

трехчленов,

так как функция (III.228) для

этого случая представляет

собой

сумму трехчленов от аргументов

{у}.

у\,

...,

 

у0),

Таким

образом, для

нахождения точки Уо=(«/°,

 

в которой

J (Y) принимает

наибольшее значение, достаточно

опре­

делить точки

у°,

у\,

...,

у0

, в

которых максимальны

соответст­

вующие квадратные трехчлены. Эти значения у0^

 

гД,

...,

у°т

определяются

с учетом равенства

(III.16).

 

 

 

 

 

Рис. 111.34. Структурная схема

си­

2

 

 

3

 

 

стемы управления с полной информа­

 

 

 

 

 

 

 

 

цией:

 

 

 

 

 

 

 

 

 

1 — о б ъ е к т

у п р а в л е н и я ; 2 — с и с т е м а

конт ­

 

 

 

 

 

 

р о л я ; 3 — в ы ч и с л и т е л ь н о е у с т р о й с т в о ; 4 —

-

 

 

 

 

 

к о м а н д н о е у с т р о й с т в о ; 5 — р е г у л я т о р ы по ­

 

 

4

 

 

5

 

 

 

 

 

д а ч и р е а г е н т о в

 

 

 

 

 

 

 

Игра и схема

управления

с полной информацией.

Схемы управ­

ления, рассмотренные ранее, обладают тем достоинством, что част­ ный выбор стратегий производится без каких-либо специальных расчетов или логических операций, проводимых, как правило, в вычислительных устройствах современных систем управления на основании вновь полученной информации в темпе с процессом.

Схемы, обеспечивающие оптимизацию как решение игры с пол­ ной информацией, лишены этого достоинства, но выигрыш с их применением будет максимальным. Иначе говоря, нет достаточных

оснований считать ситуацию определения режимов у^>, у^>,

у®

(при известных х^, xf, ..., х^) игровой. Тем не менее этот

пример

часто употребляется, так как практически задача состоит в отыс­ кании некоторой альтернативы (технологического режима), даю­ щей максимум эффективности. Такого рода решения обычно назы­ вают «выбором без риска» [271].

Вернемся к полиному

(III.218). При известных значениях Хі,

Xz,

Xu задача отыскания оптимальной стратегии Y=(yi,

у2, ...

 

ут), соответствующей

тахК{х,

у), состоит в решении

равен­

ства

(III.218) на максимум, так как каждый из многочленов

РГ(Х)

превращается в число.

 

 

 

Таким образом, алгоритм управления для системы с полной информацией, как и предыдущий, также очень прост, а структур­ ная схема системы управления представляет собой обычную схему (рис. 111.34).

13 З а к а з № 510

193