Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 16.10.2024
Просмотров: 115
Скачиваний: 0
Аналогично игрок Y использует в качестве чистых стратегий точки
m-мерного параллелепипеда Sm: c^t/j^df, / = 1 т (III.215) и, как указывалось ранее, должен применять такие стратегии, кото рые давали бы максимально возможный выигрыш.
|
Игра |
без |
информации характерна тем, что, решая ее, |
игрок Y |
||
не |
знает, |
с |
каким распределением F(X) |
применяет |
игрок |
X свои |
чистые стратегии из всех возможных, содержащихся |
в Rh- Игрок Y |
|||||
в |
принципе |
может применять свои чистые |
стратегии |
из Sm |
любым |
способом, например в соответствии с некоторой функцией распре
деления G(Y). В таком |
случае выигрыш игрока |
У определится со |
|||
отношением [64, 121, 146] |
|
|
|||
|
E(G, |
F) = |
j j K{X, |
V)dO(Y)dF(X). |
(III.219) |
Но игроку Y нужно максимизировать свой выигрыш; ему пред |
|||||
стоит |
применять |
свои стратегии таким образом, чтобы величина |
|||
E(G |
, F ) , подсчитанная |
по формуле |
(III.219), |
была наибольшей. |
Иначе говоря, задача состоит в определении оптимальной смешан ной стратегии G*(Y).
Можно показать [64, 146], что оптимальные стратегии игрока Y представляются в виде выпуклых линейных комбинаций чистых стратегий. Коэффициенты при этих стратегиях есть частоты, с ко торыми применяются чистые стратегии [269].
Следовательно, для того, чтобы игрок Y мог играть наилучшим
для себя |
образом в ситуации, когда он не может получить инфор |
|||
мации о |
стратегии, примененной |
природой, в |
его |
распоряжении |
должен быть случайный механизм, вырабатывающий |
оптимальное |
|||
распределение частот (Pj) применения чистых |
стратегий, соответ |
|||
ствующее функции распределения |
G*(Y). |
|
|
Известны несколько способов получения случайных чисел с за даваемыми по желанию законами распределения [75, 103, 122, 170]. Кроме того, в качестве случайного механизма в системе управления можно использовать и цифровую вычислительную машину [63, 70].
Возвращаясь к поставленной задаче, вспомним, что в разбирае мой игре одним из игроков является объект управления — природа,
а |
вторым — оптимизирующая |
система, |
вырабатывающая |
команды |
||
на |
управление регуляторами |
подачи |
реагентов |
в соответствии |
||
с распределением (Pj). |
Причем, в данном случае |
устройством вы |
||||
работки управляющих |
воздействий служит случайный |
механизм. |
Структурная схема системы управления разделительной уста новкой (технологическим контуром) для рассматриваемого случая чрезвычайно проста [121] (рис. III.33) и несколько необычна — для реализации алгоритма управления не нужна система контроля тех нологических параметров в темпе с процессом, а управляющая информация формируется случайным механизмом (например, в виде номера реагентного режима). Командное устройство в соот ветствии с номером стратегии формирует задание на регуляторы
190
подачи реагентов (стратегиями управления являются численные наборы параметров yf, yf, ..., гу«).
Система предполагает дискретное управление. Задание на регу ляторы остается постоянным на промежутке времени AT, равном минимальному из шагов квантования по времени функции xi(t), xz(t), . • -, xk(t).
Очевидно, точность регулирования процессов разделения при такой схеме управления зависит прежде всего от того, как точно отражает все возможные состояния системы платежная функция (III.216). Очевидно также, что в случае, когда технологический процесс выходит за нормы, установленные условиями управления (III.214), применение рассчитанной смешанной стратегии вероятнее всего неоптимально, хотя вполне возможны случаи удачно выбран ных чистых стратегий.
Рис. III.33. Структурная схема системы управления технологическим контуром при отсутствии текущей информации:
/ — о б ъ е к т у п р а в л е н и я ( т е х н о л о г и ч е с к и й к о н т у р ) ; |
|
|
|
|
|
|
|
2 — с л у ч а й н ы й м е х а н и з м |
о п т и м а л ь н о г о р а с п р е д е - |
• |
і |
. |
• |
' |
• |
л е н и я ч а с т о т р е а г е н т н ы х |
р е ж и м о в ; 3 — к о м а н д н о е |
I |
If. |
|
1 J |
|
I |
у с т р о й с т в о ; 4 — р е г у л я т о р ы п о д а ч и р е а г е н т о в |
I |
|
I |
1 |
|
I |
Решение игры при известной смещенной стратегии природы.
Практически весьма важным случаем является тот, когда известно априорное распределение F(X) стратегий природы. Действительно, наличие в системе управления обогатительной фабрики развитой системы контроля и достаточно мощного вычислителя позволяет заблаговременно рассчитать применяемую смешанную стратегию F (X) природы.
Задача оптимизации, как и в предыдущем случае, состоит в мак симизации функции E(G, F ) , определяемой по уравнению (III.219) выбором оптимальной смешанной стратегии.
Для получения алгоритма решения игры при известной страте гии F (X) удобно пользоваться введением функции
|
|
J (Y) |
JK(X, |
Y)dF(X). |
(111.220) |
|
Тогда, учитывая |
равенства |
(III.220) и (III.214), можно записать |
||||
|
|
E(Q, |
F)= |
\j(Y)dQ{Y). |
(III.221) |
|
Функция |
J(Y) непрерывна |
на |
замкнутом |
параллелепипеде Sm |
||
и достигает |
своего |
наибольшего |
значения |
в некоторой точке |
||
Y = Y0: |
|
|
|
|
|
|
|
|
max J (Y)=J (Y0)=a. |
(III.222) |
191
Таким образом, для равенства (III.222) имеет оценку
|
|
Е ( 0 |
, F ) |
= |
j / ( Г ) й Ю ( К ) < | а ^ О ( К ) = |
а, |
(III.223) |
||
так как по определению J" dG (У) = 1. |
|
|
|
|
|||||
|
Кроме того, |
|
|
|
|
|
|
|
|
|
|
|
E(JyDF)=$J(Y)dIy=J(Y0) |
|
= «, |
|
(ПІ.224) |
||
где |
/ у 0 — одноступенчатая |
функция |
распределения |
со |
скачком, |
||||
равным |
единице, в точке У = Уо. |
|
|
|
|
||||
|
Сравнивая равенства |
(III.223) и (III.224), |
видим, |
что |
функция |
||||
E(G, |
F) |
максимизируется |
при G ( F ) = / y 0 и |
имеет место |
соотно |
||||
шение |
|
|
|
|
|
|
|
|
|
|
a = m a x £ ( G , |
F)=E(IY<1, |
|
F ) = m a x |
[К(Х, |
Y)dF(X). |
|
(III.225) |
|
|
|
о (Г) |
|
|
y £ s |
m J |
|
|
|
Таким образом, решением игры будет стратегия У = Уо (чистая стратегия из всех возможных стратегий параллелепипеда Sm), применение которой дает игроку Y минимальный выигрыш, равный
maxE(G, |
F). |
|
|
|
|
|
|
|
|
G(Y) |
|
|
|
|
|
|
|
|
|
Рассмотрим решение |
игры |
с |
заданной |
платежной |
функцией |
||||
(III.218). |
|
|
|
|
|
|
|
|
|
Подстановкой |
формулы (III.218) в |
формулу |
(III.220) |
получим |
|||||
|
|
|
я |
|
j Pt |
|
|
|
|
|
J |
(У)= |
2 Qr |
(У) |
(X) dF(X). |
|
(III.226) |
||
Интегралы |
|
|
|
|
|
|
|
|
|
|
|
b=\pT(X)dF(X); |
|
r=\7~R |
|
(Ш.227) |
|||
легко |
вычисляются через моменты функции |
распределения F(X). |
|||||||
В результате получаем J(Y) |
в виде некоторого |
полинома |
|||||||
|
|
•/00=2 Qr (>0rV |
|
|
(1П-228) |
Находя максимум функции /(У), получаем единственную опти мальную (чистую) стратегию У0==(г/°1> у°, ..., у°т), т. е. единст венный оптимальный реагентный режим. Отсюда ясно, что построение системы управления технологическим контуром в такой ситуации вообще теряет смысл, и при условии неизменности техно логических характеристик оборудования на длительных интервалах
192
времени практически обеспечивается статическая оптимизация тех
нологического |
процесса. |
|
|
|
F(X), |
|
|
|
||||
Оценивая решение игры, при известной стратегии |
видим, |
|||||||||||
что алгоритм ее чрезвычайно прост. И для случая платежной |
функ |
|||||||||||
ции К(Х, |
Y) |
в виде полинома второй степени, не |
включающего |
|||||||||
произведения различных аргументов из группы {у}, |
решение |
со |
||||||||||
стоит в максимизации соответствующих квадратных |
трехчленов, |
|||||||||||
так как функция (III.228) для |
этого случая представляет |
собой |
||||||||||
сумму трехчленов от аргументов |
{у}. |
у\, |
..., |
|
у0), |
|||||||
Таким |
образом, для |
нахождения точки Уо=(«/°, |
|
|||||||||
в которой |
J (Y) принимает |
наибольшее значение, достаточно |
опре |
|||||||||
делить точки |
у°, |
у\, |
..., |
у0 |
, в |
которых максимальны |
соответст |
|||||
вующие квадратные трехчлены. Эти значения у0^ |
|
гД, |
..., |
у°т |
||||||||
определяются |
с учетом равенства |
(III.16). |
|
|
|
|
|
|||||
Рис. 111.34. Структурная схема |
си |
2 |
|
|
3 |
|
|
|||||
стемы управления с полной информа |
|
|
|
|
|
|
||||||
|
|
цией: |
|
|
|
|
|
|
|
|
|
|
1 — о б ъ е к т |
у п р а в л е н и я ; 2 — с и с т е м а |
конт |
|
|
|
|
|
|
||||
р о л я ; 3 — в ы ч и с л и т е л ь н о е у с т р о й с т в о ; 4 — |
- |
|
|
|
|
|
||||||
к о м а н д н о е у с т р о й с т в о ; 5 — р е г у л я т о р ы по |
|
|
4 |
|
|
|||||||
5 |
|
|
|
|
||||||||
|
д а ч и р е а г е н т о в |
|
|
|
|
|
|
|
||||
Игра и схема |
управления |
с полной информацией. |
Схемы управ |
ления, рассмотренные ранее, обладают тем достоинством, что част ный выбор стратегий производится без каких-либо специальных расчетов или логических операций, проводимых, как правило, в вычислительных устройствах современных систем управления на основании вновь полученной информации в темпе с процессом.
Схемы, обеспечивающие оптимизацию как решение игры с пол ной информацией, лишены этого достоинства, но выигрыш с их применением будет максимальным. Иначе говоря, нет достаточных
оснований считать ситуацию определения режимов у^>, у^>, |
у® |
(при известных х^, xf, ..., х^) игровой. Тем не менее этот |
пример |
часто употребляется, так как практически задача состоит в отыс кании некоторой альтернативы (технологического режима), даю щей максимум эффективности. Такого рода решения обычно назы вают «выбором без риска» [271].
Вернемся к полиному |
(III.218). При известных значениях Хі, |
|||
Xz, |
Xu задача отыскания оптимальной стратегии Y=(yi, |
у2, ... |
||
|
ут), соответствующей |
тахК{х, |
у), состоит в решении |
равен |
ства |
(III.218) на максимум, так как каждый из многочленов |
РГ(Х) |
||
превращается в число. |
|
|
|
Таким образом, алгоритм управления для системы с полной информацией, как и предыдущий, также очень прост, а структур ная схема системы управления представляет собой обычную схему (рис. 111.34).
13 З а к а з № 510 |
193 |