Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 16.10.2024
Просмотров: 109
Скачиваний: 0
ное устройство о применяемом на ближайшем отрезке времени AT распределении рФ . В соответствии с этим командное устройство управляет регуляторами подачи реагентов. Таким образом, распре деление рФ характеризует чередование режимов лишь на проме жутке времени А Г.
Заметим, если игрока Y удовлетворяет гарантированный ему выигрыш, равный max min а^, то система управления технологиче ским контуром строится по схеме, показанной на рис. III.36.
Случай 3. Решение игры (ѵХг) при известных априорных распределениях неизмеряемых параметров соответствует положе-
Рис. III.37. Схема управления для дискретных игр с неполной информа цией:
/ — о б ъ е к т у п р а в л е н и я ; 2 — с и с т е м а конт р о л я ; 3 — у с т р о й с т в о к в а н т о в а н и я ; 4 — уст р о й с т в о с р а в н е н и я с и т у а ц и й ; 5 — с л у ч а й н ы й м е х а н и з м ; 6 — к о м а н д н о е у с т р о й с т в о ; 7 — р е г у л я т о р п о д а ч и р е а г е н т о в
нию, когда игроку Y известны относительные частоты qi, q2, . . . , qr k
(г= П Ai) появления наборов неизмеряемых параметров хп+и .. • i=h+l
• • -, Xk. |
платежи |
Л^ = Е^|аг| ( і = 1 , ѵ ) |
для |
всех |
стратегий |
Рассмотрим |
|||||
|
|
і |
|
|
|
игрока У (строк |
подматрицы lla^ll). Выберем |
среди |
платежей наи |
||
больший, равный, например, Л;. Оказывается, |
что режим, соответ |
||||
ствующий значению Ai, |
и есть оптимальный. |
Чтобы |
убедиться |
вэтом, докажем следующую теорему.
Те о р е м а . Если р, и q% есть такие частоты применения чистых
стратегий соответственно |
игроков Y и X, при которых р г ^ 0 ; |
qi^O; |
||||
V |
г |
qi, qi, . . . , qr заданы, то выражение |
|
|||
2 |
Рг = 2 <7r= 1 и частоты |
|
||||
имеет максимум при p» = 0 для |
всех іфі |
(t = l,v ) |
и р»= 1 для |
|||
і = 1. |
|
|
|
|
|
|
|
Д о к а з а т е л ь с т в о |
теоремы |
состоит |
в доказательстве |
нера |
|
венства |
|
|
|
|
|
|
|
|
2a ^/V7e<2a ^- |
(Ш.248) |
|||
|
Очевидно, |
|
|
|
|
|
|
2' |
*і\РіЧ\ < |
2' аііРЛь |
|
(ІІІ.249) |
где 2 ' — суммирование по всем і и £ за исключением і =
203
Но так как |
2] Pi = 1 и, |
следовательно Л'РІ=І—Pi, |
получим |
|
|
г = 1 |
|
|
|
2' |
аиРіЯі < 2' |
% «Aft =2 |
алЯ\ (1 - Л ) |
(III.250) |
или |
|
|
|
|
|
2 |
< 2 |
алЯь |
(III.251) |
|
і, S |
£ |
|
|
что и требовалось доказать.
Таким образом, решение игры в рассматриваемом случае со стояло в отыскании максимума Ai, равного А\. Игрок Y, применяя (чистую) стратегию і = 1, будет получать
Игроку Y предстоит |
|
max ^aupiq^ |
|
h |
|
|
отыскать |
Для всех Ц |
Ai по- |
||||
|
|
|
», 5 |
|
»-і |
|
дыгр (ѵ Хг). Режимы, соответствующие этим |
максимумам, есть оп |
|||||
тимальные режимы |
для |
соответствующих |
наборов х\, |
х%, |
• • -, Xh. |
|
Схема управления |
для |
данного |
случая будет такой |
же, |
как и |
схема системы управления для игр с седловой точкой.
Решение игры без информации. В принципе игры без информа
ции для небольших матриц |
(ѵХг) |
мы уже |
рассмотрели. |
Игры |
с платежными матрицами |
(ѵХя) |
большого |
размера могут |
быть |
решены таким же образом, однако такие решения связаны |
с боль |
|
шими вычислительными трудностями. Для решения игры |
(ѵХп) |
|
можно предложить, например, метод Брауна—Робинсона |
|
[199], |
дающий алгоритм, достаточно просто и быстро реализуемый на электронных вычислительных машинах.
Для матрицы ||û!jj|| построим векторную систему из ѵ-мерных векторов V и n-мерных векторов U
Ѵ(0), |
|
Ѵ(\), |
Vu, |
|
(III.252) |
||
U(0), |
U |
{I), |
|
|
|||
|
|
|
|||||
таким образом, что |
|
|
|
|
|
|
|
V(k |
+ |
|
\)=V(k)+Aj, |
|
(III.253) |
||
U(k |
+ |
\)=U(k) |
+ At, |
||||
|
|||||||
где Aj — /-й столбец матрицы |
||аг-;-||; |
Лг-- |
і-ая |
строка матрицы |
|||
||a,-j||. і и / определяются из |
условий |
|
|
|
|||
vt |
(£) = |
max |
V(k); |
|
(III.254) |
||
Uj (k)=m'm U |
(k), |
|
|||||
|
|
||||||
т. е. Vi(k)—максимальный |
компонент V(k), |
a |
Uj(k) — минималь |
||||
ный компонент U (k). |
|
|
|
|
|
|
204
За Ѵ(0) и t/(0) можно принять произвольные столбец и строку матрицы IlOijU. В частности, когда U(0) = 0 и Ѵ(0) = 0 для каждого k я k' справедливо неравенство
тіпсУ (k) |
max |
V(k') |
(Ш.255) |
|||
|
|
|
||||
Если существуют такие k и k', |
при которых |
|
||||
m i n £ / ( f e) |
m a x ^ ( f e f ) |
|
(III.256) |
|||
ь |
Т |
if |
> |
|||
|
||||||
то у есть решение игры. |
|
|
|
|
|
|
Однако такие k и k' |
существуют далеко |
не всегда. Но при k, |
||||
k'-^oo эти две границы |
приближаются |
к цене игры, причем [247] |
k
max V (k)
(III.257)
k •ï
Итак, если оборвать систему (III.252) на k-оы шаге, то получим
£/(£)=£/(<>)+2 °Лк)Аг,
(III.258)
V(k)=V(0)+ |
2 e ; |
(k)Aj, |
где
2 <зг ( * ) = Ä ;
(III.259)
ft
2<v(*)=ä.
Далее |
|
«у (*) |
(III.260) |
|
Таким образом, получаем распределение частот Pj, т. е. опти мальную смешанную стратегию, при которой игрок Y получает вы игрыш не менее
т ' = т - о ( а - v+ L2 )- |
(ш-261> |
Возвращаясь назад к решению непрерывной игры без инфор мации, обнаруживаем идентичность результатов решения в обоих случаях. Как для непрерывной игры, так и для дискретной опти мальной стратегией игрока Y является оптимальная смешанная стратегия pj. Следовательно, и схемы управления для них одина-
205
ковы. Однако, если непрерывные игры (как было отмечено выше) в смешанных стратегиях в большинстве случаев не решаются, то для решения дискретных игр разработаны машинные алгоритмы.
Так, к алгоритму Брауна—Робинсона |
[199] можно |
добавить |
итеративный алгоритм, предложенный Дж . Нейманом |
[283], ал |
|
горитм Брауна и Дж . Неймана [262]і , где |
оптимальные |
смешан |
ные стратегии игрока У отыскиваются как предельные точки си
стемы дифференциальных уравнений для |
матриц вида (III.234), |
||||
алгоритм, основанный на методе двойного описания |
[131, |
159], |
|||
представляющий |
собой |
распространение графического |
метода |
[64, |
|
146] решения игр |
(2Хп) |
на многомерные |
игры (тХп) |
т>2, |
алго |
ритмы, основанные на решении эквивалентных задач линейного программирования [64, 224].
Алгоритм решения игры (ѵХ«) с платежной |
матрицей |
(III.234) |
|||
при |
заданных |
распределениях частот чистых |
стратегий |
природы |
|
(qu |
. . . , qu) не отличается от рассмотренного выше для игры |
(ѵХ |
|||
Хг), |
поэтому |
здесь не рассматривается. Напомним только, |
что, |
как и ранее, решением игры является единственная чистая страте гия, так что построение специальной системы управления не тре буется.
Резюмируя результаты решения дискретных игр, можно отме
тить перспективность применения изложенных здесь |
алгоритмов |
||||
для медленно текущих процессов малой размерности. |
|
||||
Остановимся |
еще на |
одном |
методе управления, предложенном |
||
в работе |
[274]. |
|
|
|
|
Идея |
метода |
состоит |
в том, |
что набором уравнений |
регрессии |
описывается работа флотатора. Флотатор, выполняя роль опера тора в системе, сознательно или бессознательно отрабатывает воз мущения, действующие на входе объекта управления, стремясь поддерживать процесс в некоторой заданной области. При этом совершенно безразлично, на основе какой информации он прини мает решение изменить управляющее воздействие — ориентируясь на конечные показатели качества концентратов и хвостов или на какие-то промежуточные признаки (цвет пены, нагруженность и т. п.), взятые в промежуточных точках процесса, так как любые изменения выходных переменных объекта или некоторых проме жуточных параметров являются следствием изменения состояния входных воздействий, которые флотатор может даже ни количест венно, ни качественно не оценивать.
Очевидно, если флотатор всегда стремится (и это ему удается) вывести процесс в некоторую заданную на пространстве выходных координат область, то управляющие воздействия будут достаточно тесно коррелировать с вектором входа, в то время как связи между выходными переменными и вектором входа и управляющих воз действий (вообще J/G2) могут быть весьма слабыми. Эта простая
1 |
Изложенный в работе [262] метод представляет одно из приложений ме |
тода |
градиента '[251]. |
206
идея, основанная на отражении причинно-следственных отношений, впервые была применена в 1962 г. при построении системы управ ления флотацией на фабрике Лондон Милл (США) [272].
Математическая модель процесса в виде уравнений связи ме
жду вектором неуправляемых входных воздействий z и вектором
управляющих воздействий у в форме уравнений регрессии можно представить в виде
У = ? ( г ) .
Для того чтобы получить достаточно надежные модели, необ ходимо учитывать некоторые особенности. Целевая функция управ ления при таком подходе не задана в явном виде, хотя цель уп
равления, очевидно, состоит |
в том, чтобы поддерживать |
процесс |
по выходным координатам в |
некоторой заданной области, |
причем |
в первом приближении эта область задана некоторым многогран ником на пространстве выходных координат, например в виде ßI ?.t a <
< ß i j < ß ™ a x — для |
содержания |
металла |
в концентрате; 0 |
< ß j n < |
<ß™i n — для содержания металла в хвостах. |
|
|||
По-видимому, границы этой |
области могут быть заданы, |
исходя |
||
из технологических |
предпосылок. |
|
|
|
Если можно представить область, в |
которую стремятся, |
в та |
ком виде (при этом не запрещается ввести ограничения и на не которые другие показатели), то, выбрав из всей совокупности дан ных только такие, которые соответствуют поставленным ограниче ниям, можно найти связи вида г/'=ф(2), приняв которые за
уравнение управляющей модели |
будем |
стремиться |
попасть |
в желаемую область, осуществляя |
таким |
образом |
субопти |
мальное управление технологическим процессом. Разумеется, мо дель имеет смысл только в том случае, если оценка тесноты связи
между у и z достаточно высока и надежна, т. е. описанный метод имеет смысл в том случае, когда модель достаточно близка к де терминированной. Поэтому неслучайно, что число элементов век тора z в модели достаточно большое, причем на первом шаге ис следований в качестве элементов вектора принимают любой пара метр, который на основе технологических или каких-либо других соображений может оказывать влияние на конечные показатели.
Число элементов в дальнейшем уменьшается за счет математи ческой оценки степени влияния путем использования, например, методов корреляционного анализа и отбрасывания незначимых па раметров.
При построении модели управления в таком виде в качестве выходных переменных для расчета определенного управляющего воздействия принимаются другие управляющие величины. Модель имеет пирамидальную структуру. Это объясняется тем, что флота ция представляет собой последовательно соединенные процессы.
207