Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 109

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ное устройство о применяемом на ближайшем отрезке времени AT распределении рФ . В соответствии с этим командное устройство управляет регуляторами подачи реагентов. Таким образом, распре­ деление рФ характеризует чередование режимов лишь на проме­ жутке времени А Г.

Заметим, если игрока Y удовлетворяет гарантированный ему выигрыш, равный max min а^, то система управления технологиче­ ским контуром строится по схеме, показанной на рис. III.36.

Случай 3. Решение игры (ѵХг) при известных априорных распределениях неизмеряемых параметров соответствует положе-

Рис. III.37. Схема управления для дискретных игр с неполной информа­ цией:

/ — о б ъ е к т у п р а в л е н и я ; 2 — с и с т е м а конт ­ р о л я ; 3 — у с т р о й с т в о к в а н т о в а н и я ; 4 — уст­ р о й с т в о с р а в н е н и я с и т у а ц и й ; 5 — с л у ч а й н ы й м е х а н и з м ; 6 — к о м а н д н о е у с т р о й с т в о ; 7 — р е г у л я т о р п о д а ч и р е а г е н т о в

нию, когда игроку Y известны относительные частоты qi, q2, . . . , qr k

(г= П Ai) появления наборов неизмеряемых параметров хп+и .. • i=h+l

• • -, Xk.

платежи

Л^ = Е^|аг| ( і = 1 , ѵ )

для

всех

стратегий

Рассмотрим

 

 

і

 

 

 

игрока У (строк

подматрицы lla^ll). Выберем

среди

платежей наи­

больший, равный, например, Л;. Оказывается,

что режим, соответ­

ствующий значению Ai,

и есть оптимальный.

Чтобы

убедиться

вэтом, докажем следующую теорему.

Те о р е м а . Если р, и q% есть такие частоты применения чистых

стратегий соответственно

игроков Y и X, при которых р г ^ 0 ;

qi^O;

V

г

qi, qi, . . . , qr заданы, то выражение

 

2

Рг = 2 <7r= 1 и частоты

 

имеет максимум при p» = 0 для

всех іфі

(t = l,v )

и р»= 1 для

і = 1.

 

 

 

 

 

 

Д о к а з а т е л ь с т в о

теоремы

состоит

в доказательстве

нера­

венства

 

 

 

 

 

 

 

2a ^/V7e<2a ^-

(Ш.248)

 

Очевидно,

 

 

 

 

 

 

2'

*і\РіЧ\ <

2' аііРЛь

 

(ІІІ.249)

где 2 ' — суммирование по всем і и £ за исключением і =

203


Но так как

2] Pi = 1 и,

следовательно Л'РІ=ІPi,

получим

 

г = 1

 

 

 

2'

аиРіЯі < 2'

% «Aft =2

алЯ\ (1 - Л )

(III.250)

или

 

 

 

 

 

2

< 2

алЯь

(III.251)

 

і, S

£

 

 

что и требовалось доказать.

Таким образом, решение игры в рассматриваемом случае со­ стояло в отыскании максимума Ai, равного А\. Игрок Y, применяя (чистую) стратегию і = 1, будет получать

Игроку Y предстоит

 

max ^aupiq^

 

h

 

отыскать

Для всех Ц

Ai по-

 

 

 

», 5

 

»-і

 

дыгр (ѵ Хг). Режимы, соответствующие этим

максимумам, есть оп­

тимальные режимы

для

соответствующих

наборов х\,

х%,

• • -, Xh.

Схема управления

для

данного

случая будет такой

же,

как и

схема системы управления для игр с седловой точкой.

Решение игры без информации. В принципе игры без информа­

ции для небольших матриц

(ѵХг)

мы уже

рассмотрели.

Игры

с платежными матрицами

(ѵХя)

большого

размера могут

быть

решены таким же образом, однако такие решения связаны

с боль­

шими вычислительными трудностями. Для решения игры

(ѵХп)

можно предложить, например, метод Брауна—Робинсона

 

[199],

дающий алгоритм, достаточно просто и быстро реализуемый на электронных вычислительных машинах.

Для матрицы ||û!jj|| построим векторную систему из ѵ-мерных векторов V и n-мерных векторов U

Ѵ(0),

 

Ѵ(\),

Vu,

 

(III.252)

U(0),

U

{I),

 

 

 

 

 

таким образом, что

 

 

 

 

 

 

V(k

+

 

\)=V(k)+Aj,

 

(III.253)

U(k

+

\)=U(k)

+ At,

 

где Aj — /-й столбец матрицы

||аг-;-||;

Лг--

і-ая

строка матрицы

||a,-j||. і и / определяются из

условий

 

 

 

vt

(£) =

max

V(k);

 

(III.254)

Uj (k)=m'm U

(k),

 

 

 

т. е. Vi(k)—максимальный

компонент V(k),

a

Uj(k) — минималь­

ный компонент U (k).

 

 

 

 

 

 

204


За Ѵ(0) и t/(0) можно принять произвольные столбец и строку матрицы IlOijU. В частности, когда U(0) = 0 и Ѵ(0) = 0 для каждого k я k' справедливо неравенство

тіпсУ (k)

max

V(k')

(Ш.255)

 

 

 

Если существуют такие k и k',

при которых

 

m i n £ / ( f e)

m a x ^ ( f e f )

 

(III.256)

ь

Т

if

>

 

то у есть решение игры.

 

 

 

 

 

Однако такие k и k'

существуют далеко

не всегда. Но при k,

k'-^oo эти две границы

приближаются

к цене игры, причем [247]

k

max V (k)

(III.257)

k •ï

Итак, если оборвать систему (III.252) на k-оы шаге, то получим

£/(£)=£/(<>)+2 °Лк)Аг,

(III.258)

V(k)=V(0)+

2 e ;

(k)Aj,

где

2 г ( * ) = Ä ;

(III.259)

ft

2<v(*)=ä.

Далее

 

«у (*)

(III.260)

 

Таким образом, получаем распределение частот Pj, т. е. опти­ мальную смешанную стратегию, при которой игрок Y получает вы­ игрыш не менее

т ' = т - о ( а - v+ L2 )-

(ш-261>

Возвращаясь назад к решению непрерывной игры без инфор­ мации, обнаруживаем идентичность результатов решения в обоих случаях. Как для непрерывной игры, так и для дискретной опти­ мальной стратегией игрока Y является оптимальная смешанная стратегия pj. Следовательно, и схемы управления для них одина-

205


ковы. Однако, если непрерывные игры (как было отмечено выше) в смешанных стратегиях в большинстве случаев не решаются, то для решения дискретных игр разработаны машинные алгоритмы.

Так, к алгоритму Брауна—Робинсона

[199] можно

добавить

итеративный алгоритм, предложенный Дж . Нейманом

[283], ал­

горитм Брауна и Дж . Неймана [262]і , где

оптимальные

смешан­

ные стратегии игрока У отыскиваются как предельные точки си­

стемы дифференциальных уравнений для

матриц вида (III.234),

алгоритм, основанный на методе двойного описания

[131,

159],

представляющий

собой

распространение графического

метода

[64,

146] решения игр

(2Хп)

на многомерные

игры (тХп)

т>2,

алго­

ритмы, основанные на решении эквивалентных задач линейного программирования [64, 224].

Алгоритм решения игры (ѵХ«) с платежной

матрицей

(III.234)

при

заданных

распределениях частот чистых

стратегий

природы

(qu

. . . , qu) не отличается от рассмотренного выше для игры

(ѵХ

Хг),

поэтому

здесь не рассматривается. Напомним только,

что,

как и ранее, решением игры является единственная чистая страте­ гия, так что построение специальной системы управления не тре­ буется.

Резюмируя результаты решения дискретных игр, можно отме­

тить перспективность применения изложенных здесь

алгоритмов

для медленно текущих процессов малой размерности.

 

Остановимся

еще на

одном

методе управления, предложенном

в работе

[274].

 

 

 

 

Идея

метода

состоит

в том,

что набором уравнений

регрессии

описывается работа флотатора. Флотатор, выполняя роль опера­ тора в системе, сознательно или бессознательно отрабатывает воз­ мущения, действующие на входе объекта управления, стремясь поддерживать процесс в некоторой заданной области. При этом совершенно безразлично, на основе какой информации он прини­ мает решение изменить управляющее воздействие — ориентируясь на конечные показатели качества концентратов и хвостов или на какие-то промежуточные признаки (цвет пены, нагруженность и т. п.), взятые в промежуточных точках процесса, так как любые изменения выходных переменных объекта или некоторых проме­ жуточных параметров являются следствием изменения состояния входных воздействий, которые флотатор может даже ни количест­ венно, ни качественно не оценивать.

Очевидно, если флотатор всегда стремится (и это ему удается) вывести процесс в некоторую заданную на пространстве выходных координат область, то управляющие воздействия будут достаточно тесно коррелировать с вектором входа, в то время как связи между выходными переменными и вектором входа и управляющих воз­ действий (вообще J/G2) могут быть весьма слабыми. Эта простая

1

Изложенный в работе [262] метод представляет одно из приложений ме­

тода

градиента '[251].

206


идея, основанная на отражении причинно-следственных отношений, впервые была применена в 1962 г. при построении системы управ­ ления флотацией на фабрике Лондон Милл (США) [272].

Математическая модель процесса в виде уравнений связи ме­

жду вектором неуправляемых входных воздействий z и вектором

управляющих воздействий у в форме уравнений регрессии можно представить в виде

У = ? ( г ) .

Для того чтобы получить достаточно надежные модели, необ­ ходимо учитывать некоторые особенности. Целевая функция управ­ ления при таком подходе не задана в явном виде, хотя цель уп­

равления, очевидно, состоит

в том, чтобы поддерживать

процесс

по выходным координатам в

некоторой заданной области,

причем

в первом приближении эта область задана некоторым многогран­ ником на пространстве выходных координат, например в виде ßI ?.t a <

< ß i j < ß ™ a x для

содержания

металла

в концентрате; 0

< ß j n <

<ß™i n — для содержания металла в хвостах.

 

По-видимому, границы этой

области могут быть заданы,

исходя

из технологических

предпосылок.

 

 

Если можно представить область, в

которую стремятся,

в та­

ком виде (при этом не запрещается ввести ограничения и на не­ которые другие показатели), то, выбрав из всей совокупности дан­ ных только такие, которые соответствуют поставленным ограниче­ ниям, можно найти связи вида г/'=ф(2), приняв которые за

уравнение управляющей модели

будем

стремиться

попасть

в желаемую область, осуществляя

таким

образом

субопти­

мальное управление технологическим процессом. Разумеется, мо­ дель имеет смысл только в том случае, если оценка тесноты связи

между у и z достаточно высока и надежна, т. е. описанный метод имеет смысл в том случае, когда модель достаточно близка к де­ терминированной. Поэтому неслучайно, что число элементов век­ тора z в модели достаточно большое, причем на первом шаге ис­ следований в качестве элементов вектора принимают любой пара­ метр, который на основе технологических или каких-либо других соображений может оказывать влияние на конечные показатели.

Число элементов в дальнейшем уменьшается за счет математи­ ческой оценки степени влияния путем использования, например, методов корреляционного анализа и отбрасывания незначимых па­ раметров.

При построении модели управления в таком виде в качестве выходных переменных для расчета определенного управляющего воздействия принимаются другие управляющие величины. Модель имеет пирамидальную структуру. Это объясняется тем, что флота­ ция представляет собой последовательно соединенные процессы.

207