Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 116

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

' ( Л Г - 1 ) + л

 

( Л Г — l ) - f - 2 n

 

1 I

V

,

 

 

 

 

 

1, N '

_

2,

;

j =

N+n

 

 

 

 

 

 

 

, (N-l)+2n

 

\ 2

 

 

 

"

i = N +

n

 

 

 

 

 

 

(N—

2

l)+2n

 

 

 

2, TV '

 

 

Л

3 ,

y

 

• a,

 

 

 

2n

 

 

j =

N

+ n

 

(N — l ) +

 

 

 

 

 

(ІѴ— l ) +

2n

 

 

 

i = N +

л;.з. f

+ —

S

* 3 ,

 

 

 

n

 

 

 

 

 

i — N-T- n

4. Завершение опознавания. В случае обнаружения неисправной работы датчика выдается оповещающий сигнал диспетчеру фаб­ рики (оператору главного корпуса) и прерывается работа первой

итретьей частей алгоритма.

И1.7. ОПТИМИЗАЦИЯ УПРАВЛЕНИЯ ФЛОТАЦИОННЫМИ ПРОЦЕССАМИ

Результатом рассмотрения вопросов управления флотацион­ ными процессами явилась постановка задачи оптимизации в нату­ ральном масштабе времени, выбор целевой функции управления и алгоритм расчета статической модели управляемого процесса

ввиде полинома (III.78).

Влитературе имеется очень немного предложений по оптими­ зации флотационных процессов в натуральном масштабе времени.

Значительное число работ посвящено статической оптимизации с последующим усовершенствованием технологических схем и реагентных режимов. Обсуждение этих вопросов выходит за рамки настоящей книги, и на них мы не останавливаемся. Укажем лишь, что наибольшее распространение получили известные и уже ранее упоминавшиеся методы Бокса—Уилсона и эволюционного планиро­ вания (так называемый «ЕѴОР»),

Вработе [286] указывается, например, что в системе управле­ ния флотационным процессом на фабрике Цинк Корпорейшн (Австралия) использовались методы оптимизации типа прямого по­ иска и «крутого восхождения». Однако эта работа не содержит сведений о применяемых алгоритмах. Поэтому не представляется возможным оценить их достоинства и недостатки. То же можно сказать о более ранней работе [79], где приводится лишь схема алгоритма управления процессом флотации угля без указания при­ меняемого метода оптимизации.

Вэтом плане выгодно отличается работа [217], где обсужда­ ется возможность приложения к задаче оптимизации флотацион­ ного процесса в натуральном масштабе времени метода стохасти­ ческих аппроксимаций, предложенного Кифером и Вольфовитцем

185


[278]. Причем автор работы [217] (с чем мы также согласны) за­ нялся отысканием подходящего метода потому, что метод Бокса— Уилсона для этих целей оказался не совсем эффективным, так как слишком высок уровень шумов рассматриваемых процессов.

Метод стохастических аппроксимаций лишен этого недостатка. Однако он обладает другим, не менее существенным недостатком — его эффективность резко убывает с увеличением размерности опти­ мизируемого процесса.

В самом деле, сущность метода, предложенного в работе

[217],

состоит в том, что для некоторой неслучайной

входной величины

(управляемый параметр), начиная с произвольного

значения

уи

последовательно

определяются

значения у г, ...,

уп,

так что уп

 

схо­

дится в некоторой точке Ѳ, в которой выходной параметр

и в сред­

нем имеет максимум. Предполагается, что величина и

имеет

(хотя

и неизвестное)

условное распределение H (и/у),

а

математическое

ожидание M (и/у)

принимает

максимум

строго

в точке

Ѳ,

т. е.

функция

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

со

 

 

 

 

 

 

 

 

 

 

 

 

—со

 

 

 

 

 

 

 

 

максимальна в точке Ѳ.

 

 

 

 

 

 

 

 

 

Для

многомерных процессов {у}

= у^\

уѴ\

...,

ут

(Ѳ — тоже

многомерная) приращения даются каждому входу

по очереди,

на­

пример, для z/W приращения даются

при

фиксированных

у&\ ...

..., z/m ) .

Таким

образом, для

этих

значений у&\

...,

г/<га)

отыски­

вается

max M

(и/у).

 

 

 

 

 

 

 

 

 

Такой единичный поиск необязательно приведет к максимуму выходной величины по всем управляемым параметрам, т. е. к max M («/y). Следовательно, для его отыскания придется много­ кратно повторять поиск.

Если учесть, что последующий поиск производится лишь после измерения величины выходного параметра и в установившемся ре­ жиме [217], то время поиска оптимальных значений всех управ­ лений становится недопустимо большим, что и определяет малую эффективность данного метода при большой размерности {у}.

В начале 60-х годов [123, 124] были предложены игровые алго­ ритмы оптимизации разделительных процессов сущность которых

1 Выбор игровых алгоритмов оптимизации для построения систем управле­ ния этими процессами не является неожиданным. Еще в 1956 г. Эшби В. Росс

[257] отметил, что поведение любой

системы регулирования

(управления)

можно описать таблицей исходов, которая

тождественна платежной

матрице соот­

ветствующей игры.

 

 

Нужно сказать, что 60-е годы характеризуются повышенным интересом ис­ следователей к теории игр при решении различных задач оптимизации. Так, при­ мерно в то же время М. Б. Гаджиев [47] предложил решение задачи о пресле­ довании, аналогичное задаче отыскания оптимальных стратегий в случае конф­ ликтной ситуации, т. е. когда управляющее воздействие выбирается двумя противниками. Один из них минимизирует, а другой максимизирует суммарную

186


состоит в том, что процесс выбора оптимальных технологических режимов представляется как игра двух групп лиц: первая группа лиц {х} представляет интересы природы (игрок X), которая, во­ обще говоря, относится безразлично к платежам. Вторая группа лиц {у} (игрок Y) стремится максимизировать свои выигрыш. Стратегиями (чистыми) природы являются всевозможные наборы

параметров xi, х%, • •-,

хи, стратегиями группы

{у}—наборы

у\,

уг,

• •., у т. Платежной

функцией игры является

К(хі, ..., Xk,

уи---

...,

у m) в виде полинома (III.80).

 

 

 

 

Процедура игры состоит в том, что оба игрока X и Y играют

бесконечное число партий (точнее, играют, пока существует

данный

управляемый процесс). Причем в каждой партии игроки

делают

по одному ходу, применяя любую из своих стратегий — численных наборов значений x i , xz, . • -, Xh для игрока X и наборов уи у-і, ...

..., ут для игрока Y. Расчет производится после каждой партии в со­ ответствии с заданной платежной функцией К{х, у).

Решение задачи отыскания оптимальных управлений в случае флотационного разделения (оптимальных реагентных режимов) можно свести к трем основным типам игр:

игра

без информации. Члены группы

{у} применяют свои стра­

тегии, не имея информации о примененной

природой стратегии;

группе {у} известны смешанные стратегии природы;

 

случай полной информации, соответствующий положению, когда

всякий выбор

стратегий {у}

связывается

с безусловным

знанием

примененной чистой стратегии

природы.

 

 

 

Решение этих типов игр можно провести как в непрерывной

форме (бесконечные

игры), так и в дискретной (матричные игры).

 

 

Построение

систем

управления

 

 

 

при

решении

непрерывных

игр

 

Выше была определена математическая модель флотационного

процесса

в виде некоторой поверхности отклика К (хі, ...,

х%, у и ...

ут),

заданной в

пространстве

значений параметров

х%, ..., хг

и у и ...,

ут,

определяющих процесс и отвечающих условиям

 

 

 

 

 

 

 

 

(Ш.214)

 

 

 

0 < У ; < ^ ;

7 = 1 ,

m,

(III.215)

где й{, bu Cj, dj — границы изменения параметров ХІ и у у

плату. В. Ю. Крылов и М. Л. Цейтлин [108] рассмотрели задачи, характерные при игровых ситуациях, для ограниченного числа конечных автоматов. Причем одну из задач [237] — поведение автоматов при игре с природой — М. Л. Цейт­ лин решил еще в 1960 г., применив почти игровую терминологию — «Штраф— нештраф». Интересные исследования проведены позднее Ю. А. Кочетковым [102] по выбору управлений.

В последние годы проводятся работы по использованию теории игр как перс­ пективного метода оптимизации.

187


При этом параметры {х} представляют собой возмущения си­

стемы

и являются случайными

стационарными (в

широком смы­

сле)

функциями

времени,

а

{у}—параметрами

управления.

Принимается, что функции распределения случайных процессов

X(t)

={xi(t),

 

Xk(t)}

 

и

Y(t)

=

{yi(t),

ym{t)}

соответствуют

F ( X i , ...,xh)

и

G(г/і,

y m

)

. *

 

 

 

 

В дальнейшем задачу отыскания оптимальных режимов пред­

ставляем в виде игры с платежной

функцией

 

 

К[х,

у)

=

2

 

.

a

i

t j

j

• • - *i*x

 

 

 

 

lk-

h

 

Jm

 

 

 

 

 

 

 

 

 

 

Xy\\

• • -, У™-

 

(Ш.216)

Решение игры и схема управления без информации. Управляю­

щие системы флотационных процессов представляют собой системы с неполной информацией; характерным для них является отсутст­

вие полного описания «поведения» в процессе управления,

так как

в этих описаниях трудно (или невозможно) учесть влияние

многих

факторов, существенно влияющих на ход процесса. Поэтому при построении модели игры можно представить, что управляемый про­

цесс ведет себя как игрок, применяющий

свои

стратегии (наборы

значений параметров

{х})

на

основании

некоторого,

неизвестного

игроку У закона распределения

F (X)

=F(xi,

...,

хи, который может

с течением времени

либо

меняться,

либо

оставаться

неизменным.

Максимизирующий игрок У (оптимизирующая система) должен вы­ работать для этих случаев оптимальную линию поведения.

Здесь рассматривается игра без информации с природой, кото­ рая представляет собой игрока бернуллиевского типа [176], т. е. иг­ рока, не использующего никакой информации о результатах игры. Иначе говоря, решения игры в предположении, что игрок X, раз применив стратегию с распределением F(X), в дальнейшем ее не меняет.

Это весьма важный случай, так как основные возмущающие факторы технологических процессов флотационного разделения представляют собой стационарные случайные функции времени,

обладающие свойством

эргодичности.

Как известно [43,

182, 196], для того чтобы убедиться в этом

в каждом конкретном

случае, достаточно найти для возмущающих

воздействий пределы

их нормированных автокорреляционных

функций

j

 

lim

[

K(t)dx.

Т -». оо

j

 

* Представление технологических режимов как случайных процессов может показаться необоснованным. Однако примерно с такой ситуацией исследователи столкнулись при решении некоторых задач в теории выбора статистических ре­ шений, на что обращает внимание Д ж . Нейман [162]. Такое допущение оказа­ лось удачным.

188


Если такой предел оказывается равным нулю, то данная слу­

 

чайная функция обладает свойством эргодичности.

 

 

 

 

 

Примеры определения эргодического свойства некоторых пара­

 

метров обогатительных процессов

можно

найти в работах

[27, 28],

 

а также

в книге

И. Г. Гринмана

[61], где нормированная

автокор­

 

реляционная функция содержания меди в руде одной из обогати­

 

тельных

фабрик

интерполируется

 

функцией К (т) = /~°'1 7 т ,

так

что

 

 

 

 

 

 

 

г

 

 

 

 

 

 

 

 

 

Обычно решение игры без информации начинается с отыскания

 

седловой

точки

 

[64,

146]. Поиск

ее

состоит

в

нахождении

 

max min К { х ,

 

у }

и

min max К

{

х ,

у

} . Если

max min К { х

,

у } =

у х

 

 

 

 

X

у

 

 

 

 

у х

имеет

сед-

 

= minmax/C{x,

у }

= К {

х а ,

г/о}, то

платежная функция

 

X

у

точке

{хо,

г/о}, которая

определяет

пару оптималь­

 

ловую точку в

 

ных стратегий:

0} — для

игрока X

и {г/о} — д л я игрока Y. На этом

 

решение игры

заканчивается.

 

 

 

 

 

 

 

 

 

Процедура поиска седловой точки платежной функции вида (III.216) для каждого конкретного случая в принципе известна, однако дать алгоритм ее отыскания в общем случае пока не уда­ ется. Определение такого алгоритма желательно, но не обяза­ тельно, так как, во-первых, наличие седловой точки для платежной функции К { х , у } большой размерности весьма маловероятно, а, вовторых, практически мы чаще всего сталкиваемся с играми, когда известны априорные распределения параметров {х}.

Здесь следует также указать замечание М. Дрешера о проверке

дискретных игр на седловую точку

[64], которое состоит в том,

что практически отыскание седловой

точки важно лишь для игр

с платежной матрицей малой размерности, так как увеличение ее

ведет к резкому уменьшению вероятности существования

седловой

точки

и для

игр

(mXm),

когда

( т > 1 0 0 )

эта

вероятность исче-

зающе

мала.

 

 

 

 

 

 

 

 

 

Рассмотрим наиболее интересный случай, когда

 

 

 

 

max min К

{х, у] <

min max К

\х,

у],

(111.217)

 

 

 

у

X

 

 

X

у

 

 

 

т. е. когда игра не имеет седловой точки.

 

 

 

Перепишем

платежную функцию

(III.216)

в виде [121]

 

 

 

 

 

 

 

R

 

 

 

 

 

 

 

 

 

К(Х,

УГ=2РГ(Х)0Г(П

 

 

 

(III.218)

где Х={ХІ,

...,

Xk}

и

К =

{г/і, ..., ут}—множества

соответствую­

щих параметров; РГ(Х)

и QR(Y) —некоторые

многочлены.

 

Игрок X использует в качестве чистых стратегий точки /^-мер­

ного параллелепипеда

Rk,

определенного соотношением

(III.214).

189