Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 16.10.2024

Просмотров: 113

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

85, 32, 121. Для этого примера новая матрица примет вид

1

1

10

100

120

0

0

0

 

2

2

9

30

101

115

О

О

 

 

 

 

21

36

85

32

131

(III.235)

ѵ0

13

20

0

0

0

0

0

 

Итак, если поступила информация о

том,

что

ХІ = Х ^ ,

ХІ~

=х®,

Xh = x&

соответствуют набору

36,

то

оптимальным

режимом для такой ситуации будет режим под № 5.

 

 

 

Рис. III.36. Схема управления для дискрет­

 

 

 

3 h**T~^"

 

ных

игр с полной информацией:

| /

|-»-ГТ~ТЧ

 

/ — о б ъ е к т у п р а в л е н и я ; 2 — с и с т е м а к о н т р о л я ; S —

 

 

 

 

 

у с т р о й с т в о к в а н т о в а н и я ;

4 — м а т р и ц а з н а ч е н и й ;

і

 

 

 

 

5 — к о м а н д н о е у с т р о й с т в о ; 6 — р е г у л я т о р п о д а ч и

I—2—Г™

 

I—£—I

 

 

р е а г е н т о в

 

 

 

 

 

Изложенное выше показывает, насколько прост алгоритм уп­ равления в случае игры с полной информацией.

Матрицу вида (ІІІ.235) можно легко представить матрицей значений [249]: наборы параметров {х} всегда можно коммутиро­ вать через проводимости на шины режимов. Снабдив такую мат­ рицу на входе устройством, переключающим вертикальные шины на источник питания в соответствии с квантованными значениями набора {х}, наблюдаемого в текущий момент времени, а на вы­ ходе—устройством-искателем максимального тока с указанием номера режима, можно применить ее в системе управления техно­ логическим контуром как устройство выработки управляющей ин­ формации.

Схема управления для этого случая показана на рис. III.36. Сигналы об измеренных системой контроля значениях параметров Х\, хг, • •., Хи поступают на вход устройства квантования, а затем — в матрицу значений. Командное устройство вырабатывает опти­ мальный режим для поступившей в матрицу ситуации и команд­ ную информацию для регуляторов подачи реагентов. Как и ранее, задание на регуляторы остается постоянным на промежутке вре­ мени Л7Л

Схема управления для дискретных игр с неполной информацией.

Предположим, что

получена

информация

о наборе

х°±, х°2, ...

6 5 х°п. Это значит,

что игрок

X применил

стратегию,

включаю­

щую этот набор. Поскольку все остальные неизмеряемые

параметры

199


xh+i, ...,

Xk, из всей группы xiy

функции

времени, то в момент

..., хк, ...,

xh — есть

случайные

получения

информации

игрок X

мог применить стратегию с любым

из

Ц

Л* оставшихся

наборов.

 

 

 

 

 

 

 

 

 

 

 

 

г = /н-1

 

 

 

 

 

 

 

 

Следовательно, задача максимизирующего игрока Y состоит в том,

чтобы

определить

свою

оптимальную

стратегию, если ему изве­

стно,

что

игрок А'

применил

стратегию

вида

 

(#°,

х°2,

...,

х° ,

xlh+i

,

...,

X*) и

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

неизвестно, какой

из

возможных

JJ

Aj

наборов

применил X в этой стратегии.

 

 

 

 

 

 

 

i-h+i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В создавшейся ситуации игрок Y может рассуждать

следующим

образом. Игрок X не применяет в данный момент стратегии с на­

борами,

не включающими

х^,

х°,

 

h . Поэтому можно,

вы­

черкнув столбцы матрицы (III.234),

отвечающие

этим

стратегиям,

получить новую

матрицу

игры

\\ац\\

[назовем

ее подматрицей

мат­

рицы

(III.234)] и найти ее решение.

 

 

 

 

 

 

 

 

 

 

Задача

состоит,

таким

образом,

в решении

игры

(ѵХг), где

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

г=

 

П А г < д .

 

 

 

 

 

 

(III.236)

 

 

 

 

 

 

 

 

 

/ =

й +

1

 

 

 

 

 

 

 

 

 

 

Здесь возможны три случая

[124].

 

 

 

 

 

 

 

 

 

Случай 1. Решение игры лежит

в

области

чистых

стратегий.

Для

решения

отыскивается

седловая точка

 

[146], для

чего

на­

ходятся

min max а0.*

по столбцам

и max min а0.^

по строкам. Если

 

 

 

 

 

 

min max a%=max

min а%,

 

 

 

 

 

(III.237)

то игра (ѵ Х'1 имеет седловую

точку: игрок Y имеет

единственную

(чистую)

оптимальную

 

стратегию,

которой

 

соответствует

max mina0

и всегда

будет

получать не менее этой

величины.

 

Таким образом, для рассматриваемого случая при поступлении

информации о наборе

х°,

х°2,

...,

h игрок

Y будет

иметь

единст­

венную

оптимальную

(чистую)

стратегию, т. е. набору х°,

х°, ...

...,

h

соответствует

единственный

оптимальный

режим.

 

 

Всего подматриц

(ѵХг)

 

будет столько, сколько

возможно набо-

 

Хі,

хг,

•. -, Хн,

 

 

 

h

 

 

 

 

 

 

 

 

 

 

 

 

ров

т. е.

Ц А*. Поступая

аналогичным

образом

 

 

 

 

 

 

 

 

І=І

 

 

 

 

 

 

 

 

 

 

 

 

с каждой из подматриц, находим

оптимальную

стратегию

для

лю-

 

 

набора х®,

х№,

...,

х® {1=1,

 

 

h

 

 

 

 

 

 

бого

 

2,

...,

JJ

А^). При этом

по-

лучим, что множество технологических ситуаций, определяемых информацией о параметрах хи х%, . .., хп, находится в однозначном соответствии с множеством технологических режимов. Отсюда оче­ видно, что структура и работа системы управления с неполной ин-

200


формацией для игры с седловой точкой аналогичны структуре и работе системы с полной информацией, показанной на рис. III.36.

Случай 2. Решение игры лежит в области смешанных страте­ гий, когда

л

max min a'j < min max а^, / = 1 , 2, . . ., П Аг.

(III.238)

і = \

В этом случае выигрыш игрока Y определяется как математи­ ческое ожидание

ЪаіъРіЯі,

(Ш.239)

где РІ и qi — частоты применения чистых стратегий соответственно игрокам Y и X, отвечающие условиям

 

 

V

г

 

1-

(ш-240)

/ 7 г > 0 ;

? е > 0 ;

2 А = 2 ^=

 

 

і=\

5=1

 

 

 

Задача состоит в отыскании оптимальных смешанных страте­

гий игрока У.

 

 

 

 

 

 

Пусть у — цена игры (ѵ Хг), тогда:

 

 

 

апр\+022^2+

• • •

+ < W v > 7 ;

 

(III.241)

 

 

 

 

 

 

О і , А + о 2 г А + • • • + а ѵ г Л > Y-

 

 

Разделим правые

и левые

части

неравенств

(III.241) на у и

положим

 

 

 

 

 

 

 

 

 

 

 

 

(ІІІ.242)

Тогда неравенства

(III.241)

примут вид

 

 

 

« 1 ^ 1 + 0 2 1 ^ 2 + • • •

> і ;

 

 

аі2?і + о2 2?2+ - • - +аѵ 2?ѵ >

1;

 

 

« 1 ^ 1 + ^ 2 +

- • - + a , r £ , >

1.

 

(III.243)

Преобразуем систему неравенств

(III.243)

в систему

уравнений,

введя фиктивную переменную Z | ^ 0 :

 

 

 

 

аи5і + « 2 і 5 2 + • • • + о ѵ і ^ - 2 , = 1;

 

Оі2Іі + о 2 2 ?2 + - • • + a v 2 Ê , — z 2

= l ;

 

 

 

 

 

 

 

 

(III.244)

201


Положим, что

Ф = 6 Ж , + . • . + 6 , = * +

»+1'~.

(ІІІ.245)

Необходимо

отыскать такие | І и Z|, чтобы они отвечали min Ф

(/ = 1, ѵ; | = 1 ,

г). Для этого

решим

систему

уравнений (III.244)

относительно | :

 

 

 

 

 

% 2 ~ C 2 \ Z \ ~\~C22Z2

~\~ • • •

~f~ C2TZT ~T~

k-2\

 

 

 

 

(III.246)

Просуммируем правые и левые части равенств (III.246):

2V

\і = Ф=гх

V2 c n + z 2

V2 с ' 2 + • •

V2 ^;r +const.

( = 1

 

1 = 1

 

i = l

i = l

 

 

 

 

 

(III.247)

Задача отыскания

Z | ^ 0

( | = 1, г), при которых

Ф обращается

в минимум, решается как вариационная задача отыскания услов­

ного экстремума (min) равенства

(111.247) при условии

£^=0 [247].

Найденные значения z\ подставляем в систему

равенств

(III.246) и определяем

Затем

по формуле (III.242)

подсчиты­

ваем значения частот рФ (і = 1, ѵ).

Таким образом, если игрок Y применяет смешанную стратегию с найденным оптимальным распределением рФ, то он всегда будет

получать выигрыш не меньше у, какую бы стратегию не применил

игрок

X.

 

 

игрок Y

 

 

 

 

 

 

Описанным

образом

должен

провести

решение

всех

h

 

(ѵХг)

 

 

 

 

 

 

 

 

Д А І

игр

и для

каждой

из

них

определить

оптимальное

І=І

 

 

 

 

 

h -

 

 

 

 

распределение частот рФ ( / = 1 , 2 , . . . ,

 

 

 

 

П ^ І ) -

 

 

 

 

 

 

 

 

 

t - i

 

 

 

 

В соответствии с этим система управления разделительной ус­

тановкой

должна включать в себя

случайный механизм,

выраба-

тывающий

h

 

 

 

 

 

 

управ-

П А І распределений р ф . Схематически система

 

 

г = 1

 

 

 

 

 

 

 

 

ления показана на рис. III.37.

 

 

 

 

 

 

Информация о текущей ситуации поступает на устройство срав­

нения

ситуаций,

которое

вырабатывает команду случайному

меха­

низму на выработку соответствующего этой ситуации распределе­ ния частот чистых стратегий рФ. Последний информирует команд-

202