Файл: Лебедкин, В. Ф. Проектирование систем управления обогатительными производствами.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 16.10.2024
Просмотров: 113
Скачиваний: 0
85, 32, 121. Для этого примера новая матрица примет вид
1 |
1 |
10 |
100 |
120 |
0 |
0 |
0 |
|
2 |
2 |
9 |
30 |
101 |
115 |
О |
О |
|
|
|
|
21 |
36 |
85 |
32 |
131 |
(III.235) |
ѵ0 |
13 |
20 |
0 |
0 |
0 |
0 |
0 |
|
Итак, если поступила информация о |
том, |
что |
ХІ = Х ^ , |
ХІ~ |
|||
=х®, |
Xh = x& |
соответствуют набору |
№ |
36, |
то |
оптимальным |
|
режимом для такой ситуации будет режим под № 5. |
|
|
|
||||
Рис. III.36. Схема управления для дискрет |
|
|
|
3 h**T~^" |
|
||
ных |
игр с полной информацией: |
| / |
|-»-ГТ~ТЧ |
|
|||
/ — о б ъ е к т у п р а в л е н и я ; 2 — с и с т е м а к о н т р о л я ; S — |
|
|
|
|
|
||
у с т р о й с т в о к в а н т о в а н и я ; |
4 — м а т р и ц а з н а ч е н и й ; |
і |
|
|
|
|
|
5 — к о м а н д н о е у с т р о й с т в о ; 6 — р е г у л я т о р п о д а ч и |
I—2—Г™ |
|
I—£—I |
|
|||
|
р е а г е н т о в |
|
|
|
|
|
Изложенное выше показывает, насколько прост алгоритм уп равления в случае игры с полной информацией.
Матрицу вида (ІІІ.235) можно легко представить матрицей значений [249]: наборы параметров {х} всегда можно коммутиро вать через проводимости на шины режимов. Снабдив такую мат рицу на входе устройством, переключающим вертикальные шины на источник питания в соответствии с квантованными значениями набора {х}, наблюдаемого в текущий момент времени, а на вы ходе—устройством-искателем максимального тока с указанием номера режима, можно применить ее в системе управления техно логическим контуром как устройство выработки управляющей ин формации.
Схема управления для этого случая показана на рис. III.36. Сигналы об измеренных системой контроля значениях параметров Х\, хг, • •., Хи поступают на вход устройства квантования, а затем — в матрицу значений. Командное устройство вырабатывает опти мальный режим для поступившей в матрицу ситуации и команд ную информацию для регуляторов подачи реагентов. Как и ранее, задание на регуляторы остается постоянным на промежутке вре мени Л7Л
Схема управления для дискретных игр с неполной информацией.
Предположим, что |
получена |
информация |
о наборе |
х°±, х°2, ... |
6 5 х°п. Это значит, |
что игрок |
X применил |
стратегию, |
включаю |
щую этот набор. Поскольку все остальные неизмеряемые |
параметры |
199
xh+i, ..., |
Xk, из всей группы xiy |
функции |
времени, то в момент |
..., хк, ..., |
xh — есть |
случайные |
получения |
информации |
игрок X |
мог применить стратегию с любым |
из |
Ц |
Л* оставшихся |
наборов. |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
г = /н-1 |
|
|
|
|
|
|
|
|
|
Следовательно, задача максимизирующего игрока Y состоит в том, |
|||||||||||||||||||||
чтобы |
определить |
свою |
оптимальную |
стратегию, если ему изве |
|||||||||||||||||
стно, |
что |
игрок А' |
применил |
стратегию |
вида |
|
(#°, |
х°2, |
..., |
х° , |
|||||||||||
xlh+i |
, |
..., |
X*) и |
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
неизвестно, какой |
из |
возможных |
JJ |
Aj |
наборов |
||||||||||||||||
применил X в этой стратегии. |
|
|
|
|
|
|
|
i-h+i |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
В создавшейся ситуации игрок Y может рассуждать |
следующим |
||||||||||||||||||||
образом. Игрок X не применяет в данный момент стратегии с на |
|||||||||||||||||||||
борами, |
не включающими |
х^, |
х°, |
|
x°h . Поэтому можно, |
вы |
|||||||||||||||
черкнув столбцы матрицы (III.234), |
отвечающие |
этим |
стратегиям, |
||||||||||||||||||
получить новую |
матрицу |
игры |
\\ац\\ |
[назовем |
ее подматрицей |
мат |
|||||||||||||||
рицы |
(III.234)] и найти ее решение. |
|
|
|
|
|
|
|
|
|
|
||||||||||
Задача |
состоит, |
таким |
образом, |
в решении |
игры |
(ѵХг), где |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
г= |
|
П А г < д . |
|
|
|
|
|
|
(III.236) |
||||
|
|
|
|
|
|
|
|
|
/ = |
й + |
1 |
|
|
|
|
|
|
|
|
|
|
Здесь возможны три случая |
[124]. |
|
|
|
|
|
|
|
|
|
|||||||||||
Случай 1. Решение игры лежит |
в |
области |
чистых |
стратегий. |
|||||||||||||||||
Для |
решения |
отыскивается |
седловая точка |
|
[146], для |
чего |
на |
||||||||||||||
ходятся |
min max а0.* |
по столбцам |
и max min а0.^ |
по строкам. Если |
|||||||||||||||||
|
|
|
|
|
|
min max a%=max |
min а%, |
|
|
|
|
|
(III.237) |
||||||||
то игра (ѵ Х'1 имеет седловую |
точку: игрок Y имеет |
единственную |
|||||||||||||||||||
(чистую) |
оптимальную |
|
стратегию, |
которой |
|
соответствует |
|||||||||||||||
max mina0 |
и всегда |
будет |
получать не менее этой |
величины. |
|
||||||||||||||||
Таким образом, для рассматриваемого случая при поступлении |
|||||||||||||||||||||
информации о наборе |
х°, |
х°2, |
..., |
x°h игрок |
Y будет |
иметь |
единст |
||||||||||||||
венную |
оптимальную |
(чистую) |
стратегию, т. е. набору х°, |
х°, ... |
|||||||||||||||||
..., |
x°h |
соответствует |
единственный |
оптимальный |
режим. |
|
|
||||||||||||||
Всего подматриц |
(ѵХг) |
|
будет столько, сколько |
возможно набо- |
|||||||||||||||||
|
Хі, |
хг, |
•. -, Хн, |
|
|
|
h |
|
|
|
|
|
|
|
|
|
|
|
|
||
ров |
т. е. |
Ц А*. Поступая |
аналогичным |
образом |
|||||||||||||||||
|
|
|
|
|
|
|
|
І=І |
|
|
|
|
|
|
|
|
|
|
|
|
|
с каждой из подматриц, находим |
оптимальную |
стратегию |
для |
лю- |
|||||||||||||||||
|
|
набора х®, |
х№, |
..., |
х® {1=1, |
|
|
h |
|
|
|
|
|
|
|||||||
бого |
|
2, |
..., |
JJ |
А^). При этом |
по- |
лучим, что множество технологических ситуаций, определяемых информацией о параметрах хи х%, . .., хп, находится в однозначном соответствии с множеством технологических режимов. Отсюда оче видно, что структура и работа системы управления с неполной ин-
200
формацией для игры с седловой точкой аналогичны структуре и работе системы с полной информацией, показанной на рис. III.36.
Случай 2. Решение игры лежит в области смешанных страте гий, когда
л
max min a'j < min max а^, / = 1 , 2, . . ., П Аг. |
(III.238) |
і = \
В этом случае выигрыш игрока Y определяется как математи ческое ожидание
ЪаіъРіЯі, |
(Ш.239) |
где РІ и qi — частоты применения чистых стратегий соответственно игрокам Y и X, отвечающие условиям
|
|
V |
г |
|
1- |
(ш-240) |
/ 7 г > 0 ; |
? е > 0 ; |
2 А = 2 ^= |
||||
|
|
і=\ |
5=1 |
|
|
|
Задача состоит в отыскании оптимальных смешанных страте |
||||||
гий игрока У. |
|
|
|
|
|
|
Пусть у — цена игры (ѵ Хг), тогда: |
|
|
|
|||
апр\+022^2+ |
• • • |
+ < W v > 7 ; |
|
(III.241) |
||
|
|
|
|
|
|
|
О і , А + о 2 г А + • • • + а ѵ г Л > Y- |
|
|
||||
Разделим правые |
и левые |
части |
неравенств |
(III.241) на у и |
||
положим |
|
|
|
|
|
|
|
|
|
|
|
|
(ІІІ.242) |
Тогда неравенства |
(III.241) |
примут вид |
|
|
|
|
« 1 ^ 1 + 0 2 1 ^ 2 + • • • |
> і ; |
|
|
|||
аі2?і + о2 2?2+ - • - +аѵ 2?ѵ > |
1; |
|
|
|||
« 1 ^ 1 + ^ 2 + |
- • - + a , r £ , > |
1. |
|
(III.243) |
||
Преобразуем систему неравенств |
(III.243) |
в систему |
уравнений, |
|||
введя фиктивную переменную Z | ^ 0 : |
|
|
|
|
||
аи5і + « 2 і 5 2 + • • • + о ѵ і ^ - 2 , = 1; |
|
|||||
Оі2Іі + о 2 2 ?2 + - • • + a v 2 Ê , — z 2 |
= l ; |
|
|
|||
|
|
|
|
|
|
(III.244) |
201
Положим, что
Ф = 6 Ж , + . • . + 6 , = * + |
»+1'~+Р. |
(ІІІ.245) |
||
Необходимо |
отыскать такие | І и Z|, чтобы они отвечали min Ф |
|||
(/ = 1, ѵ; | = 1 , |
г). Для этого |
решим |
систему |
уравнений (III.244) |
относительно | : |
|
|
|
|
|
% 2 ~ C 2 \ Z \ ~\~C22Z2 |
~\~ • • • |
~f~ C2TZT ~T~ |
k-2\ |
|
|
|
|
(III.246) |
Просуммируем правые и левые части равенств (III.246):
2V |
\і = Ф=гх |
V2 c n + z 2 |
V2 с ' 2 + • • |
V2 ^;r +const. |
|
( = 1 |
|
1 = 1 |
|
i = l |
i = l |
|
|
|
|
|
(III.247) |
Задача отыскания |
Z | ^ 0 |
( | = 1, г), при которых |
Ф обращается |
в минимум, решается как вариационная задача отыскания услов
ного экстремума (min) равенства |
(111.247) при условии |
£^=0 [247]. |
|
Найденные значения z\ подставляем в систему |
равенств |
||
(III.246) и определяем |
Затем |
по формуле (III.242) |
подсчиты |
ваем значения частот рФ (і = 1, ѵ).
Таким образом, если игрок Y применяет смешанную стратегию с найденным оптимальным распределением рФ, то он всегда будет
получать выигрыш не меньше у, какую бы стратегию не применил
игрок |
X. |
|
|
игрок Y |
|
|
|
|
|
|
Описанным |
образом |
должен |
провести |
решение |
всех |
|||||
h |
|
(ѵХг) |
|
|
|
|
|
|
|
|
Д А І |
игр |
и для |
каждой |
из |
них |
определить |
оптимальное |
|||
І=І |
|
|
|
|
|
h - |
|
|
|
|
распределение частот рФ ( / = 1 , 2 , . . . , |
|
|
|
|
||||||
П ^ І ) - |
|
|
|
|||||||
|
|
|
|
|
|
t - i |
|
|
|
|
В соответствии с этим система управления разделительной ус |
||||||||||
тановкой |
должна включать в себя |
случайный механизм, |
выраба- |
|||||||
тывающий |
h |
|
|
|
|
|
|
управ- |
||
П А І распределений р ф . Схематически система |
||||||||||
|
|
г = 1 |
|
|
|
|
|
|
|
|
ления показана на рис. III.37. |
|
|
|
|
|
|
||||
Информация о текущей ситуации поступает на устройство срав |
||||||||||
нения |
ситуаций, |
которое |
вырабатывает команду случайному |
меха |
низму на выработку соответствующего этой ситуации распределе ния частот чистых стратегий рФ. Последний информирует команд-
202