Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.10.2024
Просмотров: 106
Скачиваний: 0
Уравнения (1-5-1) и (1-5-2) описывают «динамику» собственно ав томата. Взаимодействие автомата со средой определяется ответ ной реакцией среды s [к] на действия автомата / [к]. Поэтому вход ное воздействие на автомат зависит от выходных величин и пара метров среды.
Уравнение среды можно записать как
|
|
s [к] = |
eJ (/[fe],|[fc]). |
Здесь |
0 j — квантироваииая |
функция; | [к] — случайная решет |
|
чатая |
функция. |
Среда может быть представлена как еще одна |
|
обратная связь. |
Здесь обычно рассматривают задачи целенаправ |
ленного поведения автомата под влиянием среды. Впервые сфор мулировал и решил подобные задачи М. Л. Цетлин в 1964 г. Стра тегии автоматов в таких играх являются состояниями, а память автоматов определяет число стратегий.
В случае игры автоматов с нулевой суммой основная теорема о минимаксе (см. главу 1-3) остается справедливой.
Выше был приведен подход к теории игр автоматов, основан ный на представлении игры как динамической системы. Такой под ход, по-видимому, полезен для создания ' общей картины поста новки динамических задач и, несомненно, будет использован при решении конкретных задач. Однако в собственно теории игр ав томатов используется несколько иной подход, основанный на при веденном выше абстрактном определении автомата.
Создателем теории игр автоматов является выдающийся со ветский ученый кибернетик М. Л. Цетлин.
Ниже приведены основные положения теории игр автоматов, являющиеся сокращенным изложением его работы (1964).
Рассмотрим детерминированный автомат U, заданный своими
каноническими уравнениями |
|
|
||
Ф(г + |
1) = |
Ф ( Ф ( 0 , |
s(t + l)). |
(1-5-3) |
/ |
(г) = |
F (ф (0). |
|
(1-5-4) |
В этих уравнениях переменная t имеет смысл времени и предпола гается принимающей целочисленные значения t = 1, 2, ... Пред положим, что входная переменная s (t) может принимать лишь два значения: 0 и 1 (значение s = 0 соответствует единичному вы игрышу, а значение s = 1 — единичному проигрышу автомата 31). Предположим далее, что выходная переменная / (і) автомата может принимать X различных значений Д, / 2 , / х . Значения перемен ной / (t) называют действиями автомата, т. е. в момент t автомат 91 произвел d-e действие, если
/(0 = /а, а =1,2...%.
Предполагается также, что переменная ф (I) может принимать m различных значений фІ 5 ф2 ... ф т . Эти значения называются состояниями автомата, а число m — емкостью его памяти. Очевид-
50
но, что m > %. Автомат 3Î находится в момент t в /-м состоянии,
I — 1, 2 ...m, |
если |
ср (/) — q>j. Действие / а называется |
соответст |
вующим состоянию |
cpj, если F (ср7-) = / а . |
|
|
В этих обозначениях уравнение (1-5-4) описывает изменение |
|||
состояния автомата под воздействием входной переменной. |
|||
Уравнение |
(1-5-4) описывает зависимость действий |
автомата |
от его состояний. Входная переменная принимает лишь два значе ния, так что (1-5-3) задает пару отображений в себя множества состояний автомата; одно из этих отображений задано для s = О, другое — для s = l .
Эти отображения записывают в виде специальной матрицы состояний \\а,ц (s) U, i, j = 1, 2 ... m, где каждая строка ее при любом фиксированном значении s содержит в точности один эле мент, равный единице, а остальные элементы равны нулю. Матрица
IIаи |
(s) II |
определяет |
переходы |
состояний |
детерминированного |
|||
автомата следующим образом: если в момент t автомат |
находился |
|||||||
в состоянии фг, то в момент |
t + |
1 он перейдет в такое |
состояние |
|||||
Ф;, |
для |
которого ац |
(s (t + |
1)) = 1. |
Стохастический |
автомат |
||
также имеет конечное |
число |
состояний |
ф^ |
ф2 ... ф т и |
конечное |
число действий fu / 2 ... / х ; как и для детерминированных автоматов, описанных выше, мы будем предполагать, что входная переменная принимает лишь два значения: S = 0 и S.= 1. Действия стохасти ческого автомата однозначно определяются его состоянием: / (і) =
= |
F (ф (t)), а матрицы состояний || аі} |
(s) ||, s = 0, 1 являются |
сто |
|
хастическими. При этом ац (s) |
имеет |
смысл вероятности перехо |
||
да |
из і-го состояния в jf-e при |
заданном значении входной |
пере |
менной. Очевидно, что детерминированные автоматы являются частным случаем стохастических. Автомат 31 находится в стацио
нарной |
случайной |
среде |
С —С |
(аг, |
а2 ... ах), |
если |
действия ав |
|||||
томата |
и |
значения |
его входной |
переменной связаны |
следующим |
|||||||
образом: |
действие |
/ а , а = 1, 2 ... %, произведенное |
автоматом в |
|||||||||
момент |
t, |
влечет за собой в момент |
t -J- 1 значение |
s = |
1 |
(проиг- |
||||||
|
|
|
|
|
1 — аа |
|
|
|
|
|
|
|
рыш) с вероятностью ра |
= — ^ — |
и s = |
О (выигрыш) |
с |
вероят- |
|||||||
ностыо qa |
— |
2— • При этом предполагается, что | аа\ ^ |
1. |
|||||||||
Пусть в момент I автомат находился в состоянии ф;, і = |
1, 2 ... |
|||||||||||
... m, которому соответствует действие fai |
— F (фг ). Тогда |
вероят |
||||||||||
ность ptj |
перехода |
автомата из состояния ф; в состояние ф; опре |
||||||||||
деляется |
формулой |
|
|
|
|
|
|
|
|
|||
|
Pu = |
Рагаи |
(!) + |
Я<ч а и |
(°)> |
і, 7 = |
1, 2 ... m, |
|
||||
причем матрица Р |
= || ptj |
|| является стохастической. |
Таким обра |
зом, функционирование автомата в стационарной случайной среде описывается цепью Маркова.
Обозначим через rt финальную вероятность состояния ф£ ав томата, находящегося в стационарной случайной среде С.
51
|
Обозначим через аа; |
а = |
1, 2 ... % сумму |
финальных |
вероят |
|||||
ностей таких состояний ср(, |
которым |
соответствует |
действие |
/ а . |
||||||
Величины un имеют смысл вероятностей действия / а |
автомата |
% |
||||||||
в |
среде |
С. |
|
|
|
|
|
|
|
|
|
Математическое ожидание |
W ($1, С) выигрыша для |
автомата |
|||||||
Э( в среде |
С выражается формулой |
|
|
|
|
|
||||
|
|
W(VL, С) |
2 °<*а«- |
|
|
|
|
|||
|
|
|
|
|
а = 1 |
|
|
|
|
|
Очевидно, |
что |
|
|
|
|
|
|
|
|
|
|
|
т і п ( а 1 . .. а х |
) ^ W(Vi, |
С)^ |
тах(а х ... ак). |
|
|
|
||
|
Целесообразность поведения автомата заключается в увеличе |
|||||||||
нии W. Автомат 21 обладает |
целесообразным |
поведением |
в среде |
|||||||
С, |
если |
|
|
|
|
|
|
|
|
|
|
|
W (U, о |
|
|
+ в » + . . . + |
вх). |
|
|
|
Для автомата, совершающего свои действия равновероятно и
независимо |
от реакций |
среды, |
W |
=•— (сц + |
Q-г + |
••• + а*)- |
||
Простейшим |
примером |
автомата, |
обладающего |
целесообразным |
||||
поведением, служит |
автомат L 2 |
l 2 , |
имеющий два состояния: ф! и |
|||||
ф2 и два действия: |
Д = |
F (ц),) |
и |
/ 2 = |
F (ф2 ). Автомат |
сохраняет |
свои состояния при выигрыше и изменяет при проигрыше. Мат рицы состояний имеют вид
II ««(1)1 |
0 |
1 |
К |
(0)« = |
1 |
о |
|
1 |
О |
||||||
|
|
|
0 |
1 |
Пусть автомат L 2 ) 2 погружен в среду С (п1, сі2 ). Построив матрицу переходных вероятностей
\\Яі Pi
Р = I р 2 Ч.Ч.
1 - я ,
г = 1,2,
находим для вычисления финальных вероятностей гг и г2 уравне ния
Воспользовавшись еще |
условием |
нормировки |
гх -\- г2 |
1, имеем |
||
Гі = |
Р2 |
|
„ _ |
рі |
|
|
Рі +рг |
' |
Го = • |
Р1 + Р2 |
' |
|
|
Для математического |
ожидания |
выигрыша |
получаем |
выраже- |
||
ние |
|
|
|
|
|
|
W(L2t2,C) |
= |
|
|
|
|
52
Легко |
видеть, |
что W(L2,2, |
С)^>а1~^при |
|
|
a1=f=a2,T. е. |
|||||||||||||
что |
автомат |
L 2 |
l 2 |
обладает целесообразным |
|
поведением в стацио |
|||||||||||||
нарной |
случайной |
среде. |
|
|
|
|
|
|
|
|
|
|
|
||||||
Рассмотрим |
коллективное |
поведение |
(игру) |
автоматов |
5t1, ... |
||||||||||||||
3tv. Предполагается, что |
каждый |
из этих |
автоматов |
задан |
|||||||||||||||
своими матрицами состояний и уравнениями (1-5-3), |
(1-5-4). |
||||||||||||||||||
Пусть далее sj (l), |
f (t), |
cp3 (l), / = 1, |
v — значения |
входной |
|||||||||||||||
переменной, выходной переменной и состояния |
автомата |
в |
|||||||||||||||||
момент t. Будем по-прежнему предполагать, что входная |
перемен |
||||||||||||||||||
ная s3 |
{і) принимает лишь два значения: s* (l) — 0 и sJ ( i ) = 1, со |
||||||||||||||||||
ответствующие |
(единичным) |
выигрышу |
и |
проигрышу |
|
автомата |
|||||||||||||
в момент t. Выходная переменная /J |
(і) |
предполагается |
при |
||||||||||||||||
нимающей |
значение из множества Д ... fx.. |
|
Эти значения |
назы |
|||||||||||||||
вают стратегиями автомата %' и говорят, что в момент t |
автомат |
||||||||||||||||||
9F использует свою а-ю стратегию, |
если |
f |
(t) = |
fa. |
Значения |
||||||||||||||
фі ••• фЦ переменной cpJ |
(I) назовем состояниями |
автомата W, |
|||||||||||||||||
а число nij — емкостью его памяти. Очевидно, что rrij |
|
и зада |
|||||||||||||||||
ны матрицы |
состояний |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
II <& (s;' (0) I), |
|
у = |
1 ... v; |
i,k = |
l...my, |
|
|
|
|||||||||
|
|
|
|
|
|
s1 |
(0 = |
0,1 |
|
|
|
|
|
|
|
|
|
|
|
автоматов Э11 ... 5tv. |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Перейдем к описанию |
игры автоматов. Назовем партией / (t), |
||||||||||||||||||
разыгрываемой |
в момент |
t, набор / (0 = |
(Z1 |
(0 |
••• f" (0) |
страте |
|||||||||||||
гий, |
используемых в момент |
t |
автоматами |
5t1 ...ЭДѴ.Исходом |
|||||||||||||||
s (t -f- 1) |
партии |
/ (t) |
назовем |
набор |
s (t -f- 1) = |
(s1 |
(t - f 1) ... |
||||||||||||
... sv (t -f- 1)) |
значений |
входных |
переменных (единичных |
выиг |
|||||||||||||||
рышей и проигрышей) этих автоматов |
в момент t -f- 1. |
Игра Г |
|||||||||||||||||
автоматов |
Si1 ... 3tv задана, если |
для каждой партии / (t) задана |
|||||||||||||||||
вероятность Р (/, s) ее исхода s (f -f- 1); равенство |
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
2p(/,S) = l |
|
|
|
|
|
|
|
(1-5-5) |
|||
|
|
|
|
|
|
|
|
s |
|
|
|
|
|
|
|
|
|
|
|
имеет место при любом /. |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
Таким образом, игра Г автоматов |
... 9tv |
состоит из последо |
вательности партий / (I), t= 1,2 ... исходы s (f -f- 1) которых опре деляются вероятностями р (/ (t), s (t + 1)).
Платежные функции v* (f), / = 1 . . . ѵ , задающие игру Г*, имеют смысл математического ожидания выигрыша /-го игрока при
наборе |
стратегий / и однозначно восстанавливаются по вероятно |
|
стям исходов по формуле |
|
|
vj(f) = |
2 [p&s1 ...^-1 , 0, s^...s^-p(f,sK..s^, |
1, sto...*% |
|
|
(1-5-6) |
53
Игру V лиц Г* назовем эквивалентной игре автоматов Г. Заметим, что задание игры Г* не определяет однозначно игры автоматов Г. В самом деле, игра Г* задается ѵ функциями Ѵ] (/), а игра Г зада
ется 2Ч — 1 вероятностями р |
(/, |
s) |
для каждой партии /. |
||
Назовем игру ѵ автоматов |
Г игрой с независимыми исходами, |
||||
если |
|
|
|
V |
|
|
|
|
|
|
|
p(f,s) = |
p(f,sK..s")= |
Л pi |
(/,#'), |
||
где |
|
|
|
3=1 |
|
|
|
|
|
|
|
р - '(/,0), />'(/, |
1 ) > 0 ; |
У |
(/, 0) + |
p(f, 1) = 1. |
Произвольная игра Г* позволяет однозначно построить игру авто матов с независимыми исходами; при этом
|
p4f,sj) |
= |
^a+(-i)sl'v4f)]. |
|
|
Система |
автоматов |
511 |
... 3ÎV, участвующих в игре Г, |
находит |
|
ся в состоянии a (t) = |
(ccj. ... аѵ ), если в момент t автомат W на |
||||
ходится В СОСТОЯНИИ ф а , |
Clj = |
1 ... Iflj, ) = 1 . . . Л>. |
|
||
Определенные таким образом модели коллективного |
поведения |
||||
автоматов |
используют |
язык |
теории игр. Однако возникающие |
здесь определения игр автоматов и способы поведения в этих иг рах значительно отличаются от точки зрения, принятой в теории игр.
В самом деле, в теории игр предполагается, что система пла тежных функций, определяющих игру, заранее сообщается ее участникам. Игрок должен использовать эту информацию для того, чтобы определить свою стратегию (обычно смешанную), кото рая в ходе самой игры уже не изменяется; для выбора стратегии разрешается использование любых вычислительных средств.
Игры автоматов определяются заданием не только системы пла тежных функций, но и конструкций играющих автоматов. Авто маты, участвующие в играх, априорной информацией об игре не обладают. Ходы определяются лишь проигрышами и выигрышами в ходе самой игры.
Роль платежных функций, задающих игру, и партнеров авто мата по игре сводится поэтому лишь к образованию более или ме нее сложной случайной среды, в которой автомат должен обладать целесообразным поведением.
П р и м е р . Игра двух автоматов с нулевой суммой. Рассмот рим игру Г, в которой участвуют автоматы. 9t1 и W, имеющие со
ответственно M ж N стратегий: (щ — М, и 2 = |
N). |
Предположим, что в каждой партии / = (f1, |
f) этой игры один |
из двух автоматов выигрывает, а другой проигрывает. Тогда ве роятности р (/, s) — р (f, f, s1 , s2 ) исходов s— (s1 , s2 ) равны нулю при s1 =
54