Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.10.2024

Просмотров: 106

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Уравнения (1-5-1) и (1-5-2) описывают «динамику» собственно ав­ томата. Взаимодействие автомата со средой определяется ответ­ ной реакцией среды s [к] на действия автомата / [к]. Поэтому вход­ ное воздействие на автомат зависит от выходных величин и пара­ метров среды.

Уравнение среды можно записать как

 

 

s [к] =

eJ (/[fe],|[fc]).

Здесь

0 j — квантироваииая

функция; | [к] — случайная решет­

чатая

функция.

Среда может быть представлена как еще одна

обратная связь.

Здесь обычно рассматривают задачи целенаправ­

ленного поведения автомата под влиянием среды. Впервые сфор­ мулировал и решил подобные задачи М. Л. Цетлин в 1964 г. Стра­ тегии автоматов в таких играх являются состояниями, а память автоматов определяет число стратегий.

В случае игры автоматов с нулевой суммой основная теорема о минимаксе (см. главу 1-3) остается справедливой.

Выше был приведен подход к теории игр автоматов, основан­ ный на представлении игры как динамической системы. Такой под­ ход, по-видимому, полезен для создания ' общей картины поста­ новки динамических задач и, несомненно, будет использован при решении конкретных задач. Однако в собственно теории игр ав­ томатов используется несколько иной подход, основанный на при­ веденном выше абстрактном определении автомата.

Создателем теории игр автоматов является выдающийся со­ ветский ученый кибернетик М. Л. Цетлин.

Ниже приведены основные положения теории игр автоматов, являющиеся сокращенным изложением его работы (1964).

Рассмотрим детерминированный автомат U, заданный своими

каноническими уравнениями

 

 

Ф(г +

1) =

Ф ( Ф ( 0 ,

s(t + l)).

(1-5-3)

/

(г) =

F (0).

 

(1-5-4)

В этих уравнениях переменная t имеет смысл времени и предпола­ гается принимающей целочисленные значения t = 1, 2, ... Пред­ положим, что входная переменная s (t) может принимать лишь два значения: 0 и 1 (значение s = 0 соответствует единичному вы­ игрышу, а значение s = 1 — единичному проигрышу автомата 31). Предположим далее, что выходная переменная / (і) автомата может принимать X различных значений Д, / 2 , / х . Значения перемен­ ной / (t) называют действиями автомата, т. е. в момент t автомат 91 произвел d-e действие, если

/(0 = /а, а =1,2...%.

Предполагается также, что переменная ф (I) может принимать m различных значений фІ 5 ф2 ... ф т . Эти значения называются состояниями автомата, а число m — емкостью его памяти. Очевид-

50


но, что m > %. Автомат 3Î находится в момент t в /-м состоянии,

I — 1, 2 ...m,

если

ср (/) — q>j. Действие / а называется

соответст­

вующим состоянию

cpj, если F (ср7-) = / а .

 

В этих обозначениях уравнение (1-5-4) описывает изменение

состояния автомата под воздействием входной переменной.

Уравнение

(1-5-4) описывает зависимость действий

автомата

от его состояний. Входная переменная принимает лишь два значе­ ния, так что (1-5-3) задает пару отображений в себя множества состояний автомата; одно из этих отображений задано для s = О, другое — для s = l .

Эти отображения записывают в виде специальной матрицы состояний \\а,ц (s) U, i, j = 1, 2 ... m, где каждая строка ее при любом фиксированном значении s содержит в точности один эле­ мент, равный единице, а остальные элементы равны нулю. Матрица

IIаи

(s) II

определяет

переходы

состояний

детерминированного

автомата следующим образом: если в момент t автомат

находился

в состоянии фг, то в момент

t +

1 он перейдет в такое

состояние

Ф;,

для

которого ац

(s (t +

1)) = 1.

Стохастический

автомат

также имеет конечное

число

состояний

ф^

ф2 ... ф т и

конечное

число действий fu / 2 ... / х ; как и для детерминированных автоматов, описанных выше, мы будем предполагать, что входная переменная принимает лишь два значения: S = 0 и S.= 1. Действия стохасти­ ческого автомата однозначно определяются его состоянием: / (і) =

=

F (t)), а матрицы состояний || аі}

(s) ||, s = 0, 1 являются

сто­

хастическими. При этом ац (s)

имеет

смысл вероятности перехо­

да

из і-го состояния в jf-e при

заданном значении входной

пере­

менной. Очевидно, что детерминированные автоматы являются частным случаем стохастических. Автомат 31 находится в стацио­

нарной

случайной

среде

С —С

г,

а2 ... ах),

если

действия ав­

томата

и

значения

его входной

переменной связаны

следующим

образом:

действие

/ а , а = 1, 2 ... %, произведенное

автоматом в

момент

t,

влечет за собой в момент

t -J- 1 значение

s =

1

(проиг-

 

 

 

 

 

1 аа

 

 

 

 

 

 

рыш) с вероятностью ра

= — ^ —

и s =

О (выигрыш)

с

вероят-

ностыо qa

2— • При этом предполагается, что | аа\ ^

1.

Пусть в момент I автомат находился в состоянии ф;, і =

1, 2 ...

... m, которому соответствует действие fai

— F г ). Тогда

вероят­

ность ptj

перехода

автомата из состояния ф; в состояние ф; опре­

деляется

формулой

 

 

 

 

 

 

 

 

 

Pu =

Рагаи

(!) +

Я<ч а и

(°)>

і, 7 =

1, 2 ... m,

 

причем матрица Р

= || ptj

|| является стохастической.

Таким обра­

зом, функционирование автомата в стационарной случайной среде описывается цепью Маркова.

Обозначим через rt финальную вероятность состояния ф£ ав­ томата, находящегося в стационарной случайной среде С.

51


 

Обозначим через аа;

а =

1, 2 ... % сумму

финальных

вероят­

ностей таких состояний ср(,

которым

соответствует

действие

/ а .

Величины un имеют смысл вероятностей действия / а

автомата

%

в

среде

С.

 

 

 

 

 

 

 

 

 

Математическое ожидание

W ($1, С) выигрыша для

автомата

Э( в среде

С выражается формулой

 

 

 

 

 

 

 

W(VL, С)

2 °<*а«-

 

 

 

 

 

 

 

 

 

а = 1

 

 

 

 

 

Очевидно,

что

 

 

 

 

 

 

 

 

 

 

т і п ( а 1 . .. а х

) ^ W(Vi,

С)^

тах(а х ... ак).

 

 

 

 

Целесообразность поведения автомата заключается в увеличе­

нии W. Автомат 21 обладает

целесообразным

поведением

в среде

С,

если

 

 

 

 

 

 

 

 

 

 

 

W (U, о

 

 

+ в » + . . . +

вх).

 

 

 

Для автомата, совершающего свои действия равновероятно и

независимо

от реакций

среды,

W

=•— (сц +

Q-г +

••• + а*)-

Простейшим

примером

автомата,

обладающего

целесообразным

поведением, служит

автомат L 2

l 2 ,

имеющий два состояния: ф! и

ф2 и два действия:

Д =

F (ц),)

и

/ 2 =

F 2 ). Автомат

сохраняет

свои состояния при выигрыше и изменяет при проигрыше. Мат­ рицы состояний имеют вид

II ««(1)1

0

1

К

(0)« =

1

о

1

О

 

 

 

0

1

Пусть автомат L 2 ) 2 погружен в среду С (п1, сі2 ). Построив матрицу переходных вероятностей

\\Яі Pi

Р = I р 2 Ч.Ч.

1 - я ,

г = 1,2,

находим для вычисления финальных вероятностей гг и г2 уравне­ ния

Воспользовавшись еще

условием

нормировки

гх -\- г2

1, имеем

Гі =

Р2

 

„ _

рі

 

 

Рі +рг

'

Го = •

Р1 + Р2

'

 

Для математического

ожидания

выигрыша

получаем

выраже-

ние

 

 

 

 

 

 

W(L2t2,C)

=

 

 

 

 

52


Легко

видеть,

что W(L2,2,

С)^>а1~^при

 

 

a1=f=a2,T. е.

что

автомат

L 2

l 2

обладает целесообразным

 

поведением в стацио­

нарной

случайной

среде.

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим

коллективное

поведение

(игру)

автоматов

5t1, ...

3tv. Предполагается, что

каждый

из этих

автоматов

задан

своими матрицами состояний и уравнениями (1-5-3),

(1-5-4).

Пусть далее sj (l),

f (t),

cp3 (l), / = 1,

v — значения

входной

переменной, выходной переменной и состояния

автомата

в

момент t. Будем по-прежнему предполагать, что входная

перемен­

ная s3

{і) принимает лишь два значения: s* (l) — 0 и sJ ( i ) = 1, со­

ответствующие

(единичным)

выигрышу

и

проигрышу

 

автомата

в момент t. Выходная переменная /J

(і)

предполагается

при­

нимающей

значение из множества Д ... fx..

 

Эти значения

назы­

вают стратегиями автомата %' и говорят, что в момент t

автомат

9F использует свою а-ю стратегию,

если

f

(t) =

fa.

Значения

фі ••• фЦ переменной cpJ

(I) назовем состояниями

автомата W,

а число nij — емкостью его памяти. Очевидно, что rrij

 

и зада­

ны матрицы

состояний

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

II <& (s;' (0) I),

 

у =

1 ... v;

i,k =

l...my,

 

 

 

 

 

 

 

 

 

s1

(0 =

0,1

 

 

 

 

 

 

 

 

 

 

автоматов Э11 ... 5tv.

 

 

 

 

 

 

 

 

 

 

 

 

 

Перейдем к описанию

игры автоматов. Назовем партией / (t),

разыгрываемой

в момент

t, набор / (0 =

(Z1

(0

••• f" (0)

страте­

гий,

используемых в момент

t

автоматами

5t1 ...ЭДѴ.Исходом

s (t -f- 1)

партии

/ (t)

назовем

набор

s (t -f- 1) =

(s1

(t - f 1) ...

... sv (t -f- 1))

значений

входных

переменных (единичных

выиг­

рышей и проигрышей) этих автоматов

в момент t -f- 1.

Игра Г

автоматов

Si1 ... 3tv задана, если

для каждой партии / (t) задана

вероятность Р (/, s) ее исхода s (f -f- 1); равенство

 

 

 

 

 

 

 

 

 

 

 

 

2p(/,S) = l

 

 

 

 

 

 

 

(1-5-5)

 

 

 

 

 

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

имеет место при любом /.

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, игра Г автоматов

... 9tv

состоит из последо­

вательности партий / (I), t= 1,2 ... исходы s (f -f- 1) которых опре­ деляются вероятностями р (/ (t), s (t + 1)).

Платежные функции v* (f), / = 1 . . . ѵ , задающие игру Г*, имеют смысл математического ожидания выигрыша /-го игрока при

наборе

стратегий / и однозначно восстанавливаются по вероятно­

стям исходов по формуле

 

vj(f) =

2 [p&s1 ...^-1 , 0, s^...s^-p(f,sK..s^,

1, sto...*%

 

 

(1-5-6)

53


Игру V лиц Г* назовем эквивалентной игре автоматов Г. Заметим, что задание игры Г* не определяет однозначно игры автоматов Г. В самом деле, игра Г* задается ѵ функциями Ѵ] (/), а игра Г зада­

ется 2Ч — 1 вероятностями р

(/,

s)

для каждой партии /.

Назовем игру ѵ автоматов

Г игрой с независимыми исходами,

если

 

 

 

V

 

 

 

 

 

 

p(f,s) =

p(f,sK..s")=

Л pi

(/,#'),

где

 

 

 

3=1

 

 

 

 

 

 

р - '(/,0), />'(/,

1 ) > 0 ;

У

(/, 0) +

p(f, 1) = 1.

Произвольная игра Г* позволяет однозначно построить игру авто­ матов с независимыми исходами; при этом

 

p4f,sj)

=

^a+(-i)sl'v4f)].

 

Система

автоматов

511

... 3ÎV, участвующих в игре Г,

находит­

ся в состоянии a (t) =

(ccj. ... аѵ ), если в момент t автомат W на­

ходится В СОСТОЯНИИ ф а ,

Clj =

1 ... Iflj, ) = 1 . . . Л>.

 

Определенные таким образом модели коллективного

поведения

автоматов

используют

язык

теории игр. Однако возникающие

здесь определения игр автоматов и способы поведения в этих иг­ рах значительно отличаются от точки зрения, принятой в теории игр.

В самом деле, в теории игр предполагается, что система пла­ тежных функций, определяющих игру, заранее сообщается ее участникам. Игрок должен использовать эту информацию для того, чтобы определить свою стратегию (обычно смешанную), кото­ рая в ходе самой игры уже не изменяется; для выбора стратегии разрешается использование любых вычислительных средств.

Игры автоматов определяются заданием не только системы пла­ тежных функций, но и конструкций играющих автоматов. Авто­ маты, участвующие в играх, априорной информацией об игре не обладают. Ходы определяются лишь проигрышами и выигрышами в ходе самой игры.

Роль платежных функций, задающих игру, и партнеров авто­ мата по игре сводится поэтому лишь к образованию более или ме­ нее сложной случайной среды, в которой автомат должен обладать целесообразным поведением.

П р и м е р . Игра двух автоматов с нулевой суммой. Рассмот­ рим игру Г, в которой участвуют автоматы. 9t1 и W, имеющие со­

ответственно M ж N стратегий: (щ — М, и 2 =

N).

Предположим, что в каждой партии / = (f1,

f) этой игры один

из двух автоматов выигрывает, а другой проигрывает. Тогда ве­ роятности р (/, s) — р (f, f, s1 , s2 ) исходов s— (s1 , s2 ) равны нулю при s1 =

54