Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.10.2024

Просмотров: 111

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Определенную таким образом игру автоматов назовем игрой двух автоматов с нулевой суммой.

Величина

qi'P = Р (Л Л 0, 1)

имеет смысл вероятности выигрыша первого автомата в партии

PM-- = P(f\ Л t 0)

представляет собой вероятность его проигрыша в этой партии. Со­ гласно (1-5-5)

ql4* + pNz = 1.

Математическое ожидание тр^ выигрыша автомата 3t1 в партии / (Л f) равно в силу (1-5-6)

тІЧг = qNz рІЧг.

Очевидно, что математическое ожидание суммы выигрышей авто­

матов 3t1

и ЭД2

равно нулю. Величины тар образуют прямоуголь­

ную матрицу

II maß ||, а =!..-. M,

ß = 1... ІѴ, совпадающую с

матрицей

эквивалентной игры двух

лиц с нулевой суммой. Если

игра является эргодической, то существуют финальные вероятно­ сти состояний системы участвующих в игре автоматов и величина W (ЗІ1 , 212) математического ожидания выигрыша первого авто­ мата не зависит от их начальных состояний. Эту величину назовем

ценой игры Г для автоматов

и 2І2 .

 

 

 

Обозначим, через Raia*

финальную

вероятность

состояния

системы автоматов, участвующих в игре

 

Г. В этом

состоянии

автоматы

и 212

находятся в состояниях

срі и ср2, и используют

стратегии

=F1

(cpà,)

и

f\

=

F2 (фа.)

соответственно. Ве­

личину математического

ожидания

W (ЗІ1 ,

$12, Г) выигрыша ав­

томата "2І1 можно вычислить по формуле

 

 

 

 

 

W(U\U\

 

Г ) =

^

Л

^ .

 

 

 

 

 

 

aid.

1

 

 

Рассмотрим игру автомата 31 с противником U, использующим фиксированную смешанную стратегию. Пусть противник U ав­ томата 31 в игре реализует некоторую смешанную стратегию х=

=1 + ••• + xN), т. е. в каждой партии использует свою ß-io

чистукГстратегию, ß = 1 ...Ne вероятностью xt + ... -f- xN = 1. По определению смешанной стратегии величины х$ являются функциями матрицы | т а р|| игры Г и не зависят от поведения парт­ нера.

Тогда для любой чистой стратегии / а , а = 1 ... M автомата 21 определены математические ожидания та выигрыша:

JV

та = 2 mXß.

Р=і

55


Таким образом, игра с противником, избравшим произвольную

смешанную

стратегию, определяет стационарную случайную

сре­

ду С {іщ ...

тм)

и

для

любого х

 

 

 

 

 

 

 

 

W

(U, U, Г) ==• W (U, С).

 

 

 

 

Если

... %п — асимптотически-оптимальная

последовательность

автоматов,

то,

по

определению,

 

 

 

 

W

=

lim W (U, U,

Г) =

max х... тм) =

max

2 т*№$-

 

 

 

п-юо

і

 

 

 

а

р = 1

 

 

Таким образом,

автомат

 

при достаточной величине

п максими­

зирует

свой выигрыш. Если

смешанная стратегия

х—

и ...

xN)

является оптимальной, то математическое ожидание выигрыша автомата 21Г1 при п ->- со стремится к величине

 

 

 

N

W

= max min

2 maßXß>

 

a

x

ß=i

т. е. совпадает с ценой игры по фон Нейману.

Можно сказать, что

такой

автомат «играет не хуже» своего

партнера, избравшего оптимальную стратегию, хотя и не распо­ лагает априорными сведенияАіи о структуре матрицы || тар || игры Г, а получает всю необходимую информацию в ходе самой игры; поведение, целесообразное в стационарной случайной среде, ока­ зывается целесообразным и в рассмотренном случае игры.

Приведенные выше элементы теории игр автоматов позволяют подойти к исследованию целесообразного поведения различных по сложности коллективов, состоящих из отдельных клеток, нервных центров или целых организмов.

Л И Т Е Р А Т У Р А

Гельфанд И. М., Цетлин М. Л. О математическом моделировании меха­ низмов центральной нервной системы. В сб. «Модели структурно-функ­ циональной организации некоторых биологических систем». М., «Наука», 1966.

Цетлин М. Л. Исследования по теории автоматов и моделированию биоло­ гических процессов. М., «Наука», 1969.

Цыпкин Я. 3. Адаптация и обучение в автоматических системах. М., «Нау­ ка», 1968.

56


Глава 1-6

ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ

Теория статистических решений, являясь более общей по от­ ношению к приведенным выше теориям исследования динамики управляемых систем (главы 1—2, I—3), основывается на теории игр и математической статистике (Крамер, 1948).

Выше, в главе 1-3, уже было введено понятие игры, но оно было связано с детерминированными представлениями.

Втеории статистических решений рассматриваются случайные ходы, влияющие на исход игры. В статистических играх в соот­ ветствии с определением Б. БлекуэллаиМ . Гиршика (1958) игро­ ками являются природа (обозначается игрок I) и статистик (обо­ значается игрок I I ) .

Встатистических играх элементы cod в Й (D) (см. главу 1-0) определяют чистые стратегии природы, поэтому юй можно счи­ тать состояниями природы.

Структура пространства чистых стратегий статистика (II) мо­ жет быть более сложной, Чем структура пространства чистых стра­ тегий природы (I), так как статистик имеет в своем распоряжении класс возможных действий, которые он может совершать (или со­ ответственно решений, которые он может принимать) по отношению к неизвестному для него состоянию природы cùd. Производя оп­ ределенное действие без испытания, статистик допускает, что он

может потерпеть численный убыток W (ad,

а),

представляющий

собой известную функцию состояния природы

d и действия и =

= а, которое он выбирает из множества А.

Уменьшение убытка

может быть получено за счет проведения испытаний и получения некоторой информации относительно состояния природы ш^. Основным вопросом, возникающим при этом, является выбор стра­ тегии. Как отмечалось выше, в статистической игре без испытаний пространство чистых стратегий есть пространство X (элемента­ ми этого пространства являются возможные действия статистика).

В игре с ограниченным объемом выборки (единичным испыта­ нием) число стратегий статистика растет, поскольку ему необхо­

димо выбрать правило, которое

свяжет точку а ЕЕ А с каждым

возможным исходом

испытания.

 

 

 

 

Это правило в

статистических играх

называется

решающей

функцией. Решающую функцию V можно рассматривать как раз­

биение множества X на взаимно непересекающиеся

подмноже­

ства

Ха = {х :Ѵ (я) =

о,}, сумма

которых

есть X.

Если теперь

исход

единичного

испытания может быть

отнесен

к

множеству

Ха, то совершается

действие а. Например, если параметр а может

иметь два возможных значения аг

и а 2 (с априорными вероятностя­

ми соответственно рх и р2), то стратегия V

определяет

разбиение

57


пространства X на множество Ех (называемой критической обла­

стью) и его дополнение С {Ех), такое, что если х ЕЕ Ех,

то принима­

ется решение а =

ах,

а если х Е5 С (Ех), то принимается решение

а = а2 (причем рх

+

р« = 1).

 

Весьма важную роль в определении статистической игры име­

ют два понятия — функция потерь и функция риска

(соответству­

ющие определения

будут даны ниже).

 

Статистическая игра может быть теперь определена

следующим

образом.

Если

X =

(х, Q, {D)p)

— пространство выборок, Ù (D)—

произвольное

пространство

решений; V класс

решающих

функций,

отображающих

решения в Q (D), R— функция риска,

то игра

Г = (Q (А),

V ,

R) называется статистической игрой с

фиксированным

объемом

выборки.

 

Таким образом, определяется статистическая игра, в которой рассматриваются ситуации взаимоотношений с внешним миром. Игры с разумным противником имеют ту же структуру, что и ста­ тистические игры. В общей теории статистических решений су­ ществуют несколько направлений (Фельдбаум, 1963):

теория двуальтернативных решений рассматривает случай определения одного из двух возможных значений пара­

метра ах или а2 с известными априорными вероятностями;

— теория многоальтернативных решений рассматривает слу­ чаи определения к различных значений параметра аи...

... ак при известных априорных вероятностях;

теория оценки параметров рассматривает получение наи­ лучшей оценки значения параметра, принадлежащего к определенной области Q (А) при наличии известной априор­ ной плот тости вероятности Р (А);

теория оценки процессов рассматривает получение наилуч-

--шей оценки параметра, меняющегося во времени A (t).

Исходная выборка (или сигнал) представляется вектором S, который может в общем случае содержать несколько неизвестных параметров

 

 

 

S (t) =

s (ah t);

i =

i...m

 

 

Параметры

при этом

представляются

вектором параметров

Вектор

параметров

 

А =

г-);

і =

1

... т..

 

 

 

рассматривается

в

пространстве параметров

Q (А),

являющемся яг-мерным пространством с декартовыми коор­

динатами аи... ат,

здесь Р

(A) dÇî (А)

характеризует

вероятность

попадания конца вектора в элементарный объем

пространства

dQ(A).

Аналогично

вектор наблюдений X

= (х1),

(j =

l...k)

рассматривается в

пространстве

наблюдений

Q (х),

являющемся

А-мерным пространством с декартовыми координатами хх

... Хц:

Здесь Р (X)

d£i (X)

характеризует вероятность попадания

конца

вектора X в элементарный объем

dQ (X)

(Р (X)

— плотность

вероятности

вектора

X) .

 

 

 

 

 

 

 

58


Выше были рассмотрены игровые аспекты теории статистиче­ ских решений, связанные со статистическими играми.

Основная проблема при этом заключалась в выборе решающей функции и стратегий, таких, чтобы обеспечить определенное зна­ чение выгоды.

Одним из основных и в достаточной мере разработанных направ­ лений общей теории статистических решений является теория двуальтернативных решений (Фельдбаум, 1963). Основная проблема в этой теории состоит в определении одного из двух возможных значений параметра а : ях или а2. Выше был приведен подход к этой проблеме при введении понятия стратегии V , определяющего разбиение пространства на критическую область Ег и ее дополнение С (і?і), причем при a Ez Ех параметр а имеет значение аи а при а £Е €Е С (ijj) параметр а имеет значение а2 .

Решение этой задачи связано с необходимостью определения функции правдоподобия Р (XIа) (см. главу 1-0).

Определения апостериорных вероятностей Р (АІХ) с помощью формулы Бэйеса

P № ) = _ _ M W )

VР {А) Р {XIA) dQ (А)

О(А)

сводится к выбору такого значения

А,

при котором апостериор­

ная плотность вероятности максимальна

(при известных априор­

ных вероятностях А).

 

 

Если априорные вероятности А неизвестны, то используется

метод максимума правдоподобия на

основе сформулированного

Р. Фишером правила: наиболее правдоподобно то значение парамет­

ра А, для которого функция правдоподобия L (А) = Р (XIА)

мак­

симальна.

Поскольку

здесь вектор

X задан, то функция

пра­

вдоподобия зависит только от А.

 

 

Применив формулу Бэйеса к определению апостериорных

веро­

ятностей

значений а =

ах ж а = я2 ,

получим

 

Если

значения функции

правдоподобны соответственно L (а^ =

= Р

(Х/йх) и

L (а2) = Р

(XIа2),

то, разделив

выражение (1-6-1)

на выражение

(1-6-2), получим коэффициент

правдоподобия

 

 

U(Y\

L ( a à

р №Ісч)

 

 

 

п У А - > ~ Цо£)

Р ( Х / а 2 ) -

 

Применяя теперь метод максимума правдоподобия, можно утвер­ ждать, что при H (X) ^> 1 выносится решение а — аи а при

59