Файл: Шахнович, А. Р. Математические методы в исследовании биологических систем регулирования.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 19.10.2024
Просмотров: 111
Скачиваний: 0
Определенную таким образом игру автоматов назовем игрой двух автоматов с нулевой суммой.
Величина
qi'P = Р (Л Л 0, 1)
имеет смысл вероятности выигрыша первого автомата в партии
PM-- = P(f\ Л t 0)
представляет собой вероятность его проигрыша в этой партии. Со гласно (1-5-5)
ql4* + pNz = 1.
Математическое ожидание тр^ выигрыша автомата 3t1 в партии / (Л f) равно в силу (1-5-6)
тІЧг = qNz — рІЧг.
Очевидно, что математическое ожидание суммы выигрышей авто
матов 3t1 |
и ЭД2 |
равно нулю. Величины тар образуют прямоуголь |
|
ную матрицу |
II maß ||, а =!..-. M, |
ß = 1... ІѴ, совпадающую с |
|
матрицей |
эквивалентной игры двух |
лиц с нулевой суммой. Если |
игра является эргодической, то существуют финальные вероятно сти состояний системы участвующих в игре автоматов и величина W (ЗІ1 , 212) математического ожидания выигрыша первого авто мата не зависит от их начальных состояний. Эту величину назовем
ценой игры Г для автоматов |
и 2І2 . |
|
|
|
|||||
Обозначим, через Raia* |
финальную |
вероятность |
состояния |
||||||
системы автоматов, участвующих в игре |
|
Г. В этом |
состоянии |
||||||
автоматы |
и 212 |
находятся в состояниях |
срі и ср2, и используют |
||||||
стратегии |
=F1 |
(cpà,) |
и |
f\ |
= |
F2 (фа.) |
соответственно. Ве |
||
личину математического |
ожидания |
W (ЗІ1 , |
$12, Г) выигрыша ав |
||||||
томата "2І1 можно вычислить по формуле |
|
|
|
||||||
|
|
W(U\U\ |
|
Г ) = |
^ |
Л |
^ . |
|
|
|
|
|
|
|
aid. |
1 |
|
|
Рассмотрим игру автомата 31 с противником U, использующим фиксированную смешанную стратегию. Пусть противник U ав томата 31 в игре реализует некоторую смешанную стратегию х=
=(х1 + ••• + xN), т. е. в каждой партии использует свою ß-io
чистукГстратегию, ß = 1 ...Ne вероятностью xt + ... -f- xN = 1. По определению смешанной стратегии величины х$ являются функциями матрицы | т а р|| игры Г и не зависят от поведения парт нера.
Тогда для любой чистой стратегии / а , а = 1 ... M автомата 21 определены математические ожидания та выигрыша:
JV
та = 2 maßXß.
Р=і
55
Таким образом, игра с противником, избравшим произвольную
смешанную |
стратегию, определяет стационарную случайную |
сре |
||||||||
ду С {іщ ... |
тм) |
и |
для |
любого х |
|
|
|
|
||
|
|
|
|
W |
(U, U, Г) ==• W (U, С). |
|
|
|
|
|
Если |
... %п — асимптотически-оптимальная |
последовательность |
||||||||
автоматов, |
то, |
по |
определению, |
|
|
|
|
|||
W |
= |
lim W (U, U, |
Г) = |
max (тх... тм) = |
max |
2 т*№$- |
|
|||
|
|
п-юо |
і |
|
|
|
а |
р = 1 |
|
|
Таким образом, |
автомат |
|
при достаточной величине |
п максими |
||||||
зирует |
свой выигрыш. Если |
смешанная стратегия |
х— |
(хи ... |
xN) |
является оптимальной, то математическое ожидание выигрыша автомата 21Г1 при п ->- со стремится к величине
|
|
|
N |
W |
= max min |
2 maßXß> |
|
|
a |
x |
ß=i |
т. е. совпадает с ценой игры по фон Нейману. |
|||
Можно сказать, что |
такой |
автомат «играет не хуже» своего |
партнера, избравшего оптимальную стратегию, хотя и не распо лагает априорными сведенияАіи о структуре матрицы || тар || игры Г, а получает всю необходимую информацию в ходе самой игры; поведение, целесообразное в стационарной случайной среде, ока зывается целесообразным и в рассмотренном случае игры.
Приведенные выше элементы теории игр автоматов позволяют подойти к исследованию целесообразного поведения различных по сложности коллективов, состоящих из отдельных клеток, нервных центров или целых организмов.
Л И Т Е Р А Т У Р А
Гельфанд И. М., Цетлин М. Л. О математическом моделировании меха низмов центральной нервной системы. В сб. «Модели структурно-функ циональной организации некоторых биологических систем». М., «Наука», 1966.
Цетлин М. Л. Исследования по теории автоматов и моделированию биоло гических процессов. М., «Наука», 1969.
Цыпкин Я. 3. Адаптация и обучение в автоматических системах. М., «Нау ка», 1968.
56
Глава 1-6
ТЕОРИЯ СТАТИСТИЧЕСКИХ РЕШЕНИЙ
Теория статистических решений, являясь более общей по от ношению к приведенным выше теориям исследования динамики управляемых систем (главы 1—2, I—3), основывается на теории игр и математической статистике (Крамер, 1948).
Выше, в главе 1-3, уже было введено понятие игры, но оно было связано с детерминированными представлениями.
Втеории статистических решений рассматриваются случайные ходы, влияющие на исход игры. В статистических играх в соот ветствии с определением Б. БлекуэллаиМ . Гиршика (1958) игро ками являются природа (обозначается игрок I) и статистик (обо значается игрок I I ) .
Встатистических играх элементы cod в Й (D) (см. главу 1-0) определяют чистые стратегии природы, поэтому юй можно счи тать состояниями природы.
Структура пространства чистых стратегий статистика (II) мо жет быть более сложной, Чем структура пространства чистых стра тегий природы (I), так как статистик имеет в своем распоряжении класс возможных действий, которые он может совершать (или со ответственно решений, которые он может принимать) по отношению к неизвестному для него состоянию природы cùd. Производя оп ределенное действие без испытания, статистик допускает, что он
может потерпеть численный убыток W (ad, |
а), |
представляющий |
собой известную функцию состояния природы |
cûd и действия и = |
|
= а, которое он выбирает из множества А. |
Уменьшение убытка |
может быть получено за счет проведения испытаний и получения некоторой информации относительно состояния природы ш^. Основным вопросом, возникающим при этом, является выбор стра тегии. Как отмечалось выше, в статистической игре без испытаний пространство чистых стратегий есть пространство X (элемента ми этого пространства являются возможные действия статистика).
В игре с ограниченным объемом выборки (единичным испыта нием) число стратегий статистика растет, поскольку ему необхо
димо выбрать правило, которое |
свяжет точку а ЕЕ А с каждым |
||||||
возможным исходом |
испытания. |
|
|
|
|
||
Это правило в |
статистических играх |
называется |
решающей |
||||
функцией. Решающую функцию V можно рассматривать как раз |
|||||||
биение множества X на взаимно непересекающиеся |
подмноже |
||||||
ства |
Ха = {х :Ѵ (я) = |
о,}, сумма |
которых |
есть X. |
Если теперь |
||
исход |
единичного |
испытания может быть |
отнесен |
к |
множеству |
||
Ха, то совершается |
действие а. Например, если параметр а может |
||||||
иметь два возможных значения аг |
и а 2 (с априорными вероятностя |
||||||
ми соответственно рх и р2), то стратегия V |
определяет |
разбиение |
57
пространства X на множество Ех (называемой критической обла
стью) и его дополнение С {Ех), такое, что если х ЕЕ Ех, |
то принима |
||
ется решение а = |
ах, |
а если х Е5 С (Ех), то принимается решение |
|
а = а2 (причем рх |
+ |
р« = 1). |
|
Весьма важную роль в определении статистической игры име |
|||
ют два понятия — функция потерь и функция риска |
(соответству |
||
ющие определения |
будут даны ниже). |
|
Статистическая игра может быть теперь определена |
следующим |
|||||
образом. |
Если |
X = |
(х, Q, {D)p) |
— пространство выборок, Ù (D)— |
||
произвольное |
пространство |
решений; V — класс |
решающих |
|||
функций, |
отображающих |
решения в Q (D), R— функция риска, |
||||
то игра |
Г = (Q (А), |
V , |
R) называется статистической игрой с |
|||
фиксированным |
объемом |
выборки. |
|
Таким образом, определяется статистическая игра, в которой рассматриваются ситуации взаимоотношений с внешним миром. Игры с разумным противником имеют ту же структуру, что и ста тистические игры. В общей теории статистических решений су ществуют несколько направлений (Фельдбаум, 1963):
—теория двуальтернативных решений рассматривает случай определения одного из двух возможных значений пара
метра ах или а2 с известными априорными вероятностями;
— теория многоальтернативных решений рассматривает слу чаи определения к различных значений параметра аи...
... ак при известных априорных вероятностях;
—теория оценки параметров рассматривает получение наи лучшей оценки значения параметра, принадлежащего к определенной области Q (А) при наличии известной априор ной плот тости вероятности Р (А);
—теория оценки процессов рассматривает получение наилуч-
--шей оценки параметра, меняющегося во времени A (t).
Исходная выборка (или сигнал) представляется вектором S, который может в общем случае содержать несколько неизвестных параметров
|
|
|
S (t) = |
s (ah t); |
i = |
i...m |
|
|
|||
Параметры |
при этом |
представляются |
вектором параметров |
||||||||
Вектор |
параметров |
|
А = |
(аг-); |
і = |
1 |
... т.. |
|
|
|
|
рассматривается |
в |
пространстве параметров |
|||||||||
Q (А), |
являющемся яг-мерным пространством с декартовыми коор |
||||||||||
динатами аи... ат, |
здесь Р |
(A) dÇî (А) |
характеризует |
вероятность |
|||||||
попадания конца вектора в элементарный объем |
пространства |
||||||||||
dQ(A). |
Аналогично |
вектор наблюдений X |
= (х1), |
(j = |
l...k) |
||||||
рассматривается в |
пространстве |
наблюдений |
Q (х), |
являющемся |
|||||||
А-мерным пространством с декартовыми координатами хх |
... Хц: |
||||||||||
Здесь Р (X) |
d£i (X) |
характеризует вероятность попадания |
конца |
||||||||
вектора X в элементарный объем |
dQ (X) |
(Р (X) |
— плотность |
||||||||
вероятности |
вектора |
X) . |
|
|
|
|
|
|
|
58
Выше были рассмотрены игровые аспекты теории статистиче ских решений, связанные со статистическими играми.
Основная проблема при этом заключалась в выборе решающей функции и стратегий, таких, чтобы обеспечить определенное зна чение выгоды.
Одним из основных и в достаточной мере разработанных направ лений общей теории статистических решений является теория двуальтернативных решений (Фельдбаум, 1963). Основная проблема в этой теории состоит в определении одного из двух возможных значений параметра а : ях или а2. Выше был приведен подход к этой проблеме при введении понятия стратегии V , определяющего разбиение пространства на критическую область Ег и ее дополнение С (і?і), причем при a Ez Ех параметр а имеет значение аи а при а £Е €Е С (ijj) параметр а имеет значение а2 .
Решение этой задачи связано с необходимостью определения функции правдоподобия Р (XIа) (см. главу 1-0).
Определения апостериорных вероятностей Р (АІХ) с помощью формулы Бэйеса
P № ) = _ _ M W )
VР {А) Р {XIA) dQ (А)
О(А)
сводится к выбору такого значения |
А, |
при котором апостериор |
ная плотность вероятности максимальна |
(при известных априор |
|
ных вероятностях А). |
|
|
Если априорные вероятности А неизвестны, то используется |
||
метод максимума правдоподобия на |
основе сформулированного |
Р. Фишером правила: наиболее правдоподобно то значение парамет
ра А, для которого функция правдоподобия L (А) = Р (XIА) |
мак |
|||
симальна. |
Поскольку |
здесь вектор |
X задан, то функция |
пра |
вдоподобия зависит только от А. |
|
|
||
Применив формулу Бэйеса к определению апостериорных |
веро |
|||
ятностей |
значений а = |
ах ж а = я2 , |
получим |
|
Если |
значения функции |
правдоподобны соответственно L (а^ = |
|||
= Р |
(Х/йх) и |
L (а2) = Р |
(XIа2), |
то, разделив |
выражение (1-6-1) |
на выражение |
(1-6-2), получим коэффициент |
правдоподобия |
|||
|
|
U(Y\ |
— L ( a à |
— р №Ісч) |
|
|
|
п У А - > ~ Цо£) |
Р ( Х / а 2 ) - |
|
Применяя теперь метод максимума правдоподобия, можно утвер ждать, что при H (X) ^> 1 выносится решение а — аи а при
59