ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.03.2024

Просмотров: 63

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

41

q1

=

 

a22

a12

 

 

; q2

=1 q1 ;

 

 

 

a11

+ a22

a12

a21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

γ =

a22 a11 a12 a21

 

.

(3.2)

 

 

 

 

a

+ a

22

a a

21

 

 

 

 

 

11

 

12

 

 

Игра 2 ×2 и ее решение имеют простую геометрическую интерпретацию.

Отложим на некоторой числовой оси отрезок единичной длины A1 A2 (рис. 3.1).

Пусть точки A1 и A2 соответствуют применению одноименных стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии

SA* = (p1, p2 ). В этом случае ординаты прямой B1B1 , проведенной так, как показано на рис 3.1, соответствуют выигрышу игрока A при применении им любой стратегии

(чистой или смешанной) при условии, что B применяет B1 . Прямая B2 B2 также отражает выигрыш игрока A в случае, когда B применяет B2 . Жирной линией отмечена нижняя граница выигрыша B1NB2 – минимальный выигрыш игрока A при любой его смешанной стратегией. Очевидно, решение достигается в точке максимума нижней границы (на рис. 3.1 в точке N ). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях. По рисунку легко находятся α,β, γ и проводится анализ игры.

 

 

B2

 

 

B1

 

 

 

 

N

 

 

 

 

 

 

B2

 

a12

 

B1

 

 

 

 

γ

 

 

β a21

 

a11

a22

α

 

 

 

 

 

 

 

 

 

 

 

A1

p2

*

p1

A2

 

 

 

SA

 

 

Рис. 3.1

Геометрическим способом также легко анализируются и решаются игры 2 ×n . Они задаются матрицей игры, представленной в табл. 3.3, а на рис. 3.2 представлена геометрическая интерпретация этой игры для случая n = 4 . Геометрические построения осуществляются так же, как и для игры 2 ×2 , только число наклонных линий получается равным n, по числу стратегий игрока B. Нижняя


42

граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.

Таблица 3.3

Ai

B j

B

B

B

 

 

1

2

 

n

 

A1

a11

a12

a1n

 

A2

a21

a22

a2n

 

 

 

a13

 

B3

 

 

B3

a23

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B1

a21

 

 

 

 

a12

 

B2

 

 

 

 

 

 

 

 

 

 

 

 

B4

a24

 

 

 

 

 

 

 

M

N

 

 

 

 

a14

 

B4

 

B2

a22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a11

 

B1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A1

 

p2

 

SA*

p1

A2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.2

 

 

 

 

 

Из рис. 3.2 видно, что нижняя граница

выигрыша – прямая B1MNB2 ,

ее

максимум

 

достигается в точке

N , которая определяет

оптимальную стратегию

S* =

(p , p

2

). Следует отметить, что стратегия B

вообще может не рассматриваться

A

1

 

 

 

 

3

 

 

 

как заведомо невыгодная игроку

B , а значения

p1 и p2 можно найти по формулам

игры 2 ×2 , учитывая, что в точке N активных стратегий игрока B только две B2

и

B4 .

 

 

 

 

 

 

 

 

 

 

3.2Элементы теории статистических решений

Взадачах теории игр неопределенность выбора решения связана с неизвестным для нас поведением разумного и «враждебно» настроенного противника. Однако часто в задачах поиска наилучшего решения неопределенность связана просто с нашей неосведомленностью об условиях объективной действительности, которую в теории решений принято называть «природой».


43

«Природа» здесь рассматривается как некоторая незаинтересованная сторона, поведение которой неизвестно, но не содержит элементов сознательного противодействия нашим планам. Такие задачи часто называются «играми с природой». Их нельзя решать методами антагонистических игр, так как со стороны «природы» противодействие отсутствует.

Пусть у нас (сторона A ), как и ранее, имеется m возможных стратегий:

A1, A2 ,K, Am ; что касается «природы, то о ней можно сделать n предположений

S1, S2 ,K, Sn . Последние можно рассматривать как состояния или стратегии

«природы». Наш выигрыш aij при каждой паре стратегий (Ai , S j ) задается матрицей,

приведенной в табл. 3.4. Требуется выбрать такую стратегию игрока A (чистую или смешанную), которая является наиболее выгодной для него.

Таблица 3.4

Ai S j

S

S

2

S

n

 

1

 

 

 

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

 

С точки зрения лечебного процесса состояния S j могут рассматриваться как

неизвестные состояния больного организма, а стратегии Ai – как возможные планы

лечения (в простейшем случае – лечебные воздействия). В этом случае выигрыш aij

– это эффективность лечения, например, вероятность выздоровления. В качестве оценки такой вероятность можно использовать соответствующую частость, либо субъективную вероятность, задаваемую экспертом.

Учитывая, что состояниями «природы» мы не управляем, кроме показателя aij можно ввести другие, отражающие «удачность» выбора данной стратегии именно

в данной ситуации. К таким показателям относится «риск». Риском rij игрока A при

пользовании стратегией Ai в условиях S j называется разность между выигрышем,

который он получил бы, если бы знал условия S j , и выигрышем, который он

получит, не зная их и выбирая стратегию Ai . Следовательно,

rij = βj aij .


44

При поиске оптимальной стратегии игрока A в зависимости от выбранного показателя aij или rij либо максимизируется выигрыш, либо минимизируется риск.

В работе [8] предпринята попытка объединить показатели aij и rij в один. Так как мы хотели бы иметь наибольший выигрыш и одновременно наименьший риск,

то этот объединенный показатель fij , названный автором «сочетанным показателем полезности», вычисляется в виде

fij = aij rij .

Чем больше fij тем лучше, так как больше выигрыш и меньше риск, поэтому при оптимизации выбора Ai показатель fij нужно максимизировать.

Пусть, для примера, больной организм может находиться в одном из трех состояний S1, S2 , S3 , а у врача есть три варианта лечения: A1, A2 , A3 . Применение лечения Ai к больному в состоянии S j приводит к вероятности выздоровления aij .

Пусть значения aij задаются матрицей Ma

в виде табл. 3.5. Рассчитанные по этой

 

 

 

 

 

Таблица 3.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai

S j

 

S1

S2

 

S3

 

 

 

 

 

 

A1

 

0,95

0,90

 

0,85

 

α1

= 0,85

 

 

 

A2

 

0,97

0,92

 

0,75

 

α2

= 0,75

 

 

 

 

 

 

α = 0,85

 

 

A3

 

0,99

0,75

 

0,60

 

α3

= 0,60

 

 

 

 

 

 

 

 

 

 

β1

=0,99

β2 =0,92

β3 =0,85

 

 

 

 

 

1444442444443

 

 

 

 

 

 

 

 

β=0,85

 

 

 

 

 

матрице значения αi приведены справа от соответствующих строк, а значения βj -

под соответствующими столбцами. Матрица рисков Mr получается из Ma на основе соотношения

β1

β2

β3

 

 

β2

 

M a ,

M r = β1

β3

 

β2

 

 

β1

β3

 

поэтому Mr имеет вид, представленный

в

табл. 3.6. Наконец, матрица M f

сочетанного