ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 25.03.2024

Просмотров: 60

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

36

 

 

 

 

 

<Оп>

3

w1(3)

 

 

 

<Оп>

3 w2(3)

 

 

 

 

<Оп>

3

w3(3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z2

= 3

 

 

 

 

 

 

 

 

z3

= 3

 

 

 

 

 

p3

z1

= 3

 

 

 

 

p3

 

 

p3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<Оп>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1

 

 

<Жд>

 

 

 

p1

 

 

 

 

<Жд>

 

 

 

p1

 

 

 

 

 

(1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Изм1

 

 

z

=1

 

 

 

Изм2

 

 

 

z

2

=1

 

 

 

 

Изм3

 

 

 

z

3

=1

 

 

 

1 w3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

<Жд>

 

 

 

 

 

 

 

 

<Жд>

 

 

 

 

 

 

 

 

 

 

 

 

p2

 

 

 

 

p2

 

 

 

 

 

 

p2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z1

= 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z2

= 2

 

 

 

 

 

 

 

 

z3

= 2

 

 

 

 

 

 

 

 

 

<Оп>

 

 

 

 

 

 

<Оп>

 

 

 

 

 

<Оп>

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

(2)

 

 

 

 

2

w2(2)

 

 

 

 

 

 

2

w3(2)

 

 

 

 

w1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.13


37

 

 

 

 

 

 

= w(1) p + w(2) p

 

+ w(3) p

 

=1,9 0,3 + 2 0,5 +3 0,2 = 2,17.

 

 

 

 

 

 

 

 

 

 

w

2

2

3

 

 

 

 

 

 

 

 

 

 

 

 

2

1

 

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это больше,

чем 2,

поэтому, если в 1-й день будет

 

 

 

 

 

 

 

 

 

 

w3(3)

 

z1 = 2 ,то оптимальным решением будет воздержаться

 

 

 

 

 

 

 

p3

3

 

 

 

 

 

 

 

 

 

 

от

операции

в

 

 

надежде на

улучшение

состояния

 

 

 

 

 

 

 

 

p1

1

w3(1)

больного в оставшиеся два дня, и дерево альтернатив

 

 

 

Изм3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1,9

 

 

 

 

для

первого

дня приобретает вид рис. 2.16. Из этого

 

 

 

w3

 

p2

2

w3(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

рисунка

 

видно,

 

 

 

что

 

 

 

w(1) = w(2) = w

2

.

Наконец,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.14

 

 

среднеожидаемая оценка состояния больного в 1-й день

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= w(1) p + w(2)

p

 

+ w(3)

p

 

= 2,17 0,3 + 2,17 0,5 +3 0,2 = 2,336 .

 

 

 

 

 

 

 

w

2

3

 

 

 

 

 

 

1

 

1

 

 

1

1

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

<Оп>

3

 

 

 

w2(3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p3

 

 

 

 

 

Z2 = 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1

 

 

 

 

 

 

 

<Жд>

 

 

 

 

w(1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Изм2

 

 

 

 

 

 

 

 

Z2 = 1

 

 

1.9

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 2,17

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

w2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z2 = 2

 

<Оп>

2

 

 

 

w2(2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.15

Это среднеожидаемая оценка состояния оперируемого больного, полученная за счет использования двух резервных дней. В случае, если бы эти дни не предоставлялись и больной бы оперировался всегда в 1-й день, среднеожидаемая оценка его состояния, как подсчитано выше, равнялась бы 1,9.

Таким образом, оптимальной стратегией врача будет следующая. Если в первый день состояние больного оценено на 3, то в этот день проводится операция. В случае же, если в первый день состояние больного оценивается меньше, чем на 3, решение об операции откладывается до следующего дня. Если на второй день состояние больного оценивается на 3 или на 2, то в этот день проводится операция. Если во второй день состояние больного оценено на 1, то операция откладывается на 3-й день. При такой тактике мы рассчитываем, что в момент операции состояние больного в среднем окажется равным 2,336 (вместо 1,9 при чисто случайной тактике).


38

 

 

 

 

 

 

<Оп>

3

 

 

 

 

 

 

 

 

w(3)

 

 

 

 

 

 

 

1

 

 

 

p3

z1

= 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1

 

 

<Жд>

2,17

 

Изм1

z1

=1

 

 

 

 

 

 

<Жд>

 

 

= 2,3

 

 

 

 

 

 

w1

 

 

 

 

w1(1) = w1(2) =

 

p2

 

 

w2

 

 

z1

= 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 2.16

В данном примере вместо хирургической операции могут, конечно, рассматриваться и другие существенные воздействия на организм человека, успешность применения которых критична к состоянию человека, меняющемуся во времени. Можно также переформулировать эту задачу как нахождение оптимального выбора момента выполнения ответственных действия человеком (спортивных достижений; специальных заданий, выполняемых в экстремальных условиях) в ограниченном интервале времени в условиях меняющегося во времени его физиологического или психологического состояния. При этом считается, что во всех промежуточных точках заданного интервала времени состояние человека может быть оценено количественно. Задачу можно существенно усложнить, если ввести зависимость данного состояния от предыдущего.

3 ПРИМЕНЕНИЕ ТЕОРИИ ИГР ДЛЯ ОПТИМИЗАЦИИ КЛИНИЧЕСКИХ РЕШЕНИЙ В ХИРУРГИИ

3.1 Игры и методы их решения

Рассмотрим игру (модель конфликтной ситуации), в которой участвует два игрока A и B , имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a , то игрок B при этом выигрывает a , поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а


39

совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока [6]. При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m

возможных стратегий A1, A2 ,K, Am , а у игрока B n возможных стратегий

B1, B2 ,K, Bn . Пусть также известны величины aij – выигрыши игрока A при использовании Ai с его стороны и Bj со стороны противника. Тогда игра,

называемая игрой m ×n , может быть представлена таблицей, называемой платежной матрицей или просто матрицей игры (табл. 3.1).

Таблица 3.1

Ai B j

B

B

B

 

1

2

 

n

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

Приведение игры к матричной форме может само по себе составить трудную задачу, однако таким путем многоходовая игра фактически сводится к одноходовой

– от игрока требуется сделать только один ход: выбрать подходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.

По матрице игры определяются нижняя α

и верхняя β цены игры. Пусть

αi = min αij , βj = max αij , тогда

 

 

j

i

 

 

 

α = max αi = max min αij

 

i

i

j

 

 

 

β = min βj = min max αij .

 

j

j

i

 

 

 

Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Известно [7], что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α = β. В этом случае матрица игры имеет седловую точку, а величина γ = α = β называется ценой


40

игры. Стратегии Ai и Bj , при которых достигается выигрыш γ , называются оптимальными чистыми стратегиями, а их совокупность – решением игры.

Более часто встречаются случаи, когда α β. В этом случае для получения наибольшего выигрыша игроку выгодно применять не одну (чистую) стратегию, а чередовать случайным образом несколько стратегий. Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются смешанными и задаются соответствующими вероятностными векторами. Пусть SA - смешанная стратегия игрока A , а SB - смешанная стратегия игрока B . Тогда SA = (p1, p2 ,K, pm ),

SB = (q1 , q2 ,K, qn ), где pi - вероятность применения игроком A стратегии Ai , qj -

вероятность применения игроком B стратегии Bj , причем

m

n

pi = qj =1.

i=1

j =1

Если допустить применение смешанных стратегий (чистая стратегия – частный случай смешанной), то для каждой конечной игры можно найти хотя бы одно решение, т.е. пару устойчивых оптимальных стратегий игроков (SA* , SB* ),

обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступить от своей [6]. Выигрыш, соответствующий решению, называется, как и раньше, ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α γ β.

 

Самая простая конечная игра – игра 2 ×2 . Ее матрица

 

 

Таблица 3.2

 

 

Ai Bj

 

B1

B2

имеет вид табл. 3.2. Если для этой матрицы

α = β, то игра

 

 

 

 

 

 

 

 

A1

 

a11

a12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеет седловую точку и ее

 

решение – это пара чистых

 

A2

 

a21

a22

стратегий, пересекающихся в седловой точке. Если же в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

матрице

2 ×2 седловой

точки

нет и α β,

то необходимо

искать

 

решение

в

смешанных

 

стратегиях.

Пара

 

оптимальных

 

смешанных стратегий

S* = (p , p

 

);

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

1

2

S*

= (q ,q

2

)

и цена игры в этом случае определяются по формулам [7]:

 

 

 

 

 

B

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1

=

 

 

a22 a21

;

p2 =1p1 =

 

a11 a12

;

(3.1)

 

 

 

 

 

a11

+ a22 a12

a21

a11 + a22 a12 a21