Файл: Z9411_КафкаРС_ИссОп_КР.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 12.04.2024

Просмотров: 34

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Раздел 5 Теория игр

1 Антагонистические матричные игры

1.1 Определите нижнюю и верхнюю цены, проверьте, имеет ли игра решение в чистых стратегиях.

Решение:

Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.

Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 1, которая указывает на максимальную чистую стратегию A2. Верхняя цена игры b = min(bj) = 2. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 1 ≤ y ≤ 2. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).

Ответ: нижняя цена = 1, верхняя цена = 2, игра не имеет решение в чистых стратегиях.

1.2. Найдите решение в смешанных стратегиях матричной игры 2×2 аналитически и с использованием понятия равновесия по Нэшу

Решение:

нижняя цена игры a = 1,3

верхняя цена игры b = 1,5

Находим решение игры в смешанных стратегиях. Запишем систему уравнений. Для игрока I 1.5p1+1.3p2 = y 0.9p1+1.8p2 = y p1+p2 = 1

Для игрока II 1.5q1+0.9q2 = y 1.3q1+1.8q2 = y q1+q2 = 1

Формулы:

Решая эти системы, находим:

y = 1.391 p1 = 0.455 (вероятность применения 1-ой стратегии). p2 = 0.545 (вероятность применения 2-ой стратегии).

Оптимальная смешанная стратегия игрока I: P = (0.455; 0.545) q1 = 0.818 (вероятность применения 1-ой стратегии). q2 = 0.182 (вероятность применения 2-ой стратегии).

Оптимальная смешанная стратегия игрока II: Q = (0.818; 0.182) Цена игры: y = 1.391

Ответ:y=1.391 P(0.45, 0.55) Q(0.82, 0.18)

Равновесие Нэшу

Теперь найдем решение той же игры по Нэшу, рассчитав математическое ожидание выигрыша А.


Отсюда получаем y = 0.818, x = 0.455. Соответственно, можем определить цену игры в точке равновесия по Нэшу:

1.3 Проведите сокращение размерности игры до формата m×2 или 2× n и найдите ее решение в смешанных стратегиях графическим методом. Представьте оптимизированную игру в виде задачи линейного программирования и проверьте правильность решения средствами MS Excel.

Решение:

Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью. Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ≥ akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая. Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ≤ ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой. Стратегия A1 доминирует над стратегией A3 (все элементы строки 1 больше или равны значениям 3-ой строки), следовательно, исключаем 3-ую строку матрицы. Вероятность p3 = 0.

С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B3 (все элементы столбца 2 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0.

Мы свели игру 3 x 5 к игре 2 x 4. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.

Находим решение игры в смешанных стратегиях графическим методом. Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2. Решение игры (2 x n) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Выделяем нижнюю границу выигрыша B2NB3. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B2B2 и B3B3, для которых можно записать следующую систему уравнений: y = 14 + (16 - 14)p2 y = 20 + (10 - 20)p2 Откуда p1 = 1/2 p2 = 1/2 Цена игры, y = 15 Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений, исключив стратегию B1,B4, которая дает явно больший проигрыш игроку B, и, следовательно, q1 = 0,q4 = 0. 14q2+20q3 = y 16q2+10q3 = y q2+q3 = 1 или 14q2+20q3 = 15 16q2+10q3 = 15 q2+q3 = 1 Решая эту систему, находим: q2 = 5/6. q3 = 1/6.


Ответ: Цена игры: y = 15, векторы стратегии игроков: Q(0, 5/61/6, 0), P(1/21/2)

Проверка в Excel:

С помощью дополнения «Поиск решения» удалось подтвердить корректность результатов.

Представление оптимизированной игры в виде задачи линейного программирования.

Математические модели пары двойственных задач линейного программирования можно записать так: найти минимум функции F(x) при ограничениях (для игрока II): 10x1+22x2 ≥ 1 14x1+16x2 ≥ 1 20x1+10x2 ≥ 1 24x1+8x2 ≥ 1 F(x) = x1+x2 → min найти максимум функции Z(y) при ограничениях (для игрока I): 10y1+14y2+20y3+24y4 ≤ 1 22y1+16y2+10y3+8y4 ≤ 1 Z(y) = y1+y2+y3+y4 → max Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы. Определим максимальное значение целевой функции Z(Y) = y1+y2+y3+y4 при следующих условиях-ограничений. 10y1+14y2+20y3+24y4≤1 22y1+16y2+10y3+8y4≤1 Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме). 10y1+14y2+20y3+24y4+y5 = 1 22y1+16y2+10y3+8y4+y6 = 1 Решим систему уравнений относительно базисных переменных: y5, y6 Полагая, что свободные переменные равны 0, получим первый опорный план: Y0 = (0,0,0,0,1,1)

Базис

B

y1

y2

y3

y4

y5

y6

y5

1

10

14

20

24

1

0

y6

1

22

16

10

8

0

1

Z(Y0)

0

-1

-1

-1

-1

0

0