ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.04.2024
Просмотров: 32
Скачиваний: 0
СОДЕРЖАНИЕ
Раздел 2 Линейное программирование
2 Составьте опорный план транспортной задачи методом Фогеля и оцените его стоимость.
Раздел 3 Динамическое программирование
1 Антагонистические матричные игры
1.1 Определите нижнюю и верхнюю цены, проверьте, имеет ли игра решение в чистых стратегиях.
1.4 Решите матричную игру методом Брауна-Робинсон и методом обратной матрицы.
Раздел 5 Теория игр
1 Антагонистические матричные игры
1.1 Определите нижнюю и верхнюю цены, проверьте, имеет ли игра решение в чистых стратегиях.
Решение:
Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I.
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 1, которая указывает на максимальную чистую стратегию A2. Верхняя цена игры b = min(bj) = 2. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 1 ≤ y ≤ 2. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
Ответ: нижняя цена = 1, верхняя цена = 2, игра не имеет решение в чистых стратегиях.
1.2. Найдите решение в смешанных стратегиях матричной игры 2×2 аналитически и с использованием понятия равновесия по Нэшу
Решение:
нижняя цена игры a = 1,3
верхняя цена игры b = 1,5
Находим решение игры в смешанных стратегиях. Запишем систему уравнений. Для игрока I 1.5p1+1.3p2 = y 0.9p1+1.8p2 = y p1+p2 = 1
Для игрока II 1.5q1+0.9q2 = y 1.3q1+1.8q2 = y q1+q2 = 1
Формулы:
Решая эти системы, находим:
y = 1.391 p1 = 0.455 (вероятность применения 1-ой стратегии). p2 = 0.545 (вероятность применения 2-ой стратегии).
Оптимальная смешанная стратегия игрока I: P = (0.455; 0.545) q1 = 0.818 (вероятность применения 1-ой стратегии). q2 = 0.182 (вероятность применения 2-ой стратегии).
Оптимальная смешанная стратегия игрока II: Q = (0.818; 0.182) Цена игры: y = 1.391
Ответ:y=1.391 P(0.45, 0.55) Q(0.82, 0.18)
Равновесие Нэшу
Теперь найдем решение той же игры по Нэшу, рассчитав математическое ожидание выигрыша А.
Отсюда получаем y = 0.818, x = 0.455. Соответственно, можем определить цену игры в точке равновесия по Нэшу:
1.3 Проведите сокращение размерности игры до формата m×2 или 2× n и найдите ее решение в смешанных стратегиях графическим методом. Представьте оптимизированную игру в виде задачи линейного программирования и проверьте правильность решения средствами MS Excel.
Решение:
Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы. Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью. Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ≥ akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая. Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ≤ ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой. Стратегия A1 доминирует над стратегией A3 (все элементы строки 1 больше или равны значениям 3-ой строки), следовательно, исключаем 3-ую строку матрицы. Вероятность p3 = 0.
С позиции проигрышей игрока В стратегия B2 доминирует над стратегией B3 (все элементы столбца 2 меньше элементов столбца 3), следовательно, исключаем 3-й столбец матрицы. Вероятность q3 = 0.
Мы свели игру 3 x 5 к игре 2 x 4. Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
Находим решение игры в смешанных стратегиях графическим методом. Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2. Решение игры (2 x n) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Выделяем нижнюю границу выигрыша B2NB3. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B2B2 и B3B3, для которых можно записать следующую систему уравнений: y = 14 + (16 - 14)p2 y = 20 + (10 - 20)p2 Откуда p1 = 1/2 p2 = 1/2 Цена игры, y = 15 Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений, исключив стратегию B1,B4, которая дает явно больший проигрыш игроку B, и, следовательно, q1 = 0,q4 = 0. 14q2+20q3 = y 16q2+10q3 = y q2+q3 = 1 или 14q2+20q3 = 15 16q2+10q3 = 15 q2+q3 = 1 Решая эту систему, находим: q2 = 5/6. q3 = 1/6.
Ответ: Цена игры: y = 15, векторы стратегии игроков: Q(0, 5/6, 1/6, 0), P(1/2, 1/2)
Проверка в Excel:
С помощью дополнения «Поиск решения» удалось подтвердить корректность результатов.
Представление оптимизированной игры в виде задачи линейного программирования.
Математические модели пары двойственных задач линейного программирования можно записать так: найти минимум функции F(x) при ограничениях (для игрока II): 10x1+22x2 ≥ 1 14x1+16x2 ≥ 1 20x1+10x2 ≥ 1 24x1+8x2 ≥ 1 F(x) = x1+x2 → min найти максимум функции Z(y) при ограничениях (для игрока I): 10y1+14y2+20y3+24y4 ≤ 1 22y1+16y2+10y3+8y4 ≤ 1 Z(y) = y1+y2+y3+y4 → max Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы. Определим максимальное значение целевой функции Z(Y) = y1+y2+y3+y4 при следующих условиях-ограничений. 10y1+14y2+20y3+24y4≤1 22y1+16y2+10y3+8y4≤1 Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме). 10y1+14y2+20y3+24y4+y5 = 1 22y1+16y2+10y3+8y4+y6 = 1 Решим систему уравнений относительно базисных переменных: y5, y6 Полагая, что свободные переменные равны 0, получим первый опорный план: Y0 = (0,0,0,0,1,1)
Базис |
B |
y1 |
y2 |
y3 |
y4 |
y5 |
y6 |
y5 |
1 |
10 |
14 |
20 |
24 |
1 |
0 |
y6 |
1 |
22 |
16 |
10 |
8 |
0 |
1 |
Z(Y0) |
0 |
-1 |
-1 |
-1 |
-1 |
0 |
0 |