Файл: Z9411_КафкаРС_ИссОп_КР.docx

Пусть игра задана матрицей A размерности m x n. Каждое разыгрывание игры в чистых стратегиях будет далее называться партией. Метод Брауна-Робинсон — это итеративная процедура построения последовательности пар смешанных стратегий игроков, сходящейся к решению матричной игры. В 1-ой партии оба игрока выбирают произвольную чистую стратегию. Пусть сыграно k партий, причем выбор стратегии в каждой партии запоминается. В (k + 1)-ой партии каждый игрок выбирает ту чистую стратегию, которая максимизирует его ожидаемый выигрыш, если противник играет в соответствии с эмпирическим вероятностным распределением, сформировавшимся за k партий. Оценивается интервал для цены игры и, если он достаточно мал, процесс останавливается. Полученные при этом вероятностные распределения определяют смешанные стратегии игроков. Пусть на первом этапе выбрана стратегия №1 Итерация №1. Минимальный элемент для нее равен -1 и находится под номером j=3. Следовательно, игрок II выбирает стратегию №3 Максимальный элемент равен 4 и находится под номером j=3. Следовательно, игрок I выбирает стратегию №3 Итерация №2. Минимальный элемент для нее равен 2 и находится под номером j=2. Следовательно, игрок II выбирает стратегию №2 Максимальный элемент равен 6 и находится под номером j=3. Следовательно, игрок I выбирает стратегию №3 Остальное решение сведем в таблицу.

k	i	B₁	B₂	B₃	j	A₁	A₂	A₃	V_min	V^max	V_ср
1	1	5	0	-1	3	-1	2	4	-1	4	³/₂
2	3	6	2	3	2	-1	0	6	1	3	2
3	3	7	4	7	2	-1	-2	8	⁴/₃	⁸/₃	2
4	3	8	6	11	2	-1	-4	10	³/₂	⁵/₂	2
5	3	9	8	15	2	-1	-6	12	⁸/₅	¹²/₅	2
6	3	10	10	19	1	4	-5	13	⁵/₃	¹³/₆	²³/₁₂
7	3	11	12	23	1	9	-4	14	¹¹/₇	2	²⁵/₁₄
8	3	12	14	27	1	14	-3	15	³/₂	¹⁵/₈	²⁷/₁₆
9	3	13	16	31	1	19	-2	16	¹³/₉	¹⁹/₉	¹⁶/₉
10	1	18	16	30	2	19	-4	18	⁸/₅	¹⁹/₁₀	⁷/₄

здесь: k - номер партии. i - номер стратегии, выбираемой игроком A. j - номер стратегии, выбираемой игроком В. B_i - накопленный игроком А выигрыш за k партий, при условии, что в данной партии B выбирает стратегию B_i. А_j - накопленный игроком В проигрыш за k партий, при условии, что в данной партии A выбирает стратегию А_j. V_min - нижняя оценка игры = min (накопленный выигрыш)/k. V^max - верхняя оценка игры = max (накопленный проигрыш)/k.

Доказано, что: W=(V_min+V^max)/2, при k → ∞ и p_i = N_i/k q_j = N_j/k N_i - сколько раз выбирается Аi стратегия. N_j - сколько раз выбирается Bj стратегия. N_A₁ = 2 P(A₁) = 2/10 = ¹/₅ N_A₂ = 0 P(A₂) = 0/10 = 0 N_A₃ = 8 P(A₃) = 8/10 = ⁴/₅ N_B₁ = 4 Q(B₁) = 4/10 = ²/₅ N_B₂ = 5 Q(B₂) = 5/10 = ¹/₂ N_B₃ = 1 Q(B₃) = 1/10 = ¹/₁₀ Цена игры, W = ⁷/₄ Стратегия игрока I: p = (¹/₅, 0, ⁴/₅) Стратегия игрока II: q = (²/₅, ¹/₂, ¹/₁₀)

Метод обратной матрицы

5	0	-1
1	-2	2
1	2	4

Главный определитель:

∆=5*((-2)*4 - 2*2) - 1*(0*4 - 2*(-1)) + 1*(0*2 - (-2)*(-1)) = -64

Найдём миноры и алгебраическое дополнение:

M11=

-2	2
2	4

= -12

A11 = (-1)¹⁺¹ * M1= 1 * (-12) = -12

M12 = 2; A12 = -2

M13 = 4; A13 = 4

M21 = -2; A21 = -2

M22 = 21; A22 = 21

M23 = 10; A23 = -10

M31 = -2; A31 = -2

M32 = 11; A32 = -11

M33 = -10; A33 = -10

Выпишем союзную матрицу (матрицу алгебраических дополнений):

C*=

-12	-2	4
-2	21	-10
-2	-11	-10

Транспонированная союзная матрица (поменяем местами строки со столбцами):

C*^T=

-12	-2	-2
-2	21	-10
4	-11	-10

Найдем обратную матрицу:

2 Биматричные игры.

Решите биматричную игру графическим методом

Решение:

В каждом столбце матрицы A найдем максимальный элемент. Эти элементы подчеркнуты в матрице A. Их положение соответствует приемлемым ситуациям 1-го игрока, когда второй игрок выбрал стратегию j соответственно. Затем в каждой строке матрицы B выберем наибольший элемент. Эти элементы подчеркнуты в матрице B. Их положение будет определять приемлемые ситуации 2-го игрока, когда первый игрок выбрал стратегию i соответственно. Платежная матрица игрока А:

3	2
5	1

Позиции максимумов в столбцах матрицы А: (2,1), (1,2) Платежная матрица игрока B:

4	2
0	1

Позиции максимумов в строках матрицы В: (1,1), (2,2) Если биматричная игра не имеет равновесных ситуаций в чистых стратегиях, то она неразрешима в чистых стратегиях. И тогда можно искать решение в смешанных стратегиях. Итак, чтобы в биматричной игре: А=(a), В = (b) пара (p,q); определяемая равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств: (p–1)(Cq-α) ≥ 0, p(Cq-α) ≥ 0; 0 ≤ p ≤ 1 (q-1)(Dp-β) ≥ 0, q(Dp-β) ≥ 0; 0 ≤ q ≤ 1 где C = a₁₁ - a₁₂ - a₂₁ + a₂₂ α = a₂₂- a₁₂ D = b₁₁-b₁₂-b₂₁+b₂₂ β = b₂₂-b₂₁ Проводя необходимые вычисления: C = 3 - 2 - 5 + 1 = -3 α = 1 - 2 = -1 D = 4 - 2 - 0 + 1 = 3 β = 1 - 0 = 1 и рассуждения (p–1)(-3q+1) ≥ 0 p(-3q+1) ≥ 0 (q-1)(3p-1) ≥ 0 q(3p-1) ≥ 0 получаем, что: 1) p=1,q ≤ ¹/₃ p=0, q ≥ ¹/₃ 0 ≤ p ≤ 1, q=¹/₃ 2) q=1,p ≥ ¹/₃ q=0, p ≤ ¹/₃ 0 ≤ q ≤ 1, p=¹/₃

Рассматриваемая игра имеет единственную ситуацию равновесия (P*,Q*), где оптимальными стратегиями по Нэшу являются: P* = (¹/₃;²/₃); Q* = (¹/₃;²/₃).

Она может быть реализована при многократном повторении игры (то есть при многократном воспроизведении описанной ситуации) следующим образом: игрок I должен использовать чистые стратегии 1 и 2 с частотами ¹/₃ и ²/₃, а игрок II – чистые стратегии 1 и 2 с частотами ¹/₃ и ²/₃. Любой из игроков, отклонившись от указанной смешанной стратегии, уменьшает свой ожидаемый выигрыш. Цена игры Цена игры для первого игрока: H_a(¹/₃;¹/₃) = ⁷/₃ Цена игры для второго игрока: H_b(¹/₃;¹/₃) = ⁴/₃

Ответ: Смешанная стратегия для первого игрока P* = (¹/₃;²/₃); Смешанная стратегия для второго игрока Q* = (¹/₃;²/₃). Выигрыш игроков в равновесной ситуации: f(P*,Q*) = (⁷/₃;⁴/₃).

Смотрите также файлы

Тестовые вопросы по дисциплине Теплоснабжение и зеленая энергетика.docx

Практическая работа 2 часть 3 (по Теме 2).pptx

за мерзімді жоспар блімі 10. 3С Тым уалаушылы пен згергіштік задылытары Мектеп.docx

Исследовательская работа Их имена в названиях улиц.docx

Сенсорные эталоны.docx

Файл: Z9411_КафкаРС_ИссОп_КР.docx

1.4 Решите матричную игру методом Брауна-Робинсон и методом обратной матрицы.

2 Биматричные игры.

Смотрите также файлы

Информация

Списки файлов

Дополнительно