- •Введение
- •1.1. Задачи теории игр в экономике
- •1.2. Конфликты и теория игр
- •1.3. Основные понятия и классификация видов игр
- •2.1. Примеры матричных игр
- •2.2. Равновесная ситуация
- •2.3. Смешанные стратегии
- •2.4. Решение матричной игры 2×2
- •2.5. Матричные игры 2×n
- •2.7. Матричные игры m×n
- •2.7.1. Доминирование стратегий
- •2.7.2. Аффинное правило
- •2.7.3. Итерационный метод решения матричных игр
- •3.1. Основные понятия и ситуация равновесия
- •3.2. Биматричные игры 2×2
- •3.3. Поиск равновесных ситуаций
- •3.4. Кооперативные игры
- •4. Игры с природой
- •4.3. Принятие решений в условиях риска
- •Критерий Байеса относительно выигрышей
- •Критерий Байеса относительно рисков
- •Критерий Лапласа относительно выигрышей
- •Критерий Байеса относительных значений вероятностей состояний природы с учетом выигрышей
- •4.4. О планировании эксперимента в играх с природой
- •4.5. Выбор решений с помощью дерева решений
- •Литература
Последние равенства и представляют собой основу для разработки различных методов решения матричных игр.
Таким образом, можно привести следующие условия приме-
нения смешанных стратегий: |
|
|
|
|
1. |
Игра без седловой точки. |
|
|
|
2. |
Игроки используют |
случайную |
смесь |
чистых стратегий |
с заданными вероятностями. |
|
|
|
|
3. |
Игра повторяется многократно в сходных условиях. |
|||
4. |
При любом ходе ни |
один из |
игроков |
не информирован |
остратегии второго игрока.
5.Допускается усреднение результатов игр.
Перейдем теперь к изучению методов решения матричных игр в смешанных стратегиях.
2.4. Решение матричной игры 2×2
Начнем рассмотрение методов нахождения оптимальных смешанных стратегий с простейшей игры, описываемой платежной матрицей
æ a |
a |
ö |
A = ç 11 |
12 |
÷ . |
è a21 |
a22 |
ø |
Пусть смешанные стратегии игроков имеют вид:
S1 = |
æ |
A |
A |
ö |
|
, S2 |
æ B |
B |
ö |
|
|
|
|
|||
ç |
1 |
p |
2 |
÷ |
|
= ç |
1 |
q |
2 |
÷ . |
|
|
|
|
||
|
è |
p |
2 |
ø |
|
|
è |
q |
2 |
ø |
|
|
|
|
||
|
1 |
|
|
|
1 |
|
|
|
|
|
||||||
Оптимальные |
стратегии p0 |
и |
p0 |
=1 - p0 |
и цена игрыn |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
1 |
|
должны удовлетворять условиям: |
|
|
|
|
||||||||||||
ìa |
p |
+ a |
p |
|
=n , |
|
|
|
|
|
|
|
|
(2.14) |
||
í 11 |
1 |
|
21 |
|
2 |
|
|
|
|
|
|
|
|
|
|
|
îa12 p1 + a22 p2 =n , |
|
|
|
|
|
|
|
|
|
|||||||
или |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a11 p1 + a21 (1 - p1 ) |
=a12 p1 + a22 (1 - p1 ) . |
|
27
Откуда получаем следующее решение матричной игры:
ì |
|
|
|
a22 - a21 |
|
|
|
|
|
||||
ï p10 = |
|
|
|
|
|
, |
|
|
|||||
|
a11 + a22 - (a12 + a21 ) |
|
|
||||||||||
ï |
|
|
|
|
|||||||||
ï |
|
|
|
|
|
|
|
a |
- a |
|
|
||
ï |
|
|
|
|
|
|
|
|
|
||||
í p20 = |
1 - p10 = |
|
|
11 |
|
12 |
, |
(2.15) |
|||||
a11 + a22 - (a12 + a21 ) |
|||||||||||||
ï |
|
|
|
|
|
|
|
||||||
ï |
|
|
=p0 |
|
|
|
p0 = |
|
a11a22 - a12 a21 |
|
|||
ïn a |
+ a |
|
|
|
. |
||||||||
|
|
a11 + a22 - (a12 + a21 ) |
|||||||||||
ï |
11 |
1 |
|
21 |
2 |
|
|||||||
î |
|
|
|
|
|
|
|
|
|
|
|
|
Вычислив оптимальное значение n , можем вычислить и оптимальную смешанную стратегию второго игрока из условия a11q1 + a12 q2 = v , или a11q1 + a12 (1- q1 ) = v . А именно:
q0 |
|
v - a |
q0 |
1- q0 |
a |
- v |
, |
(2.15') |
|||
= |
|
= 12 |
, |
= |
11 |
|
|||||
|
|
|
|||||||||
1 |
|
a11 |
- a12 |
2 |
1 |
a11 - a12 |
|
|
|||
|
|
|
|
|
|
при a11 ¹ a12 .
Эту задачу можно решить и графически, учитывая, что решение системы (2.14) представляет собой геометрически точку пересечения двух прямых на плоскости ( p1 , n ) или (1 - p1 , n ).
Приведем алгоритм геометрического способа решения игры
2×2:
1. На оси абсцисс откладываем отрезок единичной длины p1 = p Î[0, 1].
2. |
На оси ординат |
откладываем выигрышы при |
стратегии |
A2 , а на прямой p =1 — выигрыши при стратегии A1 . |
|
||
3. |
Строим стратегии, проходящие через точки: |
|
|
а) (0, a21 ) и (1, a11 ); |
|
|
|
б) (0, a22 ) и (1, a12 ) . |
|
|
|
4. |
Находим точку |
пересечения прямых, которая |
и дает |
решение матричной игры ( p10 , v).
28
Проиллюстрируем данный алгоритм на рисунке:
n
a21 |
a12 |
|
n |
|
|
|
|
a22 |
|
|
|
|
|
|
|
a11 |
|
0 |
|
p10 |
1 |
p |
|
|
Рис. 2.1 |
|
|
№ 2.5. Решите матричную игру 2 ´ 2 , |
заданную |
платежной |
||
матрицей: |
|
|
|
|
æ 3 |
8 ö |
|
|
|
A = ç |
4 |
÷ . |
|
|
è7 |
ø |
|
|
Решение. Определим сначала верхнюю и нижнюю цену игры:
a1 |
= 3, |
a2 |
4, =a |
max {3, =4} |
4 , |
b1 |
= 7, |
b2 |
8, =b |
min {7, =8} |
7 . |
Так как a < b , то имеем игру без седловой точки, что при-
водит к необходимости рассмотрения смешанной стратегии. По формулам (2.15) найдем:
p0 |
= |
4 |
- 7 |
|
= 0,375 , |
|
|
|
|||
1 |
|
3 + 4 |
- 7 |
- 8 |
|
|
|
|
|||
p0 |
=1 - p0 1=- 0,375 = 0,625 , |
||||
2 |
|
1 |
|
|
|
n = 3 ×0,375 + 7 ×0,625 = 5,5 .
29
По формулам (2.15´) определим смешанную стратегию второго игрока:
q0 |
= |
5,5=-8 |
= 0,5, q0 |
1- q0 |
= 0,5 . |
1 |
3 - 8 |
2 |
1 |
|
|
|
|
|
|
||
Ответ: p0 |
= (0,375; 0,625=), |
q0 (0,5; 0,5=), v 5,5 . |
|||
Проиллюстрируем это решение графически согласно приве- |
|||||
денному выше алгоритму. |
|
|
|||
|
n |
|
|
|
|
|
|
|
|
|
8 |
|
7 |
|
|
|
|
|
5,5 |
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
3 |
0 |
0,375 |
1 |
p |
Рис. 2.2
2.5. Матричные игры 2×n
Пусть платежная матрица игры имеет вид:
æ a |
a |
... |
a |
ö |
A = ç 11 |
12 |
... |
1n |
÷ . |
è a21 |
a22 |
a2n ø |
30
Тогда, согласно теореме 2.2, решение игры находится из уравнения:
n = min a |
p0 + a 1 |
- p0 |
)) |
=max min |
( |
a |
p + a |
(1 - p) |
) |
, j= |
1, n |
. |
|
j |
( 1 j |
2 j ( |
|
0£ p£1 j |
1 j |
2 j |
|
|
|
|
|||
Для нахождения максимума (по p ) функции |
|
|
|
|
|
||||||||
min (a1 j |
p + a2 j (1- p)), |
|
|
|
|
|
|
|
(2.16) |
||||
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
построим ее график. Для этого надо построить n прямых вида:
wj = a1 j p + a2 j (1 - p ) , |
(2.16´) |
на плоскости ( p, w), p Î[0, 1] |
и путем визуального сравнения |
выбрать ломанную, огибающую их снизу. Верхняя точка этой ломанной и дает решение игры.
Геометрически это можно проиллюстрировать следующим образом:
w
n
0 |
p0 |
p0 |
1 |
p |
|
||||
|
1 |
2 |
|
|
Рис. 2.3
Здесь нижняя огибающая выделена жирной линией.
31
№ 2.6. Найти оптимальную стратегию первого игрока в матричной игре, заданной матрицей 2×3:
æ1 |
3 |
5 |
ö |
|
A = ç |
4 |
2 |
1 |
÷ . |
è |
ø |
Решение. 1. Сначала проанализируем игру на наличие седловой точки:
a1 |
= 1, |
a2 |
1, =a |
max{1;=1} 1 , |
b1 |
= 4, |
b2 |
3, b3= |
5, b min{=4; 3; 5} 3 . |
Так как a < b , то седловой точки нет и надо искать решение
всмешанных стратегиях.
2.Вычислим средние выигрыши первого игрока, при условии, что второй игрок выбирает только чистые стратегии, при помощи таблицы:
|
|
p |
|
1 |
3 |
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 – p |
|
4 |
2 |
|
1 |
|
|
|
|
|
|
|
|
|
|
||
То есть, получаем следующие прямые: |
|
|
|
||||||
w1 = p + 4(1 - p)= 4 - 3 p , |
|
|
|
|
|
|
|||
w2 = 3 p + 2(1 - p)= p + 2 , |
|
|
|
|
|
|
|||
w3 = 5 p + (1- p) = 4 p -1 . |
|
|
|
|
|
|
|||
3. |
Построим нижнюю |
огибающую |
данных |
трех прямых |
|||||
(рис. 2.4). |
|
|
|
|
|
|
|||
4. |
Видно, что максимальное значение огибающей определя- |
||||||||
ется |
точкой пересечения |
прямойw1 с прямой w2 . |
Поэтому |
решаем систему уравнений:
32
w |
|
|
5 |
4 |
|
|
|
|
|
|
3 |
2,5 |
|
|
|
2 |
|
|
|
1 |
|
|
1 |
|
|
|
|
0 |
0,5 |
1 |
p |
|
Рис. 2.4 |
|
|
ì4 - 3 p = w, |
|
|
|
í |
|
|
|
î p + 2 = w, |
|
|
|
а именно: |
|
|
|
4 p = 2, p = 0,5 . |
|
|
|
Следовательно, получили следующее решение: |
|
|
|
n = 0,5 + 2 = 2,5, |
p0 = (0,5; 0,5). |
|
|
Найдем теперь оптимальную стратегию для второго игрока. Здесь в зависимости от формы нижней огибающей может представиться несколько случаев.
А. Нижняя огибающая имеет единственную точку максимума
( p0 ,n 0 ).
1. Если p0 = (0;1), то есть оптимальной стратегией первого игрока является стратегия A2 , то второму игроку выгодно применять чистую стратегию, соответствующую номеру прямой
33
( k 0 ), проходящей через точку( 0, n ) и имеющей наибольший отрицательный наклон.
w
n
(k0 )
0 |
1 |
p |
Рис. 2.5
2. Если p0 = (1; 0) , то оптимальной для второго игрока яв-
ляется стратегия, соответствующая номеру ( k 0 ) соответствующей прямой, имеющей наименьший положительный наклон.
w
n
(k0 )
0 |
1 |
p |
Рис. 2.6
34
3. Если 0 < pi0 <1 , то в оптимальной точке пересекаются, как минимум, две прямые:
w
n
(k0 ) |
(l |
0 |
) |
|
|
0 |
p0 |
1 |
p |
Рис. 2.7
одна из которых ( k 0 ) имеет положительный наклон, а другая ( l 0 ) отрицательный. И оптимальная смешанная стратегия второго игрока получается при
q0 = q , 1- q0 |
=q , q= 0, j ¹ k,l, |
k |
l j |
где q0 является решением уравнения
a1k q + a1l (1 - q) a=2k q + a2l (1- q ) .
B. Нижняя огибающая имеет горизонтальный участок.
35
w
(k0 )
0 |
1 |
p |
Рис. 2.8
Тогда оптимальной для второго игрока является чистая стратегия Bk0 .
Найдем теперь оптимальную стратегию второго игрока в нашей задаче.
1. Так как в оптимальной точке пересекаются первые две прямые, то
q1 = q, q2 = 1 - q, q3 = 0,
то есть из трех стратегий применяются первые две(активными являются B1 и B2 ).
2. Приравняем соответствующие средние выигрыши второго игрока с использованием таблицы:
q |
1 – q |
0 |
|
|
|
1 |
3 |
5 |
|
|
|
4 |
2 |
1 |
|
|
|
36
а именно:
1× q + 3×(1- q ) + 0 ×5 = 4 × q + (1 - q )× 2 + 0 ×1 .
3. Решим последнее уравнение:
q + 3 - 3q 4q +=2 - 2q, 4q =1 ,
0 |
|
1 |
|
|
0 |
æ |
|
1 |
|
3 |
|
ö |
|
q1 |
= |
|
|
, |
q |
|
= ç |
|
|
; |
|
;0 |
÷ . |
4 |
|
4 |
4 |
||||||||||
|
|
|
|
|
è |
|
|
|
ø |
||||
4. |
Вычислим цену игры: |
||||||||||||
|
|
|
1 |
|
æ |
|
|
1 ö |
|
|
|
||
n =1× |
|
|
+ 3 |
ç1 - |
|
|
÷ |
= 2,5. |
|||||
4 |
|
4 |
|||||||||||
|
|
|
|
è |
|
|
ø |
|
|
|
Следовательно, полное решение игры имеет вид:
p |
0 |
= (0,5; 0,5), |
q |
0 |
æ 1 |
; |
3 |
; 0 |
ö |
, |
n = 2,5. |
|
|
|
= ç |
|
|
÷ |
|||||||
|
|
4 |
4 |
|||||||||
|
|
|
|
|
è |
|
|
ø |
|
|
2.6.Матричные игры m×2
Вэтом случае платежная матрица игры имеет вид:
æ a11 |
a12 |
ö |
|
ç a |
a |
|
÷ |
А = ç 21 |
|
22 |
÷ . |
ç ... |
... |
÷ |
|
ç |
am2 |
÷ |
|
è am1 |
ø |
Решение этой игры аналогично решению игры2 ´ n , только
в этом случае на плоскости(q,w) ищется минимум верхней огибающей прямых
37
wi = ai1q + ai 2 (1 - q), i =1, m .
Рассмотрим конкретный пример игры 3 ´ 2 .
№ 2.7. Найти решение игры 3 ´ 2 :
|
æ1 |
4 |
ö |
|
A = |
ç |
3 |
-2 |
÷ |
ç |
÷ . |
|||
|
ç |
0 |
5 |
÷ |
|
è |
ø |
Решение. 1. Проанализируем игру на наличие седловой точки:
a1 =1, a2 = -2, a3 = 0, a = 1, b1 = 3, b2= 5, b= 3.
То есть a < b и необходимо применить смешанную страте-
гию.
2. Вычислим средние выигрыши второго игрока(при условии, что первый игрок выбирает только чистые стратегии). Из таблицы
q |
1 – q |
|
|
1 |
4 |
|
|
3 |
-2 |
|
|
0 |
5 |
|
|
получаем следующие прямые:
w = q |
+ 4 1- q = |
4 - 3q; |
||||
1 |
|
|
( |
) |
|
|
w |
2 |
= 3q - |
( |
) |
|
|
|
2 1 |
- q= -2 + 5q; |
||||
w = 0 + 5 1 - q = 5 - 5q. |
||||||
3 |
|
|
( |
) |
|
38
3. Построим верхнюю огибающую.
w
5
4
3
n
1
0 |
3 |
1 |
q |
4
-2
Рис. 2.9
4. Так как наименьшее значение верхней огибающей получается как решение системы уравнений:
ìw =q + 4(1 - q ),
ï
í
ïîw = 3q - 2(1 - q ),
то получаем:
3q - 2(1 - q) =q + 4 (1 - q);
3q - 2 + 2q= q + 4 - 4q ;
39