4329
.pdf11
Такая игра является простейшим случаем конечной игры. Если она имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.
Игра, в которой отсутствует седловая точка, в соответствии с основной
теоремой теории игр, имеет оптимальное решение, которое определяется парой |
||||||
смешанных стратегий |
S* |
p*, |
p* |
и S* |
q*, |
q* . |
|
A |
1 |
2 |
B |
1 |
2 |
Для того чтобы их найти воспользуемся теоремой об активных |
||||||
стратегиях. Если игрок |
А придерживается своей оптимальной стратегии S* , |
|||||
|
|
|
|
|
|
A |
то его средний выигрыш будет равен |
цене |
игры |
, какой бы активной |
|||
стратегией ни воспользовался игрок В. |
В данной игре обе чистые стратегии |
игрока В являются активными, поскольку в противном случае игра имела бы решение в чистых стратегиях, т.е. была бы игрой с седловой точкой. Выигрыш игрока А (проигрыш игрока В) – случайная величина, математическое ожидание (среднее значение) которой является ценой игры. Поэтому средний
выигрыш игрока (оптимальная стратегия) будет равен |
и для первой, и для |
|||||||||||
второй стратегии противника. |
|
|
|
|
|
|
|
|
||||
|
Средний выигрыш игрока А , если он использует оптимальную |
|||||||||||
смешанную стратегию S* |
p*, |
p* , а игрок В чистую стратегию B |
(это |
|||||||||
|
|
|
A |
1 |
2 |
|
|
|
|
|
1 |
|
соответствует первому столбцу платежной матрицы P) равен цене игры : |
||||||||||||
|
|
|
|
a p* a |
p* . |
|
|
|
||||
|
|
|
|
11 |
1 |
21 |
|
2 |
|
|
|
|
|
Тот же |
средний |
выигрыш |
получит |
игрок |
А , |
если |
второй |
игрок |
|||
применяет стратегию |
B , |
т.е. |
a |
p* |
a |
p* . |
Учитывая, что |
|||||
|
|
|
2 |
|
12 |
|
1 |
22 |
2 |
|
|
|
p* p* 1, |
получаем систему |
уравнений |
для |
определения оптимальной |
||||||||
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
стратегии S* |
и цены игры : |
|
|
|
|
|
|
|
|
|||
|
A |
|
|
|
|
|
|
|
|
|
|
|
12
a |
p* |
a |
p* |
, |
|
|
11 |
1 |
21 |
2 |
|
|
|
p* |
a |
p* |
, |
a |
|||||
|
12 |
1 |
22 |
2 |
|
|
|
* |
* |
1. |
|
|
|
p1 |
p2 |
|
|
Решив эту систему линейных алгебраических уравнений, получим |
|||||||||||
оптимальную стратегию S* |
p*, |
p* |
|
и цену игры . |
|
|
|
|||||
|
|
A |
|
1 |
2 |
|
|
|
|
|
|
|
|
Аналогичным образом |
можно |
найти оптимальную |
|
стратегию |
|||||||
S* |
q*, |
q* игрока |
В. |
В этом |
случае неизвестные q* |
, |
q* |
и |
||||
B |
1 |
2 |
|
|
|
|
|
|
1 |
|
2 |
|
удовлетворяют системе уравнений |
|
|
|
|
|
|
|
|||||
|
|
|
a |
q* |
a |
|
q* |
, |
|
|
|
|
|
|
|
|
11 |
1 |
12 |
2 |
|
|
|
|
|
|
|
|
|
|
q* |
a |
|
q* |
, |
|
|
|
|
|
|
a |
|
|
|
|
|
||||
|
|
|
|
21 |
1 |
|
22 |
2 |
|
|
|
|
|
|
|
|
|
* |
|
* |
1. |
|
|
|
|
|
|
|
|
|
q1 |
q2 |
|
|
|
|
1.2. Практическая часть Пример 1.1. Решить матричную игру, заданную платежной матрицей
|
4 |
5 |
6 |
7 |
9 |
|
|
|
|
|
|
|
|
P |
|
3 |
4 |
6 |
7 |
6 |
|
|
|
|
|
, |
|
|
7 |
6 |
10 |
8 |
|
|
|
|
11 |
||||
|
8 |
5 |
4 |
7 |
3 |
Решение. Найдем нижнюю и верхнюю цены игры. Для этого припишем справа от строк платежной матрицы минимальные элементы каждой строки:
|
4 |
5 |
6 |
7 |
9 |
|
4 |
|
3 |
4 |
6 |
7 |
6 |
|
3 |
|
|
||||||
7 |
6 |
10 |
8 |
11 |
6 |
||
|
8 |
5 |
4 |
7 |
3 |
|
3 |
|
|
13
и выбрав из них наибольший, получим нижнюю цену игры:
max 4;3;6;3 6 .
Припишем снизу от столбцов платежной матрицы максимальные
элементы каждого столбца: |
|
|
|
|
|
|
|
4 |
5 |
6 |
7 |
9 |
|
|
3 |
4 |
6 |
7 |
6 |
|
|
|
|||||
7 |
6 |
10 |
8 |
11 |
||
|
8 |
5 |
4 |
7 |
3 |
|
|
|
|||||
|
8 |
6 |
10 |
8 |
11 |
|
Ивыбрав из них наименьший, получим верхнюю цену игры:
min 8;6;10;8;11 6.
Вданном случае нижняя цена игры равна верхней: , а значит игра имеет седловую точку a32 6 , которой соответствует пара чистых стратегий
А3 и B2 :
B1 [B2 ] B3 B4 B5
A1 |
|
4 |
5 |
6 |
7 |
9 |
|
4 |
|
A2 |
|
3 |
4 |
6 |
7 |
6 |
|
3 |
|
|
|
||||||||
[ A ] |
7 |
6 |
10 8 |
11 |
6 |
||||
3 |
|
|
|
|
|
|
|
|
|
A |
8 |
5 |
4 |
7 |
3 |
3 |
|||
|
|
||||||||
4 |
|
|
|
|
|
|
|
|
|
|
|
8 |
6 |
10 8 11 |
6 |
О т в е т : А3 – оптимальная стратегия игрока А,
B2 – оптимальная стратегия игрока В,
= 6 – цена игры.
14
Пример 1.2. Решить матричную игру, заданную платежной матрицей
|
|
P |
1 |
2 . |
|
|
|
|
|
|
|
|
|
|
3 |
|
1 |
Решение. Прежде всего, проверим наличие седловой точки. Для этого |
|||||
найдем нижнюю и верхнюю цены игры |
|
|
|||
|
|
1 |
2 |
|
1 |
|
|
|
1 |
|
1 |
|
|
3 |
|
||
|
|
3 |
2 |
|
|
Нижняя |
цена |
игры max 1;1 1 и верхняя цена игры |
|||
min 3;2 |
2 . |
Так как , то седловой точки нет. В этом случае |
решение игры нужно искать в смешанных стратегиях.
Найдем оптимальную смешанную стратегию S* |
p*, |
|
p* |
игрока А |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
A |
1 |
|
2 |
|
|
и цену игры решая систему уравнений |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
1 p1 3 p2 |
, |
|
|
|
|
|
||||||||
|
|
|
|
|
p1 1 p2 |
|
, |
|
|
|
|
|
|
|||||
|
|
|
|
2 |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
1. |
|
|
|
|
|
|
||||
|
|
|
|
|
p1 |
p2 |
|
|
|
|
|
|
||||||
Приравняем левые части 1-го и 2-го уравнений |
|
|
|
|
|
|||||||||||||
1 p 3 p |
2 p |
1 p , то есть |
3 p 2 p |
0. |
|
|||||||||||||
1 |
2 |
|
|
1 |
|
|
|
2 |
|
|
|
|
|
1 |
2 |
|
|
|
Учитывая, что p 1 p , |
получаем |
|
5 p |
3. Таким образом, находим |
||||||||||||||
|
1 |
2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
решение системы |
p |
2 |
, |
p |
3 |
, |
|
7 |
. |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
||||||||||
|
1 |
5 |
|
2 |
5 |
|
|
5 |
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Для определения |
оптимальной смешанной стратегии |
S* |
q*, |
q* |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
B |
1 |
2 |
второго игрока составляем систему уравнений |
|
|
|
|
|
|
||||||||||||
|
|
|
|
1 q1 2 q2 |
, |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 q1 1 q2 |
, |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
1. |
|
|
|
|
|
|
||||
|
|
|
|
|
q1 |
q2 |
|
|
|
|
|
|
15
Приравнивая левые части 1-го и 2-го уравнений, и учитывая, что |
q 1 q |
, |
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
получаем уравнение |
|
|
|
|
|
|
|
1 (1 q ) 2 q |
3 (1 q ) 1 q , |
из которого |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
2 |
2 |
2 |
|
|
|
|
находим |
q |
4 |
. Подставляем найденное |
|
q в систему, находим ее решение |
||||||||||||||||||||||
|
|
|
|||||||||||||||||||||||||
|
|
|
2 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
q |
1 |
, |
q |
|
4 |
|
, |
7 |
. |
|
|
|
|
|
|
|
|
|
|
||||||||
1 |
5 |
|
2 |
5 |
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
S* |
|
2 |
|
3 |
|
|
|
|
|
|
|||||||||
|
О т в е т : |
|
|
|
|
|
, |
|
|
– оптимальная смешанная стратегия игрока А, |
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
A |
|
5 |
|
5 |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
S* |
1 |
, |
4 |
– оптимальная смешанная стратегия игрока В, |
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
B |
5 |
5 |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
7 |
|
|
|
|
|
– цена игры. |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
1.3. |
Индивидуальные задания |
|
|
|
|
|
|
Для игры с платежной матрицей игроков и цену игры.
5 |
6 |
7 |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
1. а) Р |
6 |
7 |
9 8 |
, |
|
|
|
|
|
|
|
|
|
|
|
|
5 |
8 |
4 |
|
|
|
|
|
6 |
|
|
|
|||
|
4 |
5 |
8 |
|
9 |
|
|
|
7 |
|
|||||
|
|
|
|
|
|
|
|
2. а) Р |
3 |
4 |
6 5 6 |
, |
|||
|
|
|
|
|
|
|
|
|
7 |
6 |
10 |
8 |
|
|
|
|
11 |
|
|||||
|
2 |
4 |
7 |
6 |
5 |
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
3. а) Р |
3 |
8 |
4 9 7 |
, |
|
||
|
|
|
|
|
|
|
|
|
3 |
4 |
5 |
6 |
|
|
|
|
2 |
|
|
||||
|
|
|
3 |
1 |
|
|
|
5 |
|
2 |
|
||||
|
|
|
|
|
|
|
|
4. а) Р |
5 |
|
5 4 6 |
, |
|||
|
|
|
|
|
|
|
|
|
4 |
|
2 |
0 |
|
|
|
|
|
5 |
|
||||
|
|
|
|
|
|
|
|
Р найти оптимальные стратегии
б) |
Р 2 |
11 |
; |
|
|
|
|
|
|
|
|
|
|
2 |
0 |
|
|
б) |
Р |
1 |
3 |
; |
|
|
|
|
|
|
|
|
8 |
5 |
|
||
б) |
Р 4 |
7 ; |
|
||
|
|
|
|
|
|
|
5 |
4 |
|
|
|
б) |
Р 5 |
16 |
; |
|
|
|
|
|
|
|
|
|
|
9 |
0 |
|
|
5.а)
6.а)
7.а)
8.а)
9.а)
10.а)
11.а)
12.а)
1
Р 8
8
8
Р 5
4
4
Р 7
7
4
Р 3
7
3
4
Р
62
3
3
Р
67
9
8
Р
76
2
5
Р
67
3 |
8 |
4 |
2 |
|
|
|
|
|
|
|
|
|
|
5 |
5 |
9 |
11 |
, |
|
|
|
|
|
|
|
|
|
3 |
6 |
7 |
2 |
|
|
|
|
|
|
||||
6 |
4 |
7 |
|
|
|
|
7 |
|
|
||||
|
|
|
|
|
|
|
4 |
3 |
4 |
6 |
, |
|
|
|
|
|
|
|
|
|
3 |
2 |
3 |
|
|
|
|
4 |
|
|
||||
9 |
5 |
3 |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
8 |
6 |
9 |
, |
|
|
|
|
|
|
|
|
|
|
4 |
2 |
|
|
|
|
|
6 |
|
|
|
|
||
5 |
8 |
|
9 |
|
||
7 |
|
|||||
|
|
|
|
|
|
|
4 |
6 |
5 |
|
6 |
|
, |
|
|
|
|
|
|
|
6 |
10 |
8 |
|
|
|
|
11 |
|
|||||
5 |
6 |
4 |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
8 |
4 |
3 |
|
|
|
|
|
|
|
, |
|
|
|
8 |
5 |
5 |
|
|
|
|
|
|
|
|
|||
7 |
4 |
2 |
|
|
|
|
6 |
1 |
8 |
|
|
|
|
|
|
|
|
|
4 |
4 |
9 |
|
|
|
|
|
|
, |
|
|
8 |
5 |
9 |
|
||
|
|
||||
2 |
3 |
5 |
|
|
|
0 |
3 |
5 |
|
|
|
|
|
|
|
|
|
1 |
2 |
6 |
|
|
|
|
|
|
, |
|
|
3 |
3 |
4 |
|
||
|
|
||||
1 |
4 |
5 |
|
|
|
4 |
1 |
3 |
|
||
|
|
|
|
|
|
8 |
2 |
4 |
|
||
|
|
|
|
, |
|
9 |
3 |
2 |
|||
|
|||||
10 |
8 |
9 |
|
16
б) |
Р 2 |
17 |
; |
|
|
|
|
|
|
|
|
3 |
0 |
|
б) |
Р 9 |
15 |
; |
|
|
|
|
|
|
|
|
3 |
0 |
|
б) |
Р 12 |
|
3 |
; |
|
|
|
|
|
|
9 |
7 |
|
|
б) |
Р 5 |
|
8 |
; |
|
|
|
|
|
|
7 |
|
6 |
|
б) |
Р 7 |
6 ; |
|
|
|
|
|
|
|
|
4 |
10 |
|
|
б) |
Р 9 |
17 ; |
|
|
|
|
|
|
|
|
8 |
|
0 |
|
б) |
Р 1 |
10 ; |
|
|
|
|
|
|
|
|
8 |
0 |
|
|
б) |
Р 5 |
8 |
; |
|
|
|
|
|
|
|
7 |
6 |
|
|
17
|
|
1 |
3 |
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
13. |
а) |
|
5 |
8 |
3 |
|
б) |
Р 6 |
9 |
; |
|
|
Р |
3 , |
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
7 6 8 |
5 |
|
8 |
7 |
|
|
||||
|
|
2 |
2 |
1 |
0 |
|
|
|
|
|
|
|
|
|
6 |
5 |
6 |
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
14. |
а) |
|
1 |
4 |
2 |
|
б) |
Р |
1 |
3 |
; |
|
Р |
1 , |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
8 |
5 7 |
4 |
|
|
8 |
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
2 |
6 |
2 |
|
|
|
|
|
|
|
|
|
8 |
4 |
3 |
7 |
|
|
|
|
|
|
|
15. |
а) |
|
|
6 |
8 |
|
б) |
Р |
4 |
5 . |
||
Р 7 |
9 , |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 |
|
5 |
|
|
|
|
|
8 |
2 |
4 |
|
|
|
|
|||
|
|
|
6 |
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
2.ГРАФИЧЕСКИЙ МЕТОД РЕШЕНИЯ МАТРИЧНОЙ ИГРЫ
2.1.Теоретическая часть
Рассмотрим игру размера 2 n с платежной матрицей
a |
a |
a |
... |
a |
|
P 11 |
12 |
13 |
|
1n . |
|
|
a22 |
a23 |
... |
|
|
a21 |
a2n |
По оси абсцисс (рис. 1) отложим единичный отрезок |
A1A2 ; точка |
A1 |
||||||
( x 0 ) изображает стратегию |
A1, точка |
A2 ( x 1) |
– стратегию A2 , |
а все |
||||
промежуточные точки |
этого |
отрезка – |
смешанные |
стратегии SA первого |
||||
игрока, причем расстояние от SA до правого конца – |
это вероятность |
p1 |
||||||
стратегии A1, расстояние до левого конца – вероятность |
p2 |
стратегии |
A2 . На |
|||||
вертикальных осях I и |
II откладываем выигрыши при стратегиях A1 |
и |
A2 |
|||||
соответственно. Если второй игрок примет стратегию |
Bi , то на оси I отмечаем |
|||||||
значение a , а на оси |
II – значение a |
, соответствующие стратегиям A1 и |
||||||
1i |
|
|
2i |
|
|
|
|
|
18
A2 , и через эти точки проводим прямую bi . Уравнение прямой bi находим как уравнение прямой, проходящей через две заданные точки (0;a1i ) и (1;a2i ) .
|
|
|
Рис. 1 |
|
|
|
|
|
|
Если игрок А |
применяет смешанную стратегию SA |
p ; p , |
то его |
||||||
|
|
|
|
|
|
1 |
2 |
|
|
выигрыш в случае, если противник применяет чистую стратегию Bi , равен |
|
||||||||
|
i a p a p a (1 p ) a p , |
|
|
|
|||||
|
|
1i 1 2i |
2 1i |
2 |
2i |
2 |
|
|
|
и этому выигрышу соответствует ордината y i |
точки М на прямой |
b |
c |
||||||
|
|
|
|
|
|
|
|
i |
|
абсциссой |
x p2 ( рис. 1 ). |
|
|
|
|
|
|
|
|
Ломаная b1MNb3 , отмеченная на чертеже ( рис. 2 ) жирной линией, |
|||||||||
позволяет определить минимальный выигрыш игрока |
А при любом поведении |
||||||||
игрока В. |
Точка |
N , в которой эта ломанная достигает максимума, |
|||||||
определяет решение и цену игры. |
Ордината точки N равна цене игры |
, |
19
а ее абсцисса p2 – вероятности применения стратегии A1 в оптимальной смешанной стратегии игрока А.
Рис. 2
Далее, непосредственно по чертежу, находим пару активных стратегий игрока В , пересекающихся в точке N (если в точке N пересекается более
двух стратегий, то выбираем любые две из них). Пусть это будут стратегии |
Bi |
|||||||||||
и |
B |
. Находим координаты точки N(xN ; yN ) , |
как точки пересечения прямых |
|||||||||
|
|
j |
|
|
|
|
|
|
|
|
|
|
b |
и |
b . Оптимальной стратегией игрока А будет |
p 1 x |
N |
, |
p x |
N |
, |
||||
i |
|
j |
|
|
1 |
|
|
2 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
||
yN |
|
|
|
|
|
|
|
|
|
|
||
|
|
Аналогично определяется |
оптимальная |
стратегия |
второго |
игрока |
||||||
S* |
0,..., qi*,...,q*j ,...,0 . На оси |
абсцисс откладываем |
единичный |
отрезок |
||||||||
B |
|
|
|
|
|
|
|
|
|
|
|
|
Bi |
B j , соответствующий активным стратегиям |
Bi |
и |
B j ; |
на осях |
I и |
II |
|||||
отмечаем соответствующие выигрыши и строим прямые |
a1 |
и |
a2 . |
В |
соответствии с принципом минимакса, вместо максимума нижней границы находим минимум верхней границы
20
Замечание. Иногда точка не является пересечением двух стратегий, а попадает на одну из прямых х = 0 или х = 1. В этом случае решением игры будут соответствующие чистые стратегии.
Для игры размера m 2 решение находится аналогично.
Действительно, поскольку выигрыш игрока А одновременно является проигрышем игрока В, то для решения задачи нужно построить ломаную, соответствующую верхней границе выигрыша игрока А, а затем найти на ней точку с минимальной ординатой.
2.2. Практическая часть Пример 2.1. Пусть игра задана матрицей
P 1 |
5 |
9 |
3 |
. |
|
|
|
|
|
6 |
3 |
2 |
7 |
|
Найти оптимальные стратегии игроков и определить цену игры графическим методом.
Решение. Игрок А имеет две стратегии, игрок B – четыре, поэтому на оси абсцисс откладываем единичный отрезок A1A2 . На вертикальной оси I
отмечаем выигрыши которые получит первый игрок, если будет придерживаться стратегии A1 при различных стратегиях второго игрока; а на
оси II – выигрыши которые получит, если будет придерживаться стратегии
A2 .
Проведем прямые bi (i = 1, 2, 3, 4), соответствующие стратегиям Bi и
выделим ломаную линию b1NMb3 , соответствующую нижней границе
выигрыша (рис. 3). Точка N , в которой эта ломанная достигает максимума, является пересечением прямых b1 и b2 .