
- •Элементы теории игр. Конфликтные ситуации. Решение игр. Пример решения в условиях конфликтных ситуаций и противодействия. § 1. Основные понятия теории игр.
- •Краткая классификация игр.
- •§ 2. Платежная матрица.
- •§ 3. Примеры игр.
- •§ 4.Игры с седловой точкой.
- •§5.Игры без седловых точек.
- •§ 6. Решение игры методом линейного программирования.
- •Рассмотрим пример экономической задачи.
- •§7. Итеративный метод решения игр.
§ 4.Игры с седловой точкой.
Рассмотрим общие принципы решения игр двух лиц с нулевой суммой. На основании принципа разумности рекомендуется выбирать в качестве наилучшей стратегии ту, которая обеспечивает наибольший гарантированный выигрыш (то есть выигрыш, не зависящий от действий противника, выигрыш, который противник никоим образом не может уменьшить). Пусть игра определяется матрицей: . Игрок A имеет m чистых стратегий Ai, а игрок B – n чистых стратегий Bj, . Паре стратегий
(Ai, Bj) соответствует платеж Cij, выплачиваемый игроком B игроку A в конце игры, то есть выигрыш игрока A.
Если игрок A
использует стратегию Ai,
то он получит выигрыш, по крайней мере
равный
,
где минимум берется по всем стратегиям
игрока B.
И так как игрок A
свободен в выборе своей стратегии, то
для него естественно стремится к тому,
чтобы сделать
возможно большим; то есть стремится
выбрать такую стратегию Ai0,
чтобы получить
выигрыш не меньше, чем
,
где максимум берется по всем стратегиям
игрока A.
Стратегия Ai0 называется максиминной стратегией игрока A. Это его наиболее осторожная стратегия, применение которой при любом поведении игрока B гарантирует игроку A выигрыш Cij не менее α. Величина α называется нижней ценой игры или максимином.
Игрок B,
рассуждая таким же образом, выбирает
стратегию Bj0,
при которой игрок A
получит выигрыш не более чем
.
Стратегия Bj0
называется минимаксной стратегией
игрока B.
Это его наиболее осторожная стратегия,
применение которой дает гарантию игроку
B
в том, что игрок A
при любом своем поведении получает
выигрыш не более чем
.
Величина
называется верхней
ценой игры
или минимаксом.
Таким образом, при наиболее острожной игре игрок A должен применить максиминную, а игрок B минимаксную стратегии.
Принцип осторожности, которой диктует игрокам выбор таких стратегий называется принципом минимакса, а обе стратегии обобщенно минимаксными.
Таким образом, в рекомендациях теории игр не учитываются элементы риска, а также возможные просчеты и ошибки игроков. А в реальной конфликтной ситуации имеются и элементы риска и ошибки.
В каком же отношении находятся верхняя и нижняя цены игр. Можно показать, что для этих величин всегда справедливо неравенство
,
то есть нижняя цена игры всегда не больше
верхней α ≤ β.
Если нижняя цена
игры равна верхней, то есть если α = β
,
то те значения i0,
j0
при которых это равенство достигается
указывают оптимальные стратегии игроков
Ai0
и Bj0.
В этом случае игрок A
придерживаясь своей максиминной
стратегии получает не менее чем v,
а игрок B
придерживаясь своей минимаксной
стратегии помешает игроку A
получить больше чем v.
Всякое отклонение от оптимальных стратегий невыгодно обоим игрокам, так как для любых стратегий Ai и Bj справедливы неравенства:
Ci,j0 ≤ Ci0,j0 ≤ Ci0,j.
Элемент Ci0,j0 называется седловой точкой матрицы C. Это название соответствует тому, что элемент Ci0,j0 матрицы C является одновременно минимальным в своей строке и максимальным в своем столбце.
Этот элемент Ci0,j0 = v называется ценой игры, а сама игра называется игрой с седловой точкой.
Пример. Рассмотрим игру с платежной матрицей:
Bj Ai |
B1 |
B2 |
B3 |
|
A1 |
50 |
40 |
26 |
α1=26 |
A2 |
37 |
10 |
22 |
α2=10 |
A3 |
15 |
75 |
18 |
α3=15 |
|
β1 = 50 |
β2 = 75 |
β3 = 26 |
α=26 β=26 |

α=β=v=26 Игрок A имеет три стратегии, игрок B – 3 и каждый из них не знает какую стратегию применит противник.
Проверим, есть ли у этой матрицы седловая точка.
Для этого в каждой строке выберем минимальный элемент (и запишем в последний столбец таблицы), а в каждом столбце выберем максимальный элемент (и запишем в последнюю строку таблицы).
Затем находим нижнюю и верхнюю цену игры, для этого выбираем максимальный элемент в последнем столбце и минимальный элемент в последней строке. Получим:
,
то есть верхняя и нижняя цены равны. Платежная матрица имеет седловую точку: C1,3. Следовательно, пара стратегий (A1, B3) является оптимальной и цена игры равна 26. Это и есть решение данной игры.
Действительно, если игрок A будет придерживаться стратегии A1, он выиграет не менее 26, а может выиграть и больше, если игрок B отклонится от своей оптимальной стратегии B3.