
Материалы по курсу (часть 2)
.pdf
15. Решение игры в смешанных стратегиях.
Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.
Рассмотрим игру (модель конфликтной ситуации), в которой участвует два игрока A и B, имеющие прямо противоположные интересы.
Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока.
При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m
возможных стратегий A1, A2…Am, а у игрока B – n возможных стратегий B1, B2…Bn. Пусть также известны величины aij – выигрыши игрока A при использовании Ai с его стороны и Bi
со стороны противника.
Тогда игра, называемая игрой m×n, может быть представлена таблицей, называемой платежной матрицей или просто матрицей игры.
По матрице игры определяются нижняя α и верхняя β цены игры.
i = max min ij
ij
i = min max ij
ij
Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными.
Известно, что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α = β.
В случае α ≠ β для получения наибольшего выигрыша игроку выгодно применять не
одну (чистую) стратегию, а чередовать случайным образом несколько стратегий.
Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются
смешанными и задаются соответствующими вероятностными векторами.

Пусть SA - смешанная стратегия игрока A, а SB - смешанная стратегия игрока B. Тогда
SA =(p1, p2… pm), SB =(q1, q2… qn), где pi - вероятность применения игроком A стратегии Ai, qi -
вероятность применения игроком B стратегии Bi, причем
Чистая стратегия – частный случай смешанной.
Если допустить применение смешанных стратегий, то для каждой конечной игры можно найти хотя бы одно решение, т.е. пару устойчивых оптимальных стратегий игроков
(SA*, SB*), обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступить от своей.
Выигрыш, соответствующий решению, называется ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α ≤ γ ≤ β.
α– нижняя цена игры
γ– выигрыш
β– верхняя цена игры
Рассмотрим игру 2×2.
Ее матрица имеет вид:
Если в матрице 2×2 седловой точки нет и α ≠ β, то необходимо искать решение в смешанных стратегиях.
Пара оптимальных смешанных стратегий SA = (p1, p2), SB = (q1, q2), и цена игры в этом случае определяются по формулам:

Игра 2×2 и ее решение имеют простую геометрическую интерпретацию.
Пусть точки A1 и A2 соответствуют применению одноименных стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии SA *= (p1, p2).
Рисунок 1 – геометрическая интерпретация задачи 2×2
Ординаты прямой B1B1, проведенной так, как показано на рис.1, соответствуют выигрышу игрока A при применении им любой стратегии (чистой или смешанной) при условии, что B применяет B1. Прямая B2B2 также отражает выигрыш игрока A в случае, когда
B применяет B2. Жирной линией отмечена нижняя граница выигрыша B1NB2 – минимальный выигрыш игрока A при любой его смешанной стратегией. Очевидно, решение достигается в точке максимума нижней границы (на рис.1 в точке N). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях.
По рисунку легко находятся α, β, γ и проводится анализ игры.
Геометрическим способом также легко анализируются и решаются игры 2×n.
Они задаются матрицей игры:
Например, геометрическая интерпретация игры 2×4, в которой число наклонных линий получается равным 4, по числу стратегий игрока B. имеет вид:

Рисунок 2 – геометрическая интерпретация задачи 2×4
Нижняя граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.
Т.е. находим, самую нижнюю кривую и самая верхняя точка пересечения в этой кривой и есть решение игры.
Из рис. 2 видно, что нижняя граница выигрыша – прямая B1MNB2, ее максимум достигается в точке N, которая определяет оптимальную стратегию SA *= (p1, p2). Следует отметить, что стратегия B3 вообще может не рассматриваться как заведомо невыгодная игроку B, а значения p1 и p2 можно найти по формулам игры 2×2, учитывая, что в точке N
активных стратегий игрока B только две B2 и B4.

16. Игры 2х2 и их решение.
Игра 2х2 – самая простая конечная игра, её матрица имеет вид табл. 3.2.
Если для этой матрицы α=β, то игра имеет седловую точку и её решение – это пара чистых стратегий, пересекающихся в седловой точке.
Если в этой матрице седловой точки нет и α≠β, то необходимо искать решение в смешанных
стратегиях. Пара оптимальных смешанных стратегий: = ( |
, |
); |
= ( |
, ) − и цена |
|
|
1 |
2 |
|
1 |
2 |
игры в этом случае определяется по формулам:

17. Геометрическая интерпретация решений игры 2х2.
Решение игры 2х2 допускает наглядную геометрическую интерпретацию.
Пусть игра задана платежной матрицей Р = (аij), i, j = 1, 2. По оси абсцисс отложим единичный отрезок А1А2; точка A1 (x = 0) изображает стратегию А1, а все промежуточные точки этого отрезка —смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка —это вероятностьр1стратегииА1, расстояние до левого конца — вероятность p2 стратегии А2. На перпендикулярных осях I—I и II—II откладываем выигрыши при стратегиях А1 и А2 соответственно. Если 2-й игрок примет стратегию В1, то она дает выигрыши а11 и а21 на осях I—I и II—II, соответствующие стратегиям А1 и А2. Обозначим эти точки на осях I—I и II—II буквой В1.Средний выигрыш v1, соответствующий смешанной стратегии SA, определяется по формуле математического ожидания v1 = а11р1 + а21р2 и равен ординате точки М1, которая лежит на отрезке В1В1 и имеет абсциссу SA (рис. 1).
Рис. 1 Рис. 2
Аналогично строим отрезок В2В2, соответствующий применению вторым игроком стратегии В2 (рис. 2). При этом средний выигрыш v2 = а12р1 + а22р2 — ордината точки М2.
В соответствии с принципом минимакса оптимальная стратегия S*A такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в
максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке B1N —
против стратегии В1, на участке NB2 —против стратегии B2). Оптимальную стратегию
S*A = (p*1, р*2) определяет точка N, в которой минимальный выигрыш достигает максимума;

ее ордината равна цене игры v. На рис.3 обозначены также верхняя и нижняя цены игры и.
Применим геометрический метод для решения следующей задачи.
Рис. 3 |
Рис. 4 |
Пример. Решить графически игру, заданную платежной матрицей:
= (1,52 31),
|
− 0 |
= |
− 1,5 |
или = 0,5 + 1,5 . |
|
|
|
||
1 |
− 0 |
2 − 1,5 |
Решение. Откладываем по оси абсцисс (рис. 4) единичный отрезок А1А2. На вертикальной оси
I—I откладываем отрезки: а11 = 1,5, соответствующий стратегии В1, и а12 = 3,
соответствующий стратегии В2. На вертикальной оси II—II отрезок а21 = 2 соответствует стратегии В1, отрезок а22 = 1 соответствует стратегии В2 (см. рис. 4). Нижняя цена игры
=а11 = 1,5. Верхняя цена игры =а21 = 2, седловая точка отсутствует. Из рис. 4 видно, что абсцисса точки N определяет оптимальную стратегию S*A, а ордината —цену игры v. Точка N
является точкой пересечения прямых В1В1 и В2В2. Уравнение прямой В1В1, проходящей через точки (0; 1,5) и (1;2):
Уравнение прямой В2В2, проходящей через точки (0; 3) и (1;1):

Точка пересечения прямых является решением системы:
- там знак системы, он не исправляется
или х = 0,6; у = 1,8, т. е. N (0,6; 1,8).
Таким образом, р*1 = 0,6, р*2 = 1 — 0,6 = 0,4; оптимальная стратегия S*A = (0,6; 0,4),
цена игры v = 1,8.
Геометрически можно также определить оптимальную стратегию игрока В, если поменять местами игроков А и В и вместо максимума нижней границы А2МА1 в соответствии с принципом минимакса (рис. 5) рассмотреть минимум верхней границы.
Рис. 5
Абсцисса точки М определяет q*2в оптимальной стратегии игрока В, ордината этой точки —цена игры. Прямая А1А1, проходящая через точки (0; 1,5) и (1; 3), удовлетворяет уравнению
Прямая А2А2, проходящая через точки (0; 2) и (1; 1), удовлетворяет уравнению у =—х +2.
Координаты их точки пересечения М —это решение системы уравнений:

откуда х = 0,2; у = 1,8, т. е. q*2 = 0,2, q*1 = 1— q*2 = 0,8, х =у = 1,8, S*B = (0,8; 0,2).
Оптимальное решение игры найдено.
Из решения задачи следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока B, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В примере выше платежная матрица не имела седловой точки ( ).
При наличии седловой точки графическое решение дают варианты, изображенные на рис. 6 и 7. На рис. 6 наибольшей ординатой на ломаной B1NB2 обладает точка B2, поэтому оптимальной является чистая стратегия А2 для игрока А (В2 —для игрока В), т.е. оптимальное решение: S*A = (0; 1), S*B = (0; 1). Игра имеет седловую точкуа22 = v.
Рис. 6 |
Рис. 7 |
Чистая стратегия В2 (рис. 7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия В1. На основании принципа минимакса выделим прямую В1В1 и на ней точку В1 с наибольшей ординатой на оси
I—I. Чистая стратегияА2является оптимальной для игрока А, а чистая стратегия В1 —для игрока В.
Оптимальное решение: S*A = (0;1), S*B = (1;0), цена игры v=а21= = , т.е. имеется седловая точка.