
3. Смешанные стратегии
Предположим, что рассматриваемая игра не имеет седловых точек. В этом случае у игроков нет стратегий, которые гарантировали бы им получение возможно большего выигрыша. Каждому игроку в такой игре чрезвычайно важно знать намерения противника. И хотя правила игры не представляют такой возможности, при достаточно частом повторении игры с одним и тем же противником игрок может статистически оценить возможность выбора той или иной стратегии и использовать эту информацию с целью увеличения своего выигрыша.
Как должен поступить игрок, не желающий, чтобы его намерение было скрыто? Для этого целесообразно выбирать свои стратегии случайно (в соответствии с определенным случайным механизмом).
Пусть задана матричная игра (2). В дальнейшем мы будем называть стратегии i A , i B чистыми, чтобы отличать их от смешанных стратегий, определение которых будет дано ниже.
О п р е д е л е н и е 5. Смешанной стратегией игрока называется произвольное распределение вероятностей на множестве его чистых стратегий.
Смешанная стратегия игрока Ι в игре Г есть вектор
Х = (х1, х2, …, хi, …, хm),
где хi (i = 1, 2, …, m) – вероятность выбора им i-й чистой стратегии, 0 ≤ хi ≤ 1, а поскольку одна из m чистых стратегий будет обязательно выбрана, х1 + х2 + … + хm представляет собой вероятность полной группы событий и, следовательно,
х1 + х2 + … + хi + … + хm = 1.
Аналогично смешанная стратегия игрока ΙΙ есть вектор
Y = (y1, y2, …, yj, …, yn),
где y1 (j = 1, 2, …, n) – вероятность выбора им j-й чистой стратегии,
0 ≤ yj ≤ 1 и y1 + y2 + … + yj + … + yn = 1.
Чистые стратегии являются частным случаем смешанной стратегии, задаваемой единичным вектором.
Множества смешанных стратегий игроков Ι и ΙΙ будем обозначать соответственно через Sm и Sn:
Sm
= {Х = (х1,
х2,
…, хi,
…, хm )
Rm
| 0 ≤ хi
≤ 1, i =
х1
= 1};
Sn
= {Y
= (y1,
y2,
…, yj,
…, yn)
Rn
| 0 ≤ yj
≤ 1, j
=
yj
= 1}.
4. Смешанное расширение игры
Пусть в игре (2) с матрицей выигрышей
Н = {hij, i = , j = }
игроки Ι и ΙΙ независимо друг от друга выбирают свои смешанные стратегии
Х = (х1, х2, …, хi, …, хm) и Y = (y1, y2, …, yj, …, yn).
О п р е д е л е н и е 6. Пара (Х, Y) смешанных стратегий игроков в матричной игре (2) называется ситуацией в смешанных стратегиях в этой игре.
Так как игроки Ι и ΙΙ выбирают свои смешанные стратегии Х и Y независимо (это возможно в силу отсутствия какого-либо обмена информацией между игроками), в условиях ситуации (Х, Y) каждая ситуация (i, j) (в чистых стратегиях) оказывается случайным событием, которое реализуется с вероятностью хi · yj. Следовательно, в условиях применения стратегий Х и Y выигрыш игрока Ι есть двумерная дискретная случайная величина, заданная следующей таблицей:
Значения выигрышей игрока |
h11 |
… |
h1n |
h21 |
… |
h2n |
… |
hm1 |
… |
hmn |
Вероятности появления выигрышей |
x1 · y1 |
… |
x1 · yn |
x2 · y1 |
… |
x2 · yn |
… |
xm · y1 |
… |
xm · yn |
Таким образом, при использовании смешанных стратегий выигрыш игрока Ι оказывается случайной величиной с распределением, порожденным смешанными стратегиями на множестве всех ситуаций игры. Поэтому выигрыш игрока Ι в ситуации в смешанных стратегиях полагается равным математическому ожиданию выигрыша в чистых стратегиях:
Н (Х, Y) = Е (Х, Y) = hij xi yj.
Игрок ΙΙ получит -Е (Х, Y).
Задав множества смешанных стратегий Sm, Sn и функцию выигрыша Е (Х, Y), мы определили новую игру
Г = < Sm, Sn, Е (Х, Y) >, (15)
которая называется смешанным расширением игры (2).
О п р е д е л е н и е 7. Смешанным расширением матричной игры
Г = <А, В, Н > называется антагонистическая игра Г = < Sm, Sn, Е (Х, Y) >, в которой множествами стратегий игроков являются их смешанные стратегии в исходе игры, а функция выигрыша игрока Ι определяется выражением (14).
В матричной форме выражение (14) можно записать так:
H (X, Y) =
(x1,
…, xm)
= XHYT,
где Т – знак транспонирования.
Вспоминая определение седловой точки игры (2), видим, что ситуация (Х*, Y*) в смешанном расширении матричной игры является седловой точкой, если при любых Х Sm и Y Sn выполняется двойное неравенство
XHY*T ≤ X*HYT ≤ X*HYT. (16)
О п р е д е л е н и е 8. Стратегии Х*, Y* называются оптимальными смешанными стратегиями игроков Ι, ΙΙ в игре (2), если для любых Х Sm и Y Sn справедливо двойное неравенство (16).
Аналогично тому, как это было сделано для игры (2), можно ввести понятия нижнего и верхнего значения игры (15):
= max
min H (X, Y);
Х
S
Y
S
= min max H (X, Y).
Y S Х S
Величина
v = X*HY*T = max min XHYT = min max XHYT
Х S Y S Y S Х S
называется значением (ценой) игры Н.
Нахождение Седловых точек (оптимальных стратегий) и значение игры мы будем называть решением игры Н (в смешанных стратегиях).
Теорема 3. Для того чтобы игра Н имела решение в смешанных стратегиях, необходимо и достаточно, чтобы
max min XHYT = min max XHYT (17)
Х S Y S Y S Х S
Равенство (17) представляет собой принцип максимина (минимакса) в смешанных стратегиях.
Теорема 4. Если (X', Y') (X'', Y'') – седловые точки игры в смешанных стратегиях, то:
а) (X', Y'') и (X'', Y') также являются седловыми точками;
б) Н (X', Y') = Н (X'', Y'') = Н (X', Y'') = Н (X'', Y').
Доказательства теорем (3), (4) аналогичны доказательствам теорем (1) т (2).
Как мы уже видели, не всякая матричная игра имеет решение в чистых стратегиях. С помощью смешанных стратегий становится возможным важнейшее в теории игр утверждение – теорема Неймана.
Теорема 5. Какова бы ни была матрица Н,
max min XHYT = min max XHYT
Х S Y S Y S Х S
Мы не будем останавливаться на доказательстве этой теоремы. Впервые она была доказана Дж. фон Нейманом. Приводимое им доказательство основано на теореме Брауэра о неподвижной точке и в силу этого является неконструктивным (не дает способа нахождения решения игры).
Замечание 3. В литературе по теории игр можно встретить различные названия этой теоремы – теорема о минимаксах, теорема Неймана, основная теорема (матричных игр).
Итак, любая матричная игра имеет решение в смешанных стратегиях. Поэтому следующий раздел посвящен описанию методов решения матричных игр.
МЕТОДЫ РЕШЕНИЯ МАТРИЧНЫХ ИГР
Согласно теореме 5 любая матричная игра имеет значение v, а игроки в ней – оптимальные стратегии Х*, Y* (смешанные).
Тройку (Х*, Y*, v) будем называть решением матричной игры.
Сравнительно
просто решаются игры, в которых один из
игроков имеет всего 2 чистые стратегии:
игры 2
2, 2
n и m
2. при этом, как правило, игры 2
2 решаются аналитическим методом, а 2
n и m
2 – графическим. При m, n > 2 матричные
игры сводятся к задачам линейного
программирования и решаются симплексным
методом. Однако следует заметить, что
уже в игре 3
3 применение этого метода приводит к
довольно громоздким вычислениям.