
- •Глава I. Математические модели конфликтных ситуаций
- •§ 1. Предмет теории игр. Основные понятия
- •§2. Нижняя и верхняя цена игры. Принцип "мннимакса"
- •Глава п. Чистые и смешанные стратегии
- •§ 1. Основная теорема теории игр
- •§2. Элементарные методы решения игр. Игры 2x2 и 2хп.
- •§ 3. Геометрическая интерпретация игры 2x2, игры 2xп.
- •§ 4. Общие методы решения конечных игр. Сведение их к задачам линейного программирования
- •§ 5. Игры с «природой».
Глава п. Чистые и смешанные стратегии
§ 1. Основная теорема теории игр
Придерживаясь максимальной стратегии, игрок А при любом поведении игрока В гарантирует себе выигрыш, который равен нижней цене игры α. Возникает вопрос: нельзя ли гарантировать ему средний выигрыш, больший чем α, если применять не одну - единственную "чистую" стратегию, а чередовать случайным образом несколько стратегий?
Такие комбинированные стратегии, состояния применений нескольких чистых стратегий, чередующихся по случайному закону с определённым отношением частот, в теории игр называются смешанными стратегиями.
Очевидно, каждая чистая стратегия является частным случаем смешанной, в которой все стратегии, кроме одной, применяются с нулевыми частотами, а данная - с частотой 1.
Оказывается, что применяя не только чистые, но и смешанные стратегии, можно для каждой конечной игры получить решение, то есть пару таких (в общем случае, смешанных) стратегий, что при применений их обоими игроками выигрыш будет равен цене игры. А при любом одностороннем отклонении от оптимальной стратегии выигрыш может измениться только в сторону, не выгодную для отклоняющегося.
Высказанное утверждение составляет содержание так называемой основной теоремы теории игр. Эта теорема была впервые доказана фон Нейманом в 1928 г.
Основная теорема теории игр.
Каждая конечная игра имеет, по крайней мере, одно решение (возможно, в области смешанных стратегий).
Выигрыш, получаемый в результате решения, называется ценой игры.
Следствие. Каждая конечная игра имеет цену.
Очевидно, что цена игры v всегда лежит между нижней ценой игры α и верхней ценой игры β: α<v<β.
Введём специальное обозначение для смешанных стратегий. Если, например, наша смешанная стратегия состоит в применении стратегий А1, А2, А3 с частотами р1, р2, р3, причём р1+р2+р3=1, будем обозначать эту стратегию
.
Аналогично смешанную стратегию противника будем обозначать:
,
где q1, q2, q3 - частоты, в которых смешиваются стратегии В1, В2, В3; q1+q2+q3=1.
Оптимальные стратегии, образующие решения игры, будем обозначать SA*, SB*.
Определение. Стратегии, входящие в решение игры, называются активными.
Определение. Игра, в которой все стратегии обеих сторон являются активными, называется полностью усреднённой.
Решение игры обладает замечательным свойством.
Теорема. Если один из игроков придерживается своей оптимальной смешанной стратегией, то выигрыш остаётся неизменным и равным цене игры v независимо от того, что делает другой игрок, если только он не выходит за пределы своих активных стратегий.
§2. Элементарные методы решения игр. Игры 2x2 и 2хп.
Если игра mxn не имеет седловой точки, то нахождение решения есть вообще довольно трудная задача, особенно при больших т и п.
Эту задачу можно упростить, если уменьшить число стратегий, вычёркивая излишние стратегии: дублирующие и заведомо невыгодные.
Рассмотрим, например, игру с матрицей
В А |
В1 |
В2 |
В3 |
В4 |
А1 |
1 |
2 |
4 |
3 |
А2 |
0 |
2 |
3 |
2 |
А3 |
1 |
2 |
4 |
3 |
А4 |
4 |
3 |
1 |
0 |
Стратегия А3 в точности повторяет ("дублирует") стратегию А1 поэтому любую из этих двух стратегий можно вычеркнуть.
Сравнивая почленно строки А1 и A2, видим, что каждый элемент строки А2 меньше (или равен) соответствующего элемента строки А1. Очевидно, мы никогда не должны пользоваться стратегией А2; она заведомо является невыгодной. Вычёркивая А3 и А2, приводим матрицу к более простому виду.
Далее замечаем, что для противника стратегия В3 заведомо невыгодна; вычёркивая её, приводим матрицу к окончательному виду.
В А |
В1 |
В2 |
В4 |
А1 |
1 |
2 |
3 |
А4 |
4 |
3 |
0 |
Таким образом, игра 4x4 вычёркиванием дублирующих и заведомо невыгодных стратегий сведена к игре 2x3 .
Замечание. Процедура вычёркивания дублирующих и заведомо невыгодных стратегий всегда должна предшествовать решению игры.
Наиболее простыми типами конечных игр, которые всегда можно решить элементарными способами, являются игры 2x2 и 2хп.
Рассмотрим игру 2x2 с матрицей:
В А |
В1 |
В2 |
А1 |
а11 |
а12 |
А2 |
а21 |
а22 |
Здесь могут встретиться два случая:
1. игра имеет седловую точку;
2. игра не имеет седловую точку. Решение
Первый случай. Если игра 2x2 имеет седловую точку, то решение очевидно: это - пара чистых стратегий, пересекающихся в седловой точке.
Замечание. В игре 2x2 наличие седловой точки всегда соответствует существованию заведомо невыгодых стратегий, которые должны быть вычеркнуты при предварительном анализе.
Второй случай. Если седловой точки нет, то α≠β. Требуется найти оптимальную смешанную стратегию игрока А:
.
Она отличается тем свойством, что, каковы бы ни были действия противника (если только он не выходит за пределы своих «полезных стратегий»), выигрыш будет равен цене игры v.
В игре 2x2 обе стратегии противника являются «полезными», - иначе игра имела бы решение в области чистых стратегий (седловую точку).
Значит, если мы придерживаемся своей оптимальной стратегии
, то противник может пользоваться любой из своих чистых стратегий В1, В2, не изменяя среднего выигрыша v.
Отсюда имеем два уравнения:
.
(1)
Из которых, принимая во внимание, что p1 + р2 = 1, получим:
.
(2)
Цену игры v найдём, подставляя значение р1, р2 в любое уравнение (1). Если цена игры известна, то для определения оптимальной стратегии противника
достаточно одного
уравнения, например:
,
откуда, учитывая, что q1+
q2
= 1, имеем
,
q2
= 1- q1
. (3)
Пример. У нас (А) имеется два вида вооружения А1 и А2: у противника (В) -два вида помех: B1 и В2. Вероятность выполнения боевой задачи при различных комбинациях "вооружения" — "помехи" задана матрицей 2x2
В А |
В1 |
В2 |
Минимумы строк |
А1 |
0,2 |
0,8 |
0,2 |
А2 |
0,7 |
0,3 |
0,3* |
Максимумы столбцов |
0,7* |
0,8 |
|
Найти решение.
Решение
1. α = 0,3; β = 0,7. Игра не имеет седловой точки.
2. По формуле (2) находим:
=
р2 = 1 - p1=1-0,4=0,6
3. Цена игры
v=a11·р1+ a21·р2=0,2·0,4+0,7·0,6=0,5
4. По формуле (З) находим
;
q2
= 1- q1=1-0,5=0,5
5. Оптимальные стратегии А и В будут:
S
*A=
Вывод. А должен в 40% всех случаях применять вооружение А1, а в 60% -вооружения А2. В должен в половине всех случаев применять помехи В1, а в половине - помехи В2. Если обе стороны, или, по крайней мере, одна из них, будут применять свои оптимальные стратегии, то вероятность выполнения боевой задачи будет равна v = 0,5.