- •Тема 40. Элементы теории игр
- •40.1. Игровые модели и их классификация
- •40.2. Матричные игры
- •40.3. Состояние равновесия в парной игре с нулевой суммой
- •40.3.1. Игры с решением в чистых стратегиях
- •40.3.2. Игры без решения в чистых стратегиях
- •40.4. Упрощение платежных матриц
- •40.5. Графический метод решения матричных игр, не имеющих решения в чистых стратегиях
- •40.6. Сведение матричной игры к задаче линейного программирования
40.3.2. Игры без решения в чистых стратегиях
Определение 24. Если платежная матрица
игры не имеет седлового элемента, то
есть
,
то такую игру называют игрой, не
имеющей решения в чистых стратегиях.
В этом случае для каждого игрока важно, чтобы соперник не угадал выбора его стратегии. В этом случае используются смешанные стратегии, при которых реализуется схема случайного выбора чистой стратегии.
Определение 25. Смешанной стратегией
первого игрока называют вероятностное
распределение на множестве чистых
стратегий этого игрока, задаваемого
вектором
,
элементы которого удовлетворяют
следующим условиям:
1)
(
);
2)
,
где
(
)
– вероятности, с которыми первый игрок
выбирает свои чистые стратегии
.
Определение 26. Смешанной стратегией
второго игрока называют вероятностное
распределение на множестве чистых
стратегий этого игрока, задаваемого
вектором
,
элементы которого удовлетворяют
следующим условиям:
1)
(
);
2)
,
где
(
)
– вероятности, с которыми второй игрок
выбирает свои чистые
стратегии
.
При использовании смешанных стратегий
игра приобретает случайный характер.
Выбор каждой пары чистых стратегий
является случайным событием и ввиду
независимости случайных величин
и
реализуется с вероятностью
.
Величина
выигрыша первого игрока (проигрыша
второго игрока) становится случайной
функцией смешанных стратегий
и
и определяется по формуле
.
Определение 27. Функцию
называют функцией выигрыша или
платежной функцией.
Замечание. Формально
функция
представляет собой математическое
ожидание выигрыша первого игрока на
множестве смешанных стратегий
и
.
Первый игрок, стремясь достичь наибольшего
из гарантированных выигрышей, выбирает
вектор вероятностей
так, чтобы получить максимум минимальных
значений ожидаемых выигрышей: то есть
решает задачу максимина математического
ожидания
:
.
Соответственно, второй игрок решает
задачу минимакса математического
ожидания
– найти такой вектор
,
что
.
Определение 28. Смешанные
стратегии
и
называют оптимальными,
если они удовлетворяют неравенству
.
Определение 29. Величину
называют ценой игры.
Определение 30. Набор
,
состоящий из оптимальных смешанных
стратегий
и
и цены игры
,
называют решением матричной игры.
Определение 31. Стратегию первого игрока называют максиминной стратегией, стратегию второго игрока называют минимаксной стратегией.
Теорема 2 (о минимаксе) (Дж. фон Нейман). Для матричной игры с любой платежной матрицей справедливы утверждения:
1) величины
,
существуют и равны между собой:
;
2) существует хотя бы одна ситуация в
смешанных стратегиях
,
для которой выполняется соотношение
.
Теорема 3 (о свойствах оптимальных
стратегий). Пусть
,
– оптимальные смешанные стратегии и
– цена игры. Тогда:
1) оптимальная смешанная стратегия
первого игрока может быть составлена
только из тех чистых стратегий
(
),
для которых
;
2) оптимальная смешанная стратегия
второго игрока может быть составлена
только из тех чистых стратегий
(
),
для которых
.
Следствие. Имеет место цепочка равенств:
.
Пример 40.5. Найти решение игры, имеющей платежную матрицу
.
Решение. Найдем верхнюю и нижнюю
цены игры:
,
,
нижняя цена игры
;
,
,
верхняя цена игры
.
Таким образом, выполняется неравенство
,
и седловая точка у данной матрицы
отсутствует. Задача не имеет решения в
чистых стратегиях. Решение игры нужно
искать в смешанных стратегиях.
Пусть смешанные стратегии игроков
определяются соответственно векторами
вероятностей
,
,
для которых
,
– условия нормировки. Функция выигрыша
имеет вид
.
Так как первый игрок стремится получить
максимальный гарантированный выигрыш
,
то при оптимальной смешанной стратегии
должно выполняться равенство
или
.
С учетом условий нормировки составим
систему уравнений для определения
оптимальных стратегий
и
первого игрока
В полученной системе содержится три уравнения и пять неизвестных.
Для отыскания
и
воспользуемся следующим приемом
исключения неизвестных. Так как
и
,
то справедливо равенство
.
Подставим его в первое уравнение системы:
или
.
В силу теоремы 3 значения
и
являются оптимальными и должны быть
отличны от нуля. Следовательно, последнее
равенство выполняется при произвольных
положительных
и
только в случае, когда выражения в
скобках одновременно равны нулю:
или
.
Из условия нормировки
выразим
и подставим в последнее уравнение:
.
Решая его, получаем
,
тогда
.
Таким образом, вероятности оптимальных
стратегий первого игрока
.
Перепишем функцию выигрыша следующим образом:
.
Так как второй игрок
стремится получить минимальный
гарантированный проигрыш
,
то при оптимальной смешанной стратегии
должно выполняться равенство
или
.
С учетом условий нормировки система
уравнений для определения оптимальных
стратегий
и
второго игрока имеет вид
Аналогично для отыскания
и
из соотношений
и
имеем право записать
.
Подставим полученное соотношение в
первое уравнение системы, после
группировки слагаемых получим уравнение
.
Так как по теореме 3 значения
и
должны быть отличны от нуля (как
оптимальные), то последнее равенство
выполняется при произвольных положительных
и
только в том случае, когда
.
Выразим
из условия нормировки
,
подставим в последнее уравнение и найдем
,
.
Таким образом, оптимальная смешанная
стратегия второго игрока определяется
вектором
.
Подставим найденные оптимальные вероятности смешанных стратегий в функцию выигрыша, найдем цену игры:
.
Ответ:
;
;
.
