
- •5. Теория игр
- •5.1 Понятие об игровых моделях
- •5.1.1. Общие сведения
- •5.1.2. Основные понятия теории игр
- •5.1.3. Платежная матрица. Нижняя и верхняя цена игры
- •5.1.4. Решение игр в смешанных стратегиях
- •5.1.5. Геометрическая интерпретация игры 2х2
- •5.1.6. Приведение матричной игры к задаче линейного программирования
- •5.2. Теория игр. Смешанные стратегии. Решение игр методом линейного программирования
- •5.2.1. Основные понятия теории игр
- •5.2.2. Игра двух лиц с нулевой суммой
- •5.2.3. Решение игры
- •5.2.4. Смешанные стратегии и их свойства
- •5.2.5. Решение матричных игр в смешанных стратегиях путем сведения к паре двойственных задач
- •5.2.6. Этапы решения матричной игры
5.2.2. Игра двух лиц с нулевой суммой
Методы теории игр наиболее развиты для конечной одноходовой игры двух лиц с нулевой суммой, т. е, сумма выигрышей игроков равна нулю (выигрыш одного игрока равен проигрышу другого, каждый игрок выигрывает только за счет другого игрока). Такие игры также называются антагонистическими.
Рассмотрим игру двух лиц с нулевой суммой.
Участников игры обозначим через А и
В. Эту игру можно описать с помощью так
называемой платежной матрицы игры
порядка.
Строки этой матрицы являются чистыми
стратегиями игрока А
,
а столбцы – чистыми стратегиями игрока
В
.
Предполагается, что каждому игроку
известны все элементы платежной матрицы.
Элемент
платежной матрицы определяет результат
игры, а именно выигрыш при выборе игроками
А и В стратегий
и
соответственно.
Так как сумма выигрышей игроков равна нулю, платежная матрица игрока В равна платежной матрице игрока А, умноженной на (-1). В силу этого достаточно исследовать только платежную матрицу игрока А. Положительный элемент этой матрицы определяет выигрыш игрока А и проигрыш игрока В, отрицательный - проигрыш игрока А и выигрыш игрока В.
Одноходовая игра двух лиц с нулевой
суммой проходит следующим образом.
Игрок А выбирает i- ю строку платежной матрицы (чистую
стратегию),
а игрок В выбираетj- й столбец матрицы (чистую стратегию
).
Элемент
, стоящий на пересечении выбранной
строки и столбца, определяет выигрыш
игрока А. Выигрыш игрока В равен
(
).
В данной игре игрок А стремится
выбрать такую строку матрицы, чтобы
максимизировать свой выигрыш, а игрок
В — такой столбец матрицы, чтобы
минимизировать свой проигрыш.
Пример 5.2.2.1.В качестве примера игры двух лиц с нулевой суммой рассмотрим условную военную игру под названием «игра полковника Блотто». Две армии ведут борьбу за два населенных пункта. Армия полковника Блотто (игрок А) состоит из четырех формировании, армия противника (игрок В) — из трех.
Сформулируем правила игры. Армия, которая посылает больше формирований на один или другой пункт, занимает его и уничтожает посланные туда формирования противника, получая по единице за каждый занятый пункт и каждое уничтоженное формирование противника. В случае равенства сил на одном или другом пункте противники очков не получают. Общий выигрыш определяется как сумма выигрышей в двух пунктах.
Партия игры представляет собой упрощенную имитацию военных действий. Каждый противник должен решить, как распределить свои силы, чтобы, не зная действий противника, выиграть максимальное количество очков.
Поскольку игроки стремятся к наибольшему выигрышу, они будут использовать в бою все формирования. Следовательно, у полковника Блотто имеется пять стратегий: (4,0); (0,4); (3,1); (1,3); (2,2), а у противника - четыре стратегии: (3,0); (0,3); (2,1); (1,2). Первое число в каждой стратегии показывает количество формирований, посланных на первый пункт, второе - на второй пункт. Теперь составим платежную матрицу, которая представлена в табл.5.2.2.1.
Таблица 5.2.2.1.
|
(3,0) |
(0,3) |
(2,1) |
(1,2) |
(4,0) |
4 |
0 |
2 |
1 |
(0,4) |
0 |
4 |
1 |
2 |
(3,1) |
1 |
-1 |
3 |
0 |
(1,3) |
-1 |
1 |
0 |
3 |
(2,2) |
-2 |
2 |
2 |
2 |
Поясним расчет одного из элементов
платежной матрицы пример
=
-2. (игроки А и В применяют свои чистые
стратегии
и
).
Игрок А посылает на первый пункт меньше
формирований (два), чем игрок В (три).
Согласно правилам игры игрок А теряет
все свои формирования и первый пункт,
проигрывая соответственно 2 и 1 очко.
Выигрыш игрока А на первом пункте 1
составит -3 очка. На второй пункт игрок
А посылает два своих формирования,
а игрок В – ни одного. Следовательно,
игрок А выигрывает только 1 очко,
получая его за взятие второго пункта.
В итоге выигрыш игрока А составит
-2 очка или, по-другому, игрок А проигрывает
2 очка, а игрок В столько же очков
выигрывает.