- •5. Теория игр
- •5.1 Понятие об игровых моделях
- •5.1.1. Общие сведения
- •5.1.2. Основные понятия теории игр
- •5.1.3. Платежная матрица. Нижняя и верхняя цена игры
- •5.1.4. Решение игр в смешанных стратегиях
- •5.1.5. Геометрическая интерпретация игры 2х2
- •5.1.6. Приведение матричной игры к задаче линейного программирования
- •5.2. Теория игр. Смешанные стратегии. Решение игр методом линейного программирования
- •5.2.1. Основные понятия теории игр
- •5.2.2. Игра двух лиц с нулевой суммой
- •5.2.3. Решение игры
- •5.2.4. Смешанные стратегии и их свойства
- •5.2.5. Решение матричных игр в смешанных стратегиях путем сведения к паре двойственных задач
- •5.2.6. Этапы решения матричной игры
5.1.6. Приведение матричной игры к задаче линейного программирования
Игра т х пв общем случае не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко при большихт xп, однако принципиальных трудностей не имеет, поскольку может быть сведено к решению задачи линейного программирования. Покажем это. Пусть играт х пзадана платежной матрицейр =(аij),i = 1, 2, ...,т; j = 1, 2, ...,п.ИгрокАобладает стратегиямиА1, А2,…, Аm, игрокВ —стратегиямиВ1, В2, ..., Bn. Необходимо определить оптимальные стратегииS*A = (p*1, р*2,…,p*т) иS*B = (q*1, q*2,…,q*n), гдеp*i, q*j —вероятности применения соответствующих чистых стратегийАi, Вj;
![]()
Оптимальная стратегия S*Aудовлетворяет следующему требованию. Она обеспечивает игрокуАсредний выигрыш, не меньший, чем цена игры v,при любой стратегии игрокаВи выигрыш, равный цене игры v,при оптимальной стратегии игрокаВ. Без ограничения общности полагаем v > 0;этого можно добиться, сделав все элементыаij 0.Если игрокАприменяет смешанную стратегиюS*A = (p*1, р*2,…,p*т) против любой чистой стратегииBj игрокаВ, то он получаетсредний выигрыш,илиматематическое ожидание выигрышааj =а1jр1 +а2jр2 + ... + аmjрm, j = 1, 2, ...,n(т.е. элементыj-го столбца платежной матрицы почленно умножаются на соответствующие вероятности стратегийА1, А2, ..., Amи результаты складываются).
Для оптимальной стратегии S*Aвсе средние выигрыши не меньше цены игры v,поэтому получаем систему неравенств:
(5.1.6.1)
Каждое из неравенств можно разделить на число v > 0.Введем новые переменные:
(5.1.6.2)
Тогда система (5.6.1)примет вид:
(5.1.6.3)
Цель игрока А —максимизировать свой гарантированный выигрыш, т.е. цену игрыv.
Разделив на v 0равенствор1 + p2 +...+ рm = 1,получаем, что переменныехi (i=1,2,...,m) удовлетворяют условию:х1 + х2 +...+ xт =1 /v.Максимизация цены игры vэквивалентна минимизации величины 1 / v,поэтому задача может быть сформулирована следующим образом:определить значения переменных xi0,i = 1, 2, ...,т, так, чтобы они удовлетворяли линейным ограничениям (5.1.6.3)и при этом линейная функция
(5.1.6.4)
обращалась в минимум.Это задача линейного программирования. Решая задачу (5.1.6.3)—(5.1.6.4),получаем оптимальное решениеp*1, р*2,…,p*ти оптимальную стратегиюS*A.
Для определения оптимальной стратегии
S*B
= (q*1,
q*2,…,q*n)
следует учесть, что игрокВстремится минимизировать гарантированный
выигрыш, т.е. найти
.
Переменныеq1,
q2,…,qnудовлетворяют
неравенствам
(5.1.6.5)
которые следуют из того, что средний проигрыш игрока Вне превосходит цены игры, какую бы чистую стратегию не применял игрокА.
Если обозначить
(5.1.6.6)
то получим систему неравенств:
(5.1.6.7)
Переменные уj (j = 1, 2, ...,n) удовлетворяют условиюy1+ y2 + …+ yп = 1 / v.
Игра свелась к следующей задаче.
Определить значения переменных уj > 0, j = 1, 2, ..., п, которые
удовлетворяют системе неравенств (5.1.6.7) и максимизируют линейную функцию
(5.1.6.8)
Решение задачи линейного программирования (5.1.6.6), (5.1.6.7) определяет оптимальную стратегиюS*B = (q*1, q*2,…,q*n). При этом цена игры
(5.1.6.9)
Составив расширенные матрицы для задач (5.1.6.3), (5.1.6.4)и(5.1.6.7), (5.1.6.8),убеждаемся, что одна матрица получилась из другой транспонированием:





Таким образом, задачи линейного программирования (5.1.6.3), (5.1.6.4)и (5.1.6.7), (5.1.6.8)являются взаимно-двойственными. Очевидно, при определении оптимальных стратегий в конкретных задачах следует выбрать ту из взаимно-двойственных задач, решение которой менее трудоемко, а решение другой задачи найти с помощью теорем двойственности.
