
- •5. Теория игр
- •5.1 Понятие об игровых моделях
- •5.1.1. Общие сведения
- •5.1.2. Основные понятия теории игр
- •5.1.3. Платежная матрица. Нижняя и верхняя цена игры
- •5.1.4. Решение игр в смешанных стратегиях
- •5.1.5. Геометрическая интерпретация игры 2х2
- •5.1.6. Приведение матричной игры к задаче линейного программирования
- •5.2. Теория игр. Смешанные стратегии. Решение игр методом линейного программирования
- •5.2.1. Основные понятия теории игр
- •5.2.2. Игра двух лиц с нулевой суммой
- •5.2.3. Решение игры
- •5.2.4. Смешанные стратегии и их свойства
- •5.2.5. Решение матричных игр в смешанных стратегиях путем сведения к паре двойственных задач
- •5.2.6. Этапы решения матричной игры
5.1.6. Приведение матричной игры к задаче линейного программирования
Игра т х пв общем случае не имеет наглядной геометрической интерпретации. Ее решение достаточно трудоемко при большихт xп, однако принципиальных трудностей не имеет, поскольку может быть сведено к решению задачи линейного программирования. Покажем это. Пусть играт х пзадана платежной матрицейр =(аij),i = 1, 2, ...,т; j = 1, 2, ...,п.ИгрокАобладает стратегиямиА1, А2,…, Аm, игрокВ —стратегиямиВ1, В2, ..., Bn. Необходимо определить оптимальные стратегииS*A = (p*1, р*2,…,p*т) иS*B = (q*1, q*2,…,q*n), гдеp*i, q*j —вероятности применения соответствующих чистых стратегийАi, Вj;
Оптимальная стратегия S*Aудовлетворяет следующему требованию. Она обеспечивает игрокуАсредний выигрыш, не меньший, чем цена игры v,при любой стратегии игрокаВи выигрыш, равный цене игры v,при оптимальной стратегии игрокаВ. Без ограничения общности полагаем v > 0;этого можно добиться, сделав все элементыаij 0.Если игрокАприменяет смешанную стратегиюS*A = (p*1, р*2,…,p*т) против любой чистой стратегииBj игрокаВ, то он получаетсредний выигрыш,илиматематическое ожидание выигрышааj =а1jр1 +а2jр2 + ... + аmjрm, j = 1, 2, ...,n(т.е. элементыj-го столбца платежной матрицы почленно умножаются на соответствующие вероятности стратегийА1, А2, ..., Amи результаты складываются).
Для оптимальной стратегии S*Aвсе средние выигрыши не меньше цены игры v,поэтому получаем систему неравенств:
(5.1.6.1)
Каждое из неравенств можно разделить на число v > 0.Введем новые переменные:
(5.1.6.2)
Тогда система (5.6.1)примет вид:
(5.1.6.3)
Цель игрока А —максимизировать свой гарантированный выигрыш, т.е. цену игрыv.
Разделив на v 0равенствор1 + p2 +...+ рm = 1,получаем, что переменныехi (i=1,2,...,m) удовлетворяют условию:х1 + х2 +...+ xт =1 /v.Максимизация цены игры vэквивалентна минимизации величины 1 / v,поэтому задача может быть сформулирована следующим образом:определить значения переменных xi0,i = 1, 2, ...,т, так, чтобы они удовлетворяли линейным ограничениям (5.1.6.3)и при этом линейная функция
(5.1.6.4)
обращалась в минимум.Это задача линейного программирования. Решая задачу (5.1.6.3)—(5.1.6.4),получаем оптимальное решениеp*1, р*2,…,p*ти оптимальную стратегиюS*A.
Для определения оптимальной стратегии
S*B
= (q*1,
q*2,…,q*n)
следует учесть, что игрокВстремится минимизировать гарантированный
выигрыш, т.е. найти.
Переменныеq1,
q2,…,qnудовлетворяют
неравенствам
(5.1.6.5)
которые следуют из того, что средний проигрыш игрока Вне превосходит цены игры, какую бы чистую стратегию не применял игрокА.
Если обозначить
(5.1.6.6)
то получим систему неравенств:
(5.1.6.7)
Переменные уj (j = 1, 2, ...,n) удовлетворяют условиюy1+ y2 + …+ yп = 1 / v.
Игра свелась к следующей задаче.
Определить значения переменных уj > 0, j = 1, 2, ..., п, которые
удовлетворяют системе неравенств (5.1.6.7) и максимизируют линейную функцию
(5.1.6.8)
Решение задачи линейного программирования (5.1.6.6), (5.1.6.7) определяет оптимальную стратегиюS*B = (q*1, q*2,…,q*n). При этом цена игры
(5.1.6.9)
Составив расширенные матрицы для задач (5.1.6.3), (5.1.6.4)и(5.1.6.7), (5.1.6.8),убеждаемся, что одна матрица получилась из другой транспонированием:
Таким образом, задачи линейного программирования (5.1.6.3), (5.1.6.4)и (5.1.6.7), (5.1.6.8)являются взаимно-двойственными. Очевидно, при определении оптимальных стратегий в конкретных задачах следует выбрать ту из взаимно-двойственных задач, решение которой менее трудоемко, а решение другой задачи найти с помощью теорем двойственности.