
- •Глава I. Математические модели конфликтных ситуаций
- •§ 1. Предмет теории игр. Основные понятия
- •§2. Нижняя и верхняя цена игры. Принцип "мннимакса"
- •Глава п. Чистые и смешанные стратегии
- •§ 1. Основная теорема теории игр
- •§2. Элементарные методы решения игр. Игры 2x2 и 2хп.
- •§ 3. Геометрическая интерпретация игры 2x2, игры 2xп.
- •§ 4. Общие методы решения конечных игр. Сведение их к задачам линейного программирования
- •§ 5. Игры с «природой».
§ 4. Общие методы решения конечных игр. Сведение их к задачам линейного программирования
Мы рассматривали до сих пор только самые элементарные игры типа 2хп, которые могут быть весьма просто решены и допускают удобную и наглядную геометрическую интерпретацию.
В общем случае решение игры mxn представляет довольно трудную задачу, причём сложность задачи и объём вычислений резко возрастает с увеличением т и п.
При решении игр тхп на практике удобнее пользоваться не геометрическими аналогиями, а расчётными аналитическими методами, тем более, что для решения задачи на вычислительных машинах эти методы единственно пригодны.
Решение любой конечной игры mxn может быть приведено к задаче линейного программирования.
Пусть дана игра mxn с m стратегиями А1, А2, ..., Ат игрока А и п стратегиями В1, В2, ..., Вп игрока В и задана платежная матрица ║аij║. Требуется найти решение игры, т.е. две оптимальные смешанные стратегии игроков А и В:
где р1+р2+…
+рm=1,
q1+q2+…+qn=1.
Оптимальная
стратегия
должна обеспечивать нам выигрыш, не
меньшей v,
при любом поведении противника, и
выигрыш, равный v,
при его оптимальном поведении (стратегия
).
Цена игры v
не известна. Будем считать, что v>0,
для чего нужно, чтобы все элементы
матрицы ║аij║
были неотрицательными. Этого можно
добиться, прибавляя к элементам ║аij║
достаточно большую положительную
величину L,
при этом цена игры увеличивается на L,
а решение не изменится.
Пусть мы выбрали свою оптимальную стратегию . Тогда наш средний выигрыш при стратегии Bj противника будет равен:
аj= p1a1j + p2 a2j + …+ pmamj.
Оптимальная стратегия обладает тем свойством, что при любом поведении противника обеспечивает выигрыш не меньший, чем vj, следовательно, любое из чисел aj не может быть меньше v. Получаем ряд условий:
Разделим неравенства на положительную величину v и обозначим
.
Тогда условия системы запишутся в виде
,
где
-
необязательные числа.
Т.к. p
1+p2
+... + pm
=1, то величины
удовлетворяют условию
.
Мы хотим сделать свой гарантированный выигрыш максимально возможным; очевидно, при этом правая часть последнего равенства принимает минимальное значение.
Таким образом,
задача нахождения решения игры сводится
к следующей задаче линейного
программирования: определить
неотрицательные величины
удовлетворяющие последней системе,
так, чтобы их сумма
была минимальной.
Задача второго игрока является двойственной по отношению к задаче первого игрока. Можно найти решение одного из игроков, а затем по теоремам двойственности - решение другого.
Пример. Требуется найти решение игры 3х3 с матрицей:
В А |
В1 |
В2 |
В3 |
А1 |
2 |
-3 |
4 |
А2 |
-3 |
4 |
-5 |
А3 |
4 |
-5 |
6 |
Решение. Чтобы сделать все аij≥0, прибавим ко всем элементам матрицы L=5. Получим матрицу:
В А |
В1 |
В2 |
В3 |
А1 |
7 |
2 |
9 |
А2 |
2 |
9 |
0 |
А3 |
9 |
0 |
11 |
При этом цена игры увеличится на 5, а решение не изменится.
,
где
.
Чтобы избавится от знаков неравенства, введем фиктивные переменные z1, z2 , z3, тогда имеем
.
Линейная форма Ф
имеет вид:
.
Выразим Ф через z1, z2 , z3 решая систему получим:
.
Тогда
.
В выражении
коэффициенты при всех z
положительны, значит любое увеличение
z1,
z2
, z3
сверх нуля может привести к увеличению
формы Ф, а нам нужно чтобы она была
минимальной. Следовательно, z1=z2=z3=0.
Тогда
,
v=5.
Находим
,
или умножая их на v:
Таким образом, оптимальная стратегия А найдена:
.
Зная цену игры, можно уже известными способами найти оптимальную стратегию соперника:
.
Для этого воспользуемся любыми двумя полезными стратегиями, например А2 и А3 и напишем уравнения:
,
откуда q1=q3=1/4; q2=1/2. Оптимальная стратегия противника будет такой же, как наша:
.
Теперь вернёмся к первоначальной (не преобразованной) игре. Для этого нужно только от цены игры v=5 отнять величину L=5, прибавленную к элементам матрицы. Получается цена исходной игры v=0. Следовательно, оптимальные стратегии обеих сторон обеспечивают выигрыш, равный нулю; игра в одинаковой мере выгодна или невыгодна для обеих сторон.
В рассмотренной выше задаче игра задавалась платежной матрицей, которую сводили к модели линейного программирования. И, наоборот, задача линейного программирования может быть сведена к матричной игре.
Если задача
линейного программирования имеет вид
F(x)=
,
при ограничениях:
xj
≥ 0, i=1,…,
m,
j=1,…,
n,
то матричная игра определяется платежной
матрицей размера (т
+ п
+ 1) вида
,
где
А
—
матрица коэффициентов при неизвестных
системы ограничений
задачи линейного программирования; В
— матрица
свободных членов; С
—
матрица коэффициентов при неизвестных
целевой функции; Аt,
Вt,
Сt
—
транспонированные матрицы
А,
В, С.
Если
задача линейного программирования
имеет вид F(x)=
,
при ограничениях:
xj
≥ 0, i=1,…,
m,
j=1,…,
n,
то матричная игра определяется платежной
матрицей размера (т
+ п
+ 1) вида
.
Пример. Построить матричную игру, заданную задачей линейного программирования F(x) = 2х1 + 3x2 → max при ограничениях:
x1, x2 ≥0.
Решение.
Обозначим:
,
,
.
Транспонированные матрицы:
,
,
,
т
+ п
+ 1=2+2+1=5.
Ответ: Игру, определяемую данной задачей линейного программирования, можно записать матрицей:
.