Игра nm со смешанной стратегией, решение симплексным методом
Задана матрица платежей А=|ai,j| 1 i n, 1 jm.
Требуется найти оптимальное решение игры для игроков А и В: Р=|рi| и Q=|qj|
, . (10)
Преобразование матрицы платежей
Если в матрице платежей есть отрицательные платежи, все платежи увеличим на некоторую константу С –min(ai,j). Тогда цена игры тоже увеличится на эту константу W*= W+С, при этом все платежи и цена игры станут положительными величинами.
Пусть А применяет оптимальную стратегию, а В чистую стратегию j, тогда выигрыш игрока А составляет
aj= р1 a1,j+ р2 a2, j +…+ рn an,j. (11)
Оптимальная стратегия обладает тем свойством, что выигрыш не меньше, чем цена игры
р1 a1,1+ р2 a2,1 +…+ рn an,1 W*,
р1 a1,2+ р2 a2,2 +…+ рn an,2 W*, (12)
. . .
р1 a1,m+ р2 a2, m +…+ рn an,m W*.
Введем обозначения хi=рi/ W* .
Тогда систему неравенств (13) можно записать в следующем виде
a1,1x1 + a2,1 x2 +…+ an,1 xn 1,
a1,2x1 + a2,2 x2 +…+ an,2 xn 1, (13)
. . .
a1,m x1 + a2,m x2 +…+ an,m xn 1,
где хi 0, 1 i n,
х1 + х2 +…+ хn = 1/ W* .
Теперь задачу максимизации выигрыша игрока А (Wmax и W*max) можно сформулировать следующим образом:
L= х1 + х2 +…+ хn= 1/ W* min. (14)
Мы свели задачу нахождения оптимальной стратегии игрока А к задаче линейного программирования, в которой L – целевая функция (14) и ОДР –неравенства (13).
Для игрока В задача формулируется как двойственная игре игрока А
-
a1,1
a1,2
…
a1,m
р1
a2,1
a2,2
…
a2, m
р2
…
…
…
…
…
an,1
an,2
…
an,m
рn
q1
q2
…
qm
Введем обозначения уj= qj/ W*.
ОДР (15) составляется по столбцам и вместо 1 ставим 1.
a1,1у1 + a2, 1 у2 +…+ am,1 уm 1,
a2,1 у1 + a2,2 у2 +…+ am,2 уm 1, (15)
. . .
an,1 у1 + an,2 у2 +…+ an,m уm 1,
где уi 0, 1 j m,
y1 + y2 +…+ ym = 1/ W* .
Целевая функция
L = у1 + у2 +…+ уm = 1/ W*max (16)