- •Министерство образования и науки Российской Федерации
- •Матричные игры Методические указания
- •Оглавление
- •Требования к содержанию и оформлению контрольной работы
- •2. Основные понятия и определения теории игр
- •3. Матричные игры
- •3.1. Принцип максимина; решение игры в чистых стратегиях
- •3.2. Решение матричной игры в смешанных стратегиях
- •3.2.1. Решение игры 2 2
- •3.3. Графоаналитический метод решения матричных игр
- •3.3.2 Решение игры m2
- •Аналогично предыдущему рассматриваются частные случаи.
- •3.4. Сведение матричной игры к задаче линейного программирования
- •3.5. Доминирование стратегий
- •. Варианты контрольной работы
- •Библиографический список
3.2. Решение матричной игры в смешанных стратегиях
Определение
26.
Стратегии
и
называются смешанными,
если хотя бы два значения вероятностей
выбора стратегий первым и (или) вторым
игроком не равны нулю:
Исходя
из того, что стратегии представляют
собой полную группу событий, выполняется
условие нормировки:
;
.
Примем без доказательства следующую теорему.
Теорема 2. Для того чтобы смешанные стратегии игроков были оптимальными, необходимо и достаточно выполнение условий:
;
.
Т.е.
выигрыш игрока А
при его
оптимальной стратегии
и любой чистой стратегии игрока В
не меньше цены игры, а проигрыш игрока
В
при его
оптимальной стратегии
и любой чистой стратегии игрока А
не больше цены игры.
Определение 27. Чистые стратегии называются активными, если в оптимальной смешанной стратегии их вероятности не равны нулю.
Пусть, например, оптимальная стратегия игрока А имеет вид
тогда
,
,
являются активными
стратегиями игрока А
(аналогично
для игрока В).
Примем без доказательства следующую теорему.
Теорема 3. Если первый из игроков придерживается своей оптимальной смешанной стратегии, а второй игрок выбирает любую активную стратегию, то выигрыш первого игрока равен цене игры; аналогично для второго игрока:
;
.
Здесь
и
- подмножества индексов активных
стратегий соответственно игрока В
и игрока А.
3.2.1. Решение игры 2 2
Найдем
оптимальную стратегию игрока А.
В соответствии с теоремой 3 применение
игроком А
оптимальной стратегии
должно обеспечить ему при любых стратегиях
игрока В
-
выигрыш, равный цене игры при условии,
что В
выбирает стратегию из активных:
.
(6)
Здесь
s
– количество активных стратегий игрока
В.
Рассмотрим игру, в которой m=n=2
с платежной матрицей
и
векторами стратегий
и
.
Очевидно, что число активных стратегий игрока B – s = 2. С учетом этого (6) запишется в виде
для
;
для
.
(7)
Из (7) получим
.
Тогда
и оптимальная стратегия игрока А
найдена:
.
Аналогичным образом находится оптимальная
стратегия игрока В.
Применение игроком В
оптимальной стратегии
должно обеспечить при любых стратегиях
игрока А
проигрыш, равный цене игры при условии,
что А
выбирает стратегию из активных:
.
(8)
Здесь r – количество активных стратегий игрока А.
Запишем
условие (8) для случая игры 22,
когда n =
r =
2. Будем иметь при
и
:
для
;
для
.
(9)
Из (9) получим
.
Тогда
и оптимальная стратегия игрока найдена:
.
Затем, подставив
в
одно из уравнений (9) или
в
одно из уравнений (7), получим цену игры
.
3.3. Графоаналитический метод решения матричных игр
3.3.1. Решение игры 2n
Для
игры 2n
имеем платежную матрицу вида
.
Количество
стратегий игрока А
– m =
2 и вектор стратегий имеет вид
;
количество стратегий игрока В
–п и вектор
стратегий
.
Положим р1=х
, тогда
р2=1-х
. Если игрок
В
выбрал чистую стратегию Вj
из набора
возможных, то выигрыш игрока А
является линейной функцией от х
– вероятности
принятия им первой стратегии:
Таким
образом, каждой стратегии Вj
соответствует прямая lj(x),
.
Введём в
рассмотрение функцию
.
Не сложно показать, что графиком
будет нижняя
огибающая всех прямых, соответствующих
стратегиям игрока В.
Другими
словами, ломанная
есть нижняя граница выигрыша игрока А.
Игрок А
стремится максимизировать свой выигрыш,
поэтому он должен выбирать свою
оптимальную стратегию
так, чтобы аргумент х
приносил максимум
, т.е. максимум гарантированного выигрыша:
.
Графически
х*
будет наивысшей точкой ломанной
,
тогда р1*=
х* – абсцисса
наивысшей точки; ордината наивысшей
точки – цена игры, т.к. это значение
выигрыша А
при
.
Зная цену игры V*,
ставим ей в соответствие активные
стратегии В.
Пусть это будут стратегии номер s
и r,
соответствующие прямым ls(x)
и lr(x)
и дающим в пересечении точку с абсциссой
х*.
Тогда
вектор оптимальных стратегий игрока В
имеет вид
= (0,…ps,
0…pr,
0…0). Значения
qs
и qr
находятся
для матрицы А'
вида
А'=
по правилу игры 22:
;
.
Графическая иллюстрация рассуждений приведена на рис. 1.
Рис.1
Пример 2. Для игры с платежной матрицей
найти
решение графоаналитическим методом.
Решение
1.
Запишем lj(x)=
a1j
x
+ a2j
(1-x),
:
l1(x) = 1 x - 1 (1-x) = 2 x-1,
l2(x) = 4 x - 2 (1-x) = 6 x-2,
l3(x) = 0 x + 1 (1-x) = -x+1 ,
l4(x) = -1 x + 5 (1-x) = -6 x+5.
П
остроим
графики lj(x),
;
найдем нижнюю огибающую, её Верхнюю
точку, активные стратегии игрока В.
верхняя
точка нижней огибающей x*
есть точка пересечения
и
(см рис. 2), поэтому активными стратегиями
игрока В
являются В1
и В2,
т.е. s =
1, r =
3 .
3. Найдём численное значение вероятности принятия игроком А первой стратегии, т.е. точку пересечения l3(x) и l4(x) из условия
2 x* -1 = -x* +1, x* = 2/3, тогда = (2/3, 1/3).
4. Найдём цену игры V* = l3(x*) = l4(x*) = 2 2/3 – 1 = 1/3.
По активным стратегиям игрока В для платёжной матрицы А'=
определим
и
:
;
.
= (1/3, 0, 2/3, 0).
Ответ: = (2/3; 1/3); = (1/3, 0, 2/3, 0); V* = 1/3.
В
ыделим
по виду (x)
частные случаи.
Случай
1. Рассмотрим
случай, когда
имеет множество точек, максимальных на
[0; 1]. Тогда игрок А
имеет бесконечное множество оптимальных
страте-гий,
= (x*,
1-x*),
где x*
из отрезка
[a, b]
(см. рис. 3). Оптимальной стратегией игрока
В
является чистая стратегия Вк
:
=
(0,…0,
,
0,…,0).
Цена
игры (x*)
= V(
)
одна и та же для всех
x*
[a,
b].
Случай
2: Если
достигается
в крайних точках отрезка [0,1]
а
)
если
в точке
х*
=
0, то оптимальной
стратегией игрока А
будет чистая стратегия
= (0;1), а
оптимальной стратегией игрока В
-
= (0,…0,
,
0,…0), где номер k
такой, что
точка (х*,(x))
лежит на прямой lk(x);
цена игры
(x*)
= lk(x);
б
)
если
достигается
в точке х* =
1 (см. рис.
5), то
оптимальной стратегией игрока А
будет чистая
стратегия
=(1,
0), оптимальной стратегии игрока В
– чистая
стратегия
=(0,…0,
,…0),
где s
такое, что (х*,
(x))
лежит на ls(x);
цена игры (x*)
= ls(x*).
