- •Министерство образования и науки Российской Федерации
- •Матричные игры Методические указания
- •Оглавление
- •Требования к содержанию и оформлению контрольной работы
- •2. Основные понятия и определения теории игр
- •3. Матричные игры
- •3.1. Принцип максимина; решение игры в чистых стратегиях
- •3.2. Решение матричной игры в смешанных стратегиях
- •3.2.1. Решение игры 2 2
- •3.3. Графоаналитический метод решения матричных игр
- •3.3.2 Решение игры m2
- •Аналогично предыдущему рассматриваются частные случаи.
- •3.4. Сведение матричной игры к задаче линейного программирования
- •3.5. Доминирование стратегий
- •. Варианты контрольной работы
- •Библиографический список
3.4. Сведение матричной игры к задаче линейного программирования
Примем без доказательства следующую теорему:
Теорема
4. Смешанные
стратегии игроков
в игре с платежной матрицей А
и ценой игры V*
будут оптимальны и в матричной игре с
,
элементы которой есть линейная комбинация
элементов А:
=
{ aij
} = {baij
+c},
,
;
b,c =const, b>0,
при
этом цена игры
=
bV*
+ c.
Рассмотрим процедуру сведения матричной игры к задаче линейного программирования (ЗЛП). Запишем условия, которым должны удовлетворять вектора оптимальных стратегий игроков:
по
теореме 2 имеем
,
,
,
;
(12)
условия
нормировки
;
(13)
ограничения
на знак
,
,
,
.
(14)
По
теореме 4 за счет преобразования А
в
А‘
можно добиться
того, чтобы все элементы
А' были больше
нуля. Не нарушая общности, будем считать,
что
,
,
.
Тогда цена игры будет строго больше
нуля:
Разделим
обе части (12) и (13) на V*
(мы можем это сделать, т.к. V*
>
0) и сделаем
замену переменных:
,
.
Тогда условия (12)-(14) запишутся следующим
образом:
,
;
(15)
,
;
(16)
;
(17)
;
(18)
,
;
(19)
,
.
(20)
Из
полученных условий сформулируем ЗЛП
для игрока А.
Игрок А
стремится максимизировать свой выигрыш
V*
, поэтому для него
,
тогда из (17) получим выражение для функции
цели:
Запишем ограничения на область, в которой находится минимум функции цели:
, ; (22)
, . (23)
Аналогично
игрок В
стремится минимизировать свой проигрыш
V*,
поэтому для него
и ЗЛП для игрока В имеет следующий вид:
;
(24)
, . (26)
Решив
полученные задачи линейного программирования
и сделав переход от xi
к
и от
yj
к
,
получим решение игры.
Схема перехода от решения ЗЛП к решению игры:
-
определяем цену игры
или
;
-
определим компоненты векторов оптимальных
стратегий игроков
,
;
,
.
Замечание 1. ЗЛП (21) –(23) и (24) – (26) – двойственные, поэтому, решив прямую задачу по последней симплекс-таблице, в столбцах замещения для дополнительных переменных можно найти решение двойственной задачи; этот прием позволяет существенно сократить объем вычислений.
Замечание
2. Если
матрица А
преобразовывалась в
,
то следует перейти от
к V*,
для этого используется обратное
преобразование
:
.
Пример
4. Решить
игру сведением к ЗЛП; платежная матрица
имеет вид
.
Решение
Проверим, существует ли решение игры в чистых стратегиях:
максиминные стратегии А1, А2;
минимаксная стратегия В2;
-нижняя чистая цена игры не равна верхней чистой цене игры, α ≠ β, значит, седловой точки нет и решения в чистых стратегиях нет.
Проверим, возможно ли уменьшение размерности задачи за счет использования свойства доминирования стратегий:
среди стратегий игрока А доминирования нет;
стратегия В3 доминируется стратегией В2, поэтому матрица А преобразуется к виду
и
вектора стратегий игроков будут иметь
вид
=
,
;
=
,
.
Для того чтобы решить игру сведением к ЗЛП, необходимо выполнение условия V* >0. Это достигается сведением платежной матрицы А к матрице , у которой
>0,
,
.
Пусть b=1,
с=2, тогда
=
+2
.
Запишем ЗЛП для игрока В:
; или FцB= y1+y2 max;
,
;
y1+2y2
1;
, ; 4y1+y2 1;
y1 , y2 0.
Вводим дополнительные неизвестные, сводя общую ЗЛП к каноническому виду:
Fц= y1+y2 max;
y1+2y2+y3 = 1;
4y1+y2 +y4 = 1;
,
.
Решаем задачу симплекс-методом:
|
Основные переменные |
Дополнительные переменные |
||||
Fц |
0 |
1 |
1 |
0 |
0 |
|
eб |
уб |
bi |
у1 |
у2 |
у3 |
у4 |
0 |
у3 |
1 |
1 |
2 |
1 |
0 |
0 |
у4 |
1 |
4 |
1 |
0 |
1 |
Z |
0 |
-1 |
-1 |
0 |
0 |
|
0 |
у3 |
3/4 |
0 |
7/4 |
1 |
-1/4 |
1 |
у1 |
1/4 |
1 |
1/4 |
0 |
1/4 |
Z |
1/4 |
0 |
-3/4 |
0 |
1/4 |
|
1 |
у2 |
3/7 |
0 |
1 |
4/7 |
1/7 |
1 |
у1 |
1/7 |
1 |
0 |
-1/7 |
2/7 |
Z |
4/7 |
0 |
0 |
3/7 |
1/7 |
|
Из последней симплекс-таблицы имеем: оптимальное значение функции цели ыавыавыы
=4/7;
решение прямой ЗЛП – x1=3/7,
x2=1/7;
решение обратной ЗЛП – y1=1/7,
y2=3/7.Найдем решение игры с платежной матрицей :
-
определим цену игры
;
определим вектора оптимальных стратегий игроков
,
;
;
, тогда
;
,
;
;
,
тогда;
=
.
9) Найдем решение игры с платежной матрицей А. В соответствии с теоремой 4 вектора остаются такими же, как для игры с платежной матрицей , а цена игры находится по формуле
.
Пример 5. Проверить, удовлетворяются ли условия теорем 2 и 3 для полученного решения игры.
По теореме 2 для игрока А имеем условия:
, .
Пусть игрок В принял первую чистую стратегию, j=1, тогда получим
;
пусть игрок В принял вторую чистую стратегию, j=2, тогда получим
;
пусть игрок В принял третью чистую стратегию, j=3, тогда получим
.
Таким образом, условия теоремы 2 выполняются. Аналогично проверяется выполнение теоремы 2 для игрока В.
По условиям теоремы 3 для активных стратегий в условиях теоремы 2 имеем равенства, и действительно у игрока В активными являются стратегии В1 и В2, j = 1,2 , для которых условия теоремы 2 выполняются на равенстве. Таким образом, условия теоремы 3 выполняются.
