
Karmazin_-_Teoria_Igr_Uchebnik / P12_3
.DOCТема 12. РЕШЕНИЕ МАТРИЧНЫХ ИГР
Широкий круг прикладных задач принятия решений в условиях конфликта формализуется в виде матричных игр. Оказывается, что любая матричная игра сводится к решению некоторой пары взаимно двойственных задач ЛП.
Общее описание
матричной игры таково. У игрока 1 имеется
набор из
стратегий, нумеруемых числами
;
у игрока 2 имеется
стратегий, нумеруемых числами
.
Если игрок 1 выбрал стратегию
,
а игрок 2
стратегию
,
то выигрыш 1-го игрока равен числу
(это может быть и проигрыш, если
).
Матрица
называется матрицей
игры,
упорядоченная пара стратегий
ситуацией.
Ситуация
называется приемлемой
для игрока 1, если
.
Аналогично, ситуация
приемлема для игрока 2, если
.
Ситуация, приемлемая для обоих игроков,
называется равновесной,
т.е.
равновесная, если
. (1)
Из (1) следует, что
равновесная ситуация представляет
собой седловую точку матрицы
.
Стратегии
и
,
входящие в равновесную ситуацию
,
называются соответственно оптимальными
стратегиями 1-го и 2-го игроков.
Число
называется нижним
значением
игры, а число
её верхним
значением.
Пусть
ситуация приемлемая для игрока 1, тогда
;
если же
приемлема для игрока 2, то
.
Указанные стратегии
и
будем называть гарантирующими
соответственно для игроков 1 и 2.
Легко показать,
что в общем случае
.
Теорема 1.
Для того чтобы матрица
имела седловую точку, необходимо и
достаточно, чтобы выполнялось равенство
.
Если игра с матрицей
имеет седловую точку, то число
будем называть значением
игры.
Процесс отыскания
седловой точки в матрице
можно представить схемой:
Пример 1.
Найти седловую точку в матрице
.
Так как
,
то седловой точки в матрице
нет. При этом
гарантирующая стратегия 1-го игрока, а
2-го игрока.
Таким образом, в
общем случае возникает задача раздела
между игроками величины
.
Оказывается, что игроки должны в этом
случае выбирать свои стратегии случайно.
Под смешанной
стратегией игрока 1 будем понимать такой
вектор
,
что
, (2)
. (3)
Аналогично, под
смешанной стратегией игрока 2 будем
понимать вектор
такой, что
, (4)
. (5)
Вектор
будем называть
-й
чистой
стратегией
игрока 1, а вектор
-й
чистой стратегией игрока 2.
Определим билинейную функцию
,
где
и
произвольные смешанные стратегии
игроков 1 и 2 соответственно. Функция
называется функцией
выигрыша
для игрока 1.
Пусть
и
множества смешанных стратегий 1-го и
2-го игроков соответственно.
Решением матричной
игры называется
такая пара смешанных стратегий
,
что
.
При этом
и
называются оптимальными
смешанными стратегиями
соответствующих игроков, а величина
ценой игры.
Теорема 2.
Любая матричная игра с матрицей
разрешима в смешанных стратегиях, т.е.
существует седловая точка функции
в области
.
Теорема 3.
Для того чтобы
была оптимальной смешанной стратегией
1-го игрока матричной игры с матрицей
и ценою игры
,
необходимо и достаточно выполнение
следующих неравенств:
. (6)
Аналогично для
2-го игрока: чтобы
была оптимальной смешанной стратегией
2-го игрока, необходимо и достаточно
выполнение следующих неравенств:
. (7)
Теорема 4.
Пусть дана матричная игра G1
с матрицей
и ценой
.
Тогда оптимальные смешанные стратегии
игроков матричной игры G2
с матрицей
,
где
,
совпадают с оптимальными смешанными
стратегиями соответствующих игроков
в игре G1,
а цена игры G2
равна
.
Сведение матричной
игры к задаче ЛП.
Пусть дана
матричная игра с матрицей
.
Будем предполагать, что цена игры
положительная. Это условие не нарушает
общности, так как если положить
,
то элементы
будут заведомо положительными. При этом
цена игры с матрицей
будет также положительной. Осталось
принять во внимание теорему 4.
Согласно теореме
3 оптимальные смешанные стратегии
и
соответственно 1-го и 2-го игроков и цена
игры
должны удовлетворять соотношениям (2),
(3), (6) и (4), (5), (7) соответственно. Разделим
все эти уравнения и неравенства на
и введем обозначения:
.
Тогда получим задачи:
,
.
Поскольку первый
игрок стремится найти такие значения
и, следовательно,
,
чтобы цена игры
была максимальна, то решение первой
задачи сводится к задаче ЛП:
(8)
Аналогично вторая задача сводится к задаче ЛП:
(9)
Решив эти задачи,
получим значения
и
,
а также величину
.
Тогда смешанные стратегии, т.е. значения
и
,
получаются по формулам:
. (10)
При этом заметим, что достаточно решить лишь одну задачу ЛП например, (9). Решение другой (двойственной к исходной) задачи получаем исходя из теории двойственности.
Пример 2. Найти решение игры, заданной матрицей
.
Сначала заметим,
что матрица
не имеет седловой точки, так как
.
Следовательно, игра неразрешима в чистых
стратегиях.
Прибавим ко всем
элементам матрицы
число
.
В результате получим матрицу
,
в которой все элементы положительны:
.
Таким образом,
игра с матрицей
имеет заведомо положительную цену.
Используя матрицу
,
запишем задачу ЛП вида (9):
(11)
Задачу (11) с помощью
дополнительных неотрицательных
переменных
приводим к каноническому виду:
(12)
Задача (12) имеет
очевидное опорное решение
с единичным базисом
.
Решим эту задачу симплекс-методом.
Результаты вычислений запишем в
симплекс-таблицы 1
3.
Таблицы 1-3
|
№ |
Базис |
Сбаз |
A0 |
1 |
1 |
1 |
1 |
0 |
0 |
0 |
|
|
|
|
|
A1 |
A2 |
A3 |
A4 |
A5 |
A6 |
A7 |
¬ |
1 |
A5 |
0 |
1 |
"4" |
3 |
4 |
2 |
1 |
0 |
0 |
|
2 |
A6 |
0 |
1 |
3 |
4 |
6 |
5 |
0 |
1 |
0 |
|
3 |
A7 |
0 |
1 |
2 |
5 |
1 |
3 |
0 |
0 |
1 |
|
4 |
- |
- |
0 |
-1 |
-1 |
-1 |
-1 |
0 |
0 |
0 |
|
|
|
|
|
|
|
|
¯ |
|
|
|
|
1 |
A1 |
1 |
1/4 |
1 |
3/4 |
1 |
1/2 |
1/4 |
0 |
0 |
¬ |
2 |
A6 |
0 |
1/4 |
0 |
7/4 |
3 |
"7/2" |
-3/4 |
1 |
0 |
|
3 |
A7 |
0 |
1/2 |
0 |
7/2 |
-1 |
2 |
-1/2 |
0 |
1 |
|
4 |
- |
- |
1/4 |
0 |
-1/4 |
0 |
-1/2 |
-1/4 |
0 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
A1 |
1 |
3/14 |
1 |
1/2 |
4/7 |
0 |
5/14 |
-1/7 |
0 |
|
2 |
A4 |
1 |
1/14 |
0 |
1/2 |
6/7 |
1 |
-3/14 |
2/7 |
0 |
|
3 |
A7 |
0 |
5/14 |
0 |
5/2 |
-19/7 |
0 |
-1/14 |
-4/7 |
1 |
|
4 |
|
|
2/7 |
0 |
0 |
3/7 |
0 |
1/7 |
1/7 |
0 |
Вводимые в базис и выводимые из базиса векторы обозначены стрелками на краях таблицы, ведущие элементы преобразований выделены жирным шрифтом и кавычками.
Так как в табл. 3
все оценки неотрицательные, то получено
оптимальное решение задачи (12) с базисом
,
оптимумом
и
.
Отбросив значения дополнительных
переменных, получим оптимальное решение
задачи (11) оптимум
и
.
Учитывая, что
задача (12) (а значит и (11)) является
двойственной к задаче ЛП вида (8) с
матрицей
,
получим, что вектор
определяется как решение системы:
Откуда
.
Далее, учитывая формулы (10), получаем
;
;
.
Кроме того, так как
,
то цена игры с исходной матрицей
равна
.
Таким образом,
игра с матрицей
решена:
оптимальная
смешанная стратегия игрока 1;
оптимальная
смешанная стратегия игрока 2;
цена матричной
игры.
Задание.
В задачах
12.1
12.114 для игры, заданной платежной матрицы
,
найти: нижнее и верхнее значения игры;
оптимальные смешанные стратегии обоих
игроков; цену игры.
12.1 A=
|
|
12.2 A=
|
12.3 A=
|
|
12.4 A=
|
12.5 A=
|
|
12.6 A=
|
12.7 A=
|
|
12.8 A=
|
12.9 A=
|
|
12.10 A=
|
12.11 A=
|
|
12.12 A=
|
12.13 A= |
|
12.14 A= |
12.15 A=
|
|
12.16 A=
|
12.17 A=
|
|
12.18 A=
|
12.19 A=
|
|
12.20 A=
|
12.21 A=
|
|
12.22 A=
|
12.23 A=
|
|
12.24 A=
|
12.25 A=
|
|
12.26 A=
|
12.27 A=
|
|
12.28 A=
|
12.29 A=
|
|
12.30 A=
|
12.31 A=
|
|
12.32 A=
|
12.33 A=
|
|
12.34 A=
|
12.35 A=
|
|
12.36 A=
|
12.37 A=
|
|
12.38 A=
|
12.39 A=
|
|
12.40 A=
|
12.41 A=
|
|
12.42 A=
|
12.43 A=
|
|
12.44 A=
|
12.45 A=
|
|
12.46 A=
|
12.47 A=
|
|
12.48 A=
|
12.49 A=
|
|
12.50 A=
|
12.51 A=
|
|
12.52 A=
|
12.53 A=
|
|
12.54 A=
|
12.55 A=
|
|
12.56 A=
|
12.57 A=
|
|
12.58 A=
|
12.59 A=
|
|
12.60 A=
|
12.61 A=
|
|
12.62 A=
|
12.63 A=
|
|
12.64 A=
|
12.65 A=
|
|
12.66 A=
|
12.67 A=
|
|
12.68 A=
|
12.69 A=
|
|
12.70 A=
|
12.71 A=
|
|
12.72 A=
|
12.73 A=
|
|
12.74 A=
|
12.75 A=
|
|
12.76 A=
|
12.77 A=
|
|
12.78 A=
|
12.79 A=
|
|
12.80 A=
|
12.81 A=
|
|
12.82 A=
|
12.83 A=
|
|
12.84 A=
|
12.85 A=
|
|
12.86 A=
|
12.87 A=
|
|
12.88 A=
|
12.89 A=
|
|
12.90 A=
|
12.91 A=
|
|
12.92 A=
|
12.93 A=
|
|
12.94 A=
|