
Karmazin_-_Teoria_Igr_Uchebnik / P13_3
.DOCТема 13. ГРАФИЧЕСКИЙ МЕТОД РЕШЕНИЯ МАТРИЧНЫХ ИГР
Для решения
матричных игр с платежной матрицей
размером
или
можно успешно использовать графический
метод.
Пусть задана игра
с платежной матрицей
У 1-го игрока
две чистые стратегии, у 2-го
три чистые стратегии. Смешанная стратегия
1-го игрока представляет собой совокупность
двух чисел
и
,
где
обозначает вероятность выбора 1-й
стратегии, а
вероятность выбора 2-й стратегии. В сумме
и
равны единице:
.
Смешанная стратегия 2-го игрока задается
тремя числами, вероятностями выбора
трех чистых стратегий:
и
,
также дающих в сумме единицу:
.
Геометрически
смешанную стратегию
1-го игрока можно представить точкой на
единичном отрезке:
Если 2-й игрок
выбрал
-ю
стратегию, то математическое ожидание
выигрыша 1-го игрока составит
.
Отложим на оси абсцисс единичный отрезок
для представления смешанных стратегий
1-го игрока, на оси ординат будем
откладывать ожидаемый выигрыш. Так как
ожидаемые выигрыши
функции, линейные от
и
,
то геометрическое место точек смешанных
стратегий и ожидаемых выигрышей
представляет собой прямую. Выигрыш 1-го
игрока при
,
что соответствует 2-й чистой стратегии
1-го игрока при условии, что 2-й игрок
выбрал
-ю
стратегию, составит
.
Если 1-й игрок выберет 1-ю чистую стратегию,
,
то его выигрыш составит
.
На перпендикуляре к оси абсцисс в точке
откладываем
выигрыши 1-го игрока, соответствующие
его 2-й чистой стратегии:
.
А на перпендикуляре к оси абсцисс в
точке
откладываем
выигрыши, соответствующие 1-й чистой
стратегии:
.
Соединяя прямой
линией точки
на левом перпендикуляре с точками
на правом перпендикуляре, получим
графики ожидаемых выигрышей
1-го игрока для каждой из чистых стратегий
2-го игрока.
Для каждой смешанной
стратегии
определяем наименьший (гарантированный)
ожидаемый выигрыш
График функции
является нижней границей множества
прямых
и на рис.2 выделен жирной линией. Та точка
отрезка, в которой нижняя граница
достигает наибольшего значения,
соответствует искомой смешанной
стратегии
,
высота максимума дает значение цены
игры
.
По графику определяем
номера прямых
,
точка пересечений которых имеет абсциссу
,
допустим, это
и
,
и вычисляем точные значения вероятностей
и
из системы уравнений
Оптимальную
смешанную стратегию
2-го игрока можно рассматривать как
опорное решение задачи линейного
программирования. Для игры с матрицей
из структуры соответствующей задачи
линейного программирования следует,
что смешанная стратегия 2-го игрока
имеет не более чем две ненулевые
компоненты и не менее чем
нулевых. Из соотношений двойственности
задач обоих игроков номера ненулевых
элементов
определяются номерами прямых, пересечение
которых определило оптимальную стратегию
1-го игрока. Согласно рисунку это прямые
и
,
следовательно,
,
а компоненты
определяем из уравнений
Пример 1. Найти решение игры с платежной матрицей
Прежде всего
проверяем наличие седловой точки.
Вычисляем:
откуда нижнее значение игры
.
Вычисляем: для верхнего значения
откуда
.
Так как
,
то седловой точки нет, и задача не имеет
оптимального решения в чистых стратегиях.
Решаем задачу в смешанных стратегиях, для этого строим графики математических ожиданий выигрыша первым игроком:
Нижнюю границу
ожидаемых выигрышей первого игрока
выделим жирной линией на рис. 13.3. Из
графика видно, что гарантированный
максимальный выигрыш находится в точке
пересечения прямых
и
.
Находим координаты точки пересечения
из системы уравнений:
при этом цена игры
составит
.
Оптимальную смешанную стратегию 2-го
игрока находим из уравнений:
,
полагаем, что
.
Решая, получим
.
Игра с платежной
матрицей
решается аналогично, только за основу
берутся смешанные стратегии 2-го игрока.
По ним строится ломанная, которая
характеризует верхнюю границу ожидаемого
выигрыша и на которой ищем точку с
минимальной ординатой. Перейдем сразу
к примеру.
Пример 2. Найти решение игры с платежной матрицей
Проверяем наличие
седловой точки. Вычисляем нижнее значение
игры
и верхнее значение игры
.
Так как
,
то седловой точки нет.
Решаем задачу в
смешанных стратегиях. Смешанная стратегия
1-го игрока задается вектором вероятностей
,
где
.
Смешанная стратегия второго игрока
вектором вероятностей
,
где
.
Математическое ожидание проигрыша 2-го
игрока для каждой чистой стратегии 1-го
игрока задаются формулами:
.
Построим график,
на оси абсцисс которого будем откладывать
компоненты смешанной стратегии
,
а на вертикальных осях
величину ожидаемого проигрыша 2-го
игрока.
Выделим верхнюю
границу ожидаемого выигрыша (она же
нижняя граница проигрыша 2-го игрока)
жирной линией. Точка с минимальной
ординатой на этой линии находится на
пересечении прямых
.
Найдем координаты этой точки из системы
уравнений
.
Получим
и цену игры
.
Определим оптимальную стратегию 1-го
игрока, так как 1-я стратегия неактивна,
то полагаем
,
а остальные компоненты вычислим из
уравнений:
.
Получим
.
Задание 1.
Для игры
заданной платежной матрицей
в упражнениях
13.1
13.102 найти нижнее и верхнее значения
игры; оптимальные смешанные стратегии
обоих игроков; цену игры.
Задание 2.
Для игры
заданной платежной матрицы
,
где
из 13.1
13.102 найти нижнее и верхнее значения
игры; оптимальные смешанные стратегии
обоих игроков; цену игры.
12.1 A=
|
|
13.2 A=
|
|
13.3 A=
|
13.4 A=
|
|
13.5 A=
|
|
13.6 A=
|
13.7 A=
|
|
13.8 A=
|
|
13.9 A=
|
13.10 A=
|
|
13.11 A=
|
|
13.12 A=
|
13.13 A=
|
|
13.14 A=
|
|
13.15 A=
|
13.16 A= |
|
13.17 A= |
|
13.18 A= |
13.19 A=
|
|
13.20 A=
|
|
13.21 A=
|
13.22 A=
|
|
13.23 A=
|
|
13.24 A=
|
13.25 A=
|
|
13.26 A=
|
|
13.27 A=
|
13.28 A=
|
|
13.29 A=
|
|
13.30 A=
|
13.31 A=
|
|
13.32 A=
|
|
13.33 A=
|
13.34 A=
|
|
13.35 A=
|
|
13.36 A=
|
13.37 A=
|
|
13.38 A=
|
|
13.39 A=
|
13.40 A=
|
|
13.41 A=
|
|
13.42 A=
|
13.43 A=
|
|
13.44 A=
|
|
13.45 A=
|
13.46 A=
|
|
13.47 A=
|
|
13.48 A=
|
13.49 A=
|
|
13.50 A=
|
|
13.51 A=
|
13.52 A=
|
|
13.53 A=
|
|
13.54 A=
|
13.55 A= |
|
13.56 A= |
|
13.57 A= |
13.58 A=
|
|
13.59 A=
|
|
13.60 A=
|
13.61 A=
|
|
13.62 A=
|
|
13.63 A=
|
13.64 A=
|
|
13.65 A=
|
|
13.66 A=
|
13.67 A=
|
|
13.68 A=
|
|
13.69 A=
|
13.70 A=
|
|
13.71 A=
|
|
13.72 A=
|
13.73 A=
|
|
13.74 A=
|
|
13.75 A=
|
13.76 A=
|
|
13.77 A=
|
|
13.78 A=
|
13.79 A=
|
|
13.80 A=
|
|
13.81 A=
|
13.82 A=
|
|
13.83 A=
|
|
13.84 A=
|
13.85 A=
|
|
13.86 A=
|
|
13.87 A=
|
13.88 A=
|
|
13.89 A=
|
|
13.90 A=
|
13.91 A=
|
|
13.92 A=
|
|
13.93 A=
|
13.94 A= |
|
13.95 A= |
|
13.96 A= |
13.97 A=
|
|
13.98 A=
|
|
13.99 A=
|
13.100 A=.
|
|
13.101 A=.
|
|
13.102 A=
|