- •Введение Решения в условиях определенности, риска и неопределенности
- •Тема 1. Матричные игры Лекция 1. Матричные игры
- •Лекция 2. Матричные игры (продолжение) Дублирование и доминирование стратегий
- •Решение игры
- •Решение игры
- •Решение игры
- •Лекция 3. Матричные игры (продолжение)
- •Приближенный метод решения матричных игр
- •Лекция 4. Принятие решений в условиях неопределенности
- •Критерий Лапласа:
- •Лекция 6. Биматричные игры
- •Непрерывные игры
- •Позиционные игры
- •Контрольные вопросы и задания
Лекция 2. Матричные игры (продолжение) Дублирование и доминирование стратегий
Если матрица игры содержит несколько одинаковых строк (столбцов), то из них оставляют только одну строку (один столбец), а остальные строки (столбцы) отбрасываются. Отброшенным стратегиям приписываются нулевые вероятности. Это – дублирование стратегий.
Если
i-я
строка поэлементно не меньше (
)
j-й
строки, то говорят, что i-я
строка доминирует на j-й
строкой. Поэтому игрок
не использует j-ю
стратегию, так как его выигрыш при i-й
стратегии не меньше, чем при j-й
стратегии. Вне зависимости от того, как
играет игрок
.
Аналогично,
если i-й
столбец поэлементно не меньше
j-го
столбца, то говорят, что j-й
столбец доминирует над i-м
столбцом. Поэтому игрок
не использует i-ю
стратегию. Так как его проигрыш (равный
выигрышу игрока
)
при j-й
стратегии не больше (
),
чем при i-й
стратегии, вне зависимости от того, как
играет игрок
.
Это – доминирование
стратегий.
Если
игра
имеет седловую точку, то после упрощения
получится игра 1
1.
Пример 1.3. Следует упростить матрицу игры:
.
Первая
и четвертая строки равны, поэтому
отбросим четвертую строку, а вероятность
будет
.
Получим
матрицу
.
Вторая
строка доминирует на третьей строкой
(
).
Поэтому отбросим третью строку, а
вероятность будет
.
Получим
матрицу
.
Второй
столбец доминирует на третьим (
.
Поэтому отбросим третий столбец, а
вероятность будет
.
Получим
матрицу
.
Строки
между собой несравнимы (
),
столбцы тоже (
).
Дальнейшее упрощение невозможно. Игра
сведена от
к игре
.
Решение игры
Пример
1.4.
Найдем решение матричной игры
Припишем
строкам вероятности
и
соответственно.
.
Умножив
столбец
поэлементно на первый столбец и сложив
произведения, получим линейную зависимость
.
Это средний выигрыш игрока
при применении игроком
своей первой стратегии.
Умножив
столбец
поэлементно на второй столбец и сложив
произведения, получим линейную зависимость
.
Это средний выигрыш игрока
при применении игроком
своей второй стратегии.
Приравняем
полученные зависимости:
.
Получим
,
,
т.е. оптимальная смешанная стратегия
игрока
.
Подставив
в любую из зависимостей, получим цену
игры
.
Припишем
столбцам вероятности
и
соответственно.
.
Умножив
строку (
,
)
на первую строку и сложив произведения,
получим линейную зависимость
.
Это средний выигрыш игрока
(проигрыш игрока
)
при применении игроком
своей первой стратегии.
Умножив
строку (
,
)
на вторую строку и сложив произведения,
получим линейную зависимость
.
Это средний выигрыш игрока
(проигрыш игрока
)
при применении игроком
своей второй стратегии.
Приравняем
полученные зависимости:
.
Имеем
,
,
т.е. оптимальная смешанная стратегия
игрока
.
Таким
образом, каждую стратегию необходимо
применять с частотой
.
Пример 1.5. Найти решение игры из примера 1.2 в смешанных стратегиях.
Решение. Платежная матрица, построенная ранее:
Пусть
первый игрок выбирает свою первую
стратегию с вероятностью
,
а вторую – с вероятностью
,
т.е. первый игрок играет со смешанной
стратегией
.
Обозначим
ожидаемый выигрыш, т.е. математическое
ожидание выигрыша, первого игрока, если
второй игрок при этом выберет свою j-ю
стратегию. В рассматриваемом примере
,
.
Построим графики этих функций,
представленные на рисунке 1.1.
а) гарантированный выигрыш первого игрока в зависимости от его смешанной стратегии
б) верхняя граница проигрыша второго игрока в зависимости от его смешанной стратегии
Рис. 1.1. – Гарантированный выигрыш первого игрока и верхняя граница проигрыша второго игрока в игре «Угадывание монеты» в зависимости от их смешанных стратегий»
Второй
игрок так выбирает свои стратегии, чтобы
обеспечить первому минимальный выигрыш:
.
Эта функция отмечена на рисунке 1.1. а)
жирной линией.
Второй игрок в любом случае заставит первого выиграть как можно меньше, т. е. в рассматриваемой игре:
-
при
где
соответствует максимуму функции
,
второй
игрок будет выбирать свою вторую
стратегию, и первый игрок будет выигрывать
-
при
второй игрок будет выбирать первую
стратегию, и первый игрок будет выигрывать
.
Наилучший
для первого игрока выбор соответствует
,
т. е.
,
при этом цена игры равна
.
В
рассматриваемом примере
,
определяемая из условия
или
.
Таким
образом, оптимальной смешанной стратегией
первого игрока является стратегия
,
при этом цена игры равна
.
Вне зависимости от того, какую стратегию
выберет второй игрок, первый игрок будет
выигрывать в среднем за большое число
партий по
руб.
за одну партию.
Найдем оптимальную смешанную стратегию второго игрока.
Пусть
второй игрок выбирает первую стратегию
с вероятностью
,
а вторую – с вероятностью
,
т. е. вектор смешанной стратегии второго
игрока имеет вид
.
Тогда проигрыш второго игрока, представленный на рисунке 1.1 б), равен:
,
если первый игрок выбирает свою первую
стратегию,
,
если первый игрок выбирает свою вторую
стратегию.
Наилучшее
с точки зрения второго игрока значение
определяется из условия
.
Как
видно из рис. 1.1, б, в данном случае
,
откуда
.
Поэтому
оптимальная смешанная стратегия второго
игрока равна
.
