Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СППР лекции (окончательные).docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
455.49 Кб
Скачать

Лекция 2. Матричные игры (продолжение) Дублирование и доминирование стратегий

Если матрица игры содержит несколько одинаковых строк (столбцов), то из них оставляют только одну строку (один столбец), а остальные строки (столбцы) отбрасываются. Отброшенным стратегиям приписываются нулевые вероятности. Это – дублирование стратегий.

Если i-я строка поэлементно не меньше ( ) j-й строки, то говорят, что i-я строка доминирует на j-й строкой. Поэтому игрок не использует j-ю стратегию, так как его выигрыш при i-й стратегии не меньше, чем при j-й стратегии. Вне зависимости от того, как играет игрок .

Аналогично, если i-й столбец поэлементно не меньше j-го столбца, то говорят, что j-й столбец доминирует над i-м столбцом. Поэтому игрок не использует i-ю стратегию. Так как его проигрыш (равный выигрышу игрока ) при j-й стратегии не больше ( ), чем при i-й стратегии, вне зависимости от того, как играет игрок . Это – доминирование стратегий.

Если игра имеет седловую точку, то после упрощения получится игра 1 1.

Пример 1.3. Следует упростить матрицу игры:

.

Первая и четвертая строки равны, поэтому отбросим четвертую строку, а вероятность будет .

Получим матрицу .

Вторая строка доминирует на третьей строкой ( ). Поэтому отбросим третью строку, а вероятность будет .

Получим матрицу .

Второй столбец доминирует на третьим ( . Поэтому отбросим третий столбец, а вероятность будет .

Получим матрицу .

Строки между собой несравнимы ( ), столбцы тоже ( ). Дальнейшее упрощение невозможно. Игра сведена от к игре .

Решение игры

Пример 1.4. Найдем решение матричной игры

Припишем строкам вероятности и соответственно.

.

Умножив столбец поэлементно на первый столбец и сложив произведения, получим линейную зависимость . Это средний выигрыш игрока при применении игроком своей первой стратегии.

Умножив столбец поэлементно на второй столбец и сложив произведения, получим линейную зависимость . Это средний выигрыш игрока при применении игроком своей второй стратегии.

Приравняем полученные зависимости: . Получим ,

, т.е. оптимальная смешанная стратегия игрока . Подставив в любую из зависимостей, получим цену игры .

Припишем столбцам вероятности и соответственно.

.

Умножив строку ( , ) на первую строку и сложив произведения, получим линейную зависимость . Это средний выигрыш игрока (проигрыш игрока ) при применении игроком своей первой стратегии.

Умножив строку ( , ) на вторую строку и сложив произведения, получим линейную зависимость . Это средний выигрыш игрока (проигрыш игрока ) при применении игроком своей второй стратегии.

Приравняем полученные зависимости: . Имеем , , т.е. оптимальная смешанная стратегия игрока .

Таким образом, каждую стратегию необходимо применять с частотой .

Пример 1.5. Найти решение игры из примера 1.2 в смешанных стратегиях.

Решение. Платежная матрица, построенная ранее:

Пусть первый игрок выбирает свою первую стратегию с вероятностью , а вторую – с вероятностью , т.е. первый игрок играет со смешанной стратегией .

Обозначим ожидаемый выигрыш, т.е. математическое ожидание выигрыша, первого игрока, если второй игрок при этом выберет свою j-ю стратегию. В рассматриваемом примере , . Построим графики этих функций, представленные на рисунке 1.1.

а) гарантированный выигрыш первого игрока в зависимости от его смешанной стратегии

б) верхняя граница проигрыша второго игрока в зависимости от его смешанной стратегии

Рис. 1.1. – Гарантированный выигрыш первого игрока и верхняя граница проигрыша второго игрока в игре «Угадывание монеты» в зависимости от их смешанных стратегий»

Второй игрок так выбирает свои стратегии, чтобы обеспечить первому минимальный выигрыш: . Эта функция отмечена на рисунке 1.1. а) жирной линией.

Второй игрок в любом случае заставит первого выиграть как можно меньше, т. е. в рассматриваемой игре:

- при где соответствует максимуму функции , второй игрок будет выбирать свою вторую стратегию, и первый игрок будет выигрывать

- при второй игрок будет выбирать первую стратегию, и первый игрок будет выигрывать .

Наилучший для первого игрока выбор соответствует , т. е. , при этом цена игры равна .

В рассматриваемом примере , определяемая из условия или .

Таким образом, оптимальной смешанной стратегией первого игрока является стратегия , при этом цена игры равна . Вне зависимости от того, какую стратегию выберет второй игрок, первый игрок будет выигрывать в среднем за большое число партий по руб. за одну партию.

Найдем оптимальную смешанную стратегию второго игрока.

Пусть второй игрок выбирает первую стратегию с вероятностью , а вторую – с вероятностью , т. е. вектор смешанной стратегии второго игрока имеет вид .

Тогда проигрыш второго игрока, представленный на рисунке 1.1 б), равен:

, если первый игрок выбирает свою первую стратегию,

, если первый игрок выбирает свою вторую стратегию.

Наилучшее с точки зрения второго игрока значение определяется из условия .

Как видно из рис. 1.1, б, в данном случае , откуда .

Поэтому оптимальная смешанная стратегия второго игрока равна .