
- •Математика
- •Методические указания по самостоятельной работе студентов
- •I. Введение
- •II. Игры с нулевой суммой
- •Тема 1. Выбор стратегии
- •Тема 2. Решение игр в смешанных стратегиях
- •Тема 2.1. Игры размера 2 × 2 и их аналитическое решение
- •Тема 2.2. Игры размера 2 × n и m × 2 и их графоаналитическое решение
- •Тема 2.3. Игры размера m × n
- •III. Игры с ненулевой суммой
- •Тема 3. Понятие точек равновесия
- •Точка равновесия по Нэшу
- •IV. Игры с природой
- •Тема 4. Игры с природой
- •Стохастическая задача Критерий Байеса (Лапласа).
- •Нестохастическая задача
- •Тема 2.1. Игры размера 2 × 2 и их аналитическое решение
- •Тема 2.2. Игры размера 2 × n и m × 2 и их графоаналитическое решение
- •Тема 2.3. Игры размера m × n
- •Тема 3. Понятие точек равновесия
- •Тема 4. Игры с природой
- •Примерные варианты контрольных работ
- •Задания для самостоятельной работы (с ответами)
Тема 2. Решение игр в смешанных стратегиях
Смешанной
стратегией
игрока
называется применение чистых стратегий
с вероятностями
причем
Смешанные
стратегии игрока записываются
в виде матрицы
или
.
Аналогично
смешанные стратегии игрока обозначаются
или
Чистые стратегии можно считать частным случаем смешанных стратегий. Их можно задавать строкой, в которой 1 соответствует активной чистой стратегии, остальные элементы строки равны 0.
На
основании принципа минимакса определяется
оптимальное
решение (или
решение)
игры: это пара оптимальных стратегий
и
обладающих следующим свойством: если
один из игроков придерживается своей
оптимальной стратегии, то другому не
выгодно отступать от своей.
Выигрыш, соответствующий оптимальному решению, называется ценой игры v.
,
где
– нижняя и верхняя цены игры.
Теорема Неймана (основная теорема теории игр).
Каждая конечная игра имеет по крайней мере одно оптимальное решение, возможно, среди смешанных стратегий.
Если чистая стратегия входит в оптимальную смешанную стратегию с отличной от нуля вероятностью, то она называется активной.
Теорема. Если один из игроков придерживается своей оптимальной смешанной стратегии, то выигрыш остается неизменным и равным цене игры v, если второй игрок не выходит за пределы своих активных стратегий (теорема позволяет строить модели нахождения оптимальных стратегий при отсутствии седловой точки).
Тема 2.1. Игры размера 2 × 2 и их аналитическое решение
Простейший случай конечной игры.
Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке.
Если седловой точки нет, воспользуемся теоремой об активных стратегиях.
Если
игрок I
придерживается
своей оптимальной стратегии ,
то его средний выигрыш будет равен цене
игры v,
какой бы активной стратегией ни
пользовался игрок II.
Для игры 2 × 2 любая чистая стратегия
противника является активной, если
отсутствует седловая точка. Поэтому
средний выигрыш игрока I(оптимальная
стратегия) будет равен v
и для 1-й, и для 2-й стратегии противника.
Выигрыш игрока I (проигрыш игрока II) – случайная величина, математическое ожидание которой является ценой игры.
Пусть
игра задана платежной матрицей .
Средний
выигрыш игрока I,
если он использует оптимальную смешанную
стратегию
а игрок II
– чистую
стратегию
,
равен цене игры v.
Если
игрок II
использует
чистую стратегию ,
то для игрока I
получаем
В итоге имеем систему уравнений
Решая эту систему, получим оптимальную стратегию
и цену игры
Аналогично находится оптимальная стратегия II игрока:
Пример 3. Найти оптимальные стратегии игры «Орлянка».
Игра
задана платежной матрицей
,
седловой точки нет.
Ищем решение в смешанных стратегиях.
Решая эти системы, получаем
Это означает, что оптимальная стратегия каждого игрока состоит в том, чтобы выбирать «Орел» или «Решка» с вероятностью 0,5, при этом средний выигрыш будет равен 0.
Тема 2.2. Игры размера 2 × n и m × 2 и их графоаналитическое решение
Рассмотрим
игру заданную матрицей выигрышей размера
У
игрока I
есть две стратегии
Для графического решения используем ортогональную декартову систему координат X0Y.
По
оси абсцисс от точки 0 отложим единичный
отрезок ,
точка
(
)
соответствует стратегии
(1-ой стратегии игрока I),
точка
(
)
соответствует стратегии
(2-ой стратегии игрока I).
Все
промежуточные точки отрезка –
смешанные стратегии
игрока I.
Отрезок
это вероятность
стратегии
,
отрезок
это вероятность
стратегии
.
Когда
смешанная стратегия
совпадает с чистой стратегией
вероятность
,
и наоборот,
когда
смешанная стратегия
совпадает с чистой стратегией
вероятность
.
На
оси ординат 0Y
откладываем выигрыши игрока I
при стратегии и
различных стратегиях игрока II,
отмечая их точками
На
прямой, проходящей через точку
параллельно оси 0Y,
откладываем выигрыши игрока I
при стратегии
и
различных стратегиях игрока II,
отмечая их точками
Строим
прямые ‘
для
.
Ординаты
точек лежащих на прямой ‘
равны среднему выигрышу игрока I,
когда игрок II
использует i-ую
стратегию, и могут быть вычислены по
формуле математического ожидания
для соответствующих смешанных стратегий.
В
соответствии с принципом минимакса
оптимальная стратегия ‘
такова, что минимальный выигрыш игрока
I
(при наихудшем поведении игрока II)
обращается в максимум.
Выделяем нижнюю огибающую графика (ломанную) и определяем на ней точку с максимальной ординатой (ценой игры).
Ей соответствует оптимальная смешанная стратегия игрока I.
Т.к. графическое решение дает не точные результаты определяем прямые на пересечении которых лежит эта точка и решаем систему уравнений.
Определяем цену игры и оптимальные стратегии.
Аналогично
решается игра заданная матрицей выигрышей
.
Только в этом случае выделяют верхнюю огибающую графика и на ней ищут точку с минимальной ординатой.
Пример
4.
Решить задачу заданную матрицей платежей
Решение.
Проверяем матрицу на наличие седловых точек:
,
седловой
точки нет,
.
Р
Прямые
(1), (2) и (3) соответствуют Строим
нижнюю огибающую. Точка
максимума лежит на пересечении (1) и (2)
прямой. Следовательно,
активными будут только две стратегии
стратегиям
игрока II.
игрока II.
Получили
игру
с матрицей
,
которая решается аналитически.
,
Для игрока II получим
Следовательно,
,
Ответ:
‘