
- •Транспортная задача
- •1. Постановка задачи.
- •2. Построение начального допустимого базисного решения
- •3. Переход от одного базисного решения к другому с помощью цикла пересчета свободной клетки
- •4. Решение транспортной задачи методом потенциалов
- •5. Решение несбалансированной транспортной задачи
- •6. Вопросы и упражнения
- •§9. Элементы теории игр
- •1. Основные понятия теории игр
- •2. Нижняя и верхняя цена игры. Принцип минимакса
- •3. Смешанные стратегии. Теорема Неймана.
- •4. Аналитическое решение игры размера 2×2
- •5. Геометрическая интерпретация игры размера 2×2
- •6. Решение игры размера 2×n
- •7. Решение игры размера m×n с помощью линейного программирования
- •8. Приближенное решение игры методом итераций.
- •9. Вопросы и упражнения
3. Смешанные стратегии. Теорема Неймана.
Смешанной стратегией
первого игрока называется применение
его чистых стратегий
по
случайному закону с частотами
причем сумма частот (вероятностей) равна
1:
.
Смешанная стратегия первого игрока
записывается в виде матрицы:
Аналогично смешанную стратегию второго игрока будем обозначать
где сумма частот
его
стратегий
равна 1:
.
Средняя цена игры
V(,
)
со стратегиями игроков
и
равна:
(1)
V(,
)
=
Любая чистая стратегия является частным случаем смешанной стратегии, в которой все стратегии, кроме одной, применяются с нулевыми частотами, а данная – с частотой 1.
На основании
принципа минимакса определяется решение
игры: это пара оптимальных стратегий
,
в общем случае смешанных, обладающих
свойством: если один из игроков
придерживается своей оптимальной
стратегии, то другому не может быть
выгодно отступать от своей. Выигрыш,
соответствующий решению игры, называется
ценой игры и обозначаетсяV.
Так как чистые
стратегии являются частным случаем
смешанных, то цена игры удовлетворяет
неравенству:
.
В 1928 году американский математик Джон Нейман доказал теорему:
Теорема 2 (Неймана): Каждая конечная игра имеет по крайней мере одно решение, возможно, среди смешанных стратегий.
Для нахождения решения конечных игр без седловой точки требуется ввести еще одно понятие «активной» стратегии:
Активной стратегией называется стратегия игрока, входящая в его смешанную стратегию с отличной от нуля частотой.
Теорема 3 (об активных стратегиях): если один из игроков придерживается своей оптимальной стратегии, то выигрыш остается неизменным и равным цене игры V, если другой игрок не выходит за пределы своих активных стратегий.
Пример. Позднее
мы докажем, что оптимальной стратегией
Фионы в игре с пальцами является смешанная
стратегия с частотами
. Цена игрыV
= –
.
Так как игра без седловой точки, то
обе
стратегии
Эдварда – активные. По теореме 3 при
любых частотах стратегий Эдварда цена
игры не изменится, если Фиона придерживается
своей оптимальной стратегии. Пусть,
например, частоты стратегий Эдварда
таковы:
.Средняя цена игры
по формуле (1) равна:
V.
Теорема 3 имеет большое практическое значение, так как она в некоторых случаях позволяет найти решение игры без седловой точки.
4. Аналитическое решение игры размера 2×2
Рассмотрим игру размера 2×2 с платежной матрицей
Для игры размера 2×2, в которой отсутствует седловая точка, решением игры по теореме Неймана будет пара смешанных стратегий
и
,
,
.
Чтобы их найти,
воспользуемся теоремой 3. Если первый
игрок придерживается своей оптимальной
смешанной стратегии
,
то его средний выигрыш будет равен цене
игры V
при любой активной стратегии второго
игрока. Для данной игры размера 2×2
любая чистая стратегия игроков является
активной. Если первый игрок использует
оптимальную смешанную стратегию
,
а второй игрок применит первую активную
стратегию, то выигрыш первого игрока
равен цене игры:
Если первый игрок
использует оптимальную смешанную
стратегию
,
а второй игрок применит вторую активную
стратегию, то выигрыш первого игрока
снова будет равен цене игры:
Приравнивая левые
части уравнений и учитывая, что
=
,
получаем уравнение
относительно
:
,
откуда находим оптимальную стратегию
первого игрока:
,
=
и цену игры:
Так как цена игры уже найдена, то для определения оптимальной стратегии второго игрока достаточно одного уравнения, которое получаем, если второй игрок применяет оптимальную стратегию, а первый – свою первую активную стратегию:
,
откуда , учитывая,
что
,
получаем:
=
,
Найдем решение по этим формулам игры Эдварда и Феоны.
Платежная матрица
игры :
,
поэтому
,
=
;
;
=
,
=
;
Оптимальные стратегии игроков:
и
Игра для Эдварда
невыгодная: в среднем за каждую игру он
будет проигрывать
доллара.