
3.Решение матричных игр в смешанных стратегиях
Наряду с чистыми стратегиями игроков рассматривают также смешанные стратегии.
Здесь мы впервые столкнемся с одним из важных понятий теории игр — с понятием смешанной стратегии, т. е. чередования нескольких «чистых» стратегий по случайному закону в определенных пропорциях, или, как говорят, с определенными частотами.
В случае α < β седловой точки не существует. В этом случае для, каждого игрока мы должны указать вектор частот, с которыми следует применять ту или иную стратегию. Для игрока А это Р = (р1,…рm), где р1, + ... + рт= 1, рi≥0 — частота (вероятность) применения стратегии Аi .Для игрока В это Q= (q1 ..., qn), где q1 + ... + qn = 1, qj≥0- частота (вероятность) применения стратегии Вj.. Это смешанные стратегии.
Средний
выигрыш игрока А равен:
Если частота(вероятность) применения стратегии отлична от нуля, то такая стратегия называется активной.
Стратегии Р0 и Q0 называются оптимальными смешанными стратегиями, если НА(Р, Q0) ≤НA(Р0 Q0) ≤ HA(P0 Q). В этом случае HA(P0, Q0) называется ценой игры и обозначается через γ (α < γ < β).
Первое из неравенств означает, что отклонение игрока А от своей оптимальной смешанной стратегии при условии, что игрок В придерживается своей оптимальной смешанной стратегии, приводит к уменьшению среднего выигрыша игрока А. Второе из неравенств означает, что отклонение игрока В от своей оптимальной смешанной стратегии при условии, что игрок A придерживается своей оптимальной смешанной стратегии, приводит к увеличению среднего выигрыша игрока А.
Теорема фон Неймана: Каждая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.
Рассмотрим игру с платежной матрицей
Пусть
игрок A
применяет набор своих оптимальных
стратегий
.
По основной теореме теории игр это
обеспечивает ему выигрыш
при любых стратегиях игрока В,
т.е. выполняются соотношения:
(1)
Дополняя их уравнением
(2)
получим
систему линейных уравнений относительно
и
.
Решая ее найдем
,
,
, (3)
где
.
Повторяя те же рассуждения для игрока В, получим систему линейных уравнений
(4)
Ее решениями будут
,
,
, (5)
Пример.
Молокозавод
поставляет в магазин молочную продукцию
(
)
и кисломолочную продукцию (
).
Согласно договора между ними продукция
поступает в магазин два раза в день: с
10.00 до 11.00 (1-ый срок) и с 17.00 до 18.00 (2-ой
срок). Если молокозавод соблюдает сроки
поставок, то магазин выплачивает премии
по следующей схеме: при поставке продукции
в первый срок выплачивает 5 тыс. р., во
второй срок – 3 тыс. р.; при поставке
продукции
в первый срок выплачивает 2 тыс. р., во
второй срок – 3 тыс. р.
Определить оптимальные стратегии поставок и получения продукции.
Решение. Примем молокозавод за игрока А, а магазин – за игрока В. Составим платежную матрицу игры:
Сроки Продукция |
1-ый срок |
2-ой срок |
|
5 |
1 |
|
2 |
3 |
или
Найдем
,
,
Седловой точки нет. Применим формулы
(3) – (5) для определения оптимальных
стратегий и цены игры:
,
,
,
,
,
,
Оптимальные
стратегии:
,
,
цена игры
.
Таким
образом, молокозавод поставляет молочную
продукцию с вероятностью
,
а кисломолочную продукцию – с вероятностью
,
а магазин получает продукцию в 1-ый срок
с вероятностью
,
а во 2-ой срок – с вероятностью
и выплачивает 2,6 тыс. руб. премии
молокозаводу ежедневно.
Матричная
игра
допускает простую геометрическую
интерпретацию.