Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теория игр.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
676.86 Кб
Скачать

3.Решение матричных игр в смешанных стратегиях

Наряду с чистыми стратегиями игроков рассматривают также смешанные стратегии.

Здесь мы впервые столкнемся с одним из важных понятий теории игр — с понятием смешанной стратегии, т. е. чередования нескольких «чистых» стратегий по случайному закону в определенных пропорциях, или, как говорят, с определенными частотами.

В случае α < β седловой точки не существует. В этом случае для, каждого игрока мы должны указать вектор частот, с которыми следует применять ту или иную стратегию. Для игрока А это Р = (р1,…рm), где р1, + ... + рт= 1, рi≥0 — частота (вероятность) применения стратегии Аi .Для игрока В это Q= (q1 ..., qn), где q1 + ... + qn = 1, qj≥0- частота (вероятность) применения стратегии Вj.. Это смешанные стратегии.

Средний выигрыш игрока А равен:

Если частота(вероятность) применения стратегии отлична от нуля, то такая стратегия называется активной.

Стратегии Р0 и Q0 называются оптимальными смешанными стратегиями, если НА(Р, Q0) ≤НA0 Q0) ≤ HA(P0 Q). В этом случае HA(P0, Q0) называется ценой игры и обозначается через γ (α < γ < β).

Первое из неравенств означает, что отклонение игрока А от своей оптимальной смешанной стратегии при условии, что игрок В придерживается своей оптимальной смешанной стратегии, приводит к уменьшению среднего выигрыша игрока А. Второе из неравенств означает, что отклонение игрока В от своей оптимальной смешанной стратегии при условии, что игрок A придерживается своей оптимальной смешанной стратегии, приводит к увеличению среднего выигрыша игрока А.

Теорема фон Неймана: Каждая конечная матричная игра имеет, по крайней мере, одно оптимальное решение, возможно, среди смешанных стратегий.

Рассмотрим игру с платежной матрицей

Пусть игрок A применяет набор своих оптимальных стратегий . По основной теореме теории игр это обеспечивает ему выигрыш при любых стратегиях игрока В, т.е. выполняются соотношения:

(1)

Дополняя их уравнением

(2)

получим систему линейных уравнений относительно и . Решая ее найдем

, , , (3)

где .

Повторяя те же рассуждения для игрока В, получим систему линейных уравнений

(4)

Ее решениями будут

, , , (5)

Пример. Молокозавод поставляет в магазин молочную продукцию ( ) и кисломолочную продукцию ( ). Согласно договора между ними продукция поступает в магазин два раза в день: с 10.00 до 11.00 (1-ый срок) и с 17.00 до 18.00 (2-ой срок). Если молокозавод соблюдает сроки поставок, то магазин выплачивает премии по следующей схеме: при поставке продукции в первый срок выплачивает 5 тыс. р., во второй срок – 3 тыс. р.; при поставке продукции в первый срок выплачивает 2 тыс. р., во второй срок – 3 тыс. р.

Определить оптимальные стратегии поставок и получения продукции.

Решение. Примем молокозавод за игрока А, а магазин – за игрока В. Составим платежную матрицу игры:

Сроки

Продукция

1-ый срок

2-ой срок

5

1

2

3

или

Найдем

,

, Седловой точки нет. Применим формулы (3) – (5) для определения оптимальных стратегий и цены игры:

, , , ,

, ,

Оптимальные стратегии: , , цена игры .

Таким образом, молокозавод поставляет молочную продукцию с вероятностью , а кисломолочную продукцию – с вероятностью , а магазин получает продукцию в 1-ый срок с вероятностью , а во 2-ой срок – с вероятностью и выплачивает 2,6 тыс. руб. премии молокозаводу ежедневно.

Матричная игра допускает простую геометрическую интерпретацию.