
- •Рекомендовано к изданию редакционно-издательским советом кгту
- •ОГлавление
- •Предисловие
- •1. Элементы теории игр
- •1.1. Основные понятия
- •1.2. Матричные игры. Решение матричных игр в чистых стратегиях
- •По определению
- •1.3. Упрощение игр
- •1.4. Решение матричных игр в смешанных стратегиях
- •1.5. Решение задач в смешанных стратегиях. Игра 2×2
- •1.6. Критерии принятия решений в играх с «природой»
- •1.7. Упражнения
- •2. Элементы теории массового обслуживания
- •2.1. Структура и классификация систем массового обслуживания
- •2.2. Марковский случайный процесс в смо
- •2.3. Уравнения Колмогорова
- •2.4. Одноканальная система массового обслуживания с отказами
- •2.5. Одноканальная система массового обслуживания с неограниченной очередью
- •2.6. Упражнения
- •3. Ответы к упражнениям
- •Библиографический список
1.5. Решение задач в смешанных стратегиях. Игра 2×2
В приведенных формулах для α и β функции min и max вычисляются на бесконечных множествах смешанных стратегий, поэтому значения α и β нельзя найти путем перебора вариантов. Воспользуемся теоремой об активных стратегиях.
Стратегии игроков,
входящие в их оптимальные смешанные
стратегии, называются активными. В
оптимальной смешанной стратегии
активными являются стратегии А2
и А3.
Теорема 2. Применение оптимальной смешанной стратегии обеспечивает игроку максимальныq средний выигрыш (или минимальный средний проигрыш), равный цене игры v, независимо от того, какую стратегию применяет другой игрок, если только тот не выходит за пределы своих активных стратегий.
Найдем решение в
случае игры 2×2. У игроков А
и В
по две стратегии, игра не содержит
седловую точку. Найдем оптимальную
смешанную стратегию
.
Решение. Матрица игры имеет вид:
Ai Bj |
B1 |
B2 |
A1 |
a11 |
a12 |
A2 |
a21 |
a22 |
Поскольку игра не
имеет решения в чистых стратегиях, в
оптимальной стратегии
игрока В
числа
и
,
т.е. обе стратегии В1
и В2
активные. Тогда по теореме об активных
стратегиях, если игрок А
придерживается своей оптимальной
стратегии
,
то игрок В
может, не влияя на значение выигрыша,
применять какую-либо из своих чистых
активных стратегий В1
или В2.
Игрок А
получит средний выигрыш равный цене
игры. Имеем два уравнения:
(при стратегии
В1);
(при стратегии
В2).
Учитывая, что
,
будем иметь систему трех линейных
уравнений с тремя неизвестными. Решив
ее, найдем оптимальную смешанную
стратегию
игрока А и
цену игры v.
Рассуждая аналогично, для определения
оптимальной стратегии игрока В
получим систему уравнений:
Пример. Имеются две конкурирующие фирмы А и В, выпускающие однотипные изделия, соответственно видов I и II, которые могут быть окрашены в один из двух цветов: красный (кр.) или синий (син.). Изучение спроса покупателей показало, что если выпущены изделия I кр. и II кр., то 40% покупателей получают I кр. и 60% – II кр. Если выпущены I кр. и II син., то 90% покупателей приобретают I кр. Если изготовлены I син. и II кр. будет продано 70% I син. Если сделаны I син. и II син., то 20% покупателей получат I син.
Найти оптимальные стратегии и цену матричной игры.
Решение. Составим платежную матрицу игры (выигрыш аij фирмы А).
A B |
II кр. |
II син. |
αi |
I кр. |
-20 |
80 |
-20 |
I син. |
40 |
-60 |
-60 |
βj |
40 |
80 |
|
– игра не имеет
седловой точки.
Найдем оптимальное решение матричной игры в смешанных стратегиях.
Пусть фирма А придерживается своей оптимальной стратегии . По теореме об активных стратегиях, при применении фирмой В чистой стратегии В1 или В2 фирма А получит средний выигрыш, равный цене игры, т.е.
Решим систему трех уравнений с тремя неизвестными.
– цена игры.
, v
= 10.
Составим систему уравнений для определения оптимальной стратегии игрока В.
Решая систему,
найдем
.
При таких оптимальных стратегиях изделия фирмы А будут покупать 55%, фирмы В – 45% покупателей (55%+45%=100%).
Связь между теорией игр и линейным программированием (ЛП)
Решение любой конечной матричной игры может быть сведено к решению задачи линейного программирования.
Рассмотрим случай, когда в матрице игры (aij)m×n все aij > 0 (см. теорему 2). Ясно, что тогда и цена игры v > 0. Найдем оптимальную смешанную стратегию игрока В. Применяя ее, игрок В проиграет не более v при любой чистой стратегии игрока А, т.е.
.
Разделим обе части неравенства на v:
.
Обозначим
. (1)
Имеем
;
(2)
, (3)
yj
удовлетворяет условию
.
Игрок В стремится сделать свой гарантированный проигрыш v возможно меньше, а значит возможно больше величину
. (4)
Учитывая (2), (3), (4), приходим к следующей задаче: максимизировать линейную функцию
при линейных ограничениях
;
.
Это типичная задача
ЛП, записанная в симметричной форме.
Решив ее, например, симплекс-методом,
найдем оптимальный вектор
и
,
а затем, используя (4) и (1), определим цену
игры и компонент оптимальной смешанной
стратегии q*:
.
Рассуждая аналогично, приходим к задаче
,
,
,
решая которую,
найдем оптимальный вектор
и
,
а затем
,
т.е. оптимальную стратегию
игрока А. Эти две задачи образуют пару
двойственных задач ЛП.
Теория матричных игр по существу эквивалентна теории задач ЛП. Эта эквивалентность полезна ТИ, оптимальное решение которых можно находить методами ЛП. Эквивалентность полезна и для ЛП, ибо существуют приближенные числовые методы решения матричных игр, которые в случае большой размерности более эффективны, чем СМ и его модификация решения ЗЛП.