
16.4 Принятие решений с использованием методов теории игр
В теории игр рассматриваются ситуации, связанные с принятием решений, в которых два разумных противника имеют конфликтующие цели. Этим игровые ситуации отличаются от ситуаций, рассмотренных ранее, в которых природа не имела целей, конфликтующих с лицом, принимающим решения.
В игре участвуют два противника, именуемых игроками, каждый из которых имеет некоторое множество (конечное или бесконечное) возможных вариантов действия (стратегий). С каждой парой стратегий связан платёж, который один из игроков выплачивает другому. Такие игры известны как игры двух лиц с нулевой суммой, так как выигрыш одного игрока равен проигрышу другого. В такой игре достаточно задать результаты в виде платежей для одного из игроков. Обозначим A и B игроков с числом стратегий m и n соответственно. Игру обычно представляют в виде матрицы платежей игроку A:
-
B1
B2
…
Bn
A1
a11
a12
…
a1n
A2
a21
a22
…
a2n
…
…
…
…
…
Am
am1
am2
…
amn
Такое представление матричной игры означает, что если игрок A применяет стратегию i, а игрок B – стратегию j, то выигрыш игрока A (проигрыш игрока B) составит aij.
В силу того, что игры построены на конфликте целей, в качестве оптимального решения принимается такой набор стратегий, отклонение от которого не улучшает плату тому или иному игроку. Этот набор может включать как одну, так и несколько различных стратегий. В первом случае имеем решение в чистых стратегиях, во втором – в смешанных.
Рассмотрим решение игры в чистых стратегиях. Пусть две компании, A и B, продают два вида одного и того же продукта. Компания A рекламирует свою продукцию на радио (A1), телевидении (A2) и в газетах (A3). Компания B, в дополнение к использованию радио (B1), телевидения (B2) и газет (B3), использует почтовые рассылки (B4). В зависимости от качества проведения рекламной кампании, A или B могут привлечь на свою сторону часть клиентов конкурентов. В матрице платежей в этом случае указывается процент клиентов, привлечённых или потерянных компанией A.
|
B1 |
B2 |
B3 |
B4 |
Мин. строк |
A1 |
8 |
-2 |
9 |
-3 |
-3 |
A2 |
6 |
5 |
6 |
8 |
5 |
A3 |
-2 |
4 |
-9 |
5 |
-9 |
Макс. столбцов |
8 |
5 |
9 |
8 |
|
Решение игры основано на достижении наилучшего результата из наихудших для каждого игрока. Если компания A выбирает стратегию A2, то независимо от действий компании B наихудшим результатом для неё будет увеличение рынка на 5% за счёт клиентов компании B. Если же компания A выбирает стратегию A1 или A3, то наихудшим результатом будет потеря 3% или 9% соответственно. Поэтому оптимальным выбором компании A будет стратегия A2.
Оптимальную стратегию компании B можно определить аналогично. При выборе стратегии B1 максимальная величина потерь составит 8%, B2 – 5%, B3 – 8%, B4 – 8% клиентов. Компания B должна выбрать стратегию, приводяющую к наименьшим потерям, и эта стратегия – B2.
Оптимальным решением в игре является набор стратегий A2 и B2, то есть обеим компаниям следует проводить рекламу на телевидении. При этом выигрыш будет в пользу компании A, её рынок увеличится на 5%. В этом случае говорят, что цена игры равна 5%, а компании A и B используют стратегии, соответствующие седловой точке. Решение, соответствующее седловой точке, гарантирует, что ни одной компании нет смысла пытаться выбрать другую стратегию.
Решение матричных игр в смешанных стратегиях может быть найдено либо графически, либо с использованием методов линейного программирования. При этом графический метод применяется для решения небольших задач, в то время как методы линейного программирования позволяют решить любую игру двух лиц с нулевой суммой. Оптимальные значения вероятности выбора той или иной стратегии игроком A xi могут быть определены путём решения следующей максиминной задачи:
|
|
Чтобы сформулировать эту задачу в виде задачи линейного программирования положим
|
|
Отсюда
|
|
Следовательно, задача игрока A может быть записана в виде
|
(16.9) |
Цена игры v может быть как положительной, так и отрицательной.
Для определения оптимальных вероятностей для игрока B необходимо решить следующую задачу линейного программирования:
|
(16.10) |
Две полученные задача оптимизируют одну и ту же (не ограниченную в знаке) переменную v.