
- •Часть I матричные игры 59
- •Часть II позиционные игры 86
- •Часть I матричные игры
- •1. Равновесная ситуация
- •2. Смешанные стратегии
- •Основные определения
- •Основная теорема матричных игр
- •Основные свойства оптимальных смешанных стратегий
- •3. Методы решения матричных игр
- •2 X n игры
- •Итерационный метод решения матричных игр
- •Сведение матричной игры к задаче линейного программирования
- •4. Примеры задач, сводимых к матричным играм
- •Несколько слов в заключение
- •6. О классификации игр
- •Часть II позиционные игры
- •1. Структура позиционной игры
- •2. Нормализация позиционной игры
- •3. Позиционные игры с полной информацией
- •Несколько слов в заключение
- •3.6 Принятие решений и теория игр. Примеры.
- •3.6.1. Оптимальное решение игры двух лиц с нулевой суммой
- •Упражнения 3.6,а
- •3.6.2. Решение матричных игр в смешанных стратегиях
- •Упражнения 3.6,b
- •Упражнений 3.6,с
- •3.7. Заключение
- •Литература
- •Комплексные задачи
2. Смешанные стратегии
В случае, когда нижняя цена игры α и верхняя цена игры β не совпадают,
,
игрок А может обеспечить себе выигрыш, не меньший α, а игрок В имеет возможность не дать ему больше, чем β. Возникает вопрос – а как разделить между игроками разность
Предыдущие построения на этот вопрос ответа не дают — тесны рамки возможных действий игроков. Поэтому довольно ясно, что механизм, обеспечивающий получение каждым из игроков как можно большей доли этой разности, следует искать в определенном расширении стратегических возможностей, имеющихся у игроков изначально.
Оказывается, что компромиссного
распределения разности
между игроками и уверенного получения
каждым игроком своей доли при многократном
повторении игры можно достичь путем
случайного применения ими своих
первоначальных, чистых стратегий.
При таких действиях
во-первых, обеспечивается наибольшая скрытность выбора стратегии (результат выбора не может стать известным противнику, поскольку он неизвестен самомуигроку),
во-вторых, при разумном построении механизма случайного выбора стратегий, последние оказываются оптимальными.
Случайная величина, значениями которой являются стратегии игрока, называется его смешанной стратегией.
Тем самым, задание смешанной стратегии игрока состоит в указании тех вероятностей, с которыми выбираются его первоначальные стратегии.
Основные определения
Рассмотрим произвольную m х n игру, заданную m х n-матрицей
Так как игрок А имеет m чистых стратегий, то его смешанная стратегия может, быть описана набором m неотрицательных чисел
сумма которых равна 1,
.
Смешанная стратегия второго игрока В, имеющего п чистых стратегий, описывается набором п неотрицательных чисел
сумма которых равна 1,
.
Замечание. Каждая чистая стратегия является частным случаем смешанной стратегии: в частности, чистая стратегия Ai является смешанной стратегией, описываемой набором чисел Рев котором p1, p2, … , pm, в котором
Подчеркнем, что для соблюдения секретности каждый из игроков применяет свои стратегии независимо от другого игрока.
Таким образом, задав два набора
мы оказываемся в ситуации в смешанных стратегиях. В этих условиях каждая обычная ситуация (в чистых стратегиях) {Аi, Bk} по определению является случайным событием и, ввиду независимости наборов Р и Q, реализуется с вероятностью piqk. В этой ситуации {Аi, Bk} игрок А получает выигрыш aik. Тем самым, математическое ожидание выигрыша игрока А в условиях ситуации в смешанных стратегиях (Р, Q) равно
.
Это число и принимается за средний выигрыш игрока А при смешанных стратегиях
Определение. Стратегии
и
называются оптимальными смешанными стратегиями игроков А и В соответственно, если выполнено следующее соотношение
.
Пояснение. Выписанные неравенства означают следующее:
левое неравенство – отклонение игрока А от оптимальной стратегии Р0 при условии, что игрок В придерживается стратегии Q0, приводит к тому, что выигрыш отклонившегося игрока А может только уменьшиться,
правое неравенство – отклонение игрока В от оптимальной стратегии Q0 при условии, что игрок А придерживается стратегии Р0, приводит к тому, что выигрыш игрока А может только возрасти, и значит, выигрыш игрока В – только уменьшиться.
Приведенное условие оптимальности равносильно тому, что1
Величина
,
определяемая последней формулой, называется ценой игры.
Набор (Р0, Q0, ν), состоящий из оптимальных смешанных стратегий игроков А и В и цены игры, называется решением матричной игры.
Пример 4. Рассмотрим 2 x 2 матричную игру из примера 1. Матрица этой игры имеет следующий вид
.
Как нетрудно убедиться, седловой точки у нее нет.
Смешанные стратегии игроков А и В могут быть описаны парами чисел
P = {p, 1 - p} и Q = {q, 1 - q}
соответственно.
Средний выигрыш игрока А вычисляется так
?
откуда легко следует, что
Последнее удобно записать так
.
Рис. 1
Полученная формула показывает, что если игрок А в половине случаев записывает на листе бумаге четное (нечетное) число (выбирает р = 1/2), то независимо от того, что делает игрок В, ожидаемый (средний) выигрыш игрока А в каждой партии будет нулевым.
Если же игрок А выберет р > 1/2 (так что разность р-1/2 будет положительной), то узнав об этом, игрок В может выбрать q < 1/2 (так что разность q - 1/2 будет отрицательной) и, тем самым, сделать средний выигрыш игрока А отрицательным, то есть заставит его проиграть. Если же игрок А выберет р < 1/2 (так что разность р -1/2 будет отрицательной) и игрок В узнает об этом, то он может выбрать q > 1/2 (так что разность q -1/2 будет положительной) и вновь сделать выигрыш игрока А отрицательным, то есть опять заставит его проиграть.
Исследуем теперь эту формулу с точки зрения игрока В.
Если игрок А выбирает р = 1/2, то ожидаемый (средний) выигрыш игрока B независимо от его действий будет нулевым в каждой партии. Но если игрок В выберет q > 1/2 (так что разность q - 1/2 будет положительной), то, узнав об этом, игрок А может выбрать р < 1/2 (так что разность р - 1/2 будет отрицательной), и тогда игрок В будет проигрывать в каждой партии. Если же игрок В выберет q < 1/2 (так что разность q -1/2 будет отрицательной) и игрок А узнает об этом, то он может выбрать р > 1/2 (так что разность р -1/2 будет положительной) и вновь заставит игрока В проиграть.
Тем самым наборы
,
является оптимальными, а исход игры ничейным:
ν = 0.
Замечание. На рисунке 1 показано, как устроена поверхность, описываемая функцией
Точка
является седловой точкой (точкой перевала) этой поверхности. Именно эта точка и дает решение рассматриваемой матричной игры.
Естественно возникают два ключевых вопроса:
1-й – какие матричные игры имеют решение в смешанных стратегиях?
2-й – как находить решение матричной игры, если оно существует?
Ответы на эти вопросы дают следующие две теоремы.