- •§ 1. Понятие игры. Классификация игр
- •§ 2. Антагонистические игры в нормальной форме
- •Определение антагонистической игры в нормальной форме. Матричные игры
- •Примеры
- •. Ситуация равновесия в чистых стратегиях:
- •Упражнения к § 2.1. – 2.2.
- •Смешанное расширение игры
- •Методы решения матричных игр
- •Сведение игры к системе неравенств
- •Графический (графоаналитический) метод решения игры
- •3. Сведение игры к задаче линейного программирования
- •Существование оптимальных стратегий. Теорема фон Неймана-Нэша
- •Упражнения к § 2.3–2.5.
- •2.6. Доминирование стратегий
- •Примеры
- •Упражнения к § 2.6.
- •2.7. Бесконечные антагонистические игры
- •Упражнения к § 2.7.
- •2.8. Игры в условиях неопределенности и риска (игры с природой)
- •Принятие решений в условиях полной неопределенности
- •Принятие решений в условиях риска
- •Примеры
- •Упражнения к § 2.8.
- •§ 3. Неантагонистические бескоалиционные игры n лиц в нормальной форме
- •3.1. Определение неантагонистической бескоалиционной игры в нормальной форме. Биматричные игры
- •3.2. Принципы оптимальности в бескоалиционных играх
- •Равновесие в доминирующих стратегиях
- •Равновесие по Нэшу
- •Сильное равновесие по Нэшу
- •Равновесие по Парето
- •Равновесие по Штакельбергу
- •Смешанное расширение бескоалиционной игры
- •Упражнения к § 3.
Примеры
Пример 1. Рассмотрим следующую игру. Игроки выбирают одновременно одно из трех чисел: «один», «два», «три». Выигрыш Р1 (проигрыш Р2) положителен и равен названному числу, если он правильно угадал выбор второго игрока и 0 в противном случае.
В данной задаче , а матрица игры имеет следующий вид:
.
Пример 2. Оборона города (игра полковника Блотто).
Полковник Блотто (игрок Р1) имеет 4 полка, а его противник (Р2) – 3 полка. Противник защищает 2 позиции. Позиция будет занята полковником Блотто, если на ней наступающие полки окажутся в численном превосходстве.
При этом, если у полковника Блотто на позиции полков больше, чем у противника, то его выигрыш на этой позиции равен числу полков противника плюс один (за захват позиции). Если у Р2 полков больше, то Р1 теряет все свои полки и 1 за позицию.
Если число полков Р1 и Р2 на позиции одинаково, то имеет место ничья и никто ничего не получает.
Считая, что суммарный выигрыш Р1 равен сумме его выигрышей по двум позициям и игра является антагонистической, сформировать матрицу игры.
Решение
Стратегией первого игрока является пара , , где – число полков, отправленных Блотто на позицию 1, – на позицию 2. Тогда . Аналогично для второго игрока . Матрица игры имеет следующий вид:
.
Рассмотрим формирование элементов матрицы на примере – величины выигрыша Р1 при условии, что он предпринял стратегию (4,0), а второй игрок стратегию (1,2). На первой позиции полки полковника Блотто оказываются в численном превосходстве (4>1), поэтому он выигрывает число полков противника (1) плюс 1 за захват позиции (всего выигрыш по позиции равен 2). На второй позиции наоборот, полки Р2 оказываются в превосходстве (0<2) и тогда Блотто теряет все свои полки на этой позиции (0) и 1 за поражение на позиции (всего выигрыш по позиции равен -1). Суммарный выигрыш Блотто по двум позициям: . Аналогично формируются остальные элементы матрицы.
. Ситуация равновесия в чистых стратегиях:
понятие и существование
Рассмотрим антагонистическую игру . Каждый из игроков выбором стратегии стремится максимизировать свой выигрыш, который для Р1 определяется величиной , а для второго величиной . Выигрыши игроков определены на ситуациях и поэтому в своем поведении каждый игрок должен учитывать поведение противника.
В теории игр предполагается, что оба игрока ведут себя рационально, то есть стремятся получить максимально возможную величину гарантированного выигрыша. Пусть игрок 1 выбрал стратегию x. Тогда в худшем случае он может получить величину . Р1 может себе гарантировать получение, по крайней мере, величины выигрыша , которая называется нижней ценой игры или максимином. С другой стороны, игрок 2 может себе гарантировать величину проигрыша не меньшую, чем , называемую верхней ценой игры или минимаксом.
Замечание 1. Для матричной игры , .
Лемма 1. Для любой антагонистической игры справедливо: .
Рассмотрим вопрос оптимального поведения игроков. Ситуация называется равновесной в игре , если Р1 невыгодно отклоняться от стратегии и второму игроку от стратегии при условии, что противник придерживается равновесной стратегии.
Определение 3. В антагонистической игре ситуация называется ситуацией равновесия или седловой точкой, если выполнены следующие неравенства:
, для всех стратегий , .
Так как , то при условии, что второй игрок выбрал стратегию , игроку P1 невыгодно выбирать любую стратегию , так как при этом его выигрыш разве лишь не увеличится. Аналогично, используя правую часть неравенства (1), приходим к выводу, что отклонение от невыгодноP2.
Замечание 2. В матричной игре ситуация называется ситуацией равновесия или седловой точкой матрицы А, если: , , . Другими словами, элемент является одновременно минимумом в строке и максимумом в столбце .
Свойства ситуаций равновесия
Пусть , – ситуации равновесия в антагонистической игре . Тогда:
1) ;
2) , – ситуации равновесия.
Необходимые и достаточные условия существования ситуации равновесия в чистых стратегиях доказываются следующей теоремой.
Теорема 1. Для того, чтобы в игре существовала ситуация равновесия, необходимо и достаточно, чтобы существовали верхняя и нижняя цены игры:
,
,
и выполнялось равенство: .
Доказательство
Необходимость.
Пусть – ситуация равновесия. Докажем, что . Согласно Леммы 1, , и поэтому достаточно показать выполнение неравенства .
По определению ситуации равновесия:
, , .
Тогда , а следовательно, .
Так как , то
. (*)
Аналогично:
. (**)
Из (*), (**) следует: , что и требовалось доказать.
Достаточность.
Пусть существуют , и выполнено равенство . Конструктивно докажем существование ситуации равновесия в этом случае.
Пусть и ;
и .
Докажем, что – ситуация равновесия.
;
.
Тогда, так как правые части неравенств равны по условию, то , и , , , что и требовалось доказать.
В случае, если верхняя цена игры и нижняя совпадают, величину называют ценой игры.
Для антагонистической игры справедлива следующая лемма о масштабе.
Лемма 2. ( Лемма о масштабе)
Пусть и – две антагонистические игры, причем , где , – некоторые константы. Тогда множества оптимальных стратегий и совпадают и .
Примеры
Пример 1. Найти верхнюю и нижнюю цены игры и ситуацию равновесия, при условии, что она существует, если матрица имеет вид:
.
Решение
Найдем нижнюю цену игры.
Если Р1 выберет первую стратегию, то он получит гарантированно .
Если Р1 выберет стратегию 2, то он получит гарантированно .
Если Р1 выберет стратегию 3, то он получит гарантированно .
Тогда выбором своей стратегии Р1 может получить, по крайней мере не меньше .
Найдем верхнюю цену игры.
Если Р2 выберет первую стратегию, то он проиграет гарантированно не больше .
Если Р2 выберет стратегию 2, то он проиграет гарантированно не больше .
Если Р2 выберет стратегию 3, то он проиграет гарантированно не больше .
Тогда выбором своей стратегии Р2 может проиграть, по крайней мере, не меньше . Так как =1, то равновесием является пара и v=1.
Пример 2. Пусть дана матрица выигрышей игрока P1 . Найти ситуации равновесия.
Решение
В данной игре , , и поэтому игра не имеет ситуации равновесия. Если игрок P1 выбирает свою чистую максиминную стратегию , то игрок P2, выбрав свою минимаксную стратегию , проигрывает только 20 единиц. В этом случае P1 выгодно выбрать стратегию , то есть отклониться от своей максиминной стратегии и выиграть 30. Тогда P2 будет выгодно отклониться от своей чистой минимаксной стратегии и проиграть 10. В свою очередь, игрок P1 должен выбрать свою 2-ю стратегию, чтобы выиграть 40, а P2 ответит выбором 2-ой стратегии и т. д.