- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
4.5.Вычисление последовательных равновесий
(k= 1, 2, 3, 4) – альтруистические поступки.
- эгоистические поступки.
Как найти последовательное равновесие.
Очевидно, ;(т.к. 8<9).
Для любого информационного состояния опора последовательного равновесия – это множество движений, которые используются с положительной вероятностью в этом информационном состоянии, согласно набору стратегий поведения в рассматриваемом последовательном равновесии.
Возможны три случая опор в информационном состоянии 3.
,,.
;
;
По формуле Байеса . Даже прииз способа подсчета полностью согласованного вектора.
Допустим, что опора первого игрока в состоянии 3 это . Тогда. Последовательная рациональность приводит к неравенству. Подставляя, получаем;.
(т. к.),
.
Последовательная рациональность приводит к , если. Соотношенияминельзя удовлетворить одновременно. Следовательно,не является опорой первого игрока в состоянии 3.
Допустим, что опора первого игрока в состоянии 3 – это . Тогда. Последовательная рациональность приводит к неравенству.
Подставим , получим, так что.
,
.
Соотношения инельзя удовлетворить одновременноне является опорой игрока 1 в состоянии 3.
Итак, опорой игрока 1 в состоянии 3 является . Поэтому,. Последовательная рациональность приводит к равенству,.
;.
Последовательная рациональность игрока 2 в состоянии 2 приводит к .
Определим движение первого игрока в состоянии 1.
Если выберет , то получит 0.
+
+, где,,,.
Т.к. , то из требования последовательной рациональности следует, что. Т.е. в единственном последовательном равновесии игры первый ход первого игрока – альтруистический.
Рассмотрим сценарий , т.е. сценарий, в котором все игроки всегда поступают эгоистично. При этом. Если удалить узлы и ветви, идущие после хода случая с пометкой 0.05, тогда такой сценарий будет единственным сценарием последовательного равновесия.
Более того, является равновесием в стратегиях поведения и в первоначальной игре (с ходом случая 0.95 и 0.05).
может быть расширено до слабого последовательного равновесия в, но не может быть расширено до полного последовательного равновесия. (Напоминание: слабое последовательное равновесие – это пара,- последовательно рациональная стратегия для любого игрока, в любом информационном состоянии с вектором мнений,- слабо согласован с. Векторслабо согласован с, еслиудовлетворяет условию,.)
слабо последовательно равновесный сценарий, если.с такими значениямиислабо согласован, т.к..
4>3.25 . Тогда, т.к. 5>4, последовательная рациональность заставляет второго игрока выбиратьв узле 2.2 с вероятностью 1, т.е..
,
;.
Т.е. получаем, что действительно,- сценарий слабого последовательного равновесия.
не является сценарием полного последовательного равновесия, т.к.
.
А с не является рациональным действием для первого игрока, т.к. 4<8.
Этот пример иллюстрирует факт, что небольшие начальные сомнения могут иметь большое влияние на рациональное поведение игроков в многошаговой игре.
Если первый игрок допускает, что второй игрок благородный (даже с небольшой вероятностью допускает) и это известно второму игроку, то рационально хотя бы иногда поступать как альтруист. Если первый игрок считает второго эгоистом и это известно второму игроку, тогда первый и второй игроки всегда поступают как эгоисты – такое рациональное поведение.
Рассмотрим такой пример. d– вероятность (по мнению игрока 2 в состоянии 3), что игра проходит через верхний узел с меткой 2.3.
,
,
.
будет оптимальным, если.
будет оптимальным, если,
будет оптимальным, если.
Из иследует, что ни при какомиоба одновременно не могут быть оптимальны для второго игрока в состоянии 3. Так что опорой для последовательного равновесия могут быть только,,,,.
Если 2й игрок выбирает(с вероятностью 1) , тогда первый игрок выберетв состоянии 1 ив состоянии 2. Тогда. Но прилучше, чем, т.е. не существует последовательного равновесия с опорой.
Если второй игрок выбираетс вероятностью 1, тогда первый игрок выберетв состоянии 1 ив состоянии 2. Тогда из согласованности, т.е.- любое. Последовательная рациональность второго игрока в состоянии 3 требует, чтобы. Таким образом,с вектором мненийобразует последовательное равновесие.
Если второй игрок выбираетс вероятностью 1, тогда первый игрок выбираетв состоянии 1 ив состоянии 2. Тогда из согласованности с, в этом случае- нерациональный выбор для второго игрока. Так что нет последовательного равновесия с опоройв состоянии 3.
Чтобы опорой былонадо, чтобы, т.е.. При этом есть два способа построить последовательно рациональный сценарий.
Первый способ. Пусть первый игрок выбираетв состоянии 1 ив состоянии 2. Тогда, т.е.- любое, в том числе. Чтобы сделатьрациональным выбором первого игрока в состоянии 1 надо, чтобы, т.е..
с вероятностью мненийобразует последовательное равновесие.
Второй способсделатьсогласованным – это заставить первого игрока выбирать смешанную стратегию в вершине 1.2 и выбиратьв вершине 1.1. Если вероятность выбораравна, тогдасогласовано:. Привыигрыш первого игрока при выбореравен, и при выборетоже равен 0, т.е. стратегиярациональна для первого игрока при. Значит, стратегия поведениясобразовывает последовательное равновесие.
Чтобы опорой было, нужно, чтобы, так что. Если второй игрок выбирает случайным образом междуи, тогда первый игрок выберетв состоянии 2, так что единственный способ сделать согласованным- это заставить первого игрока выбиратьв состоянии 1. Тогда, т.е.- любое, в том числе. Первый игрок захочет выбиратьв состоянии 1, если второй игрок использует стратегию, где(тогда). Так что принабор стратегий поведенияи вероятность мненийобразуют последовательное равновесие.