
- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
4.5.Вычисление последовательных равновесий
(k= 1, 2, 3, 4) – альтруистические поступки.
- эгоистические поступки.
Как найти последовательное равновесие.
Очевидно,
;
(т.к.
8<9).
Для любого информационного состояния опора последовательного равновесия – это множество движений, которые используются с положительной вероятностью в этом информационном состоянии, согласно набору стратегий поведения в рассматриваемом последовательном равновесии.
Возможны три случая опор в информационном состоянии 3.
,
,
.
;
;
По формуле Байеса
.
Даже при
из способа подсчета полностью
согласованного вектора
.
Допустим, что опора первого игрока в
состоянии 3 это
.
Тогда
.
Последовательная рациональность
приводит к неравенству
.
Подставляя
,
получаем
;
.
(т.
к.
),
.
Последовательная рациональность
приводит к
,
если
.
Соотношениям
и
нельзя удовлетворить одновременно.
Следовательно,
не
является опорой первого игрока в
состоянии 3.
Допустим, что опора первого игрока в
состоянии 3 – это
.
Тогда
.
Последовательная рациональность
приводит к неравенству
.
Подставим
,
получим
,
так что
.
,
.
Соотношения
и
нельзя удовлетворить одновременно
не
является опорой игрока 1 в состоянии 3.
Итак, опорой игрока 1 в состоянии 3
является
.
Поэтому,
.
Последовательная рациональность
приводит к равенству
,
.
;
.
Последовательная рациональность игрока
2 в состоянии 2 приводит к
.
Определим движение первого игрока в состоянии 1.
Если выберет
,
то получит 0.
+
+,
где
,
,
,
.
Т.к.
,
то из требования последовательной
рациональности следует, что
.
Т.е. в единственном последовательном
равновесии игры первый ход первого
игрока – альтруистический.
Рассмотрим сценарий
,
т.е. сценарий, в котором все игроки всегда
поступают эгоистично. При этом
.
Если удалить узлы и ветви, идущие после
хода случая с пометкой 0.05, тогда такой
сценарий будет единственным сценарием
последовательного равновесия.
Более того,
является равновесием в стратегиях
поведения и в первоначальной игре (с
ходом случая 0.95 и 0.05).
может быть расширено до слабого
последовательного равновесия в
,
но не может быть расширено до полного
последовательного равновесия.
(Напоминание: слабое последовательное
равновесие – это пара
,
- последовательно рациональная стратегия
для любого игрока, в любом информационном
состоянии с вектором мнений
,
- слабо согласован с
.
Вектор
слабо согласован с
,
если
удовлетворяет условию
,
.)
слабо последовательно равновесный
сценарий, если
.
с такими значениями
и
слабо
согласован, т.к.
.
4>3.25
.
Тогда, т.к. 5>4, последовательная
рациональность заставляет второго
игрока выбирать
в узле 2.2 с вероятностью 1, т.е.
.
,
;
.
Т.е. получаем, что
действительно,
- сценарий слабого последовательного
равновесия.
не является сценарием полного
последовательного равновесия, т.к.
.
А с
не является рациональным действием для
первого игрока, т.к. 4<8.
Этот пример иллюстрирует факт, что небольшие начальные сомнения могут иметь большое влияние на рациональное поведение игроков в многошаговой игре.
Если первый игрок допускает, что второй игрок благородный (даже с небольшой вероятностью допускает) и это известно второму игроку, то рационально хотя бы иногда поступать как альтруист. Если первый игрок считает второго эгоистом и это известно второму игроку, тогда первый и второй игроки всегда поступают как эгоисты – такое рациональное поведение.
Рассмотрим такой пример. d– вероятность (по мнению игрока 2 в состоянии 3), что игра проходит через верхний узел с меткой 2.3.
,
,
.
будет оптимальным, если
.
будет оптимальным, если
,
будет оптимальным, если
.
Из
и
следует, что ни при каком
и
оба одновременно не могут быть оптимальны
для второго игрока в состоянии 3. Так
что опорой для последовательного
равновесия могут быть только
,
,
,
,
.
Если 2й игрок выбирает(с
вероятностью 1
)
, тогда первый игрок выберет
в состоянии 1 и
в состоянии 2. Тогда
.
Но при
лучше, чем
,
т.е. не существует последовательного
равновесия с опорой
.
Если второй игрок выбираетс вероятностью 1, тогда первый игрок
выберет
в состоянии 1 и
в состоянии 2. Тогда из согласованности
,
т.е.
- любое. Последовательная рациональность
второго игрока в состоянии 3 требует,
чтобы
.
Таким образом,
с вектором мнений
образует последовательное равновесие.
Если второй игрок выбираетс вероятностью 1, тогда первый игрок
выбирает
в состоянии 1 и
в состоянии 2. Тогда из согласованности
с
,
в этом случае
- нерациональный выбор для второго
игрока. Так что нет последовательного
равновесия с опорой
в состоянии 3.
Чтобы опорой былонадо, чтобы
,
т.е.
.
При этом есть два способа построить
последовательно рациональный сценарий.
Первый способ. Пусть первый игрок
выбираетв состоянии 1 и
в состоянии 2. Тогда
,
т.е.
- любое, в том числе
.
Чтобы сделать
рациональным выбором первого игрока
в состоянии 1 надо, чтобы
,
т.е.
.
с вероятностью мнений
образует последовательное равновесие.
Второй способсделатьсогласованным – это заставить первого
игрока выбирать смешанную стратегию в
вершине 1.2 и выбирать
в вершине 1.1. Если вероятность выбора
равна
,
тогда
согласовано:
.
При
выигрыш первого игрока при выборе
равен
,
и при выборе
тоже равен 0, т.е. стратегия
рациональна для первого игрока при
.
Значит, стратегия поведения
с
образовывает последовательное равновесие.
Чтобы опорой было,
нужно, чтобы
,
так что
.
Если второй игрок выбирает случайным
образом между
и
,
тогда первый игрок выберет
в состоянии 2, так что единственный
способ сделать согласованным
- это заставить первого игрока выбирать
в состоянии 1. Тогда
,
т.е.
- любое, в том числе
.
Первый игрок захочет выбирать
в состоянии 1, если второй игрок использует
стратегию
,
где
(тогда
).
Так что при
набор стратегий поведения
и вероятность мнений
образуют последовательное равновесие.