
- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
Будем говорить, что стратегия является
последовательно рациональной для игрока
i в информационном состоянии
,
если он действительно будет хотеть
делать то, что эта стратегия предписывает
ему сделать в данном состоянии.
Бывает так, что, попав в состояние s,
игрок думает, что ему не выгодно поступать
так, как рекомендует ему выбранная в
начале игры стратегия. Рассмотрим это
явление подробнее. Для любого набора
стратегий поведения и любых двух узлов
x и y, еслиy следует за x, тогда
-
произведение всех вероятностей,
приписанных ветвям на пути из x в y
стратегий
и
распределением вероятности для хода
случая.
Если y неследует за x, тогда=0.
То есть
является условной вероятностью того,
что траектория игры пройдет через y
после x, если все игроки выберут движение
согласно
и если игра начинается в узле x.
Обозначим
–
множество всех конечных вершин в игре
Ге,
–
выигрыш игрока i в конечной вершине y,
, т.е.
– это ожидаемый выигрыш игрока i, если
траектория игры начинается из вершины
x (вместо корня) и все игроки после этого
выбирают свои движения согласно стратегии
.
Пусть игрок i находится в информационном
состоянии s, которое возникает только
в одном узле x, т.е.
.
Тогда набор
стратегий поведенияпоследовательно
рациональный, если
,
где
–
стратегия поведения, которая отличается
от
только тем, что игрок i будет вести себя
согласно
в состоянии s.
Как определяется последовательная
рациональность в случае, если
содержит два и более узла?
В таком информационном состоянии s
ожидаемый выигрыш игрока зависит от
его мнения о том, какая вершина из
оказалась
на траектории игры.
-вероятностное распределение мненийна множестве вершин, помеченных меткой
i,s.
,
где
–
вектор мнений, описывающий распределение
вероятности мнений для каждого
информационного состояния каждого
игрока.
Набор стратегий
является последовательно рациональнымдля i в состоянии s при векторе мнений
,
если
.
(4.3.1)
Также существует эквивалентное определение:
являетсяпоследовательно рациональнойдля игрока i в информационном состоянии
s с вектором мнений
,
если для любого
из
того, что
следует.
.
называется последовательным выигрышемдвижения
.
Если
неявляется последовательно
рациональной для i в s с
,
тогда существует
такое,
что
,
но последовательный выигрыш
для i в состоянии s (относительно
и
)
строго меньше, чем последовательный
выигрыш некоторого другого движения,
которое может выбрать игрок i, находясь
в s.
Такое движение
называетсянерациональным движениемпри сценарии
с вектором мнений
.
Как рациональный разумный игрок определяет вероятности мнений? Вероятности мнений – условные вероятности при условии, что в ходе игры у игрока появилась какая-то информация. Т.к. игроки разумны и рациональны, то эти условные вероятности должны быть связаны с формулой Байеса, учитывающей информацию и мнение игрока, которые у него были в начале игры.
Обозначим
,
где x0– корень дерева игры.
– называется предварительной вероятностью
вершины y при сценарии
.
Пусть
–
набор стратегий, описывающих поведение,
которое разумный игрок мог бы ожидать
в игре Ге.
–
условная вероятность, которую игрок i
приписывает событию, что он делает
движение в узле x при условии, что он
знает, что делает движение в каком-то
из узлов, принадлежащих
,
.
Тогда, согласно формуле Байеса
(4.3.2)
Будем говорить, что вектор мнений
слабо совместимсо сценарием
,
если
удовлетворяет
(4.3.2)
,
,
.
Пусть
(4.3.3)
Тогда
(4.3.4)
Если условие (4.3.3) нарушено, тогда
состояние s имеет нулевую вероятность
осуществиться по сценарию
,
в этом случае будем говорить, что s
находитсявне траекториисценария
.
Теорема 4.3.Пустьявляется равновесием в стратегиях
поведения в игре Гев развернутой
форме с совершенной памятью. Пусть s
таково, что условие (4.3.3) при сценарии
выполняется. Пусть
– вектор мнений, слабо совместимый с
.
Тогда
последовательно рациональна для игрока
i в состоянии s с вектором мнений
.
Пример.Простая карточная игра.
|
M |
P |
Rr |
0,0 |
1,-1 |
Rf |
0.5, -0.5 |
0,0 |
Fr |
-0.5, 0.5 |
1, -1 |
Ff |
0,0 |
0,0 |
Ff – сильно доминируема, т.к.
Fr – слабо доминируема, т.к.
Нет равновесия в чистых стратегиях.
Равновесные стратегии таковы:
Равновесные стратегии поведения ( формула (4.1.1))
.
Чтобы проверить последовательную рациональность, выясним, будет ли каждый игрок действительно применять эти равновесные стратегии в каждой вершине, где они будут ходить. Если 1-й игрок вытащил красную карту, то он должен поднимать ставки, т.к. он ничего не выиграет, если закончит игру (F). Если 1-й игрок вытащил черную карту, то при условии, что 2-й игрок будет применять равновесную стратегию
В том числе и для
,
как рекомендует равновесная стратегия.
Т.е. равновесная стратегия последовательно
рациональна для 1-го игрока. Оптимальное
движение 2-го игрока зависит от
вероятностного распределения его
мнений.
Пусть a0обозначает верхний узел 2-го игрока, а b0– нижний узел 2-го игрока.
На рисунках вектор мнений будет записываться в таких скобках <.>.
Т.е второму игроку нет смысла менять
вероятности выбора M и P, т.к. (4.3.1)
выполняется и
,
т.е.
.