- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
2.2.Эквивалентность игр в стратегической форме
Две игры Г=(N, (Сi)iєN, (ui) iєN) иполностью эквивалентнытогда и только тогда, когда для каждого игрока i существуют числа АiиBi, Аi>0,
i= Аiui(c)+Bi,. Более общий путь описать поведение игроков в игре в стратегической форме – задать вероятностное распределение на множестве наборов стратегий С=.
Напомним, что
.
В игре Г с функцией полезности u, игрокiпредпочитал бы, чтобы игроки вели себя согласно распределению вероятности μ=( μ(c))cєCєΔ(C), а не согласно распределению вероятностей λ тогда и только тогда, когда μ дает более высокую ожидаемую плату, чем λ, т.е..
В игре с функцией полезности, игрокiпредпочитал бы, чтобы игроки вели себя согласно распределению вероятности μ=( μ(c))cєCєΔ(C), а не согласно распределению вероятностей λ тогда и только тогда, когда
.
Из теоремы 3 следует, что Г и полностью эквивалентны тогда и только тогда, когда для каждого игрока iєN, для каждого λєΔ(C) игрок i предпочитает μ, а не λ в игре Г только тогда, когда он предпочитал бы μ, а не λ в игре.
Эквивалентность по лучшему ответу
Обозначим
;.
(e-i,di) – набор стратегий всех игроков, такой, что в нем i-компонента – этоdi, а все другие компоненты -e-i.
..
.
Если игрок i считает, что некоторое распределение предсказывает поведение других игроков в игре, тогда игрок i захочет выбрать свою собственную стратегию из множества
.
В игре , аналогично, лучший ответ i-го игрока получится заменой uiна.
Игры и эквивалентны по лучшему ответу тогда и только тогда, когда их лучшие ответы совпадают для любого игрокаiи для любого распределения вероятностей на множестве других стратегий, т.е.
=.
Пример:
С1 |
С2 | |
X2 |
Y2 | |
X1 |
9,9 |
0,8 |
Y1 |
8,0 |
7,7 |
С1 |
С2 | |
X2 |
Y2 | |
X1 |
1,1 |
0,0 |
Y1 |
0,0 |
7,7 |
Игры не полностью эквивалентны, т.к. в первой игре каждый игрок предпочитает (х1,х2), а во второй (у1,у2).
Если же каждый из игроков думает, что другие игроки выбирают у стратегию с вероятностью ⅛ или более, то эти игры эквивалентны по лучшему ответу, т.к. лучшей выбор каждого игрока в каждой из игр - (у1,у2).
Расчет: для всех игроков первой игры:
0p(θ)+9(1- p(θ))≤8(1- p(θ))+7 p(θ),
1≤8 p(θ),
⅛≤ p(θ).
Для всех игроков второй игры:
0p(θ)+1(1- p(θ))≤0(1- p(θ))+7 p(θ),
1≤8 p(θ),⅛≤ p(θ).
2.3.Сокращенная нормальная форма стратегической игры
Рассмотрим игры, которые мы можем упростить, удаляя лишние стратегии.
C1 |
C2 | |
X2 |
Y2 | |
a1x1 |
6,0 |
6,0 |
a1y1 |
6,0 |
6,0 |
a1z1 |
6,0 |
6,0 |
b1x1 |
8,0 |
0,8 |
b1y1 |
0,8 |
8,0 |
b1z1 |
3,4 |
7,0 |
(а1х1), (a1y1), (а1z1) можно заменить одной строкой(а1·) 6,0 6,0
Получим сокращенную нормальную форму игры.
В общем случае для игры Г=(N, (Ci)iєN, (ui)iєN)мы можем сказать, чтоdiи еiэквивалентны по выигрышу тогда и только тогда, когда.
Т.е. когда вне зависимости от того, что игроки отличные от i могут делать, ни один из них не заметит, что i использует стратегию di, а не еi.
C1 |
C2 | |
X2 |
Y2 | |
a1. |
6,0 |
6,0 |
b1x1 |
8,0 |
0,8 |
b1y1 |
0,8 |
8,0 |
b1z1 |
3,4 |
7,0 |
В некотором смысле стратегия b1z1сократима. Стратегия 0,5[a1·]+0,5[b1y1] дает такую же ожидаемую плату как и b1z1.
0,5(6,0)+0,5(0,8)=(3,4),если х2;
0,5(6,0)+0,5(8,0)=(7,0), если у2.
В общем случае:
cтратегияdiєСiслучайно сократима, когдатакая, что.
Полностью сокращенное нормальное представлениеполучается из сокращенной нормальной формы с помощью удаления всех стратегий, случайно сократимых в сокращенной нормальной форме.