
- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
3.4.Эволюционный подход
MaynardSmith(1982),Axelrod(1984) отождествили хорошую стратегию в игре с некоторым биологическим эволюционным критерием.
Строится этот критерий так. Выбирается
есть некоторое числоi–
животных, которые инстинктивно ведут
себя согласно стратегии
.
Этих животных называют популяцией
первого поколения. Можно создать
последовательность поколений так.
Каждоеi– животное играет
игру много раз, а роль другого игрокаjисполняетj– животное,
выбранное независимо и наугад изj– животных текущей генерации.
- доляj– животных в
генерацииk, которые
инстинктивно выбирают смешанную
стратегию
.
.
Ожидаемый выигрыш i–го
животного, инстинктивно выбирающего:
,
.
Тогда каждое животное в поколение kбудет иметь число детей в следующей генерацииk+1, которое пропорционально ожидаемому выигрышу
.
(Чтобы избежать дополнительных трудностей, считаем, что всякий выигрыш – положительное число).
Мы подсчитываем эволюцию такой мысленной системы и увидим, какие стратегии побеждают в популяции.
Возможность такого анализа проистекает из того факта, что мы – результат долгого эволюционного процесса и плата во многих играх имеет некоторое отношение к частоте
Воспроизводства наших предков в этом процессе.
Но результат любого такого воспроизведения эволюции зависит от предположения о распределении стратегий в первом поколении, например, там могут быть доминируемые стратегии. Поэтому существует возражения против такого подхода. Результаты воспроизведения эволюции не уместны для решения проблемы выбора наилучшей стратегии, т.к. игроки разумны и рациональны.
Для любого равновесия по Нэшу
,
если почти всеi– животные
первой генерации используют стратегию
,
тогда животное, использующее другую
стратегию, не добивается особых успехов
в такой среде.
Г
в стратегической форме
,
,
- равновесие по Нэшу, определим
сопротивление
набору стратегий
как наибольшее
,
такое, что
.
Т.е. сопротивление равновесия
другому равновесию
это максимальная доля животных,
применяющих стратегию
и помещённых в популяцию животных,
применяющих стратегию
такая,
что
животные не имеют никакого преимущества
по количеству потомков над
- животными. Сопротивление даёт некоторую
оценку относительной эволюционной
стабильности одного равновесия по
сравнению с другим.
Равновесие с доминирует по риску равновесие d, если сопротивлениеcстратегиямdбольше, чем сопротивлениеdстратегиям набораc.
Пример.
Два игрока,
,
,
|
| |
|
|
|
|
9,9 |
0,8 |
|
8,0 |
7,7 |
,
- равновесия в чистых стратегиях.
Сопротивление
набору стратегий
равно 7/8 (
,
).
Сопротивление
набору стратегий
равно 1/8 (
,
).
фокусируется свойством оптимальности
по Парето,
фокусируется доминируемостью по риску.
В таких случаях важны традиции относительно
свойства доминируемости по риску и
свойства оптимальности по Парето. Мы
бы могли определить, какое равновесие
центральное.
В играх, моделирующих конфликты животных
рассматриваются еще
-вязкое
равновесие и эволюционно-устойчивые
стратегии.
Игра
называется симметричной, если
,
,
.
-параметр
вязкости,
.
Он показывает относительную частоту
взаимодействия внутри маленького
подвида.
является
-вязким
равновесием в
,
если
- набор смешанных стратегий, симметричный,
т.е.
,
и для каждой чистой стратегии
если
,
то
.
То есть единственными чистыми стратегиями,
которые используются с положительной
частотой популяцией
,
являются те, которые были бы оптимальны
для подвида, если всякий раз, когда
индивид из подвида играет в игру, с
вероятностью
его соперник является представителем
того же подвида и с вероятностью
-представителем
общей популяции.
Смешанная стратегия
называетсяэволюционно устойчивой,
если
является равновесием по Нэшу и для
каждой смешанной стратегии
,
,
,
т.ч.
.
То есть равновесная стратегия
должна давать выигрыш строго больше,
чем любая другая стратегия
,
если существует небольшая положительная
вероятность того, что будет встречен
индивид, использующий альтернативную
стратегию
.
Пример:
|
x |
y |
z |
x |
(1,1) |
(3,-3) |
(-3,3) |
y |
(-3,3) |
(1,1) |
(3,-3) |
Z |
(3,-3) |
(-3,3) |
(1,1) |
{1,2}, равновесие по Нэшу,
где
.
Эволюционно устойчивой стратегии не
существует. Пусть
.
,
т.е.
.