
- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
1.4.Эквивалентные представления
Если мы говорим, что для данного события
Sфункция полезностии функция условной вероятностиqпредставляют порядок предпочтений
мы имеем ввиду, что для любой пары лотерейfиg
тогда и только тогда, когда
.
Один и тот же порядок предпочтения может задаваться разными парами функций полезности и условной вероятности.
Теорема 1.4.1.
Пусть задано.
Пусть предпочтения лица, принимающего
решение,
удовлетворяют аксиомам 1-7. Пустьuиp– функции полезности
и условной вероятности, которые
удовлетворяют условиям (1)-(3) теоремы 1.
Тогда vиqпредставляют порядок предпочтенийтогда и только тогда, когда существуетположительноечислоAи функция
такие, что
,
,
.
Доказательство.
Пусть Aи
существуют.Тогда
=
=
=
=
,
т.к.
=1.
Поэтому ожидаемая v(полезность относительноq) является возрастающей линейной функциейu, полезности относительноp, т.к.A>0.
Т.е.
тогда и только тогда, когда
и поэтомуvиqпредставляют тот же порядок предпочтений
на множестве лотерей, что иuиp.
В обратную сторону.
Пусть vиqпредставляют тот же самый порядок предпочтений, что иuиp.
Зафиксируем
и
.
Пусть
.
Напомним, что
,
если
,
,
если
;
,
если
.
,.
По линейности оператора ожидаемой полезности
,
поэтому
. Напомним,
что в доказательстве теоремы 1 мы строимuиpтак
,
=>
=>
.
Поэтому
.
Аксиома монотонности гарантирует
единственность
такого, что , т.е.
.
отличается от
только в состоянииt, в
котором лотерея
дает призxвместо
наихудшего
Приза, поэтому
.
Поэтому
.
Обозначим
,
.
Тогда
.
A>0, т.к. из=>
.
Теорема 1.4.2.
Пусть
.
Пусть предпочтения лица, принимающего
решения, удовлетворяют аксиомам 1-8 и
пустьuиp– это, соответственно, независимая от
состояния функция полезности и функция
условной вероятности, удовлетворяющие
условиям 1-3 теоремы 1.3.
Пусть v– это независимая
от состояния функция полезности, пустьq– функция условной
вероятности, и предположим, чтоvиq– задают порядок
предпочтений.
Тогда
,
и существуют числа AиCтакие, чтоA>0 и.
Доказательство:
Пусть
и
.
Тогда из теоремы 2
,
,
(1.4.1)
Суммируем по всем
,
получим
Подставляя в (1.4.1) и обозначая через xлучший приз, аu(x)=1
(по первому условию теоремы 1) , получаем:.
Т.к. A>0, то.
1.5.Системы условных вероятностей Байеса
P– система условных
вероятностей Байеса, если,
,
является условным распределением на
таким,
что
.
Напомним, что
,
.
Пусть
обозначает множество всех систем
условных вероятностей на
.
-- множество всех распределений вероятности
наz, которое приписывает
положительную вероятность любому
элементу изz, т.е.
.
Любое вероятностное распределение
генерирует систему условных вероятностей
по формуле
.
Теорема 1.5.
Pявляется системой
условных вероятностей Байеса изтогда и только тогда, когда существует
последовательность вероятностных
распределений
такая, что для любого непустого
подмножестваSиз
и любого
Парадоксы, которые привели к тому, что были разработаны другие системы предпочтений:
Пусть X={12, 1, 0}млн.$.
Многие люди высказывают такие предпочтения:
;
.
Нарушается аксиома строгой объективной подстановки:
.
(Напомним аксиому 5Б:
если
и
и
,
тогда
).
(Ellsberg).
Пусть X={-100,100},и
Многие люди выражают предпочтения
Нарушается аксиома строгой объективной подстановки, т.к.
=0.5[100]+0.5[-100]=0.5[0.5[100]+0.5[-100]]+0.5[0.5[100]+0.5[-100]].