
- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
1.6.Доминирование
Пусть у ЛПР
зависит от состояния. Пусть ЛПР может
выбрать любое
.Xсейчас будет
интерпретироваться как множество
решений, которое может сделать ЛПР.
Пусть его субъективная вероятность
состояния
равнаp(t),
т.е.
.
Тогда ЛПР будет выбирать конкретное
только если
.
(1.6.1)
Выпуклость.
Напомним, что
множество векторов выпукло тогда и
только тогда, когда для любых двух
векторов pиqи,
,
еслиpиqпринадлежат множеству, то и вектор
также должен принадлежать этому
множеству.
Теорема 1.6.1.
Пусть
и
заданы.
Множество всех
таких, чтоyоптимально,
является выпуклым.
Доказательство:
Пусть yоптимально для субъективных вероятностейpиq.
Пусть
и пусть
.
Тогда
=
=
.
То есть yоптимально, если ЛПР считает, что субъективная вероятность равнаr.
Пример:
Пусть
,
.
Функция полезностиuпоказана на таблице
Решение |
|
|
|
8 |
1 |
|
5 |
3 |
|
4 |
7 |
Только 2 состояния, поэтому.
оптимально, если
.
оптимально при
.
оптимально, если
.
оптимально при
.
оптимально, если
.
не оптимально ни при каком
так
как оно должно удовлетворять несовместимым
неравенствам (
).
никогда не оптимально для ЛПР.
Такой выбор ЛПР, который никогда не может быть оптимальным, для любой субъективной вероятности, называется сильно доминируемым.
Существует другой способ определения
доминируемости
.
Пусть ЛПР бросает монетку и выбирает
,
если орёл и
,
если решка. Обозначим эту стратегию
.
Если настоящее состояние было бы
,
то эта смещенная стратегия давала бы
ЛПР ожидаемую плату по данной функции
полезности
,
что лучше, чем ЛПР получит, выбрав
(плата в этом случае 5).
Если настоящее состояние было
,
тогда ожидаемая плата
,
что лучше, чем плата 3, которую ЛПР получил
бы, выбрав
.
Можем сказать, что
сильно доминируется смешанной стратегией
.
Смешанной стратегией является любое
распределение вероятностей на множестве
выборов решенийX. Обозначим
такую смешанную стратегию
.
Определение: для данной функции
полезности,
выбор решения
строгодоминируем
,
если
(1.6.2)
Термин строгой доминируемости определён в двух разных смыслах. Эти определения эквивалентны.
Теорема 1.6.2.
Пусть заданы
,
гдеXи
непустые конечные множества и
.
Смешанная стратегия
такая, чтоyстрого
доминируется
в смысле условия (1.6.2) существует тогда
и только тогда, когда не существует
какого-либо вероятностного распределения
,
такого, чтоyоптимально
в смысле условия (1.6.1).
Определение:
Выбор решения
слабо доминируемсмешанной стратегией
тогда и только тогда, когда
,
и существует по крайней мере одно
состояние
такое, что
.
Пример:
Пусть
,
и
показано на таблице
Решение |
|
|
|
5 |
3 |
|
5 |
1 |
слабо доминируется
(т.е. смешанной стратегией, которая с
вероятностью 1 выбирает
).
оптимально, если ЛПР верит, что
-- действительное состояние мира с
вероятностью 1, но если допускается
любая положительная вероятность для
,
тогда
не оптимально.
Теорема 1.6.3.
Пусть заданы
,
гдеXи
непустые конечные множества и
.
Смешанная стратегия
такая, чтоyслабо
доминируется этой стратегией, существует
тогда и только тогда, когда не существует
никакого вероятностного распределения
такого, чтоyоптимально
в смысле условия (1.6.1).
(Напомним:
-- это множество распределений вероятности
на
,
приписывающих положительную вероятность
любому состоянию из
).
Теоремы 6, 7 доказываются с помощью теорем двойственности из линейного программирования.