- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
1.6.Доминирование
Пусть у ЛПР зависит от состояния. Пусть ЛПР может выбрать любое.Xсейчас будет интерпретироваться как множество решений, которое может сделать ЛПР. Пусть его субъективная вероятность состоянияравнаp(t), т.е.. Тогда ЛПР будет выбирать конкретноетолько если
. (1.6.1)
Выпуклость.
Напомним, что
множество векторов выпукло тогда и только тогда, когда для любых двух векторов pиqи,, еслиpиqпринадлежат множеству, то и вектортакже должен принадлежать этому множеству.
Теорема 1.6.1.
Пусть изаданы.
Множество всех таких, чтоyоптимально, является выпуклым.
Доказательство:
Пусть yоптимально для субъективных вероятностейpиq.
Пусть и пусть.
Тогда
==.
То есть yоптимально, если ЛПР считает, что субъективная вероятность равнаr.
Пример:
Пусть ,. Функция полезностиuпоказана на таблице
Решение | ||
8 |
1 | |
5 |
3 | |
4 |
7 |
Только 2 состояния, поэтому.
оптимально, если
.
оптимально при.
оптимально, если
.
оптимально при.
оптимально, если
.
не оптимально ни при какомтак как оно должно удовлетворять несовместимым неравенствам ().никогда не оптимально для ЛПР.
Такой выбор ЛПР, который никогда не может быть оптимальным, для любой субъективной вероятности, называется сильно доминируемым.
Существует другой способ определения доминируемости .
Пусть ЛПР бросает монетку и выбирает , если орёл и, если решка. Обозначим эту стратегию.
Если настоящее состояние было бы , то эта смещенная стратегия давала бы ЛПР ожидаемую плату по данной функции полезности, что лучше, чем ЛПР получит, выбрав(плата в этом случае 5).
Если настоящее состояние было , тогда ожидаемая плата, что лучше, чем плата 3, которую ЛПР получил бы, выбрав.
Можем сказать, что сильно доминируется смешанной стратегией. Смешанной стратегией является любое распределение вероятностей на множестве выборов решенийX. Обозначим такую смешанную стратегию .
Определение: для данной функции полезности, выбор решениястрогодоминируем, если
(1.6.2)
Термин строгой доминируемости определён в двух разных смыслах. Эти определения эквивалентны.
Теорема 1.6.2.
Пусть заданы , гдеXи непустые конечные множества и. Смешанная стратегиятакая, чтоyстрого доминируетсяв смысле условия (1.6.2) существует тогда и только тогда, когда не существует какого-либо вероятностного распределения, такого, чтоyоптимально в смысле условия (1.6.1).
Определение:
Выбор решения слабо доминируемсмешанной стратегиейтогда и только тогда, когда, и существует по крайней мере одно состояниетакое, что.
Пример:
Пусть ,ипоказано на таблице
Решение | ||
5 |
3 | |
5 |
1 |
слабо доминируется(т.е. смешанной стратегией, которая с вероятностью 1 выбирает).
оптимально, если ЛПР верит, что-- действительное состояние мира с вероятностью 1, но если допускается любая положительная вероятность для, тогдане оптимально.
Теорема 1.6.3.
Пусть заданы , гдеXинепустые конечные множества и. Смешанная стратегиятакая, чтоyслабо доминируется этой стратегией, существует тогда и только тогда, когда не существует никакого вероятностного распределениятакого, чтоyоптимально в смысле условия (1.6.1).
(Напомним: -- это множество распределений вероятности на, приписывающих положительную вероятность любому состоянию из).
Теоремы 6, 7 доказываются с помощью теорем двойственности из линейного программирования.