- •Пособие по теории игр
- •Часть 1
- •Введение
- •1.Теория принятия решений
- •1.1Лотерея
- •1.2.Аксиомы
- •1.3.Теорема о максимизации ожидаемой полезности
- •1.4.Эквивалентные представления
- •1.5.Системы условных вероятностей Байеса
- •1.6.Доминирование
- •2.Основные модели теории игр
- •Развернутая и стратегическая формы игр
- •2.2.Эквивалентность игр в стратегической форме
- •2.3.Сокращенная нормальная форма стратегической игры
- •2.4.Исключение доминируемых стратегий
- •2.5.Многоагентное представление
- •2.6.Общеизвестная информация
- •2.7.Байесовская форма игры
- •2.8.Совместимость мнений
- •2.9.Эквивалентность игр в Байесовской форме
- •2.10.Тип-агентное представление
- •3.Равновесие в играх в стратегической форме
- •3.1. Равновесие по Нэшу
- •3.2.Вычисление равновесий по Нэшу
- •3.3.Эффект фокусировки
- •3.4.Эволюционный подход
- •3.5.Игры двух лиц с нулевой суммой
- •3.6.Равновесие Байеса
- •3.7.Замена смешанных стратегий чистыми
- •3.8.Аукцион
- •3.9.Игры, в которых множество выборов бесконечно
- •4.Последовательные равновесия в играх в развернутой форме
- •4.1.Смешанные стратегии и стратегии поведения
- •4.2.Равновесие по Нэшу в игре в развернутой форме
- •4.3.Последовательная рациональность в информационных состояниях, вероятность которых произойти положительная
- •4.4.Совместимость мнений и последовательная рациональность во всех информационных состояниях
- •4.5.Вычисление последовательных равновесий
- •Как найти последовательное равновесие.
- •4.6.Совершенные равновесия в подыграх
- •4.7.Игра с совершенной информацией
- •4.8.Добавление ходов случая, которым приписана небольшая вероятность
- •4.9.Прямая индукция
- •Приложение 1. Исследование операций
- •Литература
- •Оглавление
……………….
Пособие по теории игр
Часть 1
МОСКВА 2008
УДК 518.9
Работа представляет собой конспект лекций по теории игр, прочитанных на одной из базовых кафедр МФТИ при ВЦ РАН студентам факультета управления и прикладной математики. В основу лекций положен курс R. Myerson. Game Theory. Analysis of conflict. Harvarduniversitypress, 1991. Использовались также и работы других авторов. Составителем данной работы является Е.З. Мохонько.
В первой части работы рассматриваются игры в развернутой и стратегической форме, игры Байеса, антагонистические матричные игры, популяционные игры, равновесие по Нэшу в играх в стратегической и развернутой форме, равновесие по Байесу, последовательная рациональность, совершенное равновесие по подыграм, решение Штакельберга, частная и общая информация, которой обладают игроки и другие темы, связанные с этими вопросами.
Ключевые слова: лекции по теории игр, Р. B. Майерсон, основные модели теории игр, принципы оптимальности, информированность игроков.
Рецензенты:
Учебное издание
Введение
Теория игр - это теория принятия решений в условиях конфликта и неопределенности. Зарождение теории игр как математической дисциплины можно отнести к тому же письму Б. Паскаля к П. Ферма от 29 июля 1654, которое принято считать началом математической теории вероятности. В дальнейшем отдельные идеи, которые можно отнести к теоретико-игровым, высказывались рядом математиков, например, Д. Бернулли (1732), П. Лапласом (1814), Ж. Бертраном (1888). В 1911 году Э. Цермело описал теоретико- игровой подход к шахматной игре.
В 1921 Э. Борель начал систематическое изучение матричных игр. В 1928 году вышла в свет работа Дж. Неймана, содержащая основные идеи современной теории игр. Эти идеи были детально разработаны Дж. Нейманом и О. Моргенштерном в книге “Теория игр и экономическое поведение” (1944). С тех пор теория игр начала бурно развиваться и вошла в число разделов современной математики. Многие ранние работы по теории игр были сделаны во время второй мировой войны в Принстоне, в том же интеллектуальном сообществе, в котором работали физики - теоретики, разрабатывающие атомное оружие. Так в одном и том же месте и в одно и то же время работали над ядом и противоядием. Атомное оружие грозило существованию цивилизации. А теория игр, которая находится в математическом основании социальных наук, была призвана умерить человеческие конфликты.
Простейшую стратегическую игру можно описать набором . Здесь N - количество действующих в конфликте начал, называемых игроками. - множество выборов i -го игрока, состоящее из конечного числа элементов.
- функция выигрышаi- го игрока, зависящая как от его выбора, так и выбора других игроков.
Игроки считаются разумными и рациональными. Рациональность означает, что при выборе действия игрок руководствуется только соображениями выгоды, выбирает то, что увеличивает его выигрыш. Разумность означает, что игрок знает про игру все то, что знает специалист по теории игр, анализирующий игру, и может делать те же самые выводы.
Одним из центральных вопросов в теории игр является вопрос о том, что считать решением игры, то есть формулировка принципов оптимальности. Принцип оптимальности, во-первых, должен в достаточной мере отражать содержательные представления об оптимальности, и, во-вторых, должен быть реализуемым на достаточно широком и естественно очерченном классе игр. Конструирование и анализ принципов оптимальности является существенной составной частью теории игр.
Пример игры двух лиц - “дилемма заключенного”. В ней участвуют два игрока. Множество выборов i - го игрока состоит из двух элементов, Функции выигрыша описываются таблицей
| ||
5,5 |
0,6 | |
6,0 |
1,1 |
Первая цифра в ячейке показывает выигрыш первого игрока, вторая - выигрыш второго игрока.
Первый принцип оптимальности, подходящий в данной ситуации, - это равновесия по Нэшу. Второй принцип - оптимальность по Парето. Равновесие по Нэшу в такой игре - это такой выбор двух игроков , который удовлетворяет двум неравенствам
Выбор двух игроков оптимален по Парето, если не существует такого другого выбора , который для всех игроков не хуже, а для какого – то игрока лучше. Если в точке выигрыш какого-то игрока больше, чем в точке , то существует игрок, выигрыш которого в меньше, чем в точке .
Равновесие по Нэшу естественно использовать, например, при моделировании конфликта двух бизнесменов. Они не нарушают договор, если его не выгодно нарушать. Оптимальность по Парето естественно использовать при моделировании конфликтов типа “конфликт между мамой и ребенком”, когда выбор может быть и не очень выгоден, но отклоняться от него не будут, так как при отклонении игрока пострадает его партнер. Дух альтруизма воплощен в принципе оптимальности по Парето и лозунг “каждый сам за себя” отражен в равновесии по Нэшу. Что считать решением конфликта, какой принцип оптимальности применять - это зависит от смысла конфликта.
Содержательная интерпретация игры “дилемма заключенного” такая. Задержаны два преступника и они посажены в разные камеры, так что не могут общаться друг с другом и не могут ни о чем договориться между собой. Судья может доказать, что они совершили мелкое преступление и посадить их за решетку на год. При этом из шести ближайших лет пять лет они проведут на свободе и один год - в тюрьме. Судья подозревает, что они совершили еще и крупное преступление, но доказать это не может. За крупное преступление полагается отсидеть пять лет в тюрьме. Если кто - то из игроков укажет, что крупное преступление совершил партнер, то этому игроку прощается мелкое преступление и ближайшие 6 лет он проведет на свободе. Если каждый из них укажет на партнера, как на лицо, совершившее крупное преступление, тогда обоим проститься мелкое преступление и оба будут сидеть в тюрьме за крупное преступление пять лет. Так что из будущих шести лет они проведут на свободе только один год. Выбор хороший для игроков. Из ближайших шести лет они проведут на свободе пять лет. Этот выбор оптимален по Парето. Но он не обладает свойством устойчивости. Если первый игрок будет выбирать , и второй игрок знает об этом, то он, как рациональный субъект, должен выбирать , так как при таком выборе его выигрыш будет равен 6. Аналогично для первого игрока. Выбор мявляется равновесием по Нэшу. От него не выгодно отклоняться ни одному игроку.
По смыслу ситуации наиболее подходящим решением данной игры является равновесие по Нэшу.
Это игра одношаговая.
Примером развернутой во времени игры может служить дифференциальная игра.
Здесь мерный вектор состояния, и - и мерные вектор -функции управления, значения которых выбираются, соответственно, игроками 1 и 2 с целью максимизировать функции выигрыша , .
По ходу игры игроки могут использовать информацию о времени и применять программные стратегии Если же они получают информацию о текущей позиции , то могут применять позиционные стратегии .
Если интересы игроков противоположны, то это антагонистическая игра, если не противоположны - то неантагонистическая игра. В Вычислительном центре РАН развиваются неантагонистические дифференциальные игры, как игры, которые в большей степени отвечают экономической тематике. Антагонистические игры более соответствуют военной тематике. Антагонистическими играми, например, моделируют преследование одного самолета другим.
Большинство доказательств существования решений в теории игр носит не конструктивный характер. Многие из них опираются на теоремы о неподвижной точке. Поэтому в теории игр важны частные аналитические и численные методы решений.
Теория игр связана с другими разделами математики. Как общая теория множеств с несколькими бинарными отношениями она близка алгебре. В теории игр используется весьма разнообразный математический аппарат. Оптимальное поведение игрока в стратегических играх часто оказывается рандомизированным, так что теория игр тесно связана с теорией вероятности.
Можно рассматривать множество игр, отличающихся друг от друга только функцией выигрыша. Это приводит к рассмотрению пространств игр, которое осуществляется методами функционального анализа.
Математические модели исследования операций распределяются по трем уровням, детерминированному, стохастическому и неопределенному - в зависимости от степени информированности принимающего решения субъекта. Принятие решений в условиях неопределенности можно интерпретировать как конфликт принимающего решения субъекта против “природы” и тем самым - как игру. По существу к играм относятся и все многокритериальные задачи. Поэтому теорию игр можно считать разделом исследования операций.
В динамических играх стратегии игроков выступают как функции их информационных состояний. В ходе игры игроки могут приобретать или утрачивать информацию. Поэтому есть связь теории игр с теорией информации.
Теория игр больше всего применяется при научном исследовании какого-то вопроса. Например, в исследованиях Римского клуба, общественной организации, исследовавшей развитие человечества в эпоху научно - технической революции и пределы научно-технического прогресса.
Игры используются для моделирования социальных, экономических конфликтов, в рекламной политике, в военном деле. Есть даже книга о возможном использовании теории игр в хирургии.
Теория игр используется для исследования конфликтных ситуаций между государствами, возникающих, например, из-за совместного использования рыбных ресурсов, или в связи с кислотными дождями.
Один из эпизодов работы Конференции по морскому праву иллюстрирует преимущества употребления объективных критериев в дипломатических переговорах. Эти объективные критерии могут дать математические модели, созданные на основе исследования операций и, в частности, теории игр.
В ходе переговоров на этой конференции Индия, представляющая блок государств “третьего мира”, предложила предварительную цену для компаний, проводящих изыскания на морском дне, в 60 млн. долларов за участок. Соединенные Штаты отвергли это предложение, выдвинув свое - не устанавливать предварительной цены. Обе стороны заупрямились и дело превратилось в соревнование воли. Затем кто-то обнаружил, что Массачусетский технологический институт составил экономическую модель для подводных разработок. Эта модель, постепенно принятая всеми участниками в качестве объективной, определила метод оценки влияния любого из предложений о цене. Когда представитель Индии поинтересовался, каково будет влияние его предложения на экономическое состояние разработок, ему убедительно продемонстрировали, что предложенная Индией огромная цена, которую компания должна будет выплачивать за пять лет до того, как начнет получать прибыль, лишит ее возможности вообще производить какие-либо разработки. Под впечатлением услышанного он объявил, что пересмотрит свою позицию. Кроме того, с помощью модели МИТ была получена дополнительная информация, важная для американского представителя, который располагал только теми данными по этому вопросу, которые ему предоставили компании. Выяснилось, что некоторая предварительная выплата со стороны компаний экономически вполне приемлема. В результате США также изменили свою позицию. Никто ни от чего не отступился, никто не оказался слабым - все поступили разумно. После длительных переговоров обе стороны достигли предварительного соглашения, одинаково всех удовлетворившего.
Модель МИТ увеличила шанс достижения договоренности и уменьшила вероятность возникновения ситуации, которая дорого обошлась бы всем. Она привела к оптимальному решению, которое привлекло компании к разработкам и одновременно обещало значительные выгоды для всех стран. Существование объективной модели, способной прогнозировать последствия любого предложения, помогло убедить стороны в справедливости принятого ими предварительного соглашения. Это, в свою очередь, укрепило отношения среди участников переговоров и увеличило вероятность того, что соглашение выдержит испытание временем.
В Вычислительном центре РАН с использованием теории игр была разработана математическая модель распределения планового задания по производству районом сельскохозяйственной продукции между колхозами района. Распределение происходило на собрании, на котором присутствовали председатели колхозов. Каждое предложение по распределению задания вводилось в компьютер, на котором стояла модель, и выяснялось, к каким последствиям для района приводило предложение. В результате использования модели было принято такое распределение по колхозам задания по производству с/х продукции, которое было наилучшим для района в целом. А без применения модели возникала ситуация, когда принималось такое распределение, которое было выгодно наиболее горластым председателям колхозов, а не району.
Логические корни теории игр лежат в теории принятия решений Байеса. Теория игр может рассматриваться, как расширение теории принятия решений на случай двух и более лиц принимающих решение. Поэтому, чтобы понять основные идеи теории игр, необходимо начинать с теории принятия решений.