5 Дилемма заключённого
Что такое игровая стратегия и доминирующая игровая стратегия лучше всего показать на конкретном примере – простейшей игре под названием «дилемма заключенного», анализ которой и положил начало теории игр.
Дилемма заключенного - это игра между двумя участниками с двумя возможными исходами и одновременными ходами.
Суть игры заключается в следующем. Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок лишения свободы (10 лет). Однако иных доказательств их вины у следствия нет. Если оба молчат, их деяние квалифицируется как неоказание помощи следствию, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой.
Варианты развития событий приведены на рисунке 3.
|
Заключённый Б хранит молчание |
Заключённый Б даёт показания |
Заключённый А хранит молчание |
Оба получают полгода |
А получает 10 лет, Б освобождается |
Заключённый А даёт показания |
А освобождается, Б получает 10 лет тюрьмы |
Оба получают 2 года тюрьмы |
Рисунок 3 – Дилемма заключённого
Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.
Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.
Таким образом, доминирующей игровой стратегией для каждого из них становится дача показаний. В этом случае игровое равновесие устанавливается, когда они оба признаются и получат по 2 года наказания. Данное равновесие достигается потому, что стратегия «дать показания» каждого участника является оптимальной при заданной стратегии другого участника. Достигнутое равновесие является равновесием по Нэшу.
Равновесие Нэша – равновесие, когда каждый участник игры выбирает стратегию, которая является для него оптимальной при условии, что остальные участники игры придерживаются определенной стратегии.
Нетрудно увидеть, что Нэш-равновесие не является наиболее оптимальным для участников. Если бы они оба выбрали стратегию «не признаться», то получили бы только по 1 году. В этом случае говорят, что равновесие не является Парето-оптимальным. Если бы преступники смогли договориться заранее, то, возможно, они смогли бы достичь Парето-оптимального равновесия. Но даже в случае договоренности каждый из них имеет стимулы отступить от договоренностей и признаться, чтобы избежать наказания полностью. В этом случае эгоистические интересы каждого из участников и недоверие к напарнику заставляют преступников выбрать вариант «признаться». Согласованное поведение участников будет нерациональным с индивидуальной точки зрения каждого из участников.
Выводы Джона Нэша стали революционными. Адам Смит считал, что когда каждый член группы действует эгоистично, преследуя свои собственные интересы, это ведет к эффективному равновесному состоянию этой группы. Этот принцип был назван «невидимая рука рынка». Джон Нэш показал, что когда каждый член группы действует только в своих интересах, это не приводит к достижению максимальных интересов всей группы.
