
6. Эволюционно-стабильная стратегия
85
Итак, автомобилисту А известен приблизительный процент автомобилистов Б, систематически принимающих влево (Р), и процент автомобилистов Б, принимающих вправо (1 — Р). Условие для того, чтобы стратегия «принять вправо» стала для автомобилиста А эволюционно-стабильнои, формулируется следующим образом: ЕЬ (вправо) > ££/(влево), или 0Р+ 1(1 - Р)(1Р+ 0(1 - Р), откуда Р> 1/2. Таким образом, при превышении доли автомобилистов во встречном потоке, принимающих вправо, уровня 50% эволюционно-стабильной стратегией становится «принять вправо» — сворачивать на правую обочину при каждом разъезде.
Эволюционно-стабильная стратегия — такая стратегия, - что если ее использует большинство индивидов, то никакая альтернативная стратегий не может ее вытеснить посредством механизма естественного отбора, даже если последняя более эффективна по Парето.
В общем виде требования к эволюционно-стабильной стратегии записываются следующим образом. Стратегия I, используемая контрагентами с вероятностью р, является эволюционно-стабильнои для игрока тогда и только тогда, когда выполняются следующие условия: EU{\,p)> EU(J, р), что тождественно pU(l, I) + (1 -p)U(I, J)>pU(J, I) + (1 -p)U(J, J). Из чего следует:
U(I,I)> U{J,I) или
U(I, I) = U(J, I) и U(I, J) > U(J, J),
где — U (I, /) выигрыш игрока при выборе стратегии /, если контрагент выбирает стратегию /; £/(/,/) — выигрыш игрока при выборе стратегии /, если контрагент выбирает стратегию /, и т. д.
Можно представить эти условия и в графической форме. Отложим по вертикальной оси ожидаемую полезность выбора той или иной стратегии, а по горизонтальной — долю индивидов в общей популяции игроков, выбирающих обе стратегии. Тогда мы получим следующий график (значения взяты из модели разъезда двух автомобилей), изображенный на рис. 6.1.
Из рисунка следует, что и «принять влево», и «принять вправо» имеют равные шансы на то, чтобы стать эволюционно-стабильнои стратегией до тех пор, пока ни одна из них не охватила больше половины «популяции» водителей. Если же стратегия перешагивает этот рубеж, то она постепенно, но неизбежно вытеснит другую стратегию и охватит всю популяцию водителей. Дело в том, что,
86
если стратегия перешагивает рубеж 50%, для любого водителя становится выгодным использовать ее в маневрах, что, в свою очередь, еще больше увеличивает привлекательность данной стратегии для остальных водителей. В строгой форме данное утверждение Будет выглядеть следующим образом: dp/dt = G [EU(I, р) — EU(J, p)], (,">0.
Главным результатом анализа повторяющихся игр является увеличение числа точек равновесия и решение на этой основе проблем координации, кооперации, совместимости и справедливости. Даже в дилемме заключенных, как мы уже упоминали в предыдущей лекции, переход к повторяющемуся взаимодействию позволяет достичь оптимального по Парето результата («отрицать вину»), не выходя за рамки нормы рациональности и запрета на обмен информацией между игроками. Именно в этом смысл «всеобщей юоремы» (folk theorem): любой исход, устраивающий индивида индивидуально, может стать при переходе к структуре повторяющейся игры равновесным13. В ситуации дилеммы заключенных равновесным исходом при определенных условиях может стать и простая стратегия «не признавать», и множество смешанных стратегий. В числе смешанных и эволюционных стратегий, помимо I it for Tat («зуб за зуб»), отметим следующие: Tit-For-Two-Tats — начинать с отрицания вины и признавать вину, только если в два предшествующих периода кряду контрагент признавал вину; I )OWING — стратегия, исходящая из предположения о равновероятном использовании контрагентом стратегий «отрицать вину» и «признавать» в самом начале игры. Далее каждое отрицание вины со стороны контрагента поощряется, а каждое признание — наказывается выбором стратегии «признавать вину» в следующий период; TESTER — начинать с признания вины, и если контрагент тоже признает вину, то в следующем периоде отрицать вину (т. е. извиниться) и далее использовать стратегию «зуб за зуб» — Tit for Tat.
Выводы. Подведем общие итоги обзора теории игр и вариантов ее использования в институциональном анализе. Главный аргумент в пользу того, чтобы строить модели институтов с помощью теории игр, заключается в интересе теории игр к ситуациям взаимозависимости действий индивидов, проблемам координации и согласования действий. Ведь именно институты призваны решить эти проблемы. С позиции теории игр функцию института можно определить как создание предпосылок (структурных, когнитивных, организационных) для фиксации одного из исходов игры в качестве равновесного. Эта задача особенно актуальна, если равновесие по Нэшу отсутствует или оно не единственно. Достижение равновесия с помощью институтов подразумевает:
увеличение числа точек равновесия через формирование смешанных и эволюционных стратегий;
формирование репутации игроков, в которой фиксируется вся информация о его поведении в прошлом;
задание «удовлетворительных» критериев выбора альтернатив;
выбор единственного равновесия из нескольких равновесных исходов с помощью соглашений и «фокальных точек»;
задание критериев выбора альтернатив на основе ценностей; изменение структуры предпочтений индивида.