Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Тема 3(2)

.pdf
Скачиваний:
13
Добавлен:
02.06.2015
Размер:
2.23 Mб
Скачать

Тема 3. Равновесие Нэша в смешанных стратегиях

«Rock, Paper, Scissors, Lizard, Spock»

«It's very simple. Scissors cuts paper. Paper covers rock. Rock crushes lizard. Lizard poisons

Spock. Spock smashes scissors. Scissors decapitates lizard. Lizard eats paper. Paper disproves

Spock. Spock vaporizes rock. And as it always has, rock crushes scissors».

Sheldon Cooper

Антагонистические игры, и их частный вид, игры с нулевой суммой (zero-sum games),

– это некооперативные игры, в которых участвуют 2 (и только 2) игрока, выигрыши которых либо противоположны, либо равны нулю одновременно. То есть, если один игрок выигрывает, то второй обязательно проигрывает, иначе – ничья.

Впервые этот термин был введен Джоном фон Нейманом и Оскаром Моргенштерном в книге «Теория игр и экономическое поведение». Так авторы называли любую игру (включая экономическое и военное соперничество), в которой выигрыш одного игрока предполагает проигрыш другого.

К примеру, в годы Холодной войны политологи именно так описывали характер и логику взаимоотношений СССР и США.

«Камень/ножницы/бумага» («Rock, Paper, Scissors»)

 

 

II

 

 

К

Н

Б

К

0; 0

1; -1

-1; 1

I Н

-1; 1

0; 0

1; -1

Б

1; -1

-1; 1

0; 0

Может показаться, что в данной игре отсутствует равновесие Нэша, поскольку нет ни одного профиля стратегий, при котором стратегия одного игрока являлась бы лучшим

ответом на стратегию второго, и то же выполнялось бы и для его соперника. Однако это не так.

Предположим, что второй игрок случайно выбирает одну из трех возможных стратегий, то есть вероятности выбора стратегий «Камень», «Ножницы» или «Бумага» соответственно равны 1/3 каждая.

То есть

{

 

 

 

 

 

 

 

 

 

 

 

}.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Игрок I, выбирая между стратегиями «Камень»/«Ножницы»/«Бумага», получает

следующие ожидаемые выигрыши:

,

(

)-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( )

 

 

 

 

 

 

,

(

)-

 

 

 

 

( )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

(

)-

 

 

 

 

( )

 

 

 

 

 

 

 

 

 

 

 

 

При мнении о том, что соперник играет равновероятно, т.е.

{

 

 

 

 

 

}, лучшим ответом

 

 

 

на

будет любая стратегия первого игрока, поскольку все они приносят одинаковый

ожидаемый выигрыш.

 

 

 

 

 

 

 

 

 

Следовательно, *

+

( ).

 

 

 

 

 

 

 

Поскольку мы знаем, что игроку I безразлично, что играть, можно утверждать, что он может играть как угодно, что точно не принесет ему проигрыш. Он может выбрать стратегию случайно выбирать какую-либо стратегию равными вероятностями 1/3. Проше всего представить процесс его выбора подбрасыванием кубика, обладающего 6 гранями, две из которых будут соответствовать выбору первым игроком камня, 2 – ножниц и 2 – бумаги.

Такая случайная стратегия

 

 

 

 

{

 

 

 

 

 

 

 

} принесет ему следующий ожидаемый выигрыш:

 

 

 

 

 

 

 

 

 

, (

 

)-

 

 

, (

 

 

 

 

)-

 

 

 

 

, (

 

)-

 

 

 

 

 

 

, (

 

 

 

 

)-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Это означает, что

{

 

 

 

 

 

}

 

 

 

 

 

( ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично *

+

 

 

 

 

 

 

( ),

 

 

{

 

 

 

 

 

 

 

 

 

 

 

}

 

 

 

 

 

 

( ). Получаем, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, (

) – равновесие Нэша.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В данной

антагонистической

игре

выбор {

 

 

 

 

 

 

 

 

}

 

в ответ

на {

 

 

 

 

 

 

} (то есть играть

 

 

 

 

 

 

 

 

случайно) – это лучший ответ, значит .{

 

 

 

 

 

} {

 

 

 

 

 

 

}/ -

это равновесие Нэша. Если

 

 

 

 

 

 

позволить игрокам играть случайно, то равновесие Нэша может быть сыграно.

Будем называть

(

 

 

 

 

 

 

) теперь множеством чистых стратегий i-ого игрока.

Назовем

 

*

 

 

 

+ смешанной стратегией i-ого игрока, если

 

 

– рандомизация

множества

чистых

стратегий

i-ого игрока,

т.е.

(

)

 

 

 

 

,

(

) – исход в смешанных стратегиях, а

 

 

 

 

– множество смешанных стратегий i-ого

игрока.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсутствие в игре равновесия Нэша в чистых стратегиях не означает, что в игре нет равновесия Нэша как такового.

*

+ равновесие Нэша в смешанных стратегиях, если

( )

.

 

 

 

Свойство: если есть равновесие Нэша , и в нем в

входит с ( )

, то

(

)

 

 

Предпосылки для использования равновесия Нэша в смешанных стратегиях:

1)Равновесие Нэша в смешанных стратегиях стоит искать, если в игре есть больше одного равновесия в чистых стратегиях (например, в игре «Битва Полов»). Оно будет сыграно, если у участников нет возможности договориться о том, какое равновесие играть.

2)Равновесие Нэша в смешанных стратегиях будет играться в случае отсутствия равновесия Нэша в чистых стратегиях (например, в играх «Инспектирование» и «Орел или Решка»), так как, во-первых, оно существует и будет единственным; во-вторых, мы запутаем соперника так, чтобы он не смог помешать нам получить больший выигрыш.

«Орел или Решка» («Matching Pennies»)

Вданной игре (а это, кстати, игра с нулевой суммой) принимают участие два игрока, которые независимо друг от друга называют одну из сторон монеты: орла или решку. Если оба игрока выбрали одно и то же, то первый игрок выигрывает, а второй, соответственно, проигрывает. Если участники назвали разные стороны, то игрок II выигрывает, тогда как игрок I считается проигравшим.

Вматричном виде игру можно представить следующим образом:

II

ОР

I

О

1; -1

-1; 1

p

Р

-1; 1

1; -1

1-p

 

 

 

q

1-q

 

Играть какую-либо определенную (чистую) стратегию в такой игре – не такая уж и хорошая идея. Если второй игрок выбирает стратегию «Орел», у игрока I появится мотив ответить стратегией «Орел», чтобы заполучить выигрыш «1». В этом случае второй игрок выберет стратегию «Решка», которая принесет ему выигрыш «1». Далее игрок I сменит стратегию, что принесет ему выигрыш «1». Тогда второй игрок вернется к стратегии «Орел» и так далее. Здесь нет ни одного профиля стратегий, который удовлетворял бы обоих участников. Имеет смысл запутать соперника, играя случайно: выбирая не конкретную стратегию, а подбросив монетку. Что выпадет, то и стоит играть.

Мы играем равновесие в смешанных стратегиях для того, чтобы соперник нас не обыграл. Запутываем его, чтобы сделать безразличным к его чистым стратегиям.

,

(

)-

(

)

,

(

)-

(

)

,

(

)-

(

)

,

(

)-

(

)

( )

 

, -

( )

 

, -

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

 

 

 

 

{

 

 

 

 

 

 

 

 

 

q

1

1/2

 

 

 

РНСС

 

 

 

 

 

 

p

0

1/2

1

 

В данной антагонистической игре выбор { } в ответ на { } (то есть играть случайно) –

это лучший ответ, значит .{ } { }/ - это равновесие Нэша.

Здесь равновесие Нэша в смешанных стратегиях позволяет запутать соперника так, чтобы он не смог помешать нам получить больший выигрыш (в чем и заключается вторая предпосылка). Равновесие Нэша в смешанных стратегиях здесь – своего рода точка переключения между чистыми стратегиями. Если играть какую-либо чистую стратегию с определенной частотой, то соперник может догадаться и выбирать стратегию, которая принесет ему наибольший выигрыш, а если строго смешивать по 1/2, то догадаться, что лучше играть, невозможно.

«Инспектирование»/«Налогоплательщик»

 

 

В этой игре

два участника: налоговый

инспектор и налогоплательщик. То

есть

*

 

+. Налоговый инспектор может

либо

проверить

финансовые документы

налогоплательщика,

либо нет.

Тогда

*

+. Налогоплательщик же может честно уплачивать налоги

без всяких махинаций, в противном случае – он нечист на руку:

*

+.

Налогоплательщик

ЧНЧ

Налоговый

П

2; 0

4; -10

p

инспектор

НП

4; 0

0; 4

1-p

 

 

q

1-q

 

Мы уже выяснили, что равновесие Нэша в игре не всегда можно найти на матрице игры. Теорема Нэша о существовании гласит, что равновесие Нэша есть всегда, быть может в области смешанных стратегий. В более обобщенном виде она звучит так: любая конечная игра содержит равновесие Нэша. Это означает, что игра, в которой множество равновесий Нэша в чистых стратегиях отсутствует, обязательно содержит равновесие Нэша в смешанных стратегиях. Найдем его.

Выбираем такое смешение, чтобы соперник нас не обыграл.

,

(

)-

(

)

,

(

)-

(

)

,

(

)-

(

)

,

(

)-

(

)

( )

 

, -

( )

 

, -

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

 

 

 

 

{

 

 

 

 

 

 

 

 

 

q

1

РНСС

2/3

 

 

 

 

p

0

2/7

1

 

В отличие от предыдущего случая, где равновесие Нэша в смешанных стратегиях позволяло переключаться между чистыми стратегиями, в этой игре оно содержит еще и другую интерпретацию: это своего рода доли, с которыми будут сыграны чистые стратегии в популяции. Представим город с населением 210 человек, каждый из них - налогоплательщик. Часть из них предпочитают честно уплачивать налоги, тогда как

остальные пытаются всячески от них уклониться. Мы выяснили, что

 

 

, тогда

 

 

{

 

 

 

} будет означать, что

 

части населения (

 

 

) будут исправно

 

 

 

 

платить налоги, а оставшаяся треть (

 

) – напротив, будут налогов

 

избегать.

Регулятор (государство) хотел бы, чтобы в данном городе честных налогоплательщиков было больше. Обычная мера для этого - увеличим штраф за неуплату налогов с «-10» до «- 20».

Налогоплательщик

ЧНЧ

Налоговый

П

2; 0

 

4; -20

 

p

инспектор

НП

4; 0

 

0; 4

 

1-p

 

 

 

 

q

 

1-q

 

 

,

(

)-

 

(

)

 

 

,

(

 

)-

 

 

(

)

 

Мы наблюдаем уменьшение p, что говорит о том, что вероятность проверки инспектором документов налогоплательщика снизится. Однако q остается неизменным, следовательно, увеличение штрафа не приведет к увеличению честности.

Вывод: изменение выигрыша одного игрока ведет к изменению равновесия в смешанных стратегиях другого игрока, и только его. Чтобы поменять равновесие одного игрока, необходимо сменить выигрыши другого.

В рамках этой задачи увеличение честности среди налогоплательщиков последует в том случае, если мы увеличим выигрыш инспектора в (П; НЧ), т.е. увеличим его премию за поимку нечестного налогоплательщика:

Налогоплательщик

ЧНЧ

Налоговый

П

2; 0

 

 

8; -10

p

инспектор

НП

4; 0

 

 

0; 4

1-p

 

 

 

 

q

 

 

1-q

 

,

(

)-

 

(

 

)

 

,

(

 

)-

 

(

)

 

Источник изображения – веб-комикс XKCD.

«Семейный Спор #1»/«Битва Полов» («Battle of Sexes»)

Участники этой игры – муж и жена – решают, как им следует провести вечер. Обсуждаются два варианта: футбол и театр. При этом они хотят быть вместе: если они пойдут в разные места, то вечер пропадет. Решения участниками принимаются одновременно. Матрица выигрышей выглядит следующим образом:

Ж

ФТ

М

Ф

2; 1

0; 0

p

Т

0; 0

1; 2

1-p

 

 

 

q

1-q

 

Множество равновесий Нэша в чистых стратегиях: (Ф; Ф), (Т; Т).

Это классический пример координационной игры: сразу видно, что существуют два равновесия в чистых стратегиях. Актуальна первая предпосылка использования равновесия Нэша в смешанных стратегиях: его стоит искать, если в игре есть больше одного равновесия в чистых стратегиях, и оно будет сыграно, если у участников нет возможности договориться о том, какое равновесие играть.

,

(

)-

(

)

,

(

)-

(

)

{}

,

(

)-

(

)

,

(

)-

(

)

{}

Равновесие Нэша в смешанных стратегиях: ( ) = ({ } { }).

В этой игре лучше согласиться на плохое равновесие, нежели чем подумать о разных. Если все же не получается понять, какое равновесие будет сыграно, то необходимо сделать супруга безразличным.

Проверим,

что найденный исход (

 

) является равновесным. По свойству равновесия,

должно быть:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

(

)-

,

(

)-

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

(

)-

(

)

( )

 

( )

(

)

( )

( )

 

 

 

 

 

(

)

( )

 

( )

(

)

( )

 

( )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

(

)-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

(

)-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, (

)-

 

, (

)-

[ ({

 

 

 

}

)]

 

 

 

 

 

 

 

 

 

Любое другое смешение чистых стратегий мужем принесет ему выигрыш также равный .

Таким образом, желания отклониться от равновесия у него не будет. Аналогичное соотношение выигрышей можно показать и для жены.

Опишем лучшие ответы игроков:

( )

 

, -

( )

 

, -

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

 

 

 

 

{

 

 

 

 

 

 

 

 

 

График лучших ответов предполагает пересечение лучших ответов в 3 точках, т.е доказывает, что равновесий здесь действительно 3, как и в аналитическом решении.

q

1

РНЧС (Ф; Ф)

1/3 РНСС

 

РНЧС (Т; Т)

 

 

p

0

2/3

1

 

Рассмотрим менее тривиальные случаи матричных игр, например, когда у каждого из игроков по три чистые стратегии:

 

 

II

 

 

 

 

 

 

D

E

F

 

 

 

A

1; 1

6; 5

10; 1

 

I

B

5; 4

7; 0

5; 6

 

 

 

C

9; 8

6; 4

1; 1

 

1- -

 

 

 

 

1-

-

 

РНЧС: (C; D).

Чтобы найти множество равновесий Нэша в смешанных стратегиях, необходимо найти из условия, что выигрыши игрока от всех его чистых стратегий в ответ на найденное

смешение соперника будут равны. Для этого нужно решить следующую систему:

,

(

)-

 

 

{ ,

(

)-

 

 

,

(

)-

 

 

,

(

)-

(

)

,

(

)-

(

)

,

(

)-

(

)

(при )

( )

 

 

 

 

 

 

 

 

 

 

 

(при

 

 

 

и

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

 

 

 

 

)

(

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

. /

Таким образом,

*

+.

 

Далее необходимо найти

:

 

 

,

(

)-

 

 

{

,

(

 

)-

 

 

 

,

(

 

)-

 

 

,

(

 

)-

 

(

)

,

(

 

)-

 

(

)

,

(

 

)-

 

(

)

(при )

( )

(при

 

и

 

)

 

 

( )