Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1svetlov_v_a_vvedenie_v_konfliktologiyu

.pdf
Скачиваний:
227
Добавлен:
29.10.2019
Размер:
4.64 Mб
Скачать

Рассмотрим игру, которая офи­циально называется «Петухи»126. Два подростка устраивают автомобильную дуэль. На большой скорости они мчатся по одной полосе шоссе навстречу друг другу. Проигрывает тот, кто свернет первым. Пусть А = «первый подросток», В = «второй подросток­ ». Каждый из них может свернуть или не свернуть. Пусть A1 = «A сворачивает», А2 = «А не сворачивает», В1 = «В сворачивает», В2 = «В не сворачивает­ ». Имеют место следующие стратегии, исходы и порядковые платежи:

A=1(3,В1 =3)«.А и В оба сворачивают (ничья)»;

A1В2 = «А сворачивает, В не сворачивает»; = А проигрывает, В выигрывает; = (2, 4).

А2В1 = «А не сворачивает, В сворачивает»; = А выигрывает, В проигрывает; = (4, 2).

А2В2 = «А и В оба не сворачивают (лобовое столкновение)»; = никто не проигрывает; = (1, 1).

Следующая матрица суммирует всю необходимую информацию о рассматриваемом конфликте (рис. 7).

 

игрок В

 

В1

В2

А1

0

2

Игрок А

 

 

 

 

А2

2

0

Рис. 7. Платежная матрица игры «Петухи»

126 Игра была придумана математиками из RAND Corporation (Research And Development Corporation — некоммерческая исследовательская организация) по аналогии с одним из эпизодов фильма «Rebel without a Cause» («Беспричинныйбунтарь»,1955,США),вкоторомдевушкапровоцируетсмертельно опасную автомобильную дуэль между двумя своими поклонниками.

В матрице на рис. 7 числа в ячейках (левое для игрока А, правое для игрока В) обозначают платежи, т.е. веса порядкового предпочтения этого исхода­ для каждого игрока в отдельности. Конфликт заключается в том, что проигрывает тот, кто сворачивает первым; но если никто не свернет, неминуема катастрофа. Ничья воспринимается обоими подростками как вынужденный­ компромисс. Какой стратегии должен следовать каждый из игроков, если состязание проводится один раз, действия игроков независимы друг от друга, исходы и предпочтения­ друг друга известны обоим участникам и ни один из них не хочет прослыть­ трусом?

Общий ответ классической теории игр на приведенный вызов сводится к тому, что игроки должны действовать рационально, т.е. выбирать из доступных­ им стратегий ту, которая имеет для них наибольшую полезность­ ; их знание действий, исходов и предпочтений друг друга должно­ быть полным и точным. Если все эти условия выполняются, тогда кажется само собой разумеющимся, что каждая игра из двух участников с нулевой суммой­ , в которой выигрыш одного равен проигрышу другого, имеет решение­ . Это действительно так. Проблема, однако, заключается в том, что для игр с ненулевой суммой, выигрыш одного игрока в которых не равен проигрышу другого, не существует единого критерия ре­ шения. Разные критерии могут давать несовпадающие предсказания и рекомендации по разрешению конфликта. Рассматриваемая автомобильная дуэль представляет пример игры с ненулевой суммой, и какой исход или исходы считать ее решением, зависит не только от предпочтений игроков, но и от выбора критерия оценки стабильности исходов.

4.4. Критерий рациональности Джона Нэша

Второй критерий рациональности классической теории игр

Критерий равенства максиминной и минимаксной стратегий Джона фон Неймана и Оскара Моргенштерна был первой по-

320

321

пыткой классической теории игр найти общее решение проблемы рационального­ поведения в конфликтных условиях. Второй попыткой, до сих пор считающейся наиболее оптимальной, стал критерий рациональности Джона­ Нэша127.

Критерий рациональности Джона Нэша — рациональны все стратегии, чьи исходы не имеют ни одного одностороннего (независимого от действий других игроков) улуч­ шения.

Решение конфликта стабильно, если ни один игрок не способен в одностороннем порядке его улучшить.

Согласно критерию Нэша, если все игроки находятся в состоянии­ стабильного равновесия, ни один из них не должен­ испытывать желание изменить свою позицию. Тем самым данный критерий указывает на безуспешность и непрочность достижения односторонних преимуществ при разрешении конфликтов.

Критерии рациональности фон Неймана и Нэша дают одни и те же результаты в играх с нулевой суммой, но различные в играх с нестрогим соперничеством. Вместе они образуют теоретический фундамент классической теории игр.

Вернемся к игре «Демьянова уха». Платежная матрица этой игры представлена на рис. 1.

Данная игра не является игрой с нулевой суммой и не имеет решения в терминах равенства максиминной и минимаксной стратегий игроков. Нет ни одного числа из минимума по строкам, совпадающего с числом из максимума по столбцам (рис. 8).

127Nash J.F. Non-cooperative Games // Annals of Mathematics. 1951. V. 54. P. 286—295. Американский математик Джон Форбс Нэш внес значительный вклад в развитие теории игр после Джона фон Неймана и в 1994 году стал нобелевским лауреатом. Джон Нэш — главный герой фильма «Beautiful Mind» (2002), вышедшего в русском прокате под названием «Игры разума».

 

 

Фока

 

 

Ф1

 

Ф2

 

Д1

4, 1

 

3, 4

3

Демьян

 

 

 

 

 

 

 

 

Д2

2, 2

 

1, 3

1

max B

2

4

 

Рис. 8. Игра «Демьянова уха» не имеет решения в терминах равенства максиминной и минимаксной стратегий

Но данная игра имеет решение в терминах принципа рациональности Нэша.

Рассмотрим исход № 1. Он имеет наивысшую полезность для Демьяна и наименьшую для Фоки. Значит, этот исход стабилен для Демьяна. Но стабилен ли он для Фоки? Нет, потому что Фока может гарантированно (независимо от действий Демьяна) улучшить свое положение движением от исхода № 1 к исходу № 2. Нестабильность исхода хотя бы для одного игрока влечет нестабильность исхода в целом. Значит, исход № 1 нестабилен.

Рассмотрим исход № 2. Он имеет наивысшую полезность и тем самым стабильность для Фоки. Этот исход не обладает высшей полезностью для Демьяна, но тем не менее является для него стабильным. Почему? Потому что Демьян не имеет из исхода № 2 ни одного гарантированного улучшения. Действительно, Демьян может двигаться из исхода № 2 только к исходу № 4. Но полезность исхода № 4 для этого игрока ниже полезности исхода № 2. Поэтому, если Демьян — рациональный игрок, он не будет предпринимать никаких попыток ухудшить свое положение. В итоге исход № 2 стабилен для обоих игроков и тем самым стабилен в целом.

Рассуждая аналогичным образом, легко установить, что исходы № 3 и № 4 нестабильны. Значит, согласно критерию Нэша,

322

323

игра «Демьянова уха» имеет только одно стабильное решение — исход № 2, что соответствует решению конфликта, указанного И.А. Крыловым.

Трудности использования критерия рациональности Дж. Нэша в конфликтологическом исследовании

Рассмотрим игру «Петухи». Ее платежная матрица изображена на рис. 7.

Допустим, игроки А и В выбирают­ исход A1В1, т.е. ничью. Но игрок А может улучшить свое положение­ в одностороннем порядке, сделав независимо от воли В ход от A1В1 к A2В1. Аналогично В может в одностороннем порядке улучшить исход A1В1, поменяв его на A1B2. Значит, исход A1В1 игроков­ не является стабильным ни для одного игрока, так как каждый из них может в одностороннем­ порядке его улучшить. Исход А2В2 также нестабилен­ для А и В, ибо А может в одностороннем порядке поменять А2В2 на А2В1, а В также в одностороннем порядке может поменять­ исход А2В2 на А1В2. Так как только из исходов A2B1 и А1В2 ни один игрок не может получить одностороннего улучшения своей позиции, то, со­гласно критерию Нэша, именно эти исходы образуют решение рассматриваемой игры.

Каким бы рациональным ни казалось это решение, оно означает, что один из дуэлянтов должен погибнуть или серьезно пострадать. С такой рациональностью решения конфликтов не всякий может согласиться. Скорее, их можно назвать иррациональными.

Отметим, что игра «Петухи» не имеет ни «чистого», ни «смешанного» решения согласно критерию фон Неймана и Моргенштерна. Игрок А, следуя максиминной стратегии, ищет среди своих платежей­ выигрыш, минимальный в своей строке — {2, 1} и максимальный­ в своем столбце — {4, 2}. Пересечение обоих множеств дает maxmin A = {A1B2, А2В2} {А2В1, А1В2} = {А1В2}. Игрок В, следуя минимаксной­ стратегии, ищет

среди своих платежей выигрыш, максимальный в своей строке — {4, 2} и минимальный в своем столбце — {2, 1}. Пере­ сечение обоих множеств дает minmax B = {A2B1, А1В2} {A2B1, A1B1} = {A2B1}. И так как maxmin А minmax В, то следует, что данная игра согласно критерию равенства максиминной и минимаксной стратегий­ «чистого» решения не имеет. Она также не имеет и «смешанного» решения, что здесь доказываться не будет­ .

Критерий равенства максиминной и минимаксной стратегий не дает рационального решения игры «Петухи»; критерий Нэша указывает на исходы A2B1 и А1В2 как рациональные решения данного конфликта. Но их рациональность выражается в том, что кто-то один из подростков должен обязательно погибнуть или покалечиться. Вопрос в том, действительно ли рациональность всегда должна выражаться в столь иррациональной форме? Этот вопрос перестает быть академическим, если от дуэли подростков переключиться на конфликт, также подчиняющийся паттерну «Петухи», двух супердержав с ядерным оружием в 1962 году. Речь идет о Карибском ядерном кризисе. «Карибский ракетный кризис был, — отмечают американские исследователи Г. Аллисон и Ф. Зеликов, — эпохальным событием. В истории не случалось ничего подобного тем тринадцати дням октября 1962 г., когда Соединенные Штаты и Советский Союз застыли на краю ядерной пропасти. Никогда ранее не было столь высокой вероятности того, что жизнь такого большого числа людей внезапно оборвется. Если бы война разразилась, это означало бы гибель 100 миллионов американцев, более 100 миллионов русских, а также миллионов европейцев. Все другие природные катастрофы и зверства истории поблекли бы перед ущербом такого масштаба»128.

На вопрос, каким же критерием должен руководствоваться конфликтолог в подобных ситуациях, классическая теория игр

128 Аллисон Г., Зеликов Ф. Квинтэссенция решения. На примере Карибского кризиса 1962 года. М.: Либроком, 2012. С. 29.

324

325

ответа не дает. Между тем стоит отметить, что кооперативный (синергетический) исход A1B1 не идентифицируется обоими критериями. Но именно этот исход, если полагаться на здравый смысл, представляет лучшее решение конфликта «Петухи» — он сохраняет жизнь и здоровье обоим подросткам и уравнивает их шансы в борьбе за сердце девушки.

Рассмотрим игру, называемую «Дилеммой заключен­ но­ ­ го»129. По подозрению в вооруженном ограблении, подкрепленному вещественными уликами, задержали двух преступников — А и В. Однако свидетельств, достаточных для их судебного обвинения, не было. Их можно было получить только после признания хотя бы одного из задержанных. Чтобы ускорить процесс признания, судья предлагает обвиняемым сделку. Их сажают в разные камеры и каждому сообщают, что если один заключенный признается, а другой нет, тогда первый­ получит свободу, второй — 10 лет тюрьмы; если оба признаются, то оба получат по 5 лет тюрьмы; если оба не признаются, то им придется просидеть в тюрьме только 1 год в связи с недостаточностью улик. Первая, информационная, проблема для заключенных состоит в том, что они не могут общаться друг с другом. Каждый из них должен принять решение самостоятельно. Вторая, моральная, — в том, что признание своей вины для каждого игрока было равносильно доносу на своего товарища.

Участники рассматриваемого конфликта — подозреваемые в совместном­ совершении преступления. Обозначим их буквами А и В. Возможные ходы игроков: А1 = «А не признает своей вины», А2 = «А признает свою вину», B1 = «В не признает своей вины», В2 = «В признает свою вину». Стратегии, исходы и платежи задаются условиями, выдвинутыми­ прокурором:

129 Игра была изобретена математиками из RAND Corporation.

A1B1 = «А и В не признают своей вины и получают по 1 году тюрьмы за незаконное ношение оружия каждый»;

A1B2 = «А не признает себя виновным, В признает; А получает 10 лет тюрьмы без права помилования, В выпускают на свободу»;

A2B1 = «А признает себя виновным, В не признает; А отпускают на свободу, В получает 10 лет тюрьмы без права помилования»;

A2B2 = «А и В признают свою вину и получают по 5 лет тюрьмы каждый».

Если игроки А и В собираются принимать решение согласно критерию равенства минимаксной и максиминной стратегий, тогда самым предпочтительным исходом для каждого из них является собственная свобода. Но для этого одному из них следует предать своего товарища. Только в этом случае появляется шанс получить свободу. Понимая это, игрок А исключает из списка своих предполагаемых действий ход А1 и лишает тем самым В возможности достигнуть исхода А1В2 (В свободен, А получает 10 лет тюрьмы), а игрок В исключает из своего списка предполагаемых действий ход В1 и лишает тем самым А возможности достигнуть исхода A2B1 (А свободен, В получает 10 лет тюрьмы). Дополнительно к сказанному исключается исход A1B1. Значит, из четырех возможных исходов в данной игре остается только один, рационально приемлемый как для А, так и для В — исход А2В2 (оба получают по 5 лет тюрьмы).

Согласно критерию Нэша, исход А2В2 единственное стабильное решение игры, потому что ни один игрок не имеет из него одностороннего­ улучшения своей позиции. Все остальные исходы согласно этому критерию нестабильны. Игрок А может улучшить исход A1B1, перейдя к исходу А2В1, и улучшить исход А1В2, заменив его на исход А2В2. Аналогично игрок В способен улучшить исход A1B1 исходом А1В2 и исход А2В1 исходом А2В2. Матрицы, суммирующие информацию об этой игре в количественных (сроках тюремного заключения) и порядковых полезностях исходов, изображены на рис. 9.

326

327

 

 

игрок В

 

 

В1

В2

А1

 

1, 1

10, 0

Игрок А

 

 

 

 

 

 

А2

 

0, 10

5, 5

 

(а)

 

 

 

игрок В

 

 

В1

В2

А1

 

 

 

3, 3

1, 4

Игрок А

 

 

 

 

 

 

А2

 

4, 1

2, 2

(б)

Рис. 9. Платежные (количественная (а) и порядковая (б)) матрицы игры «Дилемма заключенного»

Критерий равенства максиминной и минимаксной стратегий и критерий Нэша показывают, что решением «Дилеммы заключенного» должен быть «индивидуалистический» исход А2В2 = «А и В предают друг друга» с порядковыми полезностями (2, 2). Согласно этому исходу каждый из заключенных, не доверяя своему товарищу, полагается только на самого себя. Между тем в этой игре существует и «кооперативный» исход А1В1 = «А и В не предают друг друга» с порядковыми полезностями (3, 3), согласно которому оба игрока получают значительно меньший срок тюремного заключения. Но этот исход не идентифицируется данными критериями, хотя его полезность выше полезности «индивидуалистического» исхода.

Из сказанного следует, что классическая теория игр независимо от мотивов ее авторов защищает рациональность, основанную исключительно на эгоистическом поведении игроков.

Кооперативные исходы, основанные на возможном сотрудничестве и доверии, не различаются и не принимаются ею во внимание.

Кроме указанных трудностей можно указать на несколько дополнительных ограничений классической теории игр при конфликтологическом использовании.

Классическая теория игр полагает, что лучший индивидуальный ответ в соответствии с критерием Дж. фон Неймана и О. Моргенштерна или критерием Дж. Нэша на множество фиксированных стратегий противников — единственная возможность максимизации выгоды игрока. Однако это не так. Например, в игре «Дилемма заключенного» кооперативный исход «А и

Воба не признают своей вины» заведомо лучше для обоих игроков исхода «А и В оба признают». Но согласно обоим критериям нет никакого рационального пути от исхода «А и В оба признают» к исходу «А и В оба не признают своей вины». В классической теории игр такой шаг априори выглядит как иррационалистический. Иными словами, классическая теория игр делает чрезмерный акцент на инструментальной рациональности поведения игроков, не принимая во внимание существование других видов рациональности. Она также игнорирует эмоции игроков как один из важнейших наряду с разумом факторов изменения их предпочтений и выбора стратегий.

Допущение о том, что игроки обладают полной и точной информацией о действиях, исходах и предпочтениях друг друга, редко выполняется на практике. Такое допущение полностью исключает из сферы анализа случаи сознательного искажения информации, возможность различной оценки и интерпретации игроками одной и той же конфликтной ситуации.

Существует экспоненциальная зависимость числа стратегий от числа действий игроков и связанная с этим практическая неэффективность анализа всех стратегий одновременно. Уже десять совместных действий игроков, что нередко для ситуаций практического принятия решений в конфликтных условиях, порождают необходимость анализа 1024 возможных стратегий и

328

329

исходов. В этих случаях невозможно использование матричного представления.

Классическая теория игр имеет дело с фиксированным набором игроков, их действий, исходов и предпочтений, которые не могут меняться в процессе самой игры.

Классическая теория игр никак не учитывает структурные особенности конфликтных ситуаций. Акцент на действиях, стратегиях и предпочтениях игроков не позволяет использовать возможности структурного анализа конфликтов.

Несмотря на огромное число внесенных и вносимых исправлений и улучшений в использовании классической теории игр как теории анализа и разрешения конфликтов, накопилось столько трудностей, что уже давно стала актуальной проблема конструирования альтернативной теории, более близкой к потребностям конфликтологической практики.

4.5. Критерий рациональности Найджела Ховарда

Три «поражения» рациональности классической теории игр

Решительное сближение теории игр с проблемами анализа и разрешения реальных конфликтов началось в конце 60-х годов прошлого века после того, как английский математик Найджел Ховард изобрел теорию метаигр130. По свидетельству H. Ховарда, принципиальная возможность создания теории метаигр была предсказана Дж. фон Нейманом и О. Моргенштерном131. Потребности консультирования и ведения переговоров стали главным основанием поиска более реалистической теории принятия

130См.: Howard N. Paradoxes of Rationality: Theory of Metagames and Political Behavior. Cambridge (Mass.), 1971.

О личности и научном творчестве Н. Ховарда см.: Семенов В.А., Светлов В.А. Памяти профессора Найджела Ховарда — создателя теории метаигр и теории драмы // Журнал по социологии и антропологии. № 4. 2008. С. 5—47.

131См.:Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.: Наука, 1970.С.126—127.

рациональных решений­ в конфликтных условиях. С возникновением теории метаигр начался неклассический этап развития теории игр, продолжающийся и в настоящее время. Его главным результатом можно считать возникновение теоретического и вычислительного базиса современной конфликтологии.

Неклассическая теория игр сосредоточилась, по образному выражению Найджела Ховарда, на объяснении и решении трех «поражений» рациональности классической теории игр — рациональности в смысле критериев Дж. фон Неймана и О. Моргенштерна, а также Дж. Нэша132.

Первое «поражение» рациональности состоит в том, что игра «Морская охота» опровергает постулат классической теории игр, что всякий конфликт имеет рациональное решение, если все игроки — рациональные существа. Данная игра не имеет рационального решения ни в смысле Дж. фон Неймана и О. Моргенштерна, ни в смысле Дж. Нэша. Все решения данной игры согласно обоим критериям иррациональны. Капитану торгового судна можно надеяться только на чудо, чтобы не столкнуться с военным кораблем, а капитану военного судна также необходимо уповать на чудо, чтобы, наоборот, столкнуться с торговым кораблем. Значит, рационально мыслящие игроки в подобных конфликтах обречены на поражение.

Второе «поражение» рациональности следует из того, что игра «Дилемма заключенного» лишает безусловной истинности постулат классической теории игр, будто бы рациональные исходы всегда предпочтительнее иррациональных. Рациональный исход этой игры, когда оба игрока признают свою вину, равносилен, во-первых, взаимному предательству игроками друг друга и, во-вторых, для них обоих менее предпочтителен, чем кооперативный исход, основанный на иррациональной, но ни на чем не основанной, вере игроков в искренность взаимных обещаний.

132 Howard N. Paradoxes of rationality: Theory of Metagames and Political Behavior. Cambridge (Mass.), 1971. Р. 10, 48, 180—181.

330

331

Третье «поражение» рациональности заключается в том, что игра «Петухи» подрывает постулат рациональности классической теории игр, согласно которому стратегия, приводящая к абсолютному выигрышу, всегда рациональная. Если оба игрока в данной игре пожелают выиграть во что бы то ни стало, т.е. не сворачивать ни при каких обстоятельствах, им обоим как минимум грозит тяжелое увечье. Поэтому более мудр тот, кто в этой автомобильной дуэли поступит не рационально, а наоборот, иррационально, т.е. свернет первым и не станет рисковать своей жизнью и жизнью своего соперника.

Перечисленные «поражения» рациональности классической теории игр свидетельствуют, конечно, не столько об опровержении рациональности как таковой, сколько об узости критериев рационального поведения классической теории игр. Их главный недостаток — исключительная вера в индивидуальную рациональность и, как следствие, игнорирование выбора игроками стратегий, основанных на нормах групповой рациональности.

Н. Ховард первым связал рациональность поведения игроков не с их умением вычислять лучший для себя ожидаемый исход в некоторой фиксированной ситуации, а со способностью игроков максимизировать свою выгоду, основанную на способности игроков предвидеть кооперативные стратегии и контрстратегии друг друга. Действительно, если все игроки обладают способностью предвидеть еще до начала игры возможные стратегии друг друга, а также возможные контрстратегии на свои собственные стратегии, тогда им очень легко вычислить, как совместными усилиями можно избежать всеобщей конфронтации и достигнуть одновременно лучшего для всех исхода.

Стоит отметить, что созданию теории метаигр способствовали потребности научного обоснования эффективных стратегий проведения консультаций и переговоров, более глубокого объяснения причин иррационального поведения игроков в конфликте. Конфликт меньше всего располагает его участников к бесстрастному обсуждению­ возникшей проблемы. Эмоции, иррациональные действия, обман­ , неверие, угрозы и обещания существен-

ным образом влияют на изменение предпочтений и тем самым на поведение игроков в конфликте. Теория метаигр была первой теорией, признавшей важность изучения субъективной составляющей конфликта, объяснения причин искажения информации и предвзятости игроков. Соответственно в теории метаигр был сделан акцент на обосновании возможности объективного разрешения конфликтов с любой степенью субъективности поведения игроков. Все это в конечном счете способствовало трансформации теории метаигр в 90-е годы прошлого века в два научных направления — теорию анализа конфликтов и теорию драмы, ставших для современной конфликтологии источником новейших методов исследования.

Понятие метаигры и теории метаигр

Главная отличительная черта анализа конфликтов в терминах метаигр — понятие горизонта предвидения игроками стратегий и контрстратегий друг друга. Неформально оно означает расширение обычной игры за счет увеличения степени глубины рефлексии игроков. Рефлексия игроков измеряется их способностью оценивать контрдействия друг друга в ответ на собственные действия. Каждая ступень рефлексии — расширение начальной игры до определенного уровня глубины. «Метаигра — игра, которая возникает, когда один из игроков выбирает свою стратегию после других, зная их выборы»133.

Метаигра — расширение обычной игры за счет увеличения горизонта предвидения (глубины рефлексии) игроков на любую заданную величину.

Пусть h 0 обозначает горизонт предвидения. Тогда для любой обычной игры можно построить иерархию метаигр, отличающихся друг от друга величиной горизонта предвидения.

133 Howard N. Paradoxes of rationality: Theory of Metagames and Political Behavior. Cambridge (Mass.), 1971. Р. 23.

332

333

h = 0. Знание своих возможных ходов и возможных ходов своих соперников (метаигра 0-го уровня). Уровень игры в обычном смысле.

h = 1. Знание своих возможных ходов, возможных ходов и контрходов своих соперников на каждое свое действие (мета­ игра 1-го уровня).

h = 2. Знание своих возможных ходов, возможных ходов и контрходов своих соперников на каждое свое действие и собственных возможных контрходов на каждый контрход противника (метаигра 2-го уровня).

Н. Ховард доказал, что метаигра с горизонтом предвидения, равным общему числу игроков, содержит исчерпывающую информацию о всех возможных способах решения игры, включая и кооперативные, и более не зависит от увеличения глубины рефлексии134. Следовательно, понятие метаигры более точно можно определить как расширение горизонта предвидения игроков знанием взаимных ходов и контрходов глубиной рефлексии, превышающей по своей величине нулевой уровень (уровень исходной игры).

Метаигра — конфликт, в котором каждый игрок исходит из своего предположения о ходах и контрходах других игроков, глубина рефлексии которого превышает нулевой уровень.

Метазнание, получаемое при расширении обычной игры до метаигры, уровень рефлексии которой хотя бы для одного игрока больше нуля, обладает следующими особенностями.

Во-первых, метазнание более объективно, чем знание, имеющееся у игроков в игре нулевого уровня и во всех метаиграх,

134 См.: Howard N. Paradoxes of rationality:Theory of Metagames and Political Behavior. Cambridge (Mass.), 1971. Р. 83—108.

если таковые имеются, меньшего уровня. Под объективной рациональностью здесь понимается нахождение всех исходов, максимально выгодных для всех игроков.

«Объективная рациональность достигается, — отмечает Найджел Ховард, — при получении игроками всей необходимой информации. Для каждого игрока k это означает знание решений всех других игроков. Но это представляет именно ту информацию, которую он получает в k-метаигре. Следовательно, нам следует исследовать эту k-метаигру, чтобы достигнуть необходимого уровня объективной рациональ­ ­но­ сти»135.

Во-вторых, метазнание позволяет идентифицировать максимально возможное число стабильных решений исходной игры. Это означает, что если метаигра достигла расширения, равного общему числу игроков, никаких новых решений исходного конфликта, в принципе, не может появиться. Таким образом, критерий рациональности метаигр является самым универсальным, включающим результаты всех остальных, включая Дж. фон Неймана и О. Моргенштерна, Дж. Нэша.

В-третьих, метазнание, получаемое в процессе построения метаигры, представляет знание, возникающее до реального совершения игроками своих ходов. Значит, игроки могут обсудить разные способы решения конфликта, образовать коалиции, узнать об угрозах и обещаниях другу друга.

В-четвертых, форма, в которой выступает метазнание, носит характер предположений и ожиданий; содержание — обещания и угрозы (санкции)136.

В-пятых, для моделирования метаигр используется особый метод, названный Найджелом Ховардом таблицей выборов.

135Howard N. Paradoxes of rationality: Theory of Metagames and Political Behavior. Cambridge (Mass.), 1971. Р. 27.

136Слово «санкция» в русском языке имеет два прямо противоположных значения: 1) одобрение какого-либо действия; 2) запрет какого-либо действия.

Втеории метаигр слово «санкция» употребляется во втором смысле.

334

335

В-шестых, для отражения связей между игроками, выборами, предпочтениями и исходами конфликта конструируется стратегическая карта конфликта.

Для лучшего понимания перечисленных особенностей метаигр введем определения основных понятий (табл. 2).

Таблица 2

Исход Оn представляет одностороннее улучшение исхода Om для игрока Р, если

1)игрок Р предпочитает Оn исходу Om и

2)исход On достижим игроком Р из Оm в один ход.

Исход Оn представляет коалиционное улучшение исхода Om для множества игроков К, если

1)каждый игрок из К предпочитает Оn исходу Om и

2)исход On достижим игроками К из Оm в один ход.

Санкция (угроза) для игрока Р — исход Оm, которого он может достигнуть в результате контрдействий одного игрока или коалиции игроков К из исхода Оn и полезность которого для Р меньше или равна полезности Оn, Om On.

Исход Оn называется убедительной (заслуживающей доверия) санкцией, если для осуществляющего ее игрока Р или коалиции игроков К полезность этого исхода не противоречит их собственным предпочтениям. В противном слу-

чае санкция Оn считается неубедительной (не заслуживающей доверия).

Обещание для игрока Р — исход Om, которого он может достигнуть в результате контрдействий одного игрока или коалиции игроков К из исхода Оn и полезность которого для Р больше полезности исхода Оn, Om > On.

Таблица 2 (окончание)

Исход Оn называется убедительным (заслуживающим до-

верия) обещанием, если для дающего его игрока Р или коалиции игроков К полезность этого исхода не противоречит их собственным предпочтениям. В противном случае обещание

Оn считается неубедительным (не заслуживающим доверия).

Исход Оn представляет гарантированное улучшение для игрока Р, если Оn — одностороннее или коалиционное улучшение, которое не имеет ни одной убедительной или неубедительной санкции.

Исход Оn метарационален для игрока Р в общем смыс-

ле, если и только если каждое одностороннее и коалиционное улучшение этого исхода имеет заслуживающую или не заслуживающую доверия санкцию.

Исход Оn метарационален для игрока Р в симметрич-

ном смысле, если и только если каждое одностороннее и коалиционное улучшение этого исхода имеет только заслуживающую доверия санкцию.

Исход Оn представляет стабильное метарешение игры,

если ни один игрок и никакая коалиция игроков не имеют из Оn гарантированного улучшения при горизонте предвидения, не меньшем общего числа игроков. В противном случае исход считается нестабильным.

Стратегическая карта конфликта — визуализиро-

ванное множество исходов игры с определенными на нем отношениями гарантированного улучшения и санкциониро­ вания.

336

337

Понятие санкции является ключевым в системе базисных понятий теории метаигр. Следующие два абстрактных примера поясняют смысл правдоподобной и неубедительной санкций игрока В против игрока А (рис. 10 и 11).

 

 

2

платежи

3

 

 

игрока В

 

 

 

 

исход

А

исход

В

исход

№ 1

 

№ 2

 

№ 3

2

платежи

3

платежи

1

игрока А

игрока А

 

 

 

Рис. 10. Пример убедительной санкции игрока В против игрока А

 

 

3

платежи

2

 

 

игрока В

 

 

 

 

исход

А

исход

В

исход

№ 1

 

№ 2

 

№ 3

2

платежи

3

платежи

1

игрока А

игрока А

 

 

 

Рис. 11. Пример неубедительной санкции игрока В против игрока А

По определению один игрок санкционирует какой-либо ход другого игрока, если он своим ходом приводит этого игрока к исходу с меньшей или равной полезностью. Причем игрок, осуществляющий санкцию, может поступить двояким образом: 1) в соответствии с собственными предпочтениями и 2) против

собственных предпочтений. В первом случае санкция считается убедительной, так как увеличивает личную выгоду игрока. Во втором случае санкцию называют неубедительной, ибо она уменьшает личную выгоду осуществляющего ее игрока.

На рис. 10 и 11 полезность исхода № 3 для игрока А меньше полезности исхода № 1. Иными словами, исход № 3 для него представляет санкцию. Но на рис. 10 эта санкция правдоподобна, так как движение игрока В к исходу № 3 совпадает с его предпочтениями (полезность исхода № 3 для него больше полезности исхода № 2). На рис. 11 эта санкция неубедительна, так как несовместима с его предпочтениями.

На первый взгляд может показаться, что неубедительные обещания и санкции не представляют практического интереса и их можно игнорировать в практических расчетах. Однако это неверно по следующим причинам.

Во-первых, они открывают путь к пониманию роли эмоций, иррациональностей, изменения предпочтений, обмана и недоверия в поведении игроков. Несмотря на то что все эти факторы игнорируются классической теорией игр, так как допускают возможность изменения состава игроков, их предпочтений и исходов игры, они составляют существенную часть игр, происходящих в реальной жизни137.

Во-вторых, в действительности существует много ситуаций, в которых игрок может сознательно пойти на временное или постоянное ухудшение собственной позиции, т.е. против собственных предпочтений, чтобы поставить своего соперника в положение

137 Н. Ховард приводит следующий шуточный пример, поясняющий эту мысль. «Через некоторое время после начала очередной партии в шахматы муж гордо объявляет жене, что она опять проиграла. На вопрос жены, какие

унего основания для столь безапелляционного заявления, муж объясняет, что

унее осталось только два хода, и после любого из них она получает мат. Раздраженная очередным проигрышем, безвыходностью положения и обиженная высокомерием мужа, жена резко возражает: у нее имеется и третий ход. На удивленный вопрос мужа, какой именно, жена поднимает доску с шахматными фигурами и бросает ее ему в лицо» (см.: Howard N. What is Drama Theory? // Cooperation — or Conflict. 1988. Vol. 12. № 1 (electronic research letter)).

338

339