Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

1svetlov_v_a_vvedenie_v_konfliktologiyu

.pdf
Скачиваний:
227
Добавлен:
29.10.2019
Размер:
4.64 Mб
Скачать

Ответы на указанные вопросы позволяют установить основные элементы игры — игроков, доступные им ходы (выборы), стратегии, исходы, предпочтения и платежи (определения приведены ниже).

Игроки участники конфликта. Могут быть как индивидуальными, так и коллективными (коалиционными). Игроков должно быть не менее двух (конфликт с одним игроком принято называть игрой с природой).

Ходы (выборы) действия игроков, которые они могут совершить или не совершить по условиям игры для разрешения конфликта.

Стратегии наборы последовательностей действий по одному для каждого игрока. Стратегии должны взаимно исключать друг друга и совместно исчерпывать множество всех возможных комбинаций действий всех участников конфликта. Если условия игры позволяют всем игрокам вместе совершить k ходов, значит, в данной игре имеется 2k стратегий.

Исходы — результаты осуществления стратегий, т.е. определенные способы разрешения конфликта. Число исходов находится во взаимно-однозначном соответствии с числом стратегий игроков в данной­ игре.

Предпочтения упорядочение каждым игроком исходов конфликта в соответствии со своими интересами от наилучшего до наихудшего.

Платежи значения полезности исходов­ для игроков. Делятся на количественные, основанные на объективном измерении в какой-либо системе единиц, и порядковые, основанные на субъективном упорядочении (предпочтении) игроками исходов игры.

Стабильный исход — исход, представляющий точку равновесия интересов всех игроков (решение игры).

Прокомментируем понятие стабильного исхода и понятие количественных и порядковых полезностей.

Нобелевский лауреат, специалист по поведению животных Конрад Лоренц так описывает роль точек равновесия в поведении животных, защищающих свою территорию. «С приближением к центру области обитания агрессивность возрастает в геометрической прогрессии. ...Поэтому если у территориальных животных... известны центральные точки двух подравшихся хозяев, то исходя из места их схватки можно наверняка предсказать ее исход: при прочих равных условиях победит тот, кто в данный момент находится ближе к своему дому. Когда же побежденный обращается в бегство, инерция реакций обоих животных приводит к явлению, происходящему во всех саморегулирующихся системах с торможением, а именно к колебаниям. У преследуемого по мере приближения к его штаб-квартире вновь появляется мужество, а преследователь, проникнув на вражескую территорию, мужество теряет. В результате беглец вдруг разворачивается и столь же внезапно, сколь энергично нападает на недавнего победителя, которого, как можно было предвидеть, теперь бьет и прогоняет. Все это повторяется еще несколько раз, и в конце концов бойцы останавливаются у вполне определенной точки равновесия, где они лишь угрожают друг другу, но не нападают»122.

Различие между количественными и порядковыми полезностями основано на том, что согласно первым мы их измеряем (квантифицируем) в некоторой системе единиц, согласно вторым — только упорядочиваем от большей полезности к меньшей или наоборот.

Использование количественных полезностей основано на допущении­ возможности их объективного измерения — в физических, денежных и иных единицах. Однако не каждое социальное явление допускает количественную квантификацию

122 Лоренц К. Агрессия. Так называемое зло. СПб.: Амфора, 2001. С. 53.

300

301

и не всякое квантифицированное социальное явление может быть признано объективным в общепринятом смысле. Один человек способен оценить предмет своей любви в денежных единицах, для другого сама идея подобной оценки лишена всякого смысла. Тюремное заключение сроком на один год одному человеку кажется незначительной и легкопереживаемой неприятностью, другому — потерей всей жизни. Даже если допустить, что все социальные факты будут когда-нибудь квантифицированы, люди будут продолжать действовать на основании своих личных оценок, т.е. субъективных предпочтений. Поэтому отображение и анализ этой неустранимой субъективной стороны любого вида человеческой деятельности, любого акта поведения отдельного человека или социальной группы лучше проводить в терминах не количественных, а порядковых полезностей.

Порядковые полезности требуют от субъекта только способности упорядочивать исходы конфликта по степени ценности для себя. Если, допустим, конфликт имеет четыре исхода, значит, каждый его субъект может упорядочить их от наименее худшего для себя до наиболее лучшего для себя (или наоборот) в соответствии со своими интересами в данной игре. При этом некоторые исходы он может определить для себя равнопредпочтительными. Таким образом, в порядковых полезностях символизируется субъективная составляющая поведения игроков в конфликте.

Существует два основных способа формальных ответов на вопросы, определяющих главные элементы игры, — экстенсивный и нормальный (стратегический). В экстенсивной форме игра символизируется в виде дерева, в нормальной — в виде матрицы. Первый способ наиболее предпочтителен при анализе игр, в которых игроки совершают свои ходы последовательно, один за другим. Второй способ удобен для анализа игр с одновременными и независимыми ходами игроков. Поскольку только такие игры рассматриваются в настоящем введении, матричному представлению отдано предпочтение.

Формализация конфликтов в терминах классической теории игр

Вернемся к басне И.А. Крылова «Демьянова уха». Чтобы ее сюжет представить в виде игры, следует прежде всего ответить на приведенные выше вопросы.

Игроки: Демьян (хозяин), Фока (сосед).

Действия Демьяна: Угощать соседа ухой (Д1), прекратить

угощение (Д2).

Действия Фоки: Не отказываться от угощения (Ф1), отказаться от угощения (сбежать) (Ф2).

Стратегии игроков: (Д1Ф1) = «Демьян угощает, Фока не отказывается от угощения», (Д1Ф2) = «Демьян угощает, Фока отказывается от угощения», (Д2Ф1) = «Демьян прекращает угощение, Фока не отказывается от угощения» и (Д2Ф2) = «Демьян прекращает угощение, Фока отказывается от угощения».

Каждая стратегия приводит к определенному исходу. Формально, число исходов должно соответствовать числу стратегий.

Исходы игры: (№ 1) = «Застолье продолжается по совместному согласию Демьяна и Фоки»; (№ 2) = «Застолье прекращается по инициативе Фоки»; (№ 3) = «Застолье прекращается по инициативе Демьяна»; (№ 4) = «Застолье прекращается по обоюдному согласию Демьяна и Фоки».

Порядок игры: Демьян и Фока принимают свои решения о продолжении (прекращении) застолья независимо друг от друга.

Вид полезностей: Порядковый. Примем допущение, что число 4 символизирует наибольший вес платежа, число 1 — наименьший.

Предпочтения игроков: Для Демьяна лучше угощать соседа, чем не угощать. Следовательно, полезность исходов № 1 и № 2, в которых он угощает, для него выше полезности исходов № 3 и № 4, в которых он не угощает. Среди исходов № 1 и № 2 для него как гостеприимного хозяина, более предпочтителен исход

1 (гостеприимство Демьяна подтверждается), чем исход № 2 (гостеприимство Демьяна не подтверждается). Среди исходов

3 и № 4 для Демьяна более предпочтителен исход № 3 (госте-

302

303

приимство Демьяна востребовано), чем исход № 4 (гостеприимство Демьяна не востребовано).

Для Фоки лучше всего самому прекратить затянувшееся застолье, чем его продолжать. Поэтому для него исходы № 2 и № 4 более предпочтительны, чем исходы № 1 и № 3. Среди исходов № 2 и № 4 для Фоки более предпочтителен исход № 2 (так как страдания Фоки достигли предела), чем исход № 4 (Фока не страдает от гостеприимства Демьяна). Среди исходов № 1 и № 3 для Фоки более предпочтителен исход № 3 (Демьян исходя из здравого смысла сам прекращает трапезу), чем исход № 1 (Демьян, несмотря ни на что, не прекращает угощать Фоку).

Исходя из сказанного, вектор предпочтений Демьяна равен: № 1 > № 2 > № 3 > № 4.

Вектор предпочтений Фоки равен: № 2 > № 4 > № 3 > № 1.

Всю полученную информацию о рассматриваемой игре можно компактно представить в виде платежной матрицы, в которой колонки, образованные первыми числами, характеризуют стратегии, исходы (их нумерация одна и та же для всех игр с двумя игроками) и платежи игрока «Демьян», а строки, образованные вторыми числами, характеризуют стратегии, исходы и платежи игрока «Фока» (рис. 1).

 

Фока

 

 

№ 1

Ф1

Ф2

№ 2

Д1

4,1

3,4

 

Демьян

 

 

 

Д2

2,2

1,3

 

№ 3

 

 

№ 4

Рис. 1. Платежная матрица игры «Демьянова уха»

Из платежной матрицы на рис. 1 следует, что игрок «Демьян» может делать выбор между доступными ему действиями, перемещаясь «вверх-вниз» по вертикальным ячейкам матрицы; игрок «Фока» — делать выбор между своими действиями, перемещаясь «вправо-влево» по горизонтальным ячейкам матрицы. В распоряжении игрока «Демьян» находятся колонки, образованные первыми числами, а игрока «Фока» — строки, образованные вторыми числами платежной матрицы.

4.3.Критерий рациональности Джона фон Неймана

иОскара Моргенштерна

Первый критерий рациональности классической теории игр

Классическую теорию игр можно представить в виде множества математических следствий двух лежащих в ее основе критериев рациональности. Первый из них связан с именами американского математика Джона фон Неймана и американского экономиста Оскара Моргенштерна. Второй критерий рациональности носит имя американского математика Джона Нэша и анализируется в следующем параграфе.

В классической теории игр предполагается, что всем игрокам, участвующим в одной игре, полностью известны действия, стратегии друг друга и платежи соответствующих исходов.

Так как исходы игры имеют, как правило, разные платежи, то игроки ставят своей целью выбрать такую стратегию, которая гарантирует им наибольший выигрыш при любых стратегиях своих противников. Иными словами, целью игры является максимизация каждым игроком своей выгоды. Но, будучи рациональными, игроки также осознают, что их противники никогда не предоставят им возможность получить максимальный выигрыш. Единственное, на что им можно рассчитывать как рациональным существам, — это возможность выбора лучших вариантов из худших.

304

305

Из сказанного следует первый критерий рациональности классической теории игр.

Критерий рациональности Джона фон Неймана и Оскара Моргенштерна — рациональны все стратегии, чьи исходы являются лучшими из худших, предоставленных игроку его соперниками.

Решение конфликта стабильно, если каждый игрок ра-

ционален.

В качестве иллюстрации применения критерия рациональности Дж. фон Неймана и О. Моргенштерна рассмотрим игру «Показываем пальцы», в которой выигрыш одного игрока точно равен проигрышу другого. Такие конфликты принято называть играми с нулевой суммой, или антагонистическими играми. Отметим, что игра «Демьянова уха» не является антагонистической, так как выигрыш (проигрыш) игрока «Демьян» не равен проигрышу (выигрышу) игрока «Фока» (ни в одной ячейке матрицы данной игры сумма платежей игроков не равна нулю).

Два игрока, А и В, одновременно показывают друг другу один или два пальца. Если число показываемых пальцев оказывается равным, то никто не выигрывает и соответственно никто не проигрывает (оба игрока выигрывают и проигрывают ноль рублей). Если какой-то игрок показывает большее число пальцев, то он выигрывает два рубля, а другой соответственно эту же сумму проигрывает. Обоим игрокам известны ходы, стратегии и платежи друг друга, и цель каждого из них заключается в том, чтобы выбрать такую стратегию, которая принесет ему наибольший выигрыш независимо от действий своего противника.

Возможные ходы игрока А: А1 = «А показывает один палец»; А2 = «А показывает два пальца».

Возможные ходы игрока В: B1 = «B показывает­ один палец»; В2 = «В показывает два пальца».

Каждый игрок может совершить любой из двух доступных ему ходов. Следовательно, в рассматриваемой игре имеется четыре стратегии и четыре соответствующих им исхода (с указанием суммарного выигрыша, называемого ценой игры):

A1B1 = «А и В оба показывают по одному пальцу»; = А выигрывает 0 рублей, В проигрывает 0 рублей; = 0 + 0 = 0.

A1B2 = «А показывает один палец, В — два пальца»; = А проигрывает 2 рубля, В выигрывает 2 рубля; = 2 + 2 = 0.

A2B1 = «А показывает два пальца, В — один палец»; = А выигрывает 2 рубля, В проигрывает 2 рубля; = 2 + (2) = 0.

A2B2 = «А и В оба показывают по два пальца»;

= А проигрывает 0 рублей, В выигрывает 0 рублей; = 0 + 0 = 0.

Из приведенных вычислений следует, что для каждого исхода сумма выигрышей (проигрышей) обоих игроков равна нулю. Значит, ни один из игроков не имеет гарантированного выигрыша (проигрыша). По этой причине игры с нулевой суммой часто называют безобидными играми.

Платежная матрица игры изображена на рис. 2.

 

игрок В

 

В1

В2

А1

0, 0

2, 2

Игрок А

 

 

 

 

А2

2, 2

0, 0

 

 

 

Рис. 2. Платежная матрица игры «Показываем пальцы» первого вида

306

307

Рассматриваемая игра представляет игру с нулевой суммой. По этой причине платежную матрицу на рис. 2 можно представить иначе, как это изображено на рис. 3. В этой матрице положительные значения платежей обозначают выигрыши игрока А, а отрицательные — игрока В. Нетрудно убедиться, что обе матрицы эквивалентные и поэтому взаимозаменяемые.

 

игрок В

 

В1

В2

А1

 

 

0

2

Игрок А

 

 

 

 

А2

2

0

 

 

 

Рис. 3. Платежная матрица игры «Показываем пальцы» второго вида

Векторы выигрышей игрока А и проигрышей игрока В совпадают и равны без повторения (2, 0, 2). Какие стратегии должны выбрать игроки А и В, чтобы каждый из них мог получить максимальный выигрыш? При ответе на этот вопрос следует учитывать, что обоим игрокам известны стратегии, исходы и платежи друг друга, что максимизация своей выгоды является для каждого из игроков самым разумным мотивом поведения.

Подчиняясь указанному мотиву как игрок А, так и игрок В хотели бы получить максимально возможный выигрыш, равный двум рублям. Но из-за антагонизма интересов оба игрока обречены на асимметричное противодействие друг другу: максимизация выигрыша одного из них неизбежно влечет минимизацию выигрыша (максимизацию проигрыша) другого. Поэтому А и В как действительно рациональным существам остается действовать согласно следующим­ соображениям.

Игрок А знает, что игрок В может получить максимальный выигрыш, а сам он максимальный проигрыш в случае осущест-

вления стратегии A1B2. Чтобы не допустить этого, А должен исключить из набора своих возможных действий ход А1, а вместе с ним такие стратегии, как A1B1 и A1B2. Это означает, что А оставляет за В право делать выбор только между стратегиями A2B1 и

А2В2.

Аналогично рассуждает и игрок В. Так как А может получить максимальный выигрыш, а сам он максимальный проигрыш в случае реализации стратегии A2B1, то В исключает из списка своих возможных действий ход В1, а вместе с ним такие стратегии, как A1B1 и A2B1. Следовательно­ , В оставляет за А право выбирать только между стратегиями­ A1B2 и А2В2.

В итоге оба игрока, не желая допустить максималь­ного проигрыша, исключают из четырех возможных стратегий следующие три: A1B1, A1B2 и A2B1. Единственным рациональным исходом, защищающим обоих игроков от максимального проигрыша, является А2В2. Его рациональность состоит в том, что он в равной мере удовлетворяет осторожным предпочтениям обоих игроков: игрок А получает максимальный выигрыш из минимально возможных, игрок В — минимальный проигрыш из максимально возможных. Первую стратегию и удовлетворяющие ей исходы принято называть максимином; вторую стратегию и соответствующие ей исходы — минимаксом.

Максимин стратегия игрока, обеспечивающая ему максимальный выигрыш среди минимально возможных.

Минимакс — стратегия поведения игрока, гарантирующая ему минимальный проигрыш среди максимально возможных.

Решение игры (точка стабильности) — исход, для ко-

торого максимин и минимакс соперничающих игроков совпа­ дают.

Цена игры — полезность исхода, символизирующего решение игры.

308

309

Врассматриваемой игре область пересечения максимина

иминимакса игроков А и В состоит из одного исхода — А2В2. Значит, данная игра имеет единственное рациональное решение (одну точку стабильности). В рассматриваемой игре область пересечения максимина и минимакса игроков А и В состоит из

одного исхода — А2В2. Значит, данная игра имеет единственное рациональное решение (одну точку стабильности). В рассматриваемой игре область пересечения максимина и минимакса

игроков А и В состоит из одного исхода — А2В2. Значит, данная игра имеет единственное рациональное решение (одну точку стабильности). Игрок А знает, что игрок В не даст ему получить максимальный выигрыш. Поэтому А сознательно ограничивает вектор своих выигрышей с (2, 0, 2) до (2, 0). Пусть min A = (2, 0) обозначает вектор минимальных выигрышей для А. Из них А как разумный человек предпочтет выигрыш 0 в качестве наибольшего. Тогда maxmin A = 0 обозначает максимальный выигрыш среди минимальных, которые А может получить в данной игре. Таким образом, с помощью стратегии максимина игрок А устанавливает для себя односторонний нижний уровень цены игры.

Аналогично рассуждает игрок В. Так как он осознает, что игрок А не даст ему получить минимальный проигрыш (максимальный выигрыш), то В разумно ограничивает вектор своих проигрышей с (2, 0, 2) до (0, 2). Пусть max В = (0, 2) обозначает вектор максимальных проигрышей для В. Из них В как рациональный человек предпочтет выигрыш 0 в качестве наименьшего для себя. Тогда minmax В = 0 обозначает минимальный проигрыш среди максимальных, которые В может получить в данной игре. Иными словами, с помощью стратегии минимакса игрок В ограничивает для А верхний уровень игры.

Из сказанного следует, что в рассматриваемой игре истинно равенство­ максиминной и минимаксной стратегий игроков

Аи В:

maxmin A = minmax В.

(1)

Изменится ли что-нибудь радикально в данном равенстве, если игроков А и В поменять местами? Свой вектор проигрышей (2, 0, 2) игрок А сознательно ограничивает до вектора (0, 2), из которого выигрыш 0 он выбирает как минимальный. Следовательно, истинно minmax А = 0. Свой вектор выигрышей (2, 0, 2) игрок В разумно ограничивает до вектора (2, 0), из которого он предпочитает 0 как максимальный. Следовательно, истинно maxmin В = 0, а также равенство

minmax A = maxmin В.

(2)

Приравнивая равенства 1) и 2) друг к другу, получаем­ общее утверждение:

maxmin A = minmax В = minmax A = maxmin B.

(3)

Равенство (3) выражает полную симметрию предпочтений игро­ков А и В в рассматриваемой игре относительно исхода А2В2. Для каждого игрока данный исход становится в одинаковой степени максимальным выигрышем среди минимальных и одновременно минимальным­ проигрышем среди максимальных. Никакой другой исход такими свойствами не обладает. Мы будем говорить, что исход А2В2 является рациональным, стабильным как для А, так и для В, ибо ни тот ни другой не обладают ни одной стратегией, позволяющей им получить в одностороннем порядке более лучший исход, чем данный.

Равенство (3) является частным случаем (нестрогого) неравенства

minmax В maxmin A,

(4)

характеризующего общее соотношение минимаксной и максиминной стратегий для игры двух лиц с нулевой суммой: нель-

310

311

зя выиграть больше, чем проиграет твой противник, но всегда можно проиграть больше (например, из-за неверных расчетов своих действий и действий своего соперника).

Дж. фон Нейманом и О. Моргенштерном было доказано, что игра двух лиц с нулевой суммой имеет решение (точку равновесия) тогда и только тогда, когда истинно равенство (3), т.е. когда максимальный выигрыш одного игрока совпадает с минимальным выигрышем другого123.

Для быстрого поиска maxmin и minmax обычно используют следующий прием. В платежной матрице игры напротив каждой строки выписываются минимальные значения игрока А (минимумы по строкам). Под каждой колонкой (столбцом) указываются максимальные значения проигрыша игрока В (максимумы по столбцам). И если найдется хотя бы одно число, минимальное в какой-либо строке и одновременно максимальное в своей колонке, то именно оно и представляет решение данной игры, т.е. ее точку равновесия. В игре «Показываем пальцы» — это обведенное число 0 (рис. 4 и 5).

 

игрок В

 

 

 

В1

В2

min A

 

А1

 

 

 

maxmin А

0

2

2

 

Игрок А

 

 

0

 

 

 

 

А2

2

0

 

max B

 

 

 

 

2

0

 

minmax B

Рис. 4. Решение игры «Показываем пальцы» в терминах равенства minmax A = maxmin В.

123 Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведе-

ние. М.: Наука, 1970. С. 122—123.

 

игрок В

 

 

 

В1

В2

mах A

 

А1

 

 

 

minmax А

0

2

2

Игрок А

 

 

0

 

 

 

 

А2

–2

0

 

min B

 

 

 

maxmin B

–2

0

 

 

 

Рис. 5. Решение игры «Показываем пальцы» в терминах равенства maxmin A = minmax В

Трудности использования критерия Дж. фон Неймана и О. Моргенштерна в конфликтологическом исследовании

Игра «Показываем пальцы» представляет заведомо упрощенный пример конфликта, и его анализ служит исключительно методическим целям объяснения основных понятий и техники классической теории игр. Интуиция и опыт легко подсказывают, что в данной игре самой разумной стратегией­ для обоих игроков является показывание двух пальцев в каждом сеансе игры, т.е. исход А2В2. Однако не всегда опыт и интуиция так легко согласуются с результатами теоретического анализа. Именно­ это обстоятельство и стало одной из ведущих причин последу­ющей модернизации классической теории игр.

Итак, для классической теории игр рациональное решение игры — это исход, который представляет равенство максиминной и минимаксной стратегий для всех игроков.

Как очень скоро стало ясно, отождествление рациональности исходов­ , шире — рациональности поведения в конфликтной ситуации, с равенством максиминной и минимаксной стратегий в определенном выше виде является самым проблематичным ме-

312

313

стом в методологическом основании классической теории игр124. Проблематичность обусловлена тем обстоятельством, что выполнение равенства (3) всегда влечет стабильность соответствующих исходов, но обратное в общем неверно. Иными словами, могут существовать рациональные исходы, не идентифицируемые равенством максиминной и минимаксной стратегий.

Причина подобной асимметрии в том, что согласно равенству (3), игроки действуют так, что их предпочтения никаким образом не зависят от контрдействий их противников. Платой за такую политику становится чрезмерная осторожность в планировании своих стратегий: раз твои противники умны, могущественны и никогда не дадут тебе получить максимальный выигрыш, сам откажись от надежды­ его получить и сосредоточься на выборе лучших исходов из наихудших, которые тебя ожидают. Но во всех ли конфликтных си­туациях разумно вести себя именно таким образом? Опыт подсказывает, что не во всех. Если это так, тогда должны существовать иные формы рациональных исходов — кооперативные, основанные на сотрудничестве­ , для поиска и анализа которых максиминная и минимаксная стратегии должны быть соответствующим образом модернизированы и обобщены.

Рассмотрим следующую известную игру «Морская охота», которая­ поясняет последнее утверждение. Речь идет о двух кораблях, торговом­ и военном, принадлежащих воюющим государствам и подошедших­ в ходе своего плавания к противопо-

124 Многие аналитики подчеркивают, что рациональность, основанная на оценке­ противника в терминах минимаксной стратегии, — это всего лишь нижний предельный случай рационального поведения в конфликтных ситуациях. «Идея целесообразности поиска равновесных положений при разрешенииконфликтов,—отмечаетТомасЛ.Саати,—хорошоизвестнасреди специалистов по политическим наукам и дипломатов — ее им подсказывает­ интуиция. Политики инстинктивно выбирают лучший среди худших исходов в качестве отправной точки, с которой они начинают выработку­ кооперативной позиции. Принцип минимакса, теория игр и порядок­ согласования интересов сторон в кооперативных играх формализуют эту практику» (см.: Саати Т.Л. Математические модели конфликтных ситуаций. М., 1977. С. 113).

ложным берегам (западному­ и восточному) разделяющего их острова. Капитаны обоих ко­раблей должны принять решение, с северной или южной стороны им огибать остров, чтобы продолжить свой путь. При этом капитан торгового­ корабля стремится уклониться от столкновения с вражеским военным кораблем, а капитан последнего, наоборот, планирует такое столкновение­ . Платежная матрица игры «Морская охота», которая не имеет точек равновесия, изображена на рис. 6.

 

игрок В

 

 

В1

В2

min A

А1

 

 

 

1, 1

1, 1

1

Игрок А

 

 

 

 

 

 

А2

1, 1

1, 1

1

max B

 

 

 

1

1

 

Рис. 6. Платежная матрица игры «Морская охота»

В матрице на рис. 5: А = «торговый корабль», В = «вражеский воен­ный корабль»; A1 = «А огибает остров с северной стороны», А2 = «А огибает остров с южной стороны», В1 = «В огибает остров с северной стороны», В2 = «В огибает остров с южной стороны». Платежи указаны в условных единицах выполнения кораблями своих миссий. В данной игре имеют место следующие стратегии, исходы, платежи и цена игры (1 = «корабль выполняет свою профессиональную миссию»; 1 = «ко­ рабль не выполняет свою профессиональную миссию»):

А1В1 = «оба корабля огибают остров с северной стороны, торговый корабль гибнет и не выполняет своей миссии, военный корабль выполняет свою миссию»;

= 1 + 1 = 0.

314

315

А1В2 = «торговый корабль огибает остров с северной стороны, военный — с южной, торговый корабль избегает уничтожения и выполняет свою миссию, военный корабль не выполняет своей миссии»;

= 1 1 = 0.

А2В1 = «торговый корабль огибает остров с южной стороны, военный корабль — с северной, торговый корабль избегает уничтожения и выполняет свою миссию, военный корабль не выполняет своей миссии»;

= 1 1 = 0.

А2В2 = «оба корабля огибают остров с южной стороны, торговый корабль гибнет и не выполняет своей миссии, военный корабль выполняет свою миссию»;

= 1 + 1 = 0.

Цена игры «Морское сражение» равна нулю, значит, выигрыш одного из них равен проигрышу другого, и ни один из игроков не имеет одностороннего выигрыша или проигрыша.

Анализ платежной матрицы показывает, что если исходить из требования равенства максиминной и минимаксной стратегий, то ни один из четырех возможных исходов в данной игре не является рациональным. Иными словами, в данной игре не существует ни одного исхода, чья полезность максимальна в своей колонке и минимальна в своем ряду. Так как стратегии, исходы и платежи известны обоим игрокам, то А, зная предстоящий маршрут В, всегда выберет ему противоположный; В, зная маршрут А, наоборот, всегда выберет такой же. Но это означает, что согласно равенству (3) никакое разумное поведение в рассматриваемом конфликте невозможно. Получается, что его рациональное решение возможно только тогда, когда разумные игроки начнут вести себя неразумно.

До сих пор решения игр рассматривались в так называемых чистых стратегиях­ игроков, одна из которых обязательно приводит к решению конфликта. Однако не всякая игра двух лиц

снулевой суммой имеет решение в таких стратегиях. Поэтому было предложено при отсутствии­ решения в чистых стратегиях использовать их усредненный по вероятности вариант, который был назван смешанной стратегией. Дж. фон Нейман доказал в 1928 г. центральную теорему теории игр двух лиц

снулевой суммой, согласно которой любая игра двух лиц с нулевой суммой обязательно имеет решение в терминах смешанных стратегий125. Однако легко показать, что формально правильное решение данной игры в терминах смешанных стратегий не имеет практического значения в конфликтологическом смысле.

Пусть v обозначает цену игры, х — вероятность выбора

игроком А стратегии А1, (1 – х) вероятность выбора игроком А стратегии А2, у — вероятность выбора игроком стратегии В1, (1 у) вероятность выбора игроком В стратегии В2. Из матрицы на рис. 6 следует, что средний выигрыш А равен:

(1)х + (1 х) = v, если В выберет В1; х + (1)(1 х) = v, если В выберет В2.

Решая данные уравнения, получаем:

х + (1 х) = х + (1)(1 х); 2x + 1 = 2x 1;

2x = 1; x = 1/2.

v = (1)(1/2) + (1 1/2) = 0.

Полученный результат говорит, что если игрок А не имеет решения­ игры в терминах чистых стратегий, он может попы-

125 NeumannJ.Von.ZurTheoriederGesellschaftsspiele//MathematischeAnna- len.1928.Bd.100.S.295—320.(Английскийвариантданнойстатьи:NeumannJ. OntheTheoryofGamesofStrategy//ContributionstotheTheoryofGames.Prince­ ton, 1959. Vol. IV. P. 13—42.)

316

317

таться использо­вать «смесь» данных стратегий с вероятностью 1/2 в качестве весов.

Фактически это означает, что он может выбирать маршрут с помощью­ подбрасывания симметричной монеты. Полученная таким образом­ смешанная стратегия дает средний выигрыш 0 как при В1, так и при В2. Поскольку никакая другая смешанная стратегия не дает подобной­ гарантии, то игрок А получает смешанную максиминную стратегию (1/2, 1/2).

Аналогично и для игрока В. Из матрицы на рис. 26 следует, что средний выигрыш В равен:

(1)y + (1 y) = v, если A выберет A1. y + (1)(1 y) = v, если A выберет A2.

Решая эти уравнения, получаем, что у = 1/2 и v = 0. Игрок В также должен полагаться на смешанную стратегию (1/2, 1/2), которая в силу­ своей единственности и оптимальности является для него смешанной­ минимаксной стратегией.

Поскольку полученные смешанные стратегии гарантируют один и тот же выигрыш — 0, то рассматриваемая игра получает формальное­ решение. Но что оно означает? Во-первых, то, что игроки А и В, применяя против друг друга смешанные стратегии, получают не действительное­ (актуальное) решение игры, а только среднее в математическом смысле. Среднее­ — значит ожидаемое решение игры в течение ее многократного повторения. Причем чем большее число раз повторяется данная игра­ , тем ближе наблюдаемая в опыте величина суммарного выигрыша к своей средней величине, т.е. к нулю. Во-вторых, среднее решение игры говорит о том, что смешанные стратегии не устраняют случайный, непредсказуемый характер поведения игроков в данной конфликтной ситуации, а только придают ему некоторое количественное выражение.

Из сказанного следуют два практических возражения против разумности­ найденного решения в терминах смешанных

стратегий. Ни капитана торгового корабля, ни капитана военного корабля не интересует­ средний выигрыш в результате многократного повторения конфликтной ситуации. Торговый корабль погибнет при первом же столкновении с военным кораблем, и для него повторение конфликта­ станет уже невозможным событием. Капитан военного корабля также осознает уникальность­ ситуации: без особого риска для своего корабля у него появляется­ шанс уничтожить неприятельское тортовое судно. Поэтому с большой уверенностью можно предположить, что обоих капитанов интересует разрешение прежде всего данной, конкретной и, возмож­но, никогда более не повторимой конфликтной ситуации, участниками которой­ они оказались. Их также интересует разумное, основанное на определенных принципах и зависящее от их воли и знания разрешение конфликта. Однако максиминная и минимаксная стратегии в чистой­ или смешанной форме, не способны обеспечить такое разрешение. Они либо ничего не предлагают в качестве решения, либо предлагают­ статистическое решение, которое не учитывает уникальный характер­ многих конфликтов, так как предполагает, что игроки обладают­ достаточным запасом времени и терпения, чтобы настойчиво повторять­ одну и ту же игру.

Возможности классической теории игр для анализа конфликтов выглядят еще более проблематичными, если перейти от игр с нулевой суммой, т.е. антагонистических игр, к играм, в которых допускается в той или иной степени сотрудничество участников конфликта­ и суммарный выигрыш (цена) которых не равен нулю. Последний­ вид игр принято называть

играми с нестрогим соперничеством­ , кооперативными играми.

Нетрудно убедиться, что максиминная и минимаксная стратегии не позволяют в подобных играх различать кооперативные исходы — решения, представляющие результат возможного сотрудничества участников конфликта.

318

319