
1 СЕМЕСТР. Экономика. Микроэкономика. Поведение, институты и эволюция Самуэль Боулз / Микроэкономика. Поведение, институты и эволюция_Самуэль Боулз_2010 -576с
.pdf
Глава 5. Распределение выгод от сотрудничества: торг и погоня за рентой 169
Значение x, при котором максимизируется выражение, должно удовлетво рять условию первого порядка
v'(x) = V '(1 − x) ,
v(x) V (1 − x)
(5.1)
иэта величина x* есть решение Нэша в задаче торга. Равенство (5.1) показывает, что если функции полезности Верхнего и Нижнего совпадают (или одна есть линейное преобразование другой), то они поделят выигрыш поровну. Также и в случае (как вам станет ясно после решения задачи 13), если у них были бы разные функции полезности, то игрок, предельная полезность от награды которого убы вала бы быстрее, получил бы меньшую долю. Поэтому иногда говорят, что менее
склонный к риску игрок (с более вогнутой функцией полезности) получит мень ше. Но поведение игрока при его столкновении с риском не объясняет, почему
игрок с более вогнутой функцией полезности находится в худшем положении, так как определение x* не связано с риском в рамках модели торга по Нэшу.
Вприложениях к данному подходу обычно вводятся резервные варианты z
иZ. Традиционно резервный вариант определяют как полезность, которую они получат, если взаимодействие между игроками прекратится. Но некоторые вза имодействия длятся долго «к лучшему или к худшему»: вспомните о семейных парах, соседях и работе. В этих случаях логичнее рассматривать взаимодействие как кооперативное (согласие) и некооперативное (невозможность согласия) взаимодействия, а не в более стандартной интерпретации, т. е. кооперативное
взаимодействие или отсутствие взаимодействия вообще1. Термин «внешняя аль тернатива» применяется для традиционной интерпретации z и Z, в то время как z и Z являются «внутренними альтернативами», когда говорят о выигрыше при
некооперативном взаимодействии. Поскольку в последнем случае резервный вариант задается равновесием по Нэшу при некооперативном взаимодействии
и улучшения этого исхода по Парето можно достичь с помощью переговоров,
переговорное множество можно интерпретировать как выгоды от кооперации по сравнению с отсутствием кооперации. Решение Нэша — это один из способов
определить, как эти выгоды будут разделены2.
Также в приложениях часто учитывают различие в положении и возможно стях игроков, которые ведут к различиям в переговорной силе. Для этого требу ется избавиться от предположения Нэша о симметричности, чтобы построить
1Применение данной структуры торга к взаимоотношениям между членами семьи и
котношениям между рабочим и работодателем, рассмотренным далее в гл. 8, описывают работы Ландберга и Поллака (Lundberg & Pollak, 1993).
2 Если в резервном варианте отсутствует общий излишек (т. е. при некооперативном взаимодействии обе стороны получают только следующую наилучшую альтернативу), то вы годы от сотрудничества равны сумме организационных рент (или общему излишку). Однако, как мы увидим в гл. 8 и 9, выплаты при некооперативном исходе могут превысить доход при следующей наилучшей альтернативе для одной или более сторон. Организационные ренты, составляющие общий излишек, необязательно образуются при сотрудничестве, и их перераспределение необязательно определяется в процессе торга. Например, они могут об разовываться в качестве стимулов к взаимодействию без сотрудничества или распределяться в одностороннем порядке принципалом, как в модели принципал — агент (см. гл. 7—10).

170 Часть I. Координация и конфликт: базовые социальные взаимодействия
обобщенный торг Нэша. Если явно ввести резервные варианты z и Z, то распре деление (x, 1 - x) максимизирует обобщенное произведение Нэша ω(α), где
ω (α) = (v (x) - z)α(V (1 - x) - Z)1 - α.
Степень α [0, 1] (равная 1/2 в симметричном случае) иногда называют пере говорной силой Нижнего. Распределение, которое максимизирует это выраже ние (для α [0, 1]), таково, что распределение полезностей Нижнего и Верхнего удовлетворяет условию первого порядка
αv′ |
= |
(1 − α)V ′ . |
|
(v − z) |
|||
|
(V −Z) |
Упрощение сделает результат более понятным. Пусть полезности игроков линейны по выигрышу, т. е. v = x и V = (1 - x). Игроки делят выигрыш единич ной ценности, тогда общий излишек равен 1 - (z + Z). Упрощая приведенное выше условие первого порядка и решая относительно x*, мы получаем полез ность Нижнего. Я обозначаю за vn, где верхний индекс n означает решение торга по Нэшу (а не равновесие в случае некооперативного взаимодействия, обозна чаемое N). Тогда получаем:
vn = z + α (1 - (z + Z)) = (1 - α) z + α (1 - Z). |
(5.2) |
Полезность Нижнего равняется его резервному варианту (z) плюс доля α его общего излишка. Из второго условия понятно, что, обладай Нижний всей пере говорной силой (α = 1), он бы получил 1 - Z (а именно свой резервный вариант плюс общий излишек), при отсутствии же переговорной силы — z.
Решение Нэша описывает результирующие распределения достаточно про сто и соответствует интуитивным представлениям. Например, из него следует, что резервный вариант одного игрока повлияет на исход, и расклад 50 : 50 станет вероятным исходом для игроков, находящихся в похожих условиях. Учитывая важность норм справедливости в реальных ситуациях торга, подход Нэша обла дает следующим достоинством: он явно нормативный. Правда, подход Нэша не
согласуется с интуитивными представлениями большинства о справедливости. Недостатки состоят в построении: Нэш хотел описать хороший исход; он не
собирался строить реальную модель осуществления процесса переговоров. В ре зультате торг в модели Нэша всегда осуществляется; никто никогда не получает резервный вариант (если, конечно, не обладает нулевой переговорной силой). Та кое нереалистичное условие было введено изначально: в аксиомах Нэша требует ся, чтобы исход лежал на границе Парето. Также важно, что переговорная сила просто вводится экзогенно (с предположением симметрии α = 1 - α = 1/2), а сам процесс торга — с угрозами, предложениями и контругрозами — отсутствует.
эндогенно заданная переговорная сила в модели торга с чередующимися предложениями
Модель чередующихся предложений, как и гласит ее название, рассматривает проблему переговорной силы, явно моделируя процесс торга, в результате из

Глава 5. Распределение выгод от сотрудничества: торг и погоня за рентой 171
меняя подход Нэша1. Ученый выяснял, какой исход будет совместим с набором аксиом общественного благосостояния, выражающих понятие коллективной рациональности, не интересуясь при этом, почему игроки могут прийти к та
кому исходу. Модель чередующихся предложений, напротив, описывает процесс торга как последовательность предложений и контрпредложений, подчиняю
щихся явно заданному набору правил, и задается вопросом, какой исход будет совместим с аксиомами индивидуальной рациональности. В модели нет норма
тивной оценки исхода. В подходе охвачены две особенности осуществления пе реговоров в реальном мире. Вопервых, процесс торга занимает много времени, и задержка включает определенные затраты изза нетерпеливости игрока, риска провала, упущенных возможностей и других причин. Вовторых, сторона, для которой эти затраты меньше, обладает бо2льшей переговорной силой и получает бо2льшую долю. Таким образом, переговорная сила появляется от возможности выигрывать от затрат, перекладываемых на других.
Если модель Нэша соответствует случаю, когда два рыбака просто наняли арбитра, который решал бы за них проблему, то в модели чередующихся предло жений Верхний и Нижний выбирают исход сами в соответствии с набором пра вил торга. Эти правила утверждают, что сторона, называемая «первым игроком» (делающим первый ход), делает предложение другой и если та его принимает, то взаимодействие на этом заканчивается. Если она отказывается от предложе ния, то оба игрока получают резервную выплату z и Z в течение этого периода. В соответствии с нашей интерпретацией резервного варианта как выплаты в некооперативной игре это означает, что, отказываясь от каждого предложения (в каждом периоде), игроки взаимодействуют некооперативно и получают z и Z (представьте себе группу рабочих и работодателя, продолжающих работать без контракта, пока ведутся переговоры). Если на предложение первого игро ка получен отказ, проходит определенное количество времени D и затем второй игрок делает контрпредложение. Процесс продолжается бесконечное количе ство времени, пока предложение не будет принято. Наряду с этими правилами важными детерминантами исхода станут коэффициенты дисконтирования, по казывающие меру терпения Верхнего и Нижнего: обозначаем их как δu и δl со ответственно2.
Важно, что эта игра обладает единственным равновесным исходом. Я не стану приводить доказательство — смотрите работу Озборна и Рубинштейна (Osborne
1 Иногда его называют подходом некооперативного взаимодействия противопоставлен ного кооперативному подходу Нэша. Но поскольку в модели чередующихся предложений, как и в модели Нэша, стороны могут без затрат ввести соглашение, к которому они придут, то такое различие отвлекает от реальных отличий в подходах. Таковыми являются индивиду альное поведение, направленное на оптимизацию, в модели чередующихся предложений и
коллективная рациональность в подходе Нэша.
2 Коэффициент дисконтирования равен 1/(1 + ρ), где ρ — ставка временных предпоч тений (иногда называемая коэффициентом временных предпочтений). Таким образом, став ка дисконтирования, равная единице, обозначает бесконечное терпение, т. е. нулевую ставку временных предпочтений.

172 Часть I. Координация и конфликт: базовые социальные взаимодействия
& Rubinstein, 1990), а лучше объясню, как определяется равновесие. Как и ранее, мы предполагаем, что игроки делят приз в один ютиль, так что v + V = 1, и упро стим модель еще больше, приравняв к нулю резервные варианты z = Z = 0. Предположим, Нижний ходит первым и имеется некоторая максимальная сум ма v~, которую он может получить в каждом раунде игры, выступая в роли пред лагающего. Конечно, мы не знаем (пока) этой суммы, так же как и не знает ее Нижний. Но она будет одинакова в каждом периоде, в котором Нижний делает предложение, поскольку мы предполагаем, что игра стационарная (не зависит от времени), т. е. в раунде t (раунд, в котором Нижний делает предложение) Нижний сталкивается с такой же ситуацией, как и в раундах t - 2, t - 4 и т. д.
Пусть первый раунд начинается с момента времени, равного t = 0, а поведе ние игроков подчиняется принципу обратной индукции, т. е., оценивая ситуа цию, они заранее думают о том, с чем столкнутся, если дойдут до времени t = 1 (до хода Верхнего). На этом шаге Верхний будет знать, что, если бы он предложил Нижнему сумму δl v~ , тот бы согласился. Причина в том, что при заданной став ке временных предпочтений Нижнего ему все равно, получить δl v~ при t = 1 или v~ при t = 2, когда предлагает Нижний. Если такое предложение будет сде лано и затем принято, то у Верхнего останется сумма (1 − δl v~ ). В таком случае при t = 0 Нижний будет знать, что Верхний примет предложение δu (1 −dl v~ ) и не согласится на меньшее предложение (зная, что периодом позже Нижний будет готов принять предложение δl v~ ). Другими словами, Нижний знает, что 1 − δu (1 − δl v~ ) — максимальная сумма, которую он может получить в нулевом периоде. Но мы уже знаем, что максимум, который может получить Нижний, когда делает предложение, это v~ ; поэтому, приравнивая два выражения, по лучаем
v~ = 1 − δu (1 − δl v~ ) |
|
|||||
и, решая относительно v~, |
|
|
|
1 − δu |
|
|
v |
~ |
= |
|
. |
(5.3) |
|
|
1 − δu δl |
|||||
|
|
|
|
|
Нижний станет рассуждать, что если такова максимальная сумма, которую он может получить, делая предложение, то лучше сделать его сразу, а не отклады вать получение выплаты до следующего раунда. Таким образом, Нижний сделает предложение, Верхний его примет и игра закончится.
Если мы опустим предположение, что резервные варианты равны нулю, то получим более общий случай и сможем сравнить торг с чередующимися пред ложениями и торг Нэша. Снова вводя Z и z, получаем долю Нижнего
v |
~ |
= |
(1 −Z)(1 − δu ) |
+ |
z δu (1 − δl ) |
. |
||
|
1 |
− δu δl |
1 |
− δu δl |
||||
|
|
|
|
|
Она станет понятнее, если заменить β ≡ (1 - δu)/(1 - δuδl) и (1 - β) ≡ |
|
≡ δu (1 - δl)/(1 - δuδl). Тогда исход можно записать как |
|
v~ = β(1 −Z) +(1 − β) z = z + β(1 − z −Z). |
(5.4) |

Глава 5. Распределение выгод от сотрудничества: торг и погоня за рентой 173
При z = Z = 0 выражение воспроизводит равенство (5.2), как и следовало ожидать1. Равенство (5.4) показывает, что Нижний получает свой резервный ва риант z плюс долю β общего излишка (1 - z - Z).
Модель выявляет четыре основных фактора, определяющие исход: ставки дисконтирования игроков, иные потери от задержки (обратнозависимые от резервных полезностей), какой игрок делает первый ход и период времени, проходящий между поступлениями предложений. Заметим, что, будь Нижний бес
конечно терпеливым δl = 1, он получил бы весь общий излишек независимо от ставки дисконтирования Верхнего, по крайней мере, если тот тоже не оказался бы бесконечно терпеливым. В этом случае равновесный исход нельзя определить по понятным причинам: бесконечная терпеливость исключает из рассмотрения существенный элемент торга, а именно потери от упущенного времени.
Чтобы лучше разобраться в масштабах рассмотренных величин, предполо жим, что z = Z = 0, и представим, что Верхний беден, имеет ограниченный до ступ к кредитам и часто берет в долг по кредитной карте, платя по ставке 15%, в то время как Нижний очень богат и может брать в долг неограниченную сум му по реальной ставке, скажем, в 4%. Если эти числа обозначают годовую ставку временных предпочтений двух игроков, и если D — один год, то ставки дискон тирования равны δl = 0,96 и δu = 0,87. Тогда, применяя равенство (5.3), получим v~ = 0,76, т. е. Нижний получает в три раза больше Верхнего.
Сколько Верхний проиграл от того, что был вторым игроком, а сколько про играл от своей нетерпеливости? Выясняется, что преимущество первого хода не имеет значения. Если бы двое игроков обладали одинаковой ставкой дисконти рования δ, то, применяя равенство (5.3), мы бы показали, что Нижний получит
v~ = |
1 − δ |
= |
|
(1 − δ) |
= |
|
|
1 |
. |
|
1 − δ2 |
(1 − δ)(1 + δ) |
1 |
+ δ |
|||||||
|
|
|
|
Это означает, что если бы ставка временных предпочтений Верхнего была такой же, как у Нижнего (4%), то доля Нижнего сократилась бы с 0,76 до 0,51; получается, что причина бо2льшей доли Нижнего состоит в его бо2льшей терпе ливости, а не в преимуществе первого хода. Даже если бы оба обладали более высокими, как у Верхнего, ставками временных предпочтений, доля Нижнего
1 Этот результат получается довольно просто. Если при t = 2 Нижний может гаранти ровать соглашение на получение v~ в течение бесконечного периода времени, то, чтобы избежать отказа, Верхнему придется сделать предложение с пересчетом на текущие цены не меньшее чем z + δl v~ / (1 − δl ) в t = 1. Заметим: Нижний согласится на предложение не меньше v~ в периоде t = 1, поскольку для получения v~ ему придется ждать один период, а его резервная полезность не перевешивает потерь от ожидания. Значит, лучшее, что мо
жет сделать Верхний, — это предложить ему 1 −V + = z(1 − δl ) + δl v~ , оставляя себе V+ (в те чение бесконечного периода времени, если предложение будет принято). Но если Верхний может получить V+ в период t = 1, Нижнему придется сделать ему не меньшее предложение в периоде t = 0, чтобы установить соглашение. Рассуждая аналогичным образом, лучшее, что может получить Нижний, — это 1 - Z (1 - δu) - δuV+. Мы знаем, что бо2льшее, что может
получить Нижний в любой период, когда он делает предложение, — это v~ ; таким образом, v~ = 1 −Z(1 − δu ) − δuV + . Подставляя V + = 1 − z (1 − δl ) − δl v~ в это выражение и решая отно
сительно v~, получаем равенство (5.4).

174 Часть I. Координация и конфликт: базовые социальные взаимодействия
все равно была бы близка к половине (а именно 0,53). Очевидно, преимущество первого хода играет бо2льшую роль только в случае, когда оба игрока чрезмерно нетерпеливы и время, проходящее между предложениями, достаточно велико (в данном примере предполагаемый период времени равен году). По мере того как время между периодами D стремится к нулю, преимущество первого хода, как и следовало ожидать, полностью исчезает. Вы можете удивиться, но даже при стремящемся к нулю D влияние различий между ставками временных пред почтений остается существенным. Мы вернемся к этой аномалии позднее.
Как равновесный исход v~ в модели чередующихся предложений связан с торгом Нэша vn? Простое сравнение возможно, если предположить, что z = Z и D стремится к нулю. Обозначив ставки временных предпочтений за r, получим
v~ = |
|
zρl |
|
+ |
(1 − z)ρu , |
||
ρ |
|
ρ |
|||||
|
|
+ |
|
ρ |
+ ρ |
||
|
u |
|
l |
|
u |
l |
что, используя β0 = ru/(ru + rl) как меру временных предпочтений Верхнего относительно временных предпочтений Нижнего, можно записать как
v~ = (1 − β0 )z + β0 (1 − z). |
(5.5) |
Сравнение равенств (5.5) и (5.2) показывает, что параметр обобщенной мо дели Нэша, измеряющий переговорную силу Нижнего α, равен относительной величине ставки временных предпочтений β0 (доля Нижнего растет с ростом ставки временных предпочтений Верхнего)1. Когда у игроков ставки временных предпочтений одинаковы, то предельный результат (D стремится к нулю) совпа дает с торгом Нэша в предположении симметрии (преимущество первого хода в модели чередующихся предложений пропадает при предположении о неогра ниченно малых периодах времени).
Простота такого сравнения основывается на предположении о том, что ре зервный вариант в обоих случаях — плата не за окончание взаимодействия, а связанная с предстоящим некооперативным взаимодействием с тем же пар тнером. В модели чередующихся предложений важную роль играют затраты на
ожидание следующего периода времени (обратно зависящие от z), называемые внутренней возможностью. Выплата, связанная с некоторым другим взаимодей
ствием, в которое игрок может вступить, когда текущие отношения прекратят ся, в модели чередующихся предложений не учитывается (кроме случая, когда оно превысит сумму равновесного предложения, и тогда равновесное не будет принято и взаимодействие закончится). С другой стороны, в традиционной ин
терпретации торга Нэша z определяется как выплата в случае взаимодействия со следующим наилучшим партнером (внешняя возможность), а не с тем же
партнером, но уже без соглашений.
В модели чередующихся предложений в некотором смысле также учиты ваются внешние возможности. Вспомним, что исход при некооперативном
1 Размер преимущества первого хода обозначен как β - β0, где ставки временных пред почтений равны β = 1/(1 + δ), β0 = 1/2. Преимущество первого хода исчезает, когда время, проходящее между предложениями, сокращается, потому что при стремлении D к нулю δ стремится к единице.

Глава 5. Распределение выгод от сотрудничества: торг и погоня за рентой 175
взаимодействии в предыдущем примере был внутренней возможностью; но этот исход в общем случае зависит от внешних возможностей. Например, в модели трудовой дисциплины рабочих отношений в гл. 8 равновесие по Нэшу в неко оперативной игре между рабочим и работодателем зависит от доступности для рабочего пособия по безработице или другой работы. В этом случае внешняя воз можность рабочего становится его резервным вариантом в процессе определения равновесной заработной платы при отсутствии кооперации. Рабочий и работода тель могут попытаться улучшить свое положение относительно некооперативно го равновесия путем переговоров, при этом условия торга составят внутреннюю возможность процесса осуществления сделки (модель торга при некооператив ном взаимодействии рабочий — работодатель представлена в гл. 8).
недостатки и эволюционные расширения модели
Становится ли модель чередующихся предложений адекватной основой для изу чения процесса торга в реальном мире? Ее сила состоит в том, что модель череду ющихся предложений требует четкого определения институтов, управляющих процессом торга. В ней также учитывается в терминах относительных времен ных предпочтений и (в меньшей степени) в терминах преимущества первого хода переговорная сила — параметр, который предполагался экзогенным в мо дели Нэша. Но у подхода также имеются недостатки.
Вопервых, как видно из равенства (5.5), для определения исхода важны относительные затраты от ожидания (именно поэтому бесконечно терпеливый
партнер получает весь общий излишек, даже если другой достаточно терпелив, хотя и не бесконечно). Полные затраты от ожидания (или время ожидания) мо гут стать очень малыми без уменьшения значения различия во временных пред почтениях для определения долей. Как показывает Крепс (Kreps, 1990b. P. 562), даже если предложения и контрпредложения поступают каждые несколько секунд, влияние различия во временных предпочтениях не ослабевает. Более того, среди игроков с одной и той же ставкой временных предпочтений игрок, способный ответить на предложение в течение двух секунд, заберет 3/4 общего излишка, если его партнеру требуется шесть секунд на ответ. Удивительно, но когда торг не занимает много времени и не влечет больших затрат, исход опре деляют относительные затраты на торг (даже если они малы). Таким образом, то, что в модели исход определяется относительными затратами на ожидание, неуместно в некоторых приложениях.
Вовторых, как и в подходе Нэша, торг никогда не срывается, и исход всегда Паретоэффективен. Таким образом, модели не учитывают характерных осо бенностей реального мира (которые вскоре будут описаны).
Третье соображение касается того, что не во всех ситуациях можно ввести роль внешних возможностей так, как это произошло в модели чередующихся предложений. То, что внешние предложения не играют никакой роли, противо речит нашим интуитивным соображениям. Чтобы увидеть причину, предполо жим, А и В участвуют в проекте и их внешние возможности приравнены к нулю.

176 Часть I. Координация и конфликт: базовые социальные взаимодействия
В торге с чередующимися предложениями В предлагается некоторая сумма vb, близкая к половине общего излишка. Теперь предположим, что внешние воз можности В меняются таким образом, что они больше не равны нулю, и плата за уход из проекта равна vb - ε, где ε — небольшая положительная величина. Все остальные параметры торга остаются неизменными. Изменение внешних воз можностей не влияет на равновесие в игре с чередующимися предложениями, но переводит ситуацию от той, когда А и В делили излишек пополам, к той, когда
Аполучает практически весь излишек.
Инаконец, в модели чередующихся предложений под индивидами только иногда подразумеваются люди. Имеются экспериментальные данные, что люди
(бо2льшей частью студенты колледжа) не прибегают к обратной индукции, на которой основана данная модель (Crawford, 2002; Binmore et al., 2002)1. Более
того, в модели чередующихся предложений и в подходе Нэша (как в моделях реальных поступков игроков) предполагается, что игроки знают функции полез ности друг друга. Это не только неправда, но также противоречит тому факту, что во время торга игроки традиционно идут на хитрости, чтобы сообщить не верную информацию о своих предпочтениях. (Говорили, что во время «холодной войны» президент США Ричард Никсон специально пытался убедить россий ских политиков в том, что его случайно выбрали на этот пост.)
Однако тот факт, что когнитивные предположения модели могут быть не
реалистичными, не становится решающим недостатком. Главное — не то, как люди думают, а то, как они действуют. Вероятно, индивиды избегают приме
нения метода обратной индукции и последовательного исключения доминируе мых стратегий, вместо чего привычно используют накопленный опыт, которым успешно пользуются или думают, что его удачно применяют другие. Конечно, ссылка на традицию ничего не объясняет, но многое говорит о том, как объяс нить процесс торга, например, с помощью моделирования эволюции традиций и норм перераспределения при достаточно вероятных предположениях о ког нитивных способностях и знаниях. Возможно, правила поведения, возникаю щие в процессе обучения адаптивных агентов, поддерживают исходы, которые предсказывает модель с чередующимися предложениями или подход Нэша, или оба подхода. Посмотрим, верно ли это.
Предположим, что имеется некоторая норма, согласно которой доля x еди ничного пирога достается игроку, названному Строка, а остаток 1 - x достается
1 Модель процесса торга в некотором смысле парадоксальна, потому что в ней никакого торга не происходит (потому что если игроки действуют в соответствии с предположениями модели, то первое предложение всегда принимается). Можно привести много доводов, по чему субъекты обычно не используют обратную индукцию в подобных ситуациях: чтобы так мыслить, они должны предположить, что гипотетически находятся в периодах t = 1 и t = 2, и оба игрока используют обратную индукцию. Однако если такие предположения о поведении игроков были бы верными, то никогда не добрались бы до t = 1. Таким образом, если бы они действительно находились в периоде t = 1, то им пришлось бы пересмотреть свои поведенче ские предположения, и в таком случае они не станут действовать так, как предписывает им модель.

Глава 5. Распределение выгод от сотрудничества: торг и погоня за рентой 177
другому игроку, называемому Столбец. Соответственно u (x) и n (1 - x) — их вогнутые функции полезности фон Неймана — Моргенштерна. Взаимодействие между ними отличается от построенных нами ранее популяционных игр, когда индивиды объединялись в пары с другими игроками случайным образом. Попу ляция теперь включает в себя подпопуляции — Столбцы и Строки, — и игроки теперь разбиваются в пары по сегментам: Столбцы случайным образом объеди няются в пары со Строками. Строки не взаимодействуют со Строками, а Столб цы со Столбцами. Например, Строки могут быть работодателями, а Столбцы — рабочими. Или это могут быть продавцы и покупатели. У Столбцов и Строк нет внешнего арбитра, как в модели Нэша, и они не прибегают к методу обратной индукции, как требовалось от игроков у Рубинштейна. Они обладают ограничен ной памятью и еще худшей способностью предвидения, планируя свои действия только на основе информации о недавнем поведении тех, с кем они взаимодей ствуют, и лишь изредка пытаются улучшить условия текущей сделки. Мы уви дим, что при некоторых условиях наиболее вероятным исходом станет решение задачи торга Нэша.
Количество Строк и Столбцов равно соответственно nR и nC, и они случай ным образом объединяются в пары, как в игре «Дележ», введенной в гл. 1. Если в сумме запрашиваемые двумя игроками доли меньше или равны единице, они получают те доли, которые требовали, и соответствующие полезности u (x) и n (1 - x) (обе функции вогнутые и возрастающие). В противном случае они ни чего не получают и полезность в этом случае равна нулю. Пока предположим,
что nR = nC.
Индивиды знают распределение действий в предыдущей игре и строят на илучший на него ответ с вероятностью (1 - ε), где ε — малое положительное число, измеряющее долю ненаилучшего (или специфического) ответа. С веро ятностью ε они «пробуют» понять, смогут ли получить бо2льшую долю, увеличи вая свои требования, при этом Строки требуют x + D, а Столбцы 1 - x + D, где D — дискретное изменение в требованиях. Предположим, что D = 0,1, и теперь игрок пытается увеличить свои требования на эту величину. Пока значение ε мало, в течение многих периодов норма выполняется, поскольку и Столбцы, и Строки будут наилучшим образом отвечать на прошлое распределение, в ко тором все фактически придерживались нормы. Но вдруг большое количество игроков из одной подпопуляции, скажем, Строк, отвечающих ненаилучшим об разом, заставит наилучшим образом отвечающих Столбцов затребовать меньше. Зная это, в следующем периоде Строки, отвечая наилучшим образом, потребуют бо2льшую долю, и тогда установится новая норма, отражающая некоторый про цесс «перелома».
Поскольку процесс состоит из большого числа случайно происходящих со бытий, понятно, что по истечении достаточно продолжительного периода вре мени все нормы из интервала 0,1 — 0,9 будут наблюдаться с положительной вероятностью (я предполагаю, что ни один индивид не потребует нулевой доли, и такое требование не возникнет ни в качестве случайной пробы, ни в качестве наилучшего ответа). Но некоторые нормы станут встречаться чаще других, на

178 Часть I. Координация и конфликт: базовые социальные взаимодействия
блюдаясь в течение долгого периода и повторяясь снова, едва исчезнув1. Что мы можем сказать об этих постоянных нормах?
Определим l как вероятность перехода от нормы x к норме x + D в тече ние заданного периода в результате «перелома», а µ — как вероятность перехода от x к x - D. Норма получит тенденцию к увеличению, если l > µ, и наоборот. Эти вероятности станут зависеть от минимального числа ненаилучших отве тов, необходимых для того, чтобы заставить отвечающих наилучшим образом требовать меньшую долю. Рассмотрим наилучший ответ Строки при условии, что в предыдущем периоде доля k Столбцов потребовала норму 1 - x + D, а не 1 - x. Строки знают: снизив требования до x - D, они гарантированно получат меньший выигрыш, а если продолжат запрашивать ту же норму, то рискуют не получить ничего с вероятностью k. Наилучшим ответом Строк будет придержи ваться нормы, если
(1 - k) u (x) ≥ u (x - D), |
(5.6) |
и требовать меньше в противном случае (я предполагаю, что норма не изменена до тех пор, пока ее изменение не станет строгим наилучшим ответом). Перепи сывая (5.6) как равенство и решая относительно k, получаем критическое для k значение, а именно
κ* = u(x) −u(x − ) , u(x)
такое, что если в предыдущем периоде k > k*, то наилучшим ответом для Стро ки в этом периоде станет снижение требования. Аналогично показывается, что если r — доля ненаилучших ответов среди Строк, то наилучшим ответом Столб цов станет придерживаться нормы, если
n (1 - x) (1 - p) ≥ n (1 - x - D),
и требовать меньше в противном случае. Критическое значение r, таким обра зом, равно
ρ* = v(1 −x) − v(1 −x − ) . v(1 −x)
Поясним на примере, как изменяется норма. Предположим, что текущая норма равна x = 0, 2 и D = 0,1, таким образом, «проба» Строк равна 0,3, а Столб цов — 0,9. Наблюдая некоторую долю проб в предыдущем периоде у противопо ложной стороны, какова будет ожидаемая выплата игроку со стороны Строк (R), если он станет придерживаться нормы π′ или π*? Пусть u = x и v = 1 - x. Тогда
π*R = (1 - k) x и π′R = x - D.
1 То, что описывается далее, представляет собой вариант эволюционной модели торга Янга (Young, 1993). В моей формулировке ее главное различие состоит в том, что разные раз меры подгрупп играют ту же роль, что и разные объемы информации (размеры выборки) в модели Янга (большой объем выборки и маленький размер группы являются преимущест вами).