Парето-эффективность равновесий в активных системах с распределённым контролем - Караваев А.П
..pdf11
fi(s) соответствующий максимум не уменьшается (может увеличиваться). Соответственно если максимумы уменьшаются, то множество воз- можных x , удовлетворяющих (4), увеличивается, в противном случае
уменьшается. При различных неравенствах (для первого и второго цен- |
|||
тров) эффекты действуют в различные стороны, и результат их действия |
|||
(как изменится множество реализуемых с данной угрозой исходов) ука- |
|||
зать нельзя. |
|
|
|
После этих рассуждений естественно задать вопрос: а всегда ли в си- |
|||
стеме с двумя центрами существует равновесие, исход которого Парето- |
|||
эффективен? Положительный ответ на данный вопрос дает следующая |
|||
Ò å î ð å ì à 3. |
В АС с двумя центрами и одним АЭ для любого |
||
x |
Argmax |
2 |
|
|
существуют такие функции стимули- |
||
x X |
i=1 Hi(x) − c(x) |
||
рования σi(x), Pi = 1, 2, что тройка (σ1(x), σ2(x), x ) является равнове- |
сием Нэша, т.е. любой Парето-эффективный исход реализуем. |
||||||
Заметим, что в силу теоремы 1 достаточно предполагать, что функции |
||||||
стимулирования являются двухпиковыми. |
|
|||||
Доказательство теоремы 3 приведено в Приложении. |
||||||
Заметим, что в теореме не только доказано, что в системе из двух |
||||||
элементов всегда реализуем Парето-эффективный исход, но и для боль- |
||||||
шинства случаев перечислены возможные равновесия (с точностью до |
||||||
места расположения угроз, которые, в принципе, тоже можно опреде- |
||||||
лить как произвольные точки некоторых множеств), причем выигрыш |
||||||
каждого из центров легко найти. |
|
|
||||
Однако хотелось бы знать, как связаны выигрыши в равновесии с |
||||||
возможными выигрышами в Парето-эффективном равновесии. |
||||||
Т е о р е м а 4. Пусть в АС с двумя центрами и одним АЭ имеется |
||||||
(σ1(x), σ2(x), x˜) некоторое равновесие Нэша, |
||||||
|
|
|
|
|
2 |
! |
|
x˜ / |
x |
|
X |
i − |
|
(6) |
|
|
|
Xi |
c(x) . |
|
|
Argmax |
H (x) |
||||
|
|
|
|
|
=1 |
|
Тогда для любого
(7)
|
|
|
2 |
x |
x |
X |
Hi(x) − c(x)! |
|
|
|
Xi |
|
Argmax |
|
|
|
|
|
=1 |
существуют такие σ1(x) è σ2(x), ÷òî (σ1(x), σ2(x), x ) равновесие Нэша, причем при переходе от одного равновесия к другому выигрыши центров не уменьшатся (и по крайней мере одного центра увеличится), а выигрыш АЭ останется прежним.
Доказательство теоремы 4 приведено в Приложении.
Таким образом, для любого равновесия в системе с двумя центрами существует Парето-эффективное равновесие, в котором выигрыш АЭ не изменится, а выигрыши центров не уменьшатся (при соответствующем дележе строго увеличатся).
И если мы решаем, сколько центров должно быть в системе (два или один), распределяя весь доход от функционирования системы между центрами, то необходимо учитывать следующее:
12
1)при двух центрах возможен более богатый спектр получающихся равновесий;
2)Парето-эффективный исход может быть реализован в любом слу- чае;
3)при двух центрах возможно такое распределение дохода от деятельности системы между центрами, что при любом равновесии АЭ будет получать ненулевую прибыль (значение его целевой функции будет больше нуля);
4)при двух центрах для любого равновесия существует Паретоэффективное равновесие, которое доминирует (слабо) первона- чальное равновесие.
6.Заключение
Âтеории АС, при большом внимании к АС с одним управляющим центром, уделялось мало внимания системам, в которых присутствует несколько управляющих центров, несмотря на то, что примеры таких систем встречаются достаточно часто. В силу более сложной структуры
èанализ таких систем является более сложным, хотя бы из-за большего разнообразия получающихся равновесий.
Âданной работе исследованы вопросы равновесия в АС с несколькими управляющими центрами. Показано, что исход, реализуемый в АС с одним центром, достижим в АС с несколькими центрами как равновесие Нэша, если суммарные доходы центров в обоих системах равны (но во втором случае просто делятся на несколько присутствующих в системе центров). Подробно исследована АС с двумя центрами, показано, что в такой системе всегда существует равновесие Нэша, реализующее Парето-эффективный исход.
Перспективным направлением для дальнейших исследований является вопрос о свойствах АС с произвольным числом и реализуемости в ней Парето-эффективных исходов. Важным представляется вопрос об определении на основании данной модели оптимального количества центров при возможности влиять на распределение дохода АС между центрами или при равномерном распределении дохода между центрами.
|
ПРИЛОЖЕНИЕ |
Ä î ê à ç à ò å ë ü ñ ò â î ò å î ð å ì û |
2. В силу теоремы 1 достаточно |
рассматривать только функции стимулирования с конечным числом пи- |
|
ков. Обозначим подмножество множества X, на котором расположены |
|
угрозы, через Y . Тогда множество Y |
(заметим, что x Y ) является |
конечным множеством. Оставим во множестве Y только те точки x, â
которых |
n |
n |
|
||
|
Xi |
X |
|
σi(x) − c(x) = |
σi(x ) − c(x ) |
|
=1 |
i=1 |
13
(т.е. те точки, в которых угрозы имеют смысл, или, что то же самое, величина угрозы равна суммарной переплате АЭ) Функции стимулиро-
вания, равные нулю всюду, кроме точек множества Y , ãäå îíè íå èç-
менили своих значений, по-прежнему являются равновесными, причем выигрыши центров и АЭ не изменятся.
Пусть утверждение теоремы неверно. Тогда существует такое p, ÷òî
во всех точках угроз центр с номером p предлагает АЭ ненулевое стимулирование (в том числе и в равновесной точке x , иначе в качестве x˜ в уравнении (2) можно было бы взять x ). Кроме того, в силу нали-
чия угрозы АЭ получает больше, чем ему надо просто для покрытия затрат на выбор x . Но тогда, уменьшив во всех точках множества Y
стимулирование p-го центра на сумму
|
|
"σp(y), |
n |
δ = min |
y Y |
σi(x ) − c(x )#! > 0, |
|
|
min |
|
Xi |
|
|
|
|
|
|
|
=1 |
мы получим, что реализуется по-прежнему тот же исход, поскольку
n |
n |
|
Xi |
X |
|
σi(x ) − c(x ) |
− δ ≥ σi(x) − c(x) − δI{Y }(x), |
|
=1 |
i=1 |
|
ãäå |
|
0, x / Y. |
{Y } |
||
I |
(x) = |
1, x Y ; |
Однако, поскольку функции стимулирования других центров не изменились, а целевая функция p-го центра увеличилась (так как мы умень-
шили его затраты на стимулирование), то мы имели дело не с равновесием. Противоречие.
Д о к а з а т е л ь с т в о с л е д с т в и я 1. В равновесии против каждого из центров должна существовать коалиция (которая ограничена множеством всех центров без данного), способная обеспечить соответ-
ствующую угрозу. Но коалиция против p-го центра не может обеспечить угрозу больше, чем
|
|
i |
n |
|
|
|
|
max |
X6 |
(x) |
− |
c(x) |
|||
|
H |
|
|||||
x |
X |
|
i |
|
|
|
|
|
|
|
=1,i=p |
|
|
|
|
для любого p, о чем и говорит следствие.
Д о к а з а т е л ь с т в о с л е д с т в и я 2. В качестве точек множества Y необходимо взять точки, в которых против p-го центра остальные центры образуют коалицию:
Y = |
n |
xp x , |
xp Argmax |
|
σi(x) − c(x) |
|
[ |
|
x X |
X |
|
|
p=1 |
|
i=p |
|
|
|
|
|
|
6 |
|
(заметим, что выбранные xp есть точки, о которых говорится в теореме 2)
Тогда по теореме 2 σp(xp) = 0, P σi(xp) − c(xp) = Pσi(x ) − c(x ).
i6=p |
i |
Отклоняться же от своих стратегий центрам невыгодно в силу наличия противостоящих коалиций. Таким образом, следствие доказано.
14
Д о к а з а т е л ь с т в о т е о р е м ы 3. Возьмем x1, x2 è x такие, ÷òî
x1 Argmax(H1(x) − c(x)); a1 = H1(x1) − c(x1);
x X
x2 Argmax(H2(x) − c(x)); a2 = H2(x2) − c(x2);
x X
2
a = P Hi(x ) − c(x )
i=1
(предполагаем, что x1 6= x2, x1 6= x , x2 6= x ).
В силу определений и неотрицательности функций H1(x), H2(x) è c(x)
всегда выполняются неравенства ai ≥ 0, a ≥ 0 è a ≥ ai.
Нетрудно видеть, что если первому центру невыгодно отклоняться с x íà x1 èëè x2, то ему вообще никуда больше невыгодно отклоняться (так как возможный максимальный выигрыш будет именно в этих точках). То же самое верно и для второго центра. Таким образом, для утверждения теоремы мы можем указать соответствующие стратегии и проверить, что центры не будут изменять свои стратегии так, чтобы в
итоге реализовались x1 èëè x2.
Ñ ë ó ÷ à é 1. a1 = 0: в одиночку первый центр ничего не может получить.
Тогда при
σ1(x) = |
y, |
x = x ; |
σ2(x) = |
c(x ) |
− |
y, x = x ; |
0, |
x 6= x , |
0, |
x 6= x , |
ãäå
y [H2(x2) − c(x2) − (H2(x ) − c(x )), H1(x )] ,
тройка (σ1(x), σ2(x), x ) есть Парето-эффективное равновесие Нэша (равновесие типа "сотрудничество"). Так как второму центру перепла- чивать АЭ смысла нет (первый просто не может угрожать), то мы нашли все Парето-эффективные равновесия Нэша, реализующие исход x .
Ñ ë ó ÷ à é |
2. a1 = a: первый центр в одиночку может получить |
|||||||||||
столько же, сколько и оба центра, объединившись вместе. |
|
|
||||||||||
Тогда при функциях стимулирования |
|
|
|
|
||||||||
|
|
|
c(x ) + H2(x2) c(x2) |
H2(x ), x = x ; |
|
|
||||||
|
σ1(x) = |
c(x1) + H2(x2) |
− c(x2),− |
x = x1; |
|
|
||||||
|
|
|
0, |
|
|
|
− |
|
x / |
x , x1 |
} |
, |
|
|
|
H2(x ), x = x ; |
|
{ |
|
|
|||||
|
σ2(x) = |
|
H2(x2), x = x2; |
|
|
|
|
|
||||
|
|
|
0, |
|
|
x / |
x , x2 |
} |
|
|
|
|
|
(σ1(x), |
σ |
(x), x |
|
) |
{ |
|
|
|
|
|
|
тройка |
есть Парето-эффективное равновесие Нэша |
|||||||||||
|
2 |
|
|
|
|
|
|
|
|
|
(равновесие типа "конкуренция"). Второй центр при этом ничего не получает, а АЭ получает a2.
Ñ ë ó ÷ à é 3. a1 + a2 ≤ a, ai < a: сумма возможных выигрышей пер-
вого и второго центров не больше выигрыша центров при объединении. |
|||||
При функциях стимулирования |
σ2(x) = |
|
|
|
|
y, |
x = x ; |
c(x ) |
− |
y, x = x ; |
|
σ1(x) = 0, |
x 6= x , |
0, |
x 6= x , |
15
ãäå y [a2 + c(x ) − H2(x ), H1(x ) − a1], реализуется Парето-оптималь-
ное равновесие Нэша (σ1(x), σ2(x), x ) (равновесие типа "сотрудниче- ство"), поскольку выполняются неравенства:
(H1(x ) − a1) − (a2 + c(x ) − H2(x )) = a − a1 − a2 ≥ 0
(множество возможных значений y непусто),
H1(x ) − σ1(x ) = H1(x ) − y ≥ H1(x ) − (H1(x ) − a1) = a1
(первый центр может так стимулировать),
H2(x ) − σ2(x ) = H2(x ) − (c(x ) − y)
≥ H2(x ) − c(x ) + a2 + c(x ) − H2(x ) = a2
(второй центр может так стимулировать),
y ≥ a2 + c(x ) − H2(x ) ≥ H2(x ) − c(x ) − (H2(x ) − c(x )) = 0
(стимулирование первого центра неотрицательно),
c(x ) − y ≥ c(x ) − (H1(x ) − a1) ≥ 0
(стимулирование второго центра неотрицательно).
В данном случае переплачивать не имеет смысла, так как по отдельности (при отклонении от этих стратегий) они получают не больше и угрозы не нужны.
Ñ ë ó ÷ à é 4. a < a1 + a2, ai < a: сумма возможных выигрышей первого и второго центров строго больше выигрыша центров при объединении.
Прежде всего заметим, что
a1 > a − a2 = H1(x ) + H2(x ) − c(x ) − a2
≥H1(x2) + H2(x2) − c(x2) − a2 = H1(x2); H1(x ) = H1(x ) + H2(x ) − c(x ) − (H2(x ) − c(x ))
≥H1(x2) + H2(x2) − c(x2) − (H2(x ) − c(x )) = H1(x2); a − a1 = H1(x ) + H2(x ) − c(x ) − a1
≥H2(x1) + H2(x1) − c(x1) − a1 = H2(x1),
таким образом (проведя аналогичные вычисления для второго центра), получаем
a1 > H1(x2); |
a2 > H2(x1); |
H1(x ) ≥ H1(x2); |
H2(x ) ≥ H2(x1); |
H2(x1) ≤ a − a1; |
H1(x2) ≤ a − a2. |
Для возможности равновесия с исходом x и угрозой s должны выполняться неравенства
a − s ≥ H2(x1) + H1(x2) è a − s ≥ (a1 − s) + (a2 − s),
что говорит о том, что угроза должна принадлежать отрезку
[a1 + a2 − a, a − (H2(x1) + H1(x2))].
Этот отрезок непуст, поскольку
(a − (H2(x1) + H1(x2))) − (a1 + a2 − a)
(a − a1 − H2(x1)) + (a − a2 − H1(x2)) ≥ 0.
16
Исходя из сказанного, подберем подходящее значение для s. Пусть
s = a1 + a2 − a. Тогда на основании последнего неравенства системы (4) должно выполняться неравенство
a − s ≥ max(H1(x2), a1 − s) + max(H2(x1), a2 − s).
Проверим это:
max(H1(x2), a1 − s) + max(H2(x1), a2 − s)
=max(H1(x2), a − a2) + max(H2(x1), a − a1)
=a − a2 + a − a1 ≤ a < a1 + a2.
Кроме того, такая угроза обоими центрами реализуема, поскольку
a1 − s = a1 + a − a1 − a2 = a − a2 ≥ 0; a1 − s = a1 + a − a1 − a2 = a − a2 ≥ 0,
что и завершает доказательство теоремы.
Д о к а з а т е л ь с т в о т е о р е м ы 4. Из условия (7) следует, что для любого x (и, в частности, для x˜) выполняется
(H1(x ) + H2(x ) − c(x )) − (H1(x) + H2(x) − c(x)) ≥ 0.
Èç òîãî, ÷òî (σ1(x), σ2(x), x˜) равновесие Нэша, следует, что никако- x , ò.å.
Hi(x ) − c(x ) − (σ1(˜x) + σ2(˜x) − c(˜x)) ≤ Hi(˜x) − σi(˜x), èëè Hi(˜x) − Hi(x ) + c(x ) + σ−i(˜x) − c(˜x) ≥ 0.
Для доказательства теоремы достаточно показать, что мы можем так изменить σ1(x) è σ1(x) в точке x , что новая система реализуема, является равновесием Нэша и выигрыши центров при этом не уменьшатся (АЭ должен получить не меньше, так как иначе ему будет невыгодно выбирать x ).
Прежде всего, заметим, что по сравнению с x˜ появляется дополнительная сумма для дележа в размере
d = (H1(x ) + H2(x ) − c(x )) − (H1(˜x) + H2(˜x) − c(˜x)) > 0.
Ее центры и будут делить друг с другом.
Зададим новые функции стимулирования центров как
σ1(x) = |
H1(x ) |
− |
H1(˜x) + σ1(˜x) |
− |
y, x = x ; |
|
||||
σ1(x), |
|
|
|
|
x 6= x , |
|
||||
σ2(x) = |
σ2(˜x) |
c(˜x) + c(x |
) |
− |
H1(x ) + H1(˜x) + y, x = x ; |
|||||
σ2(x),− |
|
|
|
|
|
|
x 6= x , |
|||
где переменная y Y |
|
= [0, d]. Заметим, что в силу выбора точки x |
множество Y непусто (d > 0). Вторая функция стимулирования подбиралась из того условия, что АЭ должен получить столько же, сколько и раньше. Легко проверить, что при всех допустимых значениях y âû-
полняется Hi(x ) − σi (x ) ≥ Hi(˜x) − σi (˜x) (из чего, в частности, следует неотрицательность левой части неравенства и, как следствие, неравенство Hi(x ) ≥ σi (x )), т.е. центрам невыгодно отклоняться для того,
чтобы АЭ выбирал x˜. Но тогда в силу определения σi(x) è òîãî, ÷òî
σi(x) è σi (x) совпадают всюду, кроме точки x , центрам вообще никуда невыгодно отклоняться.
17
Теперь остается только проверить, что необходимое стимулирование σi (x ) не меньше нуля, т.е. функции стимулирования являются допустимыми. Заметим, что суммарный выигрыш центров в точке x не меньше,
чем в точке x˜. Найдем стимулирование первого центра при максимальном y (в этом случае само стимулирование минимально):
σ1(x ) = H1(x ) − H2(˜x) + σ1(˜x)
−(H1(x ) + H2(x ) − c(x ) − (H1(˜x) + H2(˜x) − c(˜x)))
= H2(˜x) − H2(x ) + c(x ) + σ1(˜x) − c(˜x) ≥ 0,
так как центрам невыгодно самостоятельно отклоняться для реализа- öèè x . Аналогично доказывается для второго центра.
Для полноты необходимо заметить, что в случае отсутствия угроз доказательство остается таким же. Также необходимо заметить, что ни один из центров не мог угрожать другому точкой x , так как второ-
му центру тогда было бы выгодно переключится именно на реализацию этого исхода и (σ1(x), σ2(x), x˜) не было бы равновесием Нэша.
18
Список литературы
1. Бурков В.Н., Кондратьев В.В. Механизмы функционирования организационных систем. М.: Наука, 1981.
2. Новиков Д.А., Петраков С.Н. Курс теории активных систем. М.: СИНТЕГ, 1999.
3. Губко М.В., Караваев А.П. Согласование интересов в матричных структурах управления // АиТ. 2001, N 10.
4. Новиков Д.А., Цветков А.В. Механизмы функционирования организационных систем с распределенным контролем. М.: ИПУ РАН, 2001.
5. Bernard Salanie. The Economics of Contracts: A Primer. The MIT Press, 2000.
6. Mas-Colell A., Whinston M., Jerry R. Green. Microeconomic Theory.
Oxford University Press, 1995.
7. Maskin E., Tirole J. The Principal-Agent Relationship with an Informed Principal, I: The Case of Private Values // Econometrica, 1990, V. 58 (2), pp. 379-409.
|
6 |
|
|
|
H2 |
(x) |
c(x) |
|||||||||||||||
|
|
|
|
|
|
|||||||||||||||||
|
|
H1(x) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ðèñ. 1
6
a2
@
a1 @@@
H2(x ) @ @ |
|
|
|
|
|
@ @ |
|
|
|
H1(x ) |
@ |
@@ |
f1(s) |
|
|
@ @ |
|
||
|
f2(s) |
@ @ |
|
|
|
|
@ @ |
|
|
|
|
@@@@a2−s |
s |
|
|
|
a1−s |
@ @ |
- |
|
|
min(a1, a2) |
|
|
|
|
Ðèñ. 2 |
|
|