Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория игр / Петросян_Теория_игр

.pdf
Скачиваний:
55
Добавлен:
13.02.2015
Размер:
6.14 Mб
Скачать

где xseXs, x^seX/^s, FS—(XS, X^s, Hs), при этом доказательство дословно повторяет приведенное выше.

8.3. Определение. Бескоалиционная игра r=(N, {X,}ieN, {H,}ieN называется игрой с постоянной суммой, если

Y,

#,(x)=c=const

ieN

 

для всех xeXN, XN=Y[ X>-

 

ieN

{Xi},BN, {Hi}ieN) бескоалиционная игра

Лемма. Пусть r=(N,

с постоянной суммой, функция v(S), SaN, определена, как в лемме п. 8.2, а игры Г5, SczN, имеют значения в смешанных стратегиях. Тогда

v(N)=v(S)+v(N\S), ScN.

Доказательство. Из определения игры с постоянной суммой получаем, что

v(N)=Z # , ( * ) = ! Ъ{ц) = с

ieN ieN

для всех ситуаций х в чистых и ц — в смешанных стратегиях. С другой стороны

v (S)=sup inf £ Kt (jis, v^s)=sup inf I с -

£ Kt (jis, v^sУ)

= c-infsup

£ Ki(ns,vNXS) =

c-v(N\S),

VN\S Ms

ieN\S

 

что и требовалось доказать.

8.4. В дальнейшем под кооперативной игрой будем понимать просто пару (N, «), где v — характеристическая функция, удовлет­ воряющая неравенству (8.1), поскольку содержательная интерпрета­ ция характеристической функции, обосновывающая свойство (8.1), не имеет принципиального значения.

Пример 15 [10]. {Игра «джаз-оркестр».) Директор клуба обещает 100 руб. певцу S, пианисту Р и ударнику D за совместное выступле­ ние*. Дуэт певца и пианиста он оценивает в 80 усл. ед., ударника и пианиста в 65 усл. ед. и одного пианиста — в 30 усл. ед. Другие дуэты и солисты не рассматриваются, поскольку присутствие фор­ тепиано директор клуба считает обязательным. Дуэт певец — удар-

*Речь идет о «золотых рублях».

150

ник зарабатывает 50 усл. ед., а певец — в среднем 20 усл. ед. за вечер. Ударник один ничего не может заработать.

Обозначая цифрами 1, 2, 3 игроков S, Р и D соответственно, мы имеем дело с кооперативной игрой (N, v), где JV={1, 2, 3}, «(1, 2, 3)=100, в(1, 3)=50, «(1)=20, и(1, 2)=80, «(2, 3)=65, «(2)=30, *(3) = 0.

Основная задача кооперативной теории игр и лиц заключается в построении реализуемых принципов оптимального распределения максимального суммарного выигрыша v(N) между игроками.

Пусть а, — сумма, которую получает игрок i при распределении максимального суммарного выигрыша v(N), iV= {l, 2, ..., и}.

Определение. Вектор а=(а15 ..., а„), удовлетворяющий усло­ виям

<x,>v{{fy, ieN;

(8.4)

I «,=«(*),

(8-5)

i— 1

где v ({/}) — значение характеристической функции для одноэле­ ментной коалиции S= {/}, называется дележом.

Условие (8.4) называется условием индивидуальной рациональ­ ности и означает, что, участвуя в коалиции, каждый игрок получает по меньшей мере столько, сколько он мог бы получить, действуя самостоятельно и не заботясь о поддержке каких-либо других иг­ роков. Должно также выполняться условие (8.5), так как в случае

£ at<v(N) существует распределение а', при котором каждый иг-

ieN

рок /eJV получит больше, чем его доля а,. Если же ]£ at>v(N), то

IeN

игроки из Оделят между собой нереализуемый выигрыш, и поэтому вектор а неосуществим. Следовательно, вектор а может считаться допустимым только при выполнении условия (8.5), которое называ­ ется условием коллективной (или групповой) рациональности.

На основании условий (8.4), (8.5) для того, чтобы вектор а=(а

..., а„) был дележом в кооперативной игре (N, v), необходимо и достаточно выполнение равенства

причем

у^О, ieN, £vi=*(iV)-L «({*»•

IeN

ieN

Определение. Игра (N, v) называется существенной, если

151

£ v({i})<v(N).

(8.6)

ieN

В противном случае игра (N, v) называется несущественной.

Для любого дележа а через а (5) будем обозначать величину YJ <*i=tx(S), а множество всех дележей — через D. Несущественная

игра имеет единственный дележ а=(«({1}), «({2}), ..., «({и})).

Во всякой существенной игре с более чем одним игроком множе­ ство дележей бесконечно. Поэтому будем анализировать такие игры с помощью отношения доминирования.

Определение. Дележ а доминирует дележ Р по коалиции S (обо­

значение а^=/?), если

 

s

 

ai>puieS,a(S)^v(S).

(8.7)

Первое из условий в определении (8.7) означает,

что дележ

а лучше дележа р для всех членов коалиции S, а второе отражает реализуемость дележа а коалицией S (т. е. коалиция S на самом деле может предложить каждому из игроков ie S величину а,).

Определение. Говорят, что дележ а доминирует дележ р\ если

существует коалиция S, для которой аС^р. Доминирование дележа

S

Р дележом а обозначается как а^=р\ Доминирование невозможно по одноэлементной коалиции

и множеству всех игроков N. Действительно, из сС^Р следовало бы

Pi<at^v({i}), что противоречит условию (8.4). А из аС^Р следовало

бы, что <х,-> Pi для всех ieN и поэтому £ а,-> £ /?,=« (N), что проти-

ieN ieN

воречит условию (8.5).

8.5. Объединение кооперативных игр в те или иные классы существенно упрощает их последующее рассмотрение. В качестве таких классов можно рассмотреть классы эквивалентных игр.

Определение. Кооперативная игра (N, v) называется эквива­ лентной игре (N, v'), если существуют положительное число кип таких произвольных вещественных чисел с„ ieN, что для любой

коалиции Sс N выполняется равенство

v'(S) = kv(S)+Yc,.

(8.8)

ieS

 

152

Эквивалентность игры (N, v) и (N, v1) будем обозначать как

(N, v)~(N, v) или v~v.

Очевидно, что «~«. Чтобы убедиться в этом, достаточно поло­ жить в формуле (8.8) с, = 0, к=\, «' = «. Такое свойство называется

рефлексивностью.

Докажем симметрию отношения, т. е. что из условия v~v следует v'~v. Действительно, полагая k' = \jk, c\= — cjk, получим

v(S)=k'v'(S)+Ydc'l,

ieS

т. е. v ~v.

Наконец, если v~«' и v'~v", то v~v". Это свойство называется транзитивностью. Оно проверяется последовательным применени­ ем формулы (8.8).

Так как отношение эквивалентности рефлексивно, симметрично и транзитивно, оно разбивает множество всех игр и лиц на взаимо­ непересекающиеся классы эквивалентных игр.

Теорема. Если две игры v и v эквивалентны, то отображение а-ю.', где

a& = kat+Cb ieN,

устанавливает также взаимно однозначное отображение множест­ ва всех дележей игры v на множество дележей игры v', так что из

а^р следует oc'^jS'.

Доказательство. Проверим, что а' является дележом в игре (N,«'). Действительно,

aj=ht,+c& kv ({/}) + cl=v' ({/}),

£ «;= I (Ь,+А) = Ь(Л0+ £ Ci=v'(N).

ieN

ieN

ieN

Следовательно, для а' условия (8.4), (8.5) вьшолнены. Далее, если

а^р, то

«!>&, ieS, £a»<«(.S),

ieS

поэтому

<xj =fax,+о,> kpi+с,=р\ (к > 0),

£ а; = к £ а,+ £ c^kv

№+ I ct=v' (S),

ieS

ieS

ieS

ieS

153

т. е. а'^=/?'. Взаимная однозначность соответствия следует из суще­ ствования обратного отображения (оно было использовано при доказательстве симметрии отношения эквивалентности). Теорема

доказана.

8.6. При разбиении множества кооперативных игр на попарно непересекающиеся классы эквивалентности возникает задача выбо­ ра наиболее простых представителей из каждого класса.

Определение. Игра (N, v) называется игрой в (0 — ^редуци­ рованной форме, если для всех ieN

v({i}) = 0,v(N) = L

Теорема. Каждая существенная кооперативная игра эквивален­ тна некоторой игре в (0 \)-редуцированной форме.

Доказательство. Пусть

 

k=

1

>0,

 

 

 

•W- I •(«)

 

 

ieN

 

Cl

*.Ш

,в'(5)=Ь(5)+Х^

 

• W - I«({/})

 

'eS

ieN

Тогда v' ({f}) = 0, v' (N) = 1. Теорема доказана.

Из теоремы следует, что свойства игр, включающие понятие доминирования, можно изучить на играх в (0 — 1)-редуцированной форме. Если v — характеристическая функция произвольной суще­ ственной игры (N, v), то

•Ю-5>(«)

V'(S)= ^ , SfcN, (8.9)

•W-I«(W)

ieN

есть (0 — 1) — нормализация, соответствующая функции «. При этом дележом оказывается любой вектор <х = (а19..., а„), компоненты

которого удовлетворяют условиям

<tt>0,ieN, Ха -= 1 >

(8.10)

ieN

 

т. е. дележи можно рассматривать как точки (и — 1)-мерного симп­ лекса, порожденного ортами w,=(0, ..., 0, 1, 0,..., 0),j=l, и простра­ нства R".

154

§ 9. С-ЯДРО И Я — М-РЕШЕНИЕ

Перейдем к рассмотрению принципов оптимального поведения в кооперативных играх. Как уже отмечалось в п. 8.4, речь будет идти о принципах оптимального распределения максимального суммарного выигрыша между игроками.

9.1. Возможен следующий подход. Пусть игроки в кооператив­ ной игре (N, v) пришли к такому соглашению о распределении выигрыша всей коалиции N (дележу а*), при котором ни один из дележей не доминирует а*. Тогда такое распределение устойчиво в том смысле, что ни одной из коалиций S невыгодно отделиться от других игроков и распределить между членами коалиции выигрыш v(5). Это рассуждение наводит на мысль о целесообразности рас­ смотрения множества недоминируемых дележей.

Определение. Множество недоминируемых дележей коопера­ тивной игры (N, v) называется ее С-ядром.

Имеет место следующая теорема, которая характеризует С- ядро.

Теорема. Для того чтобы дележ: а принадлежал С-ядру, необ­ ходимо и достаточно выполнение для всех S^-N неравенств

«(5)^а(5)=Х«с

(9-1)

Доказательство. Для несущественных игр теорема очевидна, и в силу теоремы п. 8.6 достаточно провести ее доказательство для игр в (0 — 1)-редуцированной форме.

Докажем достаточность утверждения теоремы. Пусть для деле­ жа а выполнено условие (9.1). Покажем, что дележ а принадлежит

С-ядру. Пусть это не так. Тогда найдется такой дележ /?, что /?>а,

т. е. P(S)>a(S) и P(S)^v(S). Но это противоречит (9.1).

Покажем необходимость условия (9.1). Для любого дележа а, не удовлетворяющего (9.1), существует коалиция S, для которой a(S)<v(S). Положим

»(5)-а(5) .

l-v(S)

151

IM-ISI'

где \S\ — число элементов множества S. Легко видеть, что /J (iV)= 1, Pt^O и /?}Sa. Отсюда следует, что а не принадлежит С-ядру.

Из теоремы п. 9.1 следует, что С-ядро является замкнутым, выпуклым подмножеством множества всех дележей (С-ядро может быть пустым множеством). v

9.2. Пусть игроки договариваются о выборе кооперативного соглашения. Из супераддитивности v следует, что такое соглашение

155

приводит к образованию коалиции N всех игроков. Решается вопрос о способе дележа суммарного дохода v(N), т. е. о выборе вектора

xeR", для которого £ <x,=v(N).

ieN

Минимальным требованием для получения согласия игроков выбрать вектор а является индивидуальная рациональность этого вектора, т. е. условие а, ^ «({/}), ieN. Пусть игроки договариваются

о выборе конкретного дележа а. Против выбора дележа может возражать некоторая коалиция S, требующая для себя более выгод­ ного распределения. Коалиция S выдвигает это требование, угро­ жая в противном случае нарушить общую кооперацию (это вполне реальная угроза, так как для достижения дохода v(N) требуется единодушное согласие всех игроков). Предположим, что остальные игроки N\S реагируют на эту угрозу объединенными действиями против коалиции S. Тогда максимальный гарантированный доход коалиции S оценивается числом и (5). Условие (9.1) означает сущест­ вование стабилизирующей угрозы коалиции S со стороны коалиции N\S. Таким образом, С-ядром игры (N, v) является множество устойчивых в смысле коалиционных угроз распределений макси­ мального суммарного дохода v (N).

Приведем еще один критерий принадлежности дележа С-ядру.

Лемма. Пусть а дележ игры (N, «)• Тогда а принадлежит С-ядру в том и только в том случае, когда для всех коалиций ScN выполняется неравенство

^a^v(N)-v(N\S). (9.2)

Доказательство. Так как ^a,=v(iV), то приведенное выше неравенство можно записать в виде

v(N\S)^ £ «-'•

ieN\S

Теперь утверждение леммы следует из (9.1).

Из условия (9.1) видно, что если дележ а принадлежит С-ядру, то ни одна коалиция S не может гарантировать себе выигрыш, превос­ ходящий J]a,=a(5), т. е. суммарный выигрыш, который обеспечи-

вается членам коалиции дележом а. Это делает нецелесообразным существование коалиций S, отличных от максимальной коалиции JV.

Теорема п. 9.1 дает достаточные основания для использования С-ядра как важного принципа оптимальности в кооперативной теории. Однако во многих случаях С-ядро может оказаться пустым, а в других случаях оно представляет собой множественный принцип

156

оптимальности и остается всегда открытым вопрос, какой все-таки дележ из С-ядра необходимо выбрать в конкретном случае.

Пример 16. Рассмотрим игру «джаз-оркестр» (см. пример 15 п. 8.4). Суммарный доход трех музыкантов максимален (и равен 100 руб.) в случае их совместного выступления. Если певец выступает отдельно от пианиста с ударником, то все втроем они получают 65 + 20 руб., если пианист выступает один, то 30 + 50 руб. Наконец, суммарный доход равен 80 руб., если пианист и певец отказываются от участия ударника. Какое распределение максимального общего дохода следует признать разумным, учитывая описанные возмож­ ности игроков в смысле частичной кооперации и индивидуального поведения?

Вектор а = (а19 а2, а3) в игре «джаз-оркестр» принадлежит С-ядру тогда и только тогда, когда

'<хх>20, а2^30, а3>0,

а1 + а2 + а3 = 100, ^ах + а2>80, а2 + а3^65, а! + а3>50.

Это множество является выпуклой оболочкой следующих трех дележей: (35, 45, 20), (35, 50, 15), (30, 50, 20). Таким образом, выигрыши всех игроков определяются с точностью до 5 руб. Типич­ ным представителем ядра является центр (среднеарифметическое крайних точек) С-ядра, а именно: а* = (33,3; 48,3; 18,3). Для дележа а* характерно, что все двуэлементные коалиции имеют одинаковый дополнительный доход: a, + aj—v({i, y}) = 1,6. Дележ а* является

справедливым компромиссом внутри С-ядра.

9.3. Из того, что С-ядро пусто, не следует невозможность коопе­ рации всех игроков N. Это просто означает, что никакой дележ не может быть стабилизирован с помощью простых угроз, описанных выше. Пустота ядра имеет место тогда, когда промежуточные коалиции слишком сильны. Это утверждение поясняется следу­ ющим образом.

/

1")

0Г ; г " - \ s \ •••

п п

Рис. 12

Рис. 13

157

Пример 17 [10]. (Симметричные игры.) В симметричной игре коалиции с одинаковым числом игроков имеют одинаковый выиг­ рыш. Характеристическая функция v имеет следующий вид:

»(5)=Л|5|)

для всех SczN, где \S\ — число элементов множества S. Предположим без потери общности, что/(1)=0 и #={1, .... л}.

Тогда множеством дележей игры (N, v) является следующий симп­ лекс в FC:

п

£a,=/(n)=i;(iV), a,>0, i = l, ..., п.

i - i

С-ядром является подмножество множества дележей, определенное линейными неравенствами (9.1), т. е. это выпуклый многогранник. В силу симметричности v(S) С-ядро также симметрично, т. е. ин­ вариантно относительно любой перестановки компонент al9 ..., a„.

Учитывая, кроме того, выпуклость С-ядра, можно показать, что оно не пусто в том и только в том случае, когда содержит центр а* множества всех дележей (a*=/(n)/n, i=l, ..., л). Возвращаясь к си­ стеме (9.1), получаем, что С-ядро не пусто тогда и только тогда, когда для всех |.S| = 1, ..., л имеет место неравенство (1/|51)/(|51)<(1/л)/(и). Таким образом, С-ядро непусто тогда и толь­ ко тогда, когда не существует промежуточной коалиции 5", в кото­ рой средняя доля каждого игрока больше соответствующей вели­ чины в коалиции N. Рис. 12 (13) соответствует случаю, когда С-ядро непусто (пусто).

9.4. Пример 18 [2]. Рассмотрим общую игру трех лиц в (0 — 1)- редуцированной форме. Для ее характеристической функции имеем v(0)=v(l)=v(2)=v(3) = O, v(l, 2, 3)=1, .(1, 2)=с3, v(l, 3)=c2, »(2, 3)=сх, где 0<с,^1, /=1, 2, 3. На основании теоремы п. 9.1, чтобы

дележ а принадлежал С-ядру, необходимо и достаточно выполнение следующих неравенств:

о^ + а^Сз, oij + аз^с2 , a2 + a3 ^cx

 

или

 

а3<1 — с3, а2 <1 — с2, a ^ l — cv

(9.3)

Складывая неравенства (9.3), получаем

 

х + а2 4- а3 < 3 - (сх + с2 + с3),

 

или, поскольку сумма всех а,-, /= 1, 2, 3, тождественно равна единице,

Cl + c2 + c3<2.

(9.4)

Последнее неравенство является необходимым условием сущест-

158

вования в рассматриваемой игре непустого С-ядра. С другой сто­ роны, если (9.4) выполняется, то существуют такие неотрицатель­ ные ^ , \г, £3, что

3

£(<?,+&) = 2, с,+{,<1, i=l, 2, 3.

 

Положим /?,= 1—с, —£,, f=l, 2,

 

3. Числа /?, удовлетворяют нера­

 

венствам (9.3), так что дележ

 

/?=(/?!, fl2, /f3) принадлежит С-яд-

 

ру игры. Таким образом, соотно­

 

шение (9.4) является также доста­

Рис 14

точным для существования непу-

стого С-ядра.

Геометрически множество дележей в рассматриваемой игре есть симплекс: а1 + а2 + а3 = 1, а,^0, /=1, 2, 3 (треугольник ABC, рис. 14).

Непустое С-ядро представляет собой пересечение множества деле­ жей (ААВС) и выпуклого многогранника (параллелепипеда) 0<а,<1— с„ i=l, 2, 3. Это часть треугольника АВС, вырезаемая

линиями пересечения плоскостей

 

а,= 1-с„/=1,2, 3

(9.5)

с плоскостью А АВС. На

рис. 14 через а„ /=1, 2, 3, обозначена

прямая, образованная

пересечением плоскостей

а,= 1 —с,

ио1 + о2 3 =1. Точка пересечения двух прямых а, и а, принадлежит

треугольнику АВС, если неотрицательна к-я (кф1, кф]) координата этой точки, в противном случае она находится за пределами А АВС (рис. 15, 16). Таким образом, С-ядро имеет вид треугольника, если совместное решение любой пары уравнений (9.5) и уравнения а1 + а2 + а3 = 1 состоит из неотрицательных чисел. Это требование выполняется при

ci_ + c2~^\,ci + c3^\,c1 + c3^\.

(9.6)

В зависимости от различных случаев (а всего их может быть восемь) С-ядро будет приобретать тот или иной вид. Например, если не выполняется ни одно из трех неравенств (9.6), то С-ядро оказывает­ ся шестиугольником (рис. 16).

9.5. Другим принципом оптимальности в кооперативных играх является Н — М-решение. Н — М-решение, так же как и С-ядро, является множественным принципом оптимальности в множестве

159

Соседние файлы в папке Теория игр