Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

TI_v_EMM_2014

.pdf
Скачиваний:
8
Добавлен:
27.05.2015
Размер:
3.52 Mб
Скачать

p2=1-p и, следовательно стратегию P можно переписать так: P = (p,l-p), p [0,1] . Тогда, используя матрицу

выигрышей (4), получим для выигрышей H(P, П1) И H(P, П2) игрока A при применении им смешанной

стратегии P, соответствующих состоянием природы П1 И П2, следующие представления:

 

H P, 1 4 p1 1 p2 4 p 1 p 3 p 1,

 

H P, 2 2 p1 7 p2 2 p 7(1 p) 5 p 7.

Следовательно показатель эффективности стратегии P будет иметь следующий вид:

 

W(P) = min{H(P,nl), H(P,n2)}= min{3p +1, -5p + 7}.

Ha pис.1

изображены графики выигрышей H(P, П1), H(P, П2) как функций аргумента p [0,1] ,

представляющие

собой отрезки прямых, и график показателя эффективности W(P) как функции от

p [0,1] , являющийся нижней огибающей функций H(P, П1) И H(P, П2) и выделенный жирной линией

Для того чтобы показатель эффективности W(P) был больше 2 : W(P)>2, нeo6ходимо и достаточно,

чтобы

3 p 1 2,

5 p 7 2.

Решая эту систему неравенств, получим: p 1/ 3,1 .

Таким образом, показатель эффективности смешанной стратегии P(p,1-p), определяемой любой вероятностью p 1/ 3,1 . , критерию Вальда выше показателя эффективности W1=2 стратегии A1, оптимальной среди чистых стратегий по тому же критерию.

Найдѐм смешанную стратегию P 0 ( p 0 ,1 p 0 ) , оптимальной среди всех смешанных стратегий

множества SA по критерию Вальда.

Так как по определению стратегии P0, оптимальной среди всех смешанных стратегий множества по критерию Вальда.

W(P°)=maxW(P),

P S A

то оптимальная стратегия P0 находиться во множестве {P=(p, l-p) : p 1/ 3,1 . }и определяется значением

вероятности p°, являющейся абсциссой наивысшей точки N нижней огибающей (CM. PИC. 1). HO TOЧКА N является точкой пересечения отрезков H(P, П1) = 3p+l И H(P, П2) = -5p+7 p [0,1] . Поэтому для

нахождения абсциссы точки N достаточно решить уравнение

3p+1=-5p+7.

Решением является p° = 3/4.

Таким образом, смешанная стратегия

P°= (3/4, ¼)

является оптимальной среди всех смешанных стратегий множества SA по критерию Вальда с наибольшим показателем эффективности

W P0 min{3 p0 1, 5 p0 7} min{3 34 1, 5 34 7} min{134 , 134 } 134 3 14 .

Оптимальной по критерию Вальда стратегия P°= (3/4, ¼) среди всех смешанных стратегий множества SA гарантирует игроку A при любых состояниях природы выигрыш, не меньший, чем 3'/4, в то время как чистая стратегия Al, оптимальной по тому же критерию среди чистых стратегий, гарантировала выигрыш, не меньший всего лишь 2.

Хотя и критерий Вальда, И критерий Cэвиджa являются критериями крайнего пессимизма, но они не эквивалентны. Для доказательства этого вернемся к примеру 2.23.2.

IIpимер. B IIpимере мы показали, что оптимальной (среди чистых стратегий) по критерию Вальда является стратегия A1. Найдѐм оптимальную стратегию по критерию Сэвиджа. Перепишем матрицу игры

(2.21.24), дополнив еѐ строкой максимальных выигрышей j , j=1,2, при каждом состоянии природы:

91

 

Ai, Пj

П1

П2

 

A1

4

2

 

A2

1

7

 

j

4

7

 

 

 

 

По этой матрице составим матрицу выигрышей :

 

 

Ai, Пj

П1

П2

 

 

 

 

 

A1

0

5

 

A2

3

0

Переставив элементы первой строки этой матрицы, получим матрицу

Di ,j

1

2

 

 

 

D1

5

0

D2

3

0

В первом столбце матрицы стоят показатели неэффективности стратегий A1 и A2: R1(1,0)=5, R2(l,0)=3.

Поэтому

min{R1(1,0), R2(l,0)}= min{5; 3}=3 =R2(1,0)

и, следовательно, оптимальной по критерию Cэвиджa будет стратегия A2.

Таким образом, в игре оптимальными по критериям Вальда и Севиджа будут разные стратегии, что и доказывает наше утверждение о неэквиволентности этих критериев.

Мы доказали неэквивалентность критерия Вальда и Сэвиджа, неэквивалентность максимаксного и миниминного критериев. Это означает, что критерии Гурвица относительно выигрышей и относительно рисков неэквивалентны при покателях оптимизма λ=0 и λ=1. В связи с этим возникает вопрос: может быть эти критерии эквивалентны при всех остальных показателях оптимизма λ (0,1)? Оказывается, что ответ на этот вопрос также отрицателен. Приведем соответствующийпример.

Пример. Пусть λ (0,1). По матрице, в первом столбце которой расположены минимальные выигрыши W1=2, W2=1, а во второй – максимальные М1=4, М2=7, определим показатели эффективности стратегий А1 и А2 по критерию Гурвица относительно выигрышей с показателем оптимизма λ.

G1(λ)=(1- λ)*2+λ*4=2λ+2; G2(λ)=(1- λ)*1+λ*7=6λ+1. (2.21.51)

По матрице, в которой первый столбец состоит из максимальных рисков, а второй – из минимальных рисков, выпишем показатели неэффективности стратегий А1 и А2 по критерию Гурвица относительно рисков с тем же показателем оптимизма.

R1(λ)=(1- λ)*5+λ*0=5-5λ; R2(λ)=(1- λ)*3+λ*0=3-3λ. (2.21.52)

Рассмотрим λ (0, 1/4). Имеем: λ<1/4, откуда 4* λ<1. Последнее неравенство можно переписать так: 6-6λ<2-1, откуда 6λ+1<2λ+2. Таким образом, G2(λ)<G1(λ) и потому max{ G1(λ),G2(λ)}= G1(λ). Следовательно, оптимальной среди чистых стратегий по критерию Гурвица относительны выигрышей с показателем оптимизма λ (0, 1/4) является стратегия А1.

Если 1/4 <λ<1, то 1<4λ или 2-1<6λ-2λ, откуда G1(λ)=2λ+2<6λ+1= G2(λ) и, следовательно, max{ G1(λ),G2(λ)}=

G2(λ). Значит оптимальной среди чистых стратегий по критерию гурвица относительно выигрышей с показателем оптимизма λ (1/4, 1) является стратегия А2.

При λ=1/4 в силу (21.51): G1(λ)= G1(1/4)=2*1/4+2=2*1/2; G2(λ)= G2(1/4)=6*1/4+1=2*1/2, т.е. G1(1/4)=G2(1/4) и,

следовательно, в качестве оптимальной по критерию Гурвица относительно выигрышей с показателем оптимизма λ=1/4 можно взять любую из стратегий А1, А2.

Так как λ<1, то 2λ<2, откуда 5λ-3λ<5-3 или R2(λ)=3-3λ<5-5λ=R1(λ) и, следовательно, min{R1(λ), R2(λ)}=R2(λ),

т.е. оптимальной среди чистых стратегий по критерию Гурвица относительно рисков с показателем оптимальности λ (0, 1) является стратегия А2.

Для более обозримого сравнения применения критериев Гурвица относительно выигрышей и рисков к игре с природой составим сводную таблицу оптимальных по этим критериям стратегий, которые мы получили в примерах, в доказательстве теорем. В этой таблице на пересечении строки «название критерия» и столбца «значение показателя оптимизма λ» стоит оптимальная стратегия по этому критерию с данным показателем оптимизма.

Из таблицы мы видим, что оптимальные стратегии по критериям Гурвица относительно выигрышей и рисков разные для показателя оптимизма λ (0, 1/4), одинаковые для λ (1/4, 1), а при λ=1/4 и λ=1 оптимальные стратегии могут быть одинаковыми или разными в зависимости от выбора игрока А.

92

Распространим критерий Гурвица относительно рисков и его частные случаи – критерий Сэвиджа и миниминный критерий на смешанные стратегии.

Значения

показателя

λ=0

0<λ<1/4

λ=1/4

1/4<λ<1

λ=1

оптимизма

 

 

 

 

 

 

Критерии

 

 

 

 

 

 

Критерий

Гурвица

Критерий

А1

А1,А2

А2

Максимаксный

относительно выигрышей с

вальда А1

 

 

 

критерий А2

показателем оптимизма λ

 

 

 

 

 

Критерий

Гурвица

Критерий

А2

А2

А2

Миниминный

относительно

рисков с

Сэвиджа А2

 

 

 

критерий А1, А2

показателем оптимизма λ

 

 

 

 

 

Может существовать смешанная, не чистая, стратегия игрока А, показатель неэффективности которой по критерию Сэвижда будет ниже показателя неэффективности стратегии, оптимальной среди чистых стратегий по тому же критерию.

Это утверждение доказывает следующий

Пример . В предыдущем примере было показано, что стратегия A2 является оптимальной среди чистых

стратегий по критерию Сэвиджа, причем, показатель неэффективности этой стратегии по критерию Сэвиджа

R2 (1, 0) 3 .

Пусть P ( p1 , p2 ) -

произвольная смешанная стратегия

из множества S A .

Так как p1 p2

1, то

p2 1 p1 . Поэтому

, если обозначить p1 p , то

p2

1 p и стратегия P запишется

в виде

P ( p,1 p) .

 

 

 

 

 

Найдем риски R(P, Ï 1 ) и R(P, Ï 2 ) смешанной стратегии P, соответствующие состояниям природы Ï 1 и

Ï 2 :

 

 

 

 

 

r(P, Ï 1 ) p1r11 p2r21 p 0 (1 p) 3 3 3 p ,

 

 

r(P, Ï 2 ) p1r12 p2r22 p 5 (1 p) 0 5 p

 

 

 

Тогда показатель неэффективности стратегии P по критерию Сэвиджа будет равен

 

 

R(P;0) max r(P, Ï 1), r( p, Ï 2 ) max 3 3p,5p .

 

 

Таким образом, каждый из рисков R(P, Ï 1 ) , R(P, Ï 2 )

представляет собой линейную функцию аргумента

p, определенную на отрезке [0,1], а показатель неэффективности R(P; 0) стратегии P является верхней

огибающей этих двух

функций. На рисунке построены графики рисков

R(P, Ï 1 ) , R(P, Ï 2 ) ,

представляющие собой отрезки прямых, пересекающихся в точке N, а верхняя огибающая этих отрезков

выделена жирной линией.

 

 

 

 

Для того, чтобы выполнялось неравенство R(P; 0) <3 необходимо и достаточно, чтобы 3 3 p <3 и 5 p <3.

Решением неравенства 3 3 p <3 является p>0,

а решением неравенства

5 p <3 является

p<3/5. Таким

образом показатель неэффективности смешанной стратегии P ( p,1 p)

при

p (0, 3

)

по критерию

 

 

 

5

 

 

Сэвиджа меньше показателя неэффективности

R2 (1, 0) 3 чистой стратегии

A2 , оптимальной среди

чистых стратегий по тому же критерию:

 

 

 

 

 

93

 

 

r(P,Пj), j=1,2

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

R(P;0)=max{3-3p,5p}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1*7/8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

r(P,Пj)=3-3p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

R(P,П2)=5p

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

Р

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3/8 3/5 1

 

 

 

 

 

 

 

 

 

 

 

 

 

Легко найти смешанную стратегию P0 ( p0 ,1 p0 ) оптимальную среди всех смешанных стратегий

 

множества S A по критерию Сэвиджа.

 

 

 

 

 

 

Поскольку,

по определению,

R(P0 , 0) min R(P; 0) , то оптимальная стратегия P0

будет находиться

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P SA

 

 

 

 

среди стратегий P ( p,1 p) , p (0, 3

 

) , и определяться значением вероятности

p0 , являющемся

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

абсциссой наинизшей точки N верхней огибающей (см. 2.21.2). Поскольку точка N является точкой

пересечения отрезков

 

 

 

 

 

 

 

 

 

 

 

 

 

r(P, Ï

1

) 3 3 p и

r(P, Ï

2

) 5 p , p

 

 

 

 

 

 

 

0,1 , то для нахождения абсциссы этой точки надо решить

уравнение

3 3p 5 p .

Решением этого

уравнения является

p0 3

. Таким образом смешанная

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8

 

 

 

стратегия

 

p0 ( 3

, 5

8

)

является оптимальной среди всех смешанных стратегий множества S по

 

 

 

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

критерию Сэвиджа с наименьшим показателем неэффективности

 

 

 

 

 

 

 

 

R(P0 ; 0) max 3 3 p0 , 5 p0 max 3 3 38 , 5 38 158 ,158 17 8

 

 

94

Теоретический материал для самостоятельного изучения. Вопросы, упражнения, задачи для самостоятельной работы.

Темы для саамостоятельной работы Кооперативные игры. Виды взаимодействия игроков. Характеристическая функция игры. Дележ. Доминирование дележей. С-ядро.

1. Виды взаимодействия игроков В предыдущих темах были рассмотрены некооперативные игры, то есть игры, в процессе которых

игроки не могут действовать совместно. При этом под совместными действиями может подразумеваться добровольный обмен между игроками информацией о выбранных стратегиях, о функциях выигрыша, о других параметрах игры, совместный выбор стратегий, передача игроками части выигрыша друг другу. Этот подход вполне оправдывает себя в целом ряде практически важных случаев. Однако, зачастую способность игроков к совместным действиям является неотъемлемой частью конфликтной ситуации. Примером подобных конфликтов являются задачи дележа. Исследование этих задач требует учета переговорных процессов между игроками. Для этого необходимо изменить модель игры.

Пример. Парето-оптимальное равновесие в примере 5 как результат кооперации игроков.

В примере 5 рассматривалась игра с биматрицей

 

 

сотр, эгоист

сотр

 

10,10

5,15

 

 

 

 

 

 

эгоист

15, 5

0,0

Выше было показано, что единственное равновесие Нэша («эгоист.», «эгоист.») этой игры не оптимально по Парето. В то же время, в реальной жизни подобные конфликты зачастую разрешаются довольно эффективно. Дело в том, что на практике в подобных ситуациях у игроков имеются и другие способы поведения, помимо одновременного выбора их двух стратегий. Модифицируем игру следующим образом: добавим каждому игроку дополнительную стратегию «договор» и доопределим матрицу

выигрышей следующим образом:

 

 

 

 

сотр, эгоист, договор

сотр

 

10,10

5,15

5,15

эгоист

 

 

 

 

 

15, 5

0,0

0,0

 

 

 

15,5

 

 

 

договор

0,0

10,10

 

 

 

 

 

 

Содержательно дополнительную стратегию можно проинтерпретировать следующим образом: первый начальник, выбрав эту стратегию, предлагает второму заключить совместный договор (обычно называемый в таких случаях положением о должностных полномочиях), который бы регламентировал время, которое подчиненный тратит на работы каждого начальника. В случае, если второй начальник отвергнет договор, выбирая «эгоистическую» стратегию (ситуация («договор», «эгоист.»)), первый начальник угрожает также применить «эгоистическую» стратегию, что приводит к нулевым выигрышам для обоих. Если второй начальник выбирает безусловное сотрудничество (это ситуация («договор», «сотр.»)). договор будет подписан на условиях, более выгодных для первого начальника. Если же оба начальника одновременно выходят с инициативой подписания договора (ситуация («договор», «договор»)), их выигрыши равны выигрышам при одновременном сотрудничестве.

В этой игре уже две ситуации равновесия Нэша, («эгоист.», «эгоист.») и («договор», «договор»), причем вторая доминирует по Парето первую. Кроме того, можно заметить, что, при «эгоистической» стратегии второго начальника, первому безразлично, «эгоистическую» ли стратегию выбирать, или «договор». Но если он выберет «договор», стратегия «договор» станет выгодной и второму начальнику. Дело в том, что «эгоистическое» равновесие - это нестрогое равновесие Нэша, в отличие от «договорного».

Все сказанное позволяет надеяться, что именно «договорное» равновесие будет исходом этой игры. Вышеприведенный пример проиллюстрировал, как расширение множества стратегий за счет введения

возможности совместных действий между игроками может вывести игру из неоптимального по Парето равновесия Нэша. Подобные идеи лежат в основе подхода отдельного раздела теории игр, теории кооперативных игр. В теории кооперативных игр взаимодействия игроков формализуются с помощью понятия коалиции. Информационными коалициями будем называть группу игроков, обменивающихся друг с другом информацией. Считается, что в процессе образования коалиции заключаются соглашения,

95

заставляющие игроков сообщать необходимую информацию. При этом возможность блефа, сообщения недостоверной информации, не рассматривается. Коалиции, члены которых могут обмениваться между собой выигрышем, будем называть коалициями полезности, или просто коалициями.

Игры, в которых игроки могут образовывать коалиции полезности, называются играми с трансферабельной полезностью (ТП-играми). В отличие от них игры, в которых игроки могут образовывать только информационные коалиции, называются играми с нетрансферабельной полезностью (НТП-играми).

Исследование ТП и НТП-игр исторически происходило параллельно, однако, теория НТП-игр технически гораздо сложнее, поэтому ниже ограничимся рассмотрением только ТП-игр.

Теория кооперативных игр делает упор в основном на кооперативные действия игроков в процессе игры, то есть ее интересует то, какие коалиции образуются в процессе игры и какие условия необходимы для устойчивого существования коалиций. С этим связано существенное различие в постановке задачи по сравнению с теорией некооперативных игр, основной математической моделью которой является игра в нормальной форме.

Игра в нормальной форме, как достаточно подробное описание конфликтной ситуации, оказалась слишком сложной моделью для исследования кооперативных взаимодействий игроков. Чтобы описать с помощью игры в нормальной форме даже самый простой переговорный процесс, требуется немыслимое усложнение множества стратегий каждого игрока, включающее в себя как элементы, соответствующие передаче информации другим игрокам, так и элементы, описывающие реакцию на их сообщения.

Основная идея теории кооперативных игр состоит в том, чтобы, не рассматривая переговорный процесс как таковой, анализировать возможные его исходы и делать выводы о реализуемости того или иного результата переговоров. Поэтому и элементами описания игры в форме характеристической функции (базовой модели теории кооперативных игр), являются не стратегии игроков, а выигрыши, которые может себе гарантировать та или иная коалиция.

2. Переход от нормальной формы игры к игре в форме характеристической функции Игра в форме характеристической функции может быть построена на основе игры в нормальной

форме. Так обычно и приходится делать, потому что даже кооперативные игры обычно формулируются сперва в нормальной форме — перечислением стратегий игроков и их функций выигрыша.

Характеристическая функция определяет выигрыш, получаемый коалицией S (если в процессе игры такая коалиция образовалась) при рациональных действиях ее участников. Что понимать в каждом конкретном случае под рациональными действиями игроков, должно быть понятным из постановки игры в нормальной форме и выбранной модели рационального поведения Базовая модель кооперативной игры разрешает передачу выигрыша между игроками, а это значит, что

предполагается наличие линейно-трансферабельного товара, например, денег .

Характеристической функцией игры п лиц называется вещественнозначная функция v(S), определенная на подмножествах S N , такая, что ( ) 0 .

Характеристическая функция называется супераддитивной, если

(1) S,T 2N : S T (S) (T) (S T)

то есть для любых непересекающихся коалиций, их объединение может получить полезность не меньшую, чем эти коалиции могли бы в сумме получить, действуя по отдельности. В этих условиях объединение в коалицию, включающую всех игроков, представляет собой самое эффективное с точки зрения суммарной полезности поведение участников игры, однако дополнительного исследования требует устойчивость коалиций.

Супераддитивные игры представляют собой, в некотором роде, типичный случай. Действительно, пусть есть коалиции S и Т с их значениями v(S) и v(Т). Что мешает образующейся коалиции

S T действовать так, как если бы такого объединения не существовало? Тогда полезность этой коалиции будет как минимум равна сумме полезностей коалиций S и Т, обеспечивая супераддитивность. Это - нестрогие рассуждения и, как будет показано ниже, они верны лишь при некоторых предположениях.

Классическая теория рассматривает, в основном, супераддитивные игры. Главными вопросами, которые встают при их исследовании - это вопросы об условиях реализуемости максимальной коалиции и «справедливом» распределении выигрыша v(N) между игроками.

Обычно игровые задачи ставятся в нормальной форме. Для исследования кооперативных взаимодействий игру необходимо перевести в форму характеристической функции. При этом процедура перехода существенно зависит от используемого принципа рационального поведения. Для классической постановки задачи теории кооперативных игр характерно отсутствие информированности членов коалиции о стратегиях игроков, не входящих в коалицию. У членов коалиции не предполагается даже знания о структуре других образовавшихся коалиций. Также предполагается, что выбор стратегий игроками происходит одновременно.

В этих условиях осторожные игроки должны использовать принцип МГР для оценки выигрыша коалиции, к которой они собираются присоединиться. Применение принципа МГР для некоторой коалиции

96

S состоит в минимизации выигрыша коалиции по стратегиям игроков, не входящих в коалицию S, и, затем, в максимизации выигрыша по стратегии коалиции S.

Под стратегией коалиции понимается вектор стратегий ее участников, а под выигрышем коалиции - сумма их выигрышей. Характеристическая функция определяется выражением

 

 

 

 

 

(2) (S)

max

min

Kk ( yS , yN / S ) , где

yS AS

yN / S AN / S

 

 

 

 

 

K S

 

yS ( yi )i S AS Ai - вектор действий участников коалиции S.

i S

Можно заменить чистые стратегии на смешанные. Тогда v(S) будет в точности совпадать с решением антагонистической игры двух лиц - коалиции S и коалиции N\S .

Введенная таким образом характеристическая функция супераддитивна.

Несмотря на удобство использования максимина (то есть применения принципа МГР) для построения характеристической функции, дополнительная информированность игроков может сделать более логичным использование других концепций равновесия. Обратим внимание на то, что переговорный процесс должен сопровождаться передачей игроками друг другу информации о своих функциях выигрыша, поскольку подобные данные могут оказывать существенное влияние на структуру коалиций. В связи с этим можно предположить, что к моменту окончательного выбора коалиции каждый игрок (а, значит, и любая коалиция) будет обладать информацией о целевых функциях всех остальных игроков (а, значит, и всех возможных коалиций). В этих условиях коалиция S должна ожидать от остальных игроков действий, направленных на максимизацию их функций полезности, а не действий, наихудших для коалиции S, как предписывает максимин (напомним, что в играх с произвольной суммой минимаксная стратегия второго игрока может не совпадать с наихудшим, с точки зрения первого игрока, его поведением).

Такие модификации процедуры построения характеристической функции могут приблизить модель к реальному процессу переговоров, однако при этом может нарушаться супераддитивность. Чтобы воспользоваться многочисленными результатами кооперативной теории игр, полученными для супераддитивных игр, необходимо для каждой такой процедуры проверять, сохраняется ли при ее применении свойство супераддитивности.

3. Описание игры в терминах характеристической функции

Определение : Игра в форме характеристической функции задается множеством игроков N и характеристической функцией ( ) на его подмножествах.

Одним из часто встречающихся видов игр являются игры с постоянной суммой.

Определение: Кооперативная игра (N, ) называется игрой с постоянной суммой, если для любой коалиции S справедливо равенство

(3) v(S) + v(N\S) = v(N).

Многими исследователями отмечалось, что вопрос о порядке и способах взаимодействия игроков в теории кооперативных игр разработан недостаточно полно. Однако целью введения характеристической функции, как основы описания игры, является именно упрощение постановки задачи за счет того, что подробности функционирования, такие как: переговорный процесс, процесс образования коалиций, механизмы выработки совместной стратегии, и пр. скрыты «внутри» характеристической функции игры. Такое смысловое наполнение характеристической функции может быть достаточно сложным, однако на уровне постановки задачи поведение игроков описывается относительно просто.

Игроки в процессе игры выбирают, к какой коалиции им присоединиться, и каким образом будет распределяться выигрыш этой коалиции. Затем, после образования коалиций, каждая из них получает выигрыш v(S), равный значению ее характеристической функции. Полученный выигрыш распределяется между членами коалиции согласно предварительной договоренности.

Классическая постановка с целью упрощения задачи не предполагает никакого описания процесса переговоров. Фактически, предметом исследования является рациональное, с некоторой точки зрения, распределение выигрыша коалиции между ее участниками.

Обычно считается, что выигрыш коалиции равен значению характеристической функции для этой коалиции. Однако можно заметить, что характеристическая функция определяет гарантированный выигрыш, но, в общем случае, в результате игры коалиция может получить и выигрыш, больший гарантированного, определяющего лишь минимальное значение выигрыша при самых неблагоприятных условиях. Проблема распределения такого «неожиданного» дохода лежит за рамками исследования кооперативной теории игр, так как этот «бонус» не влияет на рациональную, с точки зрения игроков, структуру коалиций. Считается, что процесс кооперирования опирается только на имеющуюся информацию, в роли которой выступает лишь характеристическая функция игры.

Перейдем к обсуждению возможных способов распределения выигрыша коалиции между ее участниками.

97

4. Определение дележа, доминирование дележей

Определение: Эффективным распределением супераддитивной игры (N, v) называется вектор х = (х1, x2, ..., хn), такой, что

(4) xi (N ) i N

Определение: Дележом для игры (N, v) называется эффективное распределение, удовлетворяющее условию

(5) xi ({i}), i N

Множество дележей игры (N, v) будем обозначать E(v).

Условие (4) ограничивает понятие дележа лишь случаем, когда игроки достигли достаточного взаимопонимания, чтобы образовать коалицию, состоящую из всех игроков.

Условие (5) называемое еще индивидуальной рациональностью (individual rationality), предлагает рассматривать только распределения полезности, дающие каждому игроку значения выигрыша не меньшие, чем он получил бы, действуя в одиночку. Это условие позволяет сразу ограничится рассмотрением только множества инивидуально рациональных распределений дохода между игроками.

Определение дележа приводит к понятию существенных игр. Супераддитивная игра называется существенной, если

(6) (Т ) ({i}).

i N

В противном случае супераддитивная игра называется несущественной.

Несущественность игры означает нулевой эффект от кооперации. Действительно, выигрыш любой коалиции в несущественной игре равен просто сумме индивидуальных выигрышей ее участников.

Множество дележей несущественной игры состоит из единственного элемента (7) xi ({i}), i N

Доказательство этого утверждения следует непосредственно из определений дележа и несущественной игры (см. (5)-(7)).

Обычно рассматриваются лишь существенные игры, так как вопрос о поиске решения среди дележей несущественной игры тривиален.

Пусть х и у — два дележа, и S— произвольная коалиция. Говорят, что х доминирует у по коалиции S (обозначается х >s у), если

(8)xi yi , i S ,

(9)xi (N) .

i S

Если существует коалиция S, такая, что x>s у, говорят, что х доминирует у (обозн. x> у ).

Условие (8) означает, что дележ х лучше дележа у для членов коалиции S, а условие (9) отражает реализуемость дележа х коалицией S - если оно выполнено, то коалиция действительно может предложить

своим участникам выигрыши xi .

Определение: Игры п лиц с характеристическими функциями и и v называются изоморфными, если существует функция f, взаимно однозначно отображающая множество дележей игры и на множество дележей игры v таким образом, что для любой пары дележей х и у игры и и произвольной коалиции S из доминирования дележа л дележом у следует доминирование образа f(x) образом f(y). Иначе говоря, х>sy у

f{x) >s f(y), где f ( ) - дележи игры v.

При анализе свойств игры с помощью отношения доминирования полезно значь, у каких игр множества дележей имеют одинаковую структуру доминирования, то есть какие игры являются изоморфными.

Определение: Игры п лиц и и v называются S-эквивалентными, если существует положительное число r и п таких вещественных чисел 1... n что для любой коалиции S N

(10) (S) r u(S) i .

i S

Теорема. Если и и v являются S-эквивалентными, то они изоморфны.

Определение: Игра v называется игрой в (0, 1 )-редуцированной форме, если

i N ({i}) 0, (N) 1.

Теорема. Любая существенная игра S-эквивалентна одной и только одной игре в (0, 1)-

редуцированной форме.

 

 

Таким образом,

определение

вводит классы игр, изоморфных относительно операции

доминирования, теорема

дает удобный способ проверки изоморфности игр, а теорема утверждает, что

 

 

98

анализ игр с помощью отношения доминирования можно ограничить анализом игр в (0, 1)-редуцированной форме.

Понятия дележа и доминирования дележей играют немаловажную роль в формулировках концепций решения, изложение которых представлено ниже.

5. Концепции решения кооперативных игр В теории кооперативных игр, также как и вообще в теории игр, не существует единой концепции

решения. Это связано с тем, что в начальной стадии развития теории были разработаны достаточно простые модели игр, которые легко поддавались анализу, и, соответственно, простые концепции решений, такие, как С-ядро и НМ-решения. По мере развития теории встал вопрос о практической применимости полученных результатов. Для того чтобы приблизить теорию к примерам игр, встречающихся в жизни, были разработаны более сложные модели, например, игры с нетрансферабельной полезностью, игры «в разбиениях» и др. Параллельно появлялись как обобщения понятий решения на эти более сложные модели, так и новые концепции решений. Некоторые концепции решения пришли в теорию игр из теорий общественного благосостояния и кооперативного выбора . Темой исследования этих теорий является задача выбора коллективных решений в обществе. Понятно, что коллективный выбор должен быть (или желательно, чтобы был) единственным. Для сужения круга возможных решений эти теории пользуются аксиоматическими предположениями о стратегии принятия коллективных решений. В этих аксиомах широко используется понятие «справедливого» распределения благ (то есть распределения выигрышей, полезности и т.д.).

С понятием справедливости в условиях принятия решения обществом связана отдельная проблематика. Аксиоматический подход предполагает, что при исследовании ситуации выбора, для того, чтобы обосновать выбор общества, исследователь делает предположения, более или менее очевидные, о моральных установках данного общества, и, тем самым, определяет, что в данном обществе понимается под справедливостью. Парадокс состоит в том, что многие достаточно очевидные и соответствующие здравому смыслу по отдельности предположения оказываются противоречащими друг другу. На сегодняшний момент в науке не существует единого мнения о том, что понимать под справедливостью. Двумя основными концепциями справедливого распределения благ являются эгалитаризм и утилитаризм. Эгалитаризм утверждает, что при распределении благ в первую очередь следует обращать внимание на полезность наиболее «обделенных» членов общества. Утилитаризм же считает справедливым «эффективное» распределение, приводящее к наибольшей сумме полезностей членов общества. Применение этих концепций к теории кооперативных игр приводит к понятиям N-ядра и вектора Щепли соответственно.

Все концепции решения кооперативных игр, определяющие в качестве решения единственное распределение полезности между игроками, называются значениями игры.

6. С-ядро Если игроки пришли к такому дележу х выигрыша максимальной коалиции, что не существует

дележа, доминирующего дележ x. то дележ x устойчив в том смысле, что никакой коалиции S не выгодно отделяться от коалиции N и делить между членами этой коалиции выигрыш v(S).

Теорема. Для того чтобы дележ х принадлежал С-ядру, необходимо и достаточно выполнения для всех S N неравенств

(11) xi (S) . i N

Доказательство очевидно.

Эта теорема дает удобный способ нахождения С-ядра путем решения системы неравенств. Решением

этой линейной системы является выпуклый многогранник в пространстве N . Можно найти его крайние точки и описать любой дележ из ядра, как взвешенную линейную комбинацию крайних точек.

Итак, С-ядро существует не для всех игр. Мало того, даже условие супераддитивности является лишь необходимым, но не достаточным условием существования непустого ядра. Например, все игры с постоянной суммой имеют пустое С-ядро.

Необходимым и достаточным условием существования непустого ядра является свойство

сбалансированности игры.

Определение: Максимальной коалицией называется коалиция, состоящая из всех игроков. Определение: Собственной коалицией называется коалиция, отличная от максимальной коалиции. Определение: Для данного множества игроков N сбалансированным покрытием называется такое

отображение ( ) из 2N /{N} в [0,1], что

S 1 для всех игроков I,

S:i S

причем суммирование ведется по всем собственным коалициям, содержащим игрока i.

99

Теорема. С-ядро игры (N, v) не пусто тогда и только тогда, когда для любого сбалансированного покрытия ( ) выполнено неравенство

(12) S (S) (N) .

S N

Если для игры выполнено условие (12), то игра называется сбалансированной.

Например, для супераддитивной игры трех лиц непустоту С-ядра гарантирует следующее дополнительное (к условиям супераддитивности) условие v ({l,2}) + v ({l,3}) + v ({2,3})<2 v (V). Для игры четырех лиц условия сбалансированности задаются уже семью дополнительными неравенствами, и т.д.

Кооперативные игры

Пример. «Нахождение С-ядра игры трех лиц».

Рассмотрим игру трех лиц с характеристической функцией v(S): v({l}) = v({2}) = v({3}) = 0, v({l,2}) = 0.5, v({l,3}) = 0.6, v({2,3}) = 0.7, v(N) = l. Условие на дележи, принадлежащие С-ядру, задается системой неравенств:

x1 x2 0.5

(25)x1 x3 0.6x2 x3 0.7

x1 x2 x3 1

Множество дележей игры трех лиц можно изобразить на симплексе (см. рисунок 9), то есть на

треугольнике, задаваемом в 3 неравенствами xi,>0, i=1,3, и равенством xi (N ) 1

i N

(изображен на рисунке 9 серым цветом).

Неравенства (25) делят симплекс на области, границы которых параллельны одной из его сторон. С- ядро выделено на рисунке черным цветом. В зависимости от вида характеристической функции оно может быть множеством трех-, четырех-, пяти- и шестиугольной формы, может вырождаться в линию или точку. Оно может быть и пустым множеством.

Рис. 9. С-ядро в игре с тремя игроками

Рефлексивные игры.

Как отмечалось выше, основная задача теории игр заключается в описании взаимодействия нескольких агентов, интересы которых не совпадают, а результаты деятельности (выигрыш, полезность и т.д.) каждого зависят в общем случае от действий всех. Итогом подобного описания является прогноз разумного исхода игры – так называемого решения игры (равновесия).

Описание игры заключается в задании следующих параметров:

- множества агентов;

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]