game_theory
.pdf
4.3.ПРИМЕРЫ |
|
|
|
|
|
|
|
191 |
Целевая функция публики в момент времени s = 1, 2 равна |
|
|
|
|
|
|||
|
|
|
Usp = 1 − τs + u(Gs), |
|
|
|
|
(4.82) |
где u′ > 0, u′′ < 0.6 |
Определим задачу максимизации благосостояния публики при данном |
|||||||
θ θH , θL: |
|
|
|
|
|
|
|
|
max Up = 1 |
− |
τ + u(G) при ограничениях τ = θG + s, s |
≥ |
0 и τ |
|
[0, 1]. |
(4.83) |
|
s,G,t |
|
|
|
|
|
|||
Очевидно,что в таком случае s = 0.Мы будем получим условия первого порядка |
|
|||||||
|
|
|
u′(G) = θ |
|
|
|
|
(4.84) |
при |
|
|
|
|
|
|
|
|
4.3.5Блеф в покере.
Покер7 — одна из самых распространенных в мире карточных игр;в нее и грают как миллионы любителей,так и профессионалы,зарабатывающие игрой на жи знь.По покеру проводятся многочисленные чемпионаты.Когда идет серьезная игра,то люди ,сидящие за столом,стараются скрыть любые эмоции.Иногда,игроки надевают темные очки сп ециально для того,чтобы по выражению их лиц нельзя было понять совершенно ничего.Если игроку удается сделать «покерное лицо»,то его карты известны только ему самому:покер — эталонная игра с неполной информацией.Может ли теория игр рассказать нам что-нибудь новое о покере?
Рассмотрим игру с двумя игроками.У каждого на руках пять кар т;ценность руки опре-
деляется комбинацией из этих карт.Например,«тройка» — три |
карты одного достоинства, |
например,три валета — то это более высокая комбинация,чем « |
две двойки»(например,два |
короля и две девятки).Будем считать,что ценность карт у пер вого игрока — это величина p, известная ему одному.Второй игрок считает,что эта величин а равномерно распределенная на интервале [0, 1].Аналогично,пусть q — ценность карт у второго игрока;первый игрок также
предполагает,что q равномерно распределена на [0, 1]. |
|
|
Предположим,что в начале игры Игрок2сделал ставку,равную |
1рублю.Игрок1может |
|
либо уравнять эту ставку(«чек»),либо поднять ставку до2ру |
блей(«рейз»).Если первый |
|
игрок уравнивает ставку,то торговля прекращается и игроки |
открывают карты;тот,у кого |
|
более сильная комбинация,выигрывает1рубль,тот,у кого сл абая комбинация — проигрывает. Конечно же,мы здесь рассматриваем сильно упрощенные прави ла.В настоящей игре,второй игрок имел бы право поднять ставку после «чека» первого игрока.
Если первый игрок поднял ставку,то второй игрок может сдела ть одну из двух вещей: либо уравнять ставку(«колл»),либо сбросить карты(«фолд» ).Если второй игрок сбрасывает карты,то он проигрывает поставленный им1рубль.Если он ура внивает ставку,то оба игрока вскрывают карты,и выигрывает игрок с более сильной комбина цией — но на этот раз размер
выигрыша(и проигрыша)составит2рубля(опять же,в настоящ |
ей игре торговля могла бы |
продолжаться).Дерево этой игры изображено на рисунке ??. |
|
Обозначим за p(u) поведенческую стратегию первого игрока — то есть вероятность того, что он поднимет ставку в случае,если его комбинация составл яет u.Аналогично определим q(v) — вероятность того,что игрок2уравняет ставку,в случае,ес ли она была поднята первым игроком(и если комбинация второго игрока составляет v).
6Выигрыш публики есть квазилинейная функция от объема потребления частных благ 1 − ts и объема по - требления общественных благ Gs. Мы , без потери общности , предполагаем , что облагаемый налогом доход равен
1.
7Этот пример взят из учебника Кеннета Бинмора(1992).Авторст во задачи приписывается великому математику Джону фон Нейману,одному из основоположников теори и игр .
192 |
ГЛАВА4.ДИНАМИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ |
Найдем ожидаемые выигрыши каждого из игроков в зависимости от играемых ими стратегий.Если p — вероятность того,что первый игрок поднимет ставку и q — вероятность того,что второй игрок ее уравняет,то с вероятностью pq оба игрока раскрывают карты при удвоенных ставках;с вероятностью p(1 − q) второй игрок сбрасывает карты при удвоенных ставках;и с вероятностью (1−p) игроки раскрывают карты при обычной ставке.Ожидаемый выиг рыш пер-
вого игрока составит 1−p+p(1−q)+2pq = 1+pq при v < u и −(1−p)+p(1−q)−2pq = 2p−1+3pq
при u < v.Следовательно,ожидаемую полезность первого игрока можн о записать как
U1 = |
20 u(1 + p(u)q(v))dv + |
2u1 |
(2p(u) − 1 − 3p(u)q(v))dv. |
(4.85) |
|||
Обозначая |
|
|
|
|
|
|
|
|
S1(u) |
= 2(1 − u) + |
20 u q(v)dv − 3 |
20 |
1 q(v)dv |
(4.86) |
|
|
T1(u) |
= 2u − 1, |
|
|
|
|
(4.87) |
мы можем переписать |
|
|
|
|
|
|
|
|
|
U1 = p(u)S1(u) + T1(u). |
|
|
(4.88) |
||
Аналогично мы можем выписать функцию полезности второго игрока:
U2 = − |
2v |
1 |
(1 + p(u)q(v))du − |
20 v(2p(u) − 1 − 3p(u)q(v))du. |
(4.89) |
||||||
Обозначая |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
S2(v) |
= 3 |
20 v p(u)du − |
2v |
1 p(u)du |
(4.90) |
|||
мы можем переписать |
|
|
T2(v) |
= 2v − 1 − |
2v |
1 p(u)du, |
(4.91) |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
U2 = q(v)S2(v) + T2(v). |
(4.92) |
||||||
Так как функции U1 и U2 линейны по p(u) и q(v),соответственно,то в равновесии бы обязаны иметь p(u) = 1 при S1(u) > 0, p(u) = 0 при S1(u) < 0, q(v) = 1 при S2(v) > 0, и q(v) = 0 при
S2(v) < 0.
|
Заметим,что в равновесии |
S2(v) является неубывающей функцией.Из(4.90)следует,что |
|||||||||||||
S′ |
(v) = 4p(v) |
≥ |
0,причем S |
(0) |
≤ |
0 и S |
(1) |
≥ |
0.Из непрерывности S |
2 |
следует,что существуют |
||||
2 |
|
2 |
|
2 |
|
|
|
|
|
|
|
||||
η и ν,такие,что |
q(v) = 0 при v < η, q(v) = 1 при v > ν, и S2(v) = 0 при v [η,ν ]. |
|
|
|
|||||||||||
|
Из последнего утверждения следует,что |
S′ (v) = 0, или p(v) = 0, при v |
|
[η,ν ],причем |
|||||||||||
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
p(u) > 0 при u / [η,ν ].Найдем,чему равен |
(u) при u < η.Мы знаем,что S′ (u) = |
− |
2 + 4q(u). |
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
Так как q(u) = 0 при u < η, S1(u) является строго убывающей функцией на этом интервале. Из того,что p(u) > 0 на этом интервале,следует то,что S1(u) ≥ 0.Но так как это — строго убывающая функция,мы обязаны иметь S1(u) > 0 и p(u) = 1 для u < η.
Аналогично,для u > ν мы имеем q(u) = 1 и следовательно S1(u) является строго возраста-
ющей функцией.Так как p(u) > 0 при u > ν,мы также обязаны иметь |
S1(u) > 0 и p(u) = 1. |
||
Мы,таким образом,получили равновесную стратегию для перв ого игрока: |
|||
$ |
1, |
u [0, η) (ν, 1]. |
|
p(u) = |
0, |
u [η,ν ] |
(4.93) |
Решая систему S1(η) = S1(ν) = S2(η) = S2(ν), мы получим η = 101 и ν = 107 .Таким образом,во всех возможных равновесиях первый игрок реализует одну и ту же стратегию.
194 ГЛАВА4.ДИНАМИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ
в обоих случаях π распределен на [0, 1],причем оба распределения имеют ненулевую плотность f(·|H) и f(·|L).Добросовестная работа приносит большую выручку;это отра жено в нашем предположении,что F (π|H) ≤ F (π|L) для всех π [0, 1].
Рассмотрим сначала наиболее простой вариант задачи,когда хозяин имеет возможность
наблюдать за действиями продавца.В таком случае,зарплата |
продавца может зависеть как от |
выручки,которую он показал,так и от его добросовестности. |
Пусть wH (·) и wL(·) — зарплаты |
(зависящие от π),которые хозяин выплачивает в том случае,если продавец вы бирает e = H либо e = L.
Выигрыш продавца зависит от его зарплаты и от его добросовестности.Пусть v(w) — вы -
игрыш продавца при зарплате w и недобросовестном поведении, |
v(w) − c — при зарплате w |
||||
и добросовестном поведении.Будем считать,что |
v′ > 0 и v′′ < 0.Таким образом,ожидаемый |
||||
выигрыш продавца равен |
|
8 v(wL(π))f(π |
|L)dπ, − |
|
|
U2 |
= |
e = L |
(4.95) |
||
|
|
v(wH (π))f(π H)dπ |
c, e = H |
|
|
|
|
u,¯ |
| |
e = N, |
|
|
|
8 |
|
|
|
где u¯ — гарантированный уровень зарплаты,которую продавец може т получить на альтернативной работе.Выигрыш хозяина будет
|
U2 = |
8 |
(π − wL(π))f(π |L)dπ, |
e = L |
(4.96) |
|||
|
|
|
(π wH (π))f(π H)dπ, e = H |
|
||||
|
0, |
− |
| |
|
e = N. |
|
||
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Предположим,что хозяин хочет добиться уровня усилий |
e = L.Его задача — найти |
wL(π) |
||||||
и wH (π),максимизирующий |
2 |
|
|
|
|
|
||
при ограничениях |
|
(π − wL(π))f(π|L)dπ |
|
(4.97) |
||||
|
|
|
|
2 |
|
|
|
|
2 |
v(wH(π))f(π|H)dπ − c ≤ |
v(wL(π))f(π|L)dπ |
(4.98) |
|||||
и |
|
2 |
|
|
|
|
|
|
|
|
|
v(wL(π))f(π|L)dπ ≥ u¯. |
|
(4.99) |
|||
Легко убедиться(что предлагается сделать в качестве упраж нения),что решением этой задачи будет установление заработной платы,не зависящей от объем а продаж :wL(π) = u¯ и wH (π) ≤ u¯+c.Аналогично,если хозяин хочет,чтобы продавец выбрал e = H,то он установит заработную плату wH = u¯ + c и wL ≤ u¯.Таким образом,будет верно следующее:
1.Полезность продавца всегда равна полезности на альтерна тивной работе u¯.
2.Предложенный хозяиным контракт парето-эффективен,то е сть он максимизирует суммарный выигрыш продавца и хозяина U1 + U2 по всем возможным e {L, H} и w(·).
Намного интересней тот случай,когда любой уровень продаж, возможный при недобросовестном поведении,также возможен,если продавец ведет себ я добросовестно.У него всегда есть «отмазка».Как бы мало товара он не продал,он всегда мож ет сослаться на то,что он старался,как мог,но день выдался хуже некуда.В таком случае,е сли слишком сильно наказывать продавца за низкие продажи,то можно и вовсе лишиться работн ика,так как низкие продажи возможны и в том случае,если он работает добросовестно.Теп ерь,заработная плата не может зависеть от прилагаемых продавцом усилий,но только от пока занной им выручки.Обозначим
4.3.ПРИМЕРЫ |
195 |
заработную плату,предлагаемую хозяиным,за w(·).Ожидаемые выигрыши продавца и хозяина будут
|
U2 |
= |
8 v(w(π))f(π|L)dπ, − |
|
e = L |
(4.100) |
||||
|
|
|
u,¯ |
v(w(π))f(π H)dπ |
c, e = H |
|
||||
|
|
|
|
|
| |
|
e = N, |
|
||
|
|
|
|
8 |
|
|
|
|
|
|
где u¯ — гарантированный |
уровень зарплаты,которую продавец може т получить на альтерна- |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
тивной работе.Выигрыш хозяина будет |
− w(π))f(π|L)dπ, |
|
|
|||||||
|
U2 |
= |
8 |
(π |
e = L |
(4.101) |
||||
|
|
|
|
|
(π w(π))f(π H)dπ, e = H |
|
||||
|
|
|
0, |
− |
| |
|
e = N. |
|
||
|
|
|
|
8 |
|
|
|
|
|
|
Сразу заметим,что хозяин |
всегда может предложить контракт , при котором работник вы - |
|||||||||
|
|
|
|
|
|
|
|
|
||
берет уровень усилий e = L.Пусть зарплата не зависит от выручки и обеспечивает полезн ость, равную полезности на альтернативной работе: w¯ = v−1(¯u).При такой стратегии хозяина,одним из равновесных ответов продавца будет e = L.
Возможен ли контракт,при котором работник выберет уровень усилий e = H? При данном
w(π),необходимо,чтобы выполнялось следующие условия: |
|
||||
2 |
v(w(π))f(π|H)dπ − c |
≥ |
2 |
v(w(π))f(π|L)dπ |
(4.102) |
2 |
v(w(π))f(π|H)dπ − c |
≥ |
u¯. |
|
(4.103) |
Соответственно,в совершенном по подыграм равновесии хозя ин должен решать следующую задачу:
|
max |
(π |
− |
w(π))f(π |
H)dπ |
|
(4.104) |
||||
|
w(·) 2 |
|
|
|
| |
|
|
|
|||
при условиях(4.102)и(4.103),которые должны выполняться |
при всех π [0, 1].Выпишем |
||||||||||
лагранжиан для этой задачи: |
|
|
|
|
|
|
|
|
|
||
L = 2 (π − w(π))f(π|H)dπ + λ )2 v(w(π))f(π|H)dπ − c − 2 v(w(π))f(π|L)dπ* + |
|||||||||||
+ µ )2 |
|
v(w(π))f(π|H)dπ − c − u¯*. |
(4.105) |
||||||||
Условием первого порядка должно быть |
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
∂L |
= 0 |
|
|
|
(4.106) |
|
|
|
|
∂w(π) |
|
|
||||||
|
|
|
|
|
|
|
|
||||
для всех π [0, 1].Следовательно,в любом совершенном по подыграм равновеси |
и,в котором |
||||||||||
e = H,мы должны иметь |
|
|
|
|
|
|
|
|
|
||
−f(π|H) + λv′(w(π))(f(π|H) − f(π|L)) + µv′(w(π))f(π|H) = 0, |
(4.107) |
||||||||||
или |
= µ + λ )1 − |
|
|
* |
|
||||||
1 |
|
f(π H) |
|
||||||||
|
|
|
f(π| L) |
(4.108) |
|||||||
v′(w(π)) |
|||||||||||
|
|
|
|
|
|
|
|
|
| |
|
|
для каких-то µ ≥ 0, λ ≥ 0.
Убедимся,что в любом равновесии мы должны иметь λ > 0, µ > 0. Так как F (π|H) ≤ F (π|L) для всех π [0, 1],причем F (0|H) = F (0|L) = 0 и F (1|H = F (1|L) = 1,для какого-то π (0, 1)
4.3.ПРИМЕРЫ |
197 |
Найдем ожидаемый доход хозяина при низком и высоком уровне уcилий продавца.Мы имеем
RL = |
2 |
πf(π|L)dπ = |
1 |
|
|
|
|
2 |
|
|
|
||||
RH = |
2 |
πf(π|H)dπ = |
5 |
. |
(4.110) |
||
|
|
||||||
8 |
|||||||
Пусть хозяин решает предложить продавцу контракт,обеспеч ивающий уровень усилий e = L.Мы будем иметь v(w¯) = u¯, или w¯ = u¯2.Такой контракт будет приносить продавцу ожидаемую прибыль
ΠL = RL − w¯ = |
1 |
− u¯2, |
(4.111) |
2 |
причем прибыль будет положительной при u¯ < 1 .
√
2
Пусть теперь хозяин решил предложить контракт,при котором продавец выберет уровень усилий e = H.Согласно(4.108),он предложит зарплату w1 если продавец покажет прибыль π [0, 12 ),и зарплату w2 > w1 если π [12 , 1].Так как условия(4.102)и(4.103)оба выполняются со знаком равенства,мы можем найти w1 и w2 напрямую.Мы имеем
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|||||
2 |
v(w(π))f(π|H)dπ = |
√w1 |
+ |
√w2 |
(4.112) |
|||||||||||||||||||||
|
|
4 |
4 |
|||||||||||||||||||||||
и |
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
2 |
v(w(π))f(π|L)dπ = |
|
√w1 |
+ |
√w2. |
(4.113) |
||||||||||||||||||||
|
|
|
|
|||||||||||||||||||||||
2 |
2 |
|||||||||||||||||||||||||
Подставив полученные величины в(4.102)и(4.103),выполня |
|
|
|
|
|
емые со знаком равенства,мы |
||||||||||||||||||||
получим |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
w1 = (¯u − 2c)2, |
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
w2 |
= (¯u + 2c)2. |
|
|
|
|
|
|
|
|
|
(4.114) |
||||||||||||
Ожидаемая прибыль хозяина при этом будет равна |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
1 |
|
3 |
|
5 |
− u¯2 − 4c2 − 2¯uc. |
(4.115) |
|||||||||||||||||||
ΠH = RH − |
|
w1 |
− |
|
w2 = |
|
|
|||||||||||||||||||
4 |
4 |
8 |
||||||||||||||||||||||||
Итак,в равновесии хозяин предложит следующий контракт,в з ависимости от c и u¯:
1. |
81 |
≥ 4c2 |
+ 2¯uc1, 85 − u¯2 − 4c2 − 2¯uc ≥ 0: Контракт с e = H,предлагающий w1 при π [0, 21 ) и |
||||
|
w2 при |
π [2 , 1]. |
|
|
|||
2. |
1 |
|
2 |
1 |
|
|
|
8 |
< 4c |
|
+ 2¯uc, u¯ < √ |
|
: Контракт с e = L,предлагающий w¯ |
вне зависимости от прибыли. |
|
|
2 |
||||||
3.Любой другой случай:Продавец не может обеспечить себе по ложительную прибыль.Например,он получает нулевую прибыль,предлагая зарплату,м еньшую,чем u¯.
Приложение.
Доказательство Теоремы18о существовании совершенного ра вновесия.
Сначала дадим два альтернативных определения совершенного равновесия.Первое из них приводится у Зелтена(1975),второе — у Майерсона(1978).
Пусть G — конечная игра в нормальной форме, ϵ < ϵ0 = mini 1 .Пусть Σϵ — множество всех
|Si| i
смешанных стратегий игрока i,в котором каждая чистая стратегия играется с вероятностью , не меньшей,чем ϵ.
198 |
ГЛАВА4.ДИНАМИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ |
||||||
Определение55 |
ϵ |
0 |
.Пусть |
Gϵ = |
|
|
, σ ϵ — |
Пусть G — игра в нормальной форме, ϵ < ϵ |
|
I, Σϵ, u |
|||||
равновесие в игре G . Назовем его ϵ-ограниченным равновесием.
Совершенное равновесие можно определить относительно σϵ:
Определение56 Пусть ϵk → 0 — последовательность, ϵk < ϵ0.Будем говорить,что σ — совершенное равновесие,если он является пределом какой-то п оследовательности σ ϵk .
Для того,чтобы ввести третье по счету определение совершен ного равновесия,понадобится еще одно вспомогательное понятие.
Определение57 Профиль стратегий σϵ называется ϵ-совершенным равновесием,если он является вполне смешанным,и если для всех i, для всех si Si,если существует такое s′i Si, что
ui(si, σ−ϵ i) < ui(s′i, σ−ϵ i),
то σiϵ(si) ≤ ϵ.
Здесь не задана минимальная вероятность,с которой играютс я чистые стратегии каждого из игроков и не требуется,чтобы равновесная стратегия была наилучшим ответом на профиль стратегий других игроков(как в ϵ-ограниченном равновесии в Определении55),но требуется, чтобы «неэффективные» стратегии игрались с малой вероятностью.Определим совершенное равновесие как предел ϵ-совершенных:
Определение58 Профиль стратегий σ называется совершенным равновесием,если существует последовательность ϵk → 0, ϵk < ϵ0, что σ будет пределом последовательности ϵk-совершенных равновесий:
σ = lim σϵk
k→∞
Опять же,выбирая разные последовательности мы будем получ ать различные равновесия. Теперь докажем эквивалентность всех трех определений совершенных равновесий.
Лемма8 Определения46, 56, 58совершенного равновесия эквивалентны.
Доказательство леммы8.
Докажем,что из определения56следует определение58,из58 —46,и,замыкая круг,из46 следует56.
1.Определение56 Определение58.Пусть σϵ — ϵ-ограниченное равновесие.Докажем,что оно будет ϵ-совершенным.Первое свойство определения57выполняется автоматически,а второе следует из свойств максимума линейной функции.Пуст ь для каких-то двух чистых стратегий i-го игрока s′i и s′′i верно,что ui(s′i, σ−ϵ i) < ui(s′′i , σ−ϵ i).Пусть стратегия s′i играется
с вероятностью σi(si′),строго большей,чем ϵ.Определим |
|
|
|
|
||||||||
|
|
σ¯i(si) = |
ε, |
|
|
|
если si = si′ |
, |
|
= s′′, |
||
|
|
|
σϵ |
(s |
i |
), |
если s |
= s′ |
, |
s |
||
|
|
|
i |
|
|
|
i ̸ i |
|
|
i ̸ |
i |
|
|
|
i Σi. Так |
σiϵ |
(si′′) + σiϵ(si′) − ϵ, |
если si = si′′. |
|
|
|
||||
Заметим,что |
σ¯ |
|
|
|
|
|
|
|
|
|
|
|
|
|
ϵ |
|
|
|
|
|
|
|
|
|
|
|
|
|
ui(si′, σ−ϵ i) < ui(si′′, σ−ϵ i) и σiϵ(si′) > ϵ , |
|
|
(4.116) |
||||||
4.3.ПРИМЕРЫ |
|
199 |
получим |
|
|
(σiϵ(si′) − ϵ)ui(si′, σ−ϵ i) < (σiϵ(si′) − ϵ)ui(si′′, σ−ϵ i), |
(4.117) |
|
или |
|
|
σiϵ(si′)ui(si′, σ−ϵ i) + ϵui(si′′, σ−ϵ i) < ϵ ui(si′, σ−ϵ i) + σiϵ(si′)ui(si′′, σ−ϵ i), |
(4.118) |
|
из чего следует ui(σϵ) < ui(¯σi, σϵ |
). |
|
−i |
|
|
Это противоречит предположению о том,что σiϵ является наилучшим из множества Σϵi ответом на σ−ϵ i.Следовательно,любое ϵ -ограниченное равновесие является ϵ -совершен- ным.Для завершения доказательства этого пункта остаётся л ишь заметить,что в случае полного совпадения сходящихся последовательностей их пределы равны.
2.Определение58 Определение46.Возьмем последовательность ϵk → 0 и σϵk — соовтествующею последовательность ϵk -совершенных равновесий,удовлетворяющих опреде-
лению58.Тогда,используя свойства предела последователь |
ности,разобьём все чистые |
|||
стратегии i-го игрока на два класса:те,для которых σiϵk (si) > d для всех k ≥ k0ϵkи какой - |
||||
то d > 0,не зависящей от k (обозначим этот класс как Si′),и те,для которых |
σi (si) → 0 |
|||
при k |
→ ∞ |
(обозначим этот класс как S′′).Заметим,что в смешанной стратегии |
σ с подо - |
|
|
i |
|
i |
|
жительной вероятностью играбтся только чистые стратегии из Si′.Множество |
Si′ непусто |
|||
в силу конечности числа стратегий i-го игрока и того,что |
& σi(si) = 1. Тогда любая |
|||
|
|
|
si Si |
|
стратегия i-го игрока s′i из множества Si′ должна быть наилучшим ответом на профиль
ϵk |
|
Действительно,иначе существовала |
|
смешанных стратегий других игроков σ−i при k ≥ k0.ϵk |
ϵk |
||
бы такая смешанная стратегий σ¯i Σi, что ui(¯σi, σ−i) > ui(si′, σ−i).Но отсюда следует |
|||
существование чистой стратегии i-го игрока s¯i Si,для которой выполнено: |
|||
ui(¯si, σϵk ) > ui(s′ |
, σϵk ). |
|
|
−i |
i |
−i |
|
Тогда,согласно определению58,выполняется |
σϵk (s′) < ϵk |
и не может быть такого,что |
|
|
i |
i |
|
σiϵk (s′i) > d.Мы пришли к противоречию.
Так как любая стратегий из множества Si′ является наилучшим ответом на последовательность профилей σ−ϵki при k ! k0, то σi тоже является наилучшим ответом на любой элемент данной последовательности.
3.Определение46 Определение56.Пусть σk — последовательность профилей вполне смешанных стратегий,отвечающих определению46, σ — предел этой последовательности. Снова разобьём все стратегии i-го игрока на два класса.Пусть si Si′ если σ (si) > 0
и si Si′′ в противном случае.Заметим,что множество Si′ непусто.Для каждого |
si Si |
|||
определим последовательность ϵk′ (si) таким образом: |
|
|||
ϵ′ |
(si) = |
1/k, |
если si Si′, |
(4.119) |
k |
$ |
σk(si), |
если si Si′′ . |
|
Возьмем |
|
|
|
|
|
ϵ′ |
= max ϵ′ (si) |
(4.120) |
|
|
k |
i,si Si |
k |
|
По нашему предположению σi является наилучшим ответом на любой элемент последовательности σik,то есть решением задачи
max ui(σi, σϵ |
) |
(4.121) |
|||
σi |
|
Σi |
−i |
|
|
|
|
|
|
|
|
Из свойств максимальности линейной функции при линейных ограничениях,существует c > 0,такое,что:
ui(si, σϵ |
) = c |
(4.122) |
−i |
|
|
200 |
ГЛАВА4.ДИНАМИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ |
||
|
для всех si Si′ и |
ϵ |
(4.123) |
|
|
ui(si, σ−i) ≤ c |
|
для всех si Si′′.
Тогда по крайней мере одно из решений исходной системы будет иметь вид(при достаточно больших k):
|
|
|
|
! ϵk(si) |
|
|
|
|
|
|
|
|
|
(si) = |
|
′′ |
|
|
|
|
|
|
|
σ |
ϵk |
ϵk(si),− |
si Si |
|
, |
|
Si′′. |
|
(4.124) |
||
|Si |
| |
если si |
|
||||||||
|
|
σ (si) |
′ |
|
если si |
|
Si′, |
|
|
||
|
|
|
|
|
|
|
|
|
|
max ϵ |
|
Для завершения доказательства остаётся лишь заметить,что |
ϵk = |
i,si Si |
k(si) → 0 при |
||||||||
k → ∞ и σϵk → σ при ϵk → 0.
Q.E.D.
Теперь мы готовы доказать теорему о существовании равновесия,совершенного относительно дрожащей руки.Для этого нам достаточно доказать сущ ествование равновесия,определенного любым из трех использованных нами способов.Прощ е всего это сделать,исходя из Определения56:
Лемма9 Пусть G — игра в нормальной форме.Тогда для любой последовательности ϵk → 0, ϵk < ϵ0,существует совершенное равновесие согласно определению(56) .
Доказательство леммы9.
Для любой конечной игры G и для любого ϵ существует равновесие σ ϵ в игре Gϵ.Действительно,множества стратегий Σϵi являются выпуклыми и компактными;далее доказательство эквивалентно доказательству существования равновесия Нэша.
Множество всех смешанных профилей компактно(как декартов о произведение конечного числа компактных множеств).По определению компактности, из любой последовательности точек компактного множества можно выбрать подпоследовательность,сходящуюся к элементу этого множества.Выбрав такую подпоследовательность из по следовательности σ ϵk , получим
σкачестве ее предела.Оно и будет равновесием по Определению 56. Q.E.D.
Всилу Леммы8,это утверждение эквивалентно утверждению Те оремы18.
4.4Задачи
1.Опишите множество всех слабо секвенциальных равновесий в игре «ослик Зелтена»(рисунок4.2).Будут ли все эти равновесия сильно секвенциальн ыми?
2.Докажите,что слабо доминируемые стратегии не могут вход ить в совершенное равновесие с положительной вероятностью.
3.Пусть G — игра в нормальной форме,причем ни у одного из игроков нет сл або доминируемых стратегий.Верно ли,что любое равновесие Нэша в игре G будет совершенным?
4.Пусть G — игра двух игроков с нулевой суммой, σ — равновесие Нэна.Верно ли,что σ
— совершенное равновесие?
5.Рассмотрим игру на рисунке4.14.Найдите все равновесия Н эша.Все слабо секвенциальные равновесия.Все сильно секвенциальные равновесия.
