Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

game_theory

.pdf
Скачиваний:
117
Добавлен:
26.03.2016
Размер:
2.37 Mб
Скачать

2.3.ЗАДАЧИ

101

(c)Пусть между фирмами существует следующее негласное сог лашение:в каждый момент времени каждая фирма производит qm.Если в момент времени t какая-нибудь из фирм произведет другое количество товара,то начиная с мо мента времени t + 1 негласное соглашение перестает существовать,и выпуск каж дой фирмы будет равен qc.При каком факторе дисконта δ такое соглашение будет устойчивым,то есть возможно равновесие в бесконечно повторяющейся игре,в которо м q1 = q2 = qm во все моменты времени?

21.В автомобильной промышленности два производителя: AиB .Кроме того,существует профсоюз автомобильных рабочих.В момент времени1профсою з устанавливает заработную плату w,которую будет получать работник.В момент времени2каждая фирма i = 1, 2 решает,какое количество qi машин ей следует произвести.Предположим,что для производства машины требуется один рабочий.Рыночная цена равна P = 1 − q1 − q2. Прибыль каждой фирмы равна ui = P qi − wqi,выигрыш профсоюза равен суммарной зарплате всех рабочих Uw = (q1 + q2)w.Найдите совершенное по подыграм равновесие Нэша.

22.(Zakharov, 2009)Два политика соревнуются друг с другом на президентских выборах. В момент времени t = 1 каждый политик i = 1, 2 выбирает политическую программу

yi [0, 1].В момент времени t = 2 политики решают,сколько средств следует потратить на избирательную кампанию: e1, e2.Далее каждый из избирателей голосует за одного из политиков.Пусть существует континуум избирателей.Кажды й избиратель характеризуется своей наилучшей альтернативой альтернативой v.Пусть наилучшие альтернативы избирателей распределены равномерно на [−w, w].Предположим,что полезность избирателя с наилучшей альтернативой v при голосовании за кандидата i равна

ui(v) = −(yi − v)2 ei.

Будем считать,что избиратель голосует за того кандидата,к то приносит ему б´ольшую полезность.

(a)При данных y1, y2, e1, e2 найдите V1, V2 — доли голосов(от общего числа избирателей), получаемые кандидатами.

(b)Пусть полезность кандидата i равна Vi −ei.Найдите,какими будут e1, e2 в совершенном по подыграм равновесии при данных y1, y2 (предполагая,без потери общности, что y1 ≤ y2.Объясните зависимость e1, e2 от w и от y2 − y1.

(c)Найдите,чему будут равны y1, y2 в совершенном по подыграм равновесии.Почему мы не будем иметь y1 = y2?

23. (Остен-Смит и Бэнкс, 1988).В парламенте некоторой стра ны есть три партии,которым надо избрать коалиционное правительство.Процедура форми рования правительства выглядит следующим образом.Сначала партия1выносит на голос ование предложение,со-

стоящее из величины y1 [−1, 1] и вектора v1 = (v11, v12, v13), где v11 ≥ 0, v12 ≥ 0, v13 ≥ 0, и v11 + v12 + v13 = 1.Далее все три партии голосуют за это предложение;если оно п о-

лучает голоса как минимум двух партий из трех,то оно принима ется,и игра заканчивается.Выигрыш партии i при этом составляет ui = v1i − (y1 − ai)2.Величина y1 является предложением партии1по экономической политике(-1— левая политика,«все отнять и поделить», 1— правая политика,«каждый сам за себя»).Векто р v1 — предложение по распределению министерских портфелей между партиями.Пус ть a1 = 0, a2 = −1, a3 = 1. Если предложение,выдвинутое партией1,отвергается,то сл едующее предложение y2, v2 делает партия2.Если отвергается и оно,то предложение y3, v3 делает партия3.Наконец,

102

ГЛАВА2.ДИНАМИЧЕСКИЕ ИГРЫ С ПОЛНОЙ ИНФОРМАЦИЕЙ

если не принимается предложение партии3,то объявляются но вые выборы,игра заканчивается,и каждая партия получает нулевой выигрыш.Предпо ложим,что если партии все равно,принимать предложение или нет,то она его принима ет.

(a)Найдите y3, v3.Будут ли все три партии иметь неотрицательный выигрыш посл е предложения,сделанного партией3?Будет ли это предложени е принято ?

(b)Найдите предложения y2, v2 и y1, v1.Какие партии в итоге будут иметь ненулевой выигрыш?

24. (по мотивамAkerlof, 1970).Каждая из двух строительных фирм в городе N собирается нанять рабочих.В момент времени t = 1 каждая фирма i = 1, 2 объявляет зарплату wi, которую она готова платить за день работы.В городе проживае т континуум рабочих . В момент времени t = 2 каждый рабочий решает,за какую фирму ему стоит работать (и стоит ли работать вообще).Пусть выигрыш рабочего при работе на фирму i равен wi. Будем считать,что выигрыш рабочего,если он не работает ни н а одну фирму,равен его резервационной зарплате r [0, 1].Будем считать,что r равномерно распределен на [0, 1]. Если w1 = w2 ≥ r,то рабочий с равной вероятностью работает на каждую из двух фирм.

(a)Пусть w1, w2 — заработная плата,предлагаемая фирмами.Пусть f(r) = 32α r — производительность труда рабочего с резервационной зарплатой r. Найдите f¯(r) = E(f(ρ)|ρ ≤ r) — среднюю производительность рабочих,чья резервационная зарплата равна r или ниже.

(b)Пусть целевая функция фирмы i равна прибыли в расчете на одного рабочего.Будем предполагать,что если фирма не производит,то несет неболь шие издержки ϵ.

Ui =

$ −ϵ, i

)

w

i

wi

i<wi.i

 

f¯(w

 

 

, w

w

Найдите равновесные w1, w2.

(c)Найдите Парето-оптимальный объем производства.Почем у при некоторых значениях α производство в равновесии ниже,чем в Парето-оптимуме?Поч ему,в частности, самые производительные рабочие не будут работать?При чем з десь неспособность фирм платить б´ольшую зарплату более производительным рабочим?

25.(Гросеклоуз и Снайдер, 1996).Рассмотрим пример на стр. 77–78.Пусть депутат i голосует

за предлагаемый лоббистом A законопроект,если ai+v > bi, где v > 0 — выигрыш депутата от реализации этого закона.Найдите совершенное по подыгра м равновесие.Чему будет равен размер коалиции лоббиста A?

26.(Розенталь, 1990).Парламент некоторой страны предста влен континуумом депутатов. Парламент должен принять решение по некоторму одномерному вопросу(например,установить уровень затрат на некоторый проект).Законотворчес кий процесс происходит следующим образом.В момент времени t = 1 глава парламентского комитета предлагает

принять решение s1 [0, 1].В момент времени t = 2 депутаты голосуют(«за» либо «против»).Выигрыш парламентария составляет −β(s1 − v)2 если проект принимается,и

−β(s0 − v)2,если проект не принимается,где β > 0.Здесь, s0 [0, 1] — статус кво, v — наилучшая альтернатива парламентария.Будем предполагат ь,что v равномерно распределены на [0, 1].Найдите совершенное по подыграм равновесие в этой игре,ес ли

(a)Выигрыш главы комитета равен s1 если проект принят,и s0 если проект не принят. То есть глава комитета заинтересован в высоком уровне затрат на проект.

2.3.ЗАДАЧИ

103

(b)Выигрыш главы комитета равен

−γ(s1 − s¯)2 если проект принимается,и −γ(s0 − s¯)2,

если нет,где s¯ [0, 1] — наилучшая альтернатива главы комитета, γ > 0. Как равно - весный s1 зависит от s¯, s0?Почему в обоих случаях решение будет неоптимальным, с точки зрения парламентариев?Как изменится ваш ответ,есл и для принятия предложения s1 необходима поддержка 23 парламентариев?

27.N свиней толкаются у корыта с кормом.В каждый момент времени, у корыта может находиться только одна свинья.У этой свиньи есть два вариан та действий:пассивный (быстро поесть и отбежать в сторону,получив выигрыш V за этот момент времени),либо агрессивный(защищать свое место у корыта от посягательств а соседей,получив выигрыш V −c > 0).Другие свиньи в этот момент времени не предпринимают ника ких действий(и получают нулевой выигрыш).Если свинья выбирает агрессивн ый вариант действий,то в следующий момент времени она снова окажется у корыта.Если н ет,то у корыта окажется одна из N свиней,выбранная наугад.Игра повторяется бесконечное чи сло периодов; фактор дисконта равен δ.Найдите условия существования каждого из двух возможных стационарных равновесий в чистых стратегиях(в первом тако м равновесии свиньи всегда ведут себя агрессивно,во втором — всегда пассивно).Объясн ите,почему при некоторых значениях параметров δ, N, V , c будут существовать оба равновесия.

28.(Бергер и др., 2000).В некоторой республике проходят пр езидентские выборы,в которых принимают участие два кандидата:бывалый и новичок.Страте гия каждого кандидата —

это программа,с которой он идет на выборы(см.пример на стр. 1.3.2).Пусть s1 [0, 1]

— программа бывалого, s2 [0, 1] — программа новичка.Например,можно считать,что

s = 0 — крайне левая программа(высокие налоги,высокие затраты н а социальную сферу), s = 1 — крайне правая политика(низкие налоги).Существует конти нуум избирателей. Каждый избиратель характеризуется наилучшей альтернативой v [0, 1].Величина v равномерно распределена на [0, 1].Пусть выигрыш избирателя с наилучшей альтернативой v при победе бывалого равен

U1(v) = e − β(v − s1)2,

при голосовании за новичка —

U2(v) = −β(v − s2)2.

Величина e > 0 отражает то,насколько,при равных политических программа х,бывалый кандидат лучше новичка.Пусть β > 0.Каждый избиратель(по определению)голосует за того кандидата,кто приносит ему б´ольшую полезность.Пу сть выигрыши кандидатов равны V1, V2 — долям голосов,которые они получают на выборах.

(a)Найдите,как V1 и V2 зависят от s1, s2.Подсказка:найдите сначала позицио v˜ безразличного избирателя — то есть решение уравнения U1(v) = U2(v).

(b)Пусть кандидаты выбирают s1, s2 одновременно.Будет ли в этой игре существовать равновесие в чистых стратегиях?

(c)Пусть бывалый кандидат выбирает s1,затем новичок выбирает s2.Найдите равновесие.Почему в равновесии программа бывалого кандидата буде т близка к центру?

29.Найдите совершенное по подыграм равновесие в задаче пос ледовательного торга с конечным числом периодов(стр. 92).Предположим,что если игроки не приходят к согласию к моменту времени T ,то предлагающий дележ игрок забирает себе весь товар.Пока жите,что при T → ∞,равновесие сходится к равновесию в задаче с бесконечным чи слом периодов.

N+1
2
< p < A1 ,

104

ГЛАВА2.ДИНАМИЧЕСКИЕ ИГРЫ С ПОЛНОЙ ИНФОРМАЦИЕЙ

30.Пусть в модели последовательного торга Бэрона-Фереджо на(страница93)все игрокипарламентарии делятся на две группы,численностью A+B = N.В каждом периоде,вероятность того,что игрок из первой группы будет предлагать де леж,равняется N1 вероятность того,что дележ предложит кто-нибудь из второй группы — q = 1−BAp .Пусть N,для того,чтобы дележ был утвержден,достаточно поддержки парламентариев.Выпишите систему уравнений относительно Ra, rA, RB, rB — стоимостей игры для предлагающего и не предлагающего дележ игрока из каждой группы.Какой дележ будет предложен каждым игроком?Найдите стационарное равновеси е.Объясните,почему мы можем иметь rA < rB.

31. (Смит, 1974)Два самца дерутся из-за партнерши.В каждый момент времени t = 0, 1, 2, . . .

каждый из них решает:продолжить ли борьбу,или сдаться.Есл и в какой-то момент

времени один из самцов сдался,а другой-нет,то игра заканчи

вается,то сдавшийся самец

объявялется проигравшим,не сдавшийся — победителем.Если

оба самца сдались,то оба

проиграли.Если никто не сдался,то игра переходит в следующ ий период, cдисконтом δ < 1.Ценность победы равна1,издержки в каждом периоде равны 0 < c < 1. Найдите все стационарные смешанные равновесия(в которых каждый иг рок продолжает борьбу с какой-то вероятностью).Как изменится ваш ответ,если изд ержки самцов не равны:

0 < c1 < c2 < 1?

32.(Фереджон, 1986)В некоторой стране только что выбрали п резидента.Действия президента на посту определяются величиной r [0, 1].Чем меньше эта величина,тем лучше

избирателям,и тем хуже президенту.Например, r может отражать долю своего личного времени,которую президент тратит на не государственные де ла,или количестко денег, которое он ворует из государственного бюджета(чем больше в орует,тем больше r).Сразу после выборов,публика ставит президенту следующее усло вие:он будет переизбран, только если r ≤ r¯.

(a)Рассмотрим следующую двухпериодную игру.Сначала публ ика устанавливает r¯. За - тем президент выбирает r.Если r > r¯,то президент проигрывает следующие выборы, и е го выигрыш составляет r.Если r ≤ r¯,то президент выигрывает следующие выборы,и получает дополнительно δR, где R > 0 — выигрыш от переизбрания, δ > 0

— фактор дисконта.Найдите совершенное по подыграм равнове сие в этой игре.

(b)Теперь рассмотрим такую бесконечную игру:если президе нта переизбирают,то публика снова устанавливает r¯,после чего президент выбирает r.Если президента не переизбирают,то игра заканчивается.Пусть выигрыш президен та равен Up = &t=0 rtδt, где rt — действие президента в момент времени t.Выигрыш избирателей в момент времени t есть 1 − rt.Найдите стационарное равновесие,то есть такое,в котором r¯ и r одинаковы во всех периодах.

Литература

[1]Abreu, Dilip. 1988. On the Theory of Infinitely Repeated Games with Discounting Econometrica 56 (2): 383–396.

[2]Acemoglu, D., and J. Robinson. 2005. The Economic Origins of Democracy and Dictatorship.

New York: Oxford University Press.

[3]Akerlof, George A. 1970. The market for«lemons»: Qualit y uncertainty and the market mechanism. The Quarterly Journal of Economics 84(3): 488–500

[4]Alesina, Alberto, and Lawrence H. Summers. 1993. Central Bank Independence and Macroeconomic Performance. Journal of Money, Credit, and Banking 25: 151–162

[5]David Austen-Smith and Je rey Banks. 1988. Elections, Coalitions, and Legislative Outcomes.

American Political Science Review 82 (2): 405–422

[6]Axelrod, R. 1984. Evolution of Cooperation. Basic Books.

[7]David P. Baron and John A. Ferejohn. 1989. Bargaining in Legislatures. The American Political Science Review 83(4): 1181–1206

[8]Barro, Robert, and David B. Gordon. 1983. A positive theory of monetary policy in a natural rate model. Journal of Moneraty Economics 23: 3–30

[9]Elchanan Ben-Porath and Eddie Dekel. 1992. Signaling future actions and the potential for sacrifice. Journal of Economic Theory 57(1): 36–51

[10]Benoit, J.P., and V. Krishna. 1994. The Folk Theorems for Repeated Games: A Synthesis. Discussion Papers: New York University.

[11]Berger, Mark M., Michael C. Munger, and Richard F. Pottho . 2000. The Downsian Model Predicts Divergence. Journal of Theoretical Politics 12(2): 228–240

[12]Camerer, C.F. 2003. Behavioral Game Theory: Experiments in Strategic Interaction. Princeton: Princeton, NJ

[13]D’ Aspremont, C., J.J. Gabszewicz, and J.-F. Thisse. 1979. On Hotelling’s ’Stability in Competition’. Econometrica 50: 1431–52

[14]Dixit, A. 1979. A Model of Duopoly Suggesting a Theory of Entry Barriers. Bell Journal of Economics 10: 20–32

[15]Dixit, A. 1980. The Role of Investment in Entry Deterrence. Economic Journal 90: 95–106

[16]Ferejohn, J. 1986. Incumbent performance and electoral control. Public Choice 50(1-3): 2–25

105

106

ЛИТЕРАТУРА

[17]Friedman, D.W. 1971. Non-cooperative equilibrium for supergames. Review of Economic Studies 38: 1–12

[18]Fudenberg, Drew, and Eric Maskin. 1986. The Folk Theorem in Repeated Games with Discounting and Incomplete Information. Econometrica 54(3): 533–554

[19]Fudenberg, D., and J. Tirole. 1991. Game Theory. Cambridge, Mass.:MIT Press

[20]Gibbons, Robert. 1992. Game Theory for Applied Economists. Princeton University Press

[21]Ghemawat, P. 1997. Games Businesses Play: Cases and Models. The MIT Press.

[22]Timothy Groseclose and James M. Snyder. 1996. Buying Supermajorities. American Political Science Review 90(2): 303–315

[23]Elizabeth Ho man, Kevin McCabe and Vernon L. Smith. 1996. Social Distance and OtherRegarding Behavior in Dictator Games. American Economic Review 86(3): 653–660

[24]Kydland, Finn E., and Edward C. Prescott. 1977. Rules rather than discretion: The inconsistency of optimal plans. The Journal of Political Economy 85: 473–492

[25]McCarthy, N., and A. Meirowitz. 2007. Political Game Theory: An Introduction. Cambridge University Press.

[26]McKelvey, R., and T. Palfrey. 1992. An Experimental Study of the Centipede Game.

Econometrica. 60(4): 803–836

[27]Myerson, R. (1991) Game theory: Analysis of Conflict. Harverd University Press

[28]Osborne, Martin, and Ariel Rubinstein. 1994. A Course in Game Theory. The MIT Press

[29]Palacios-Huerta, I., and O. Volij. 2009. Field Centipedes. The American Economic Review 99(4): 1619–1635

[30]Rabin, M. 1988. Consistency and robustness criteria for game theory. Mimeo, MIT.

[31]Rosenthal, Howard. 1990. The Setter Model. In James M. Enelow and Melvin J. Hinich Advances in the Spatial Theory of Voting. Cambridge University Press, Cambridge, MA

[32]Rubinstein, Ariel. 1982. Perfect equilibrium in a bargaining model. Econometrica 50: 97–109

[33]J. Schae er, N. Burch, Y. Bjornsson, A. Kishimoto, M. Muller, R. Lake, P. Lu, and S. Sutphen. 2007. Checkers Is Solved. Science 317 (5844)

[34]Smith, Maynard. 1074. The Theory of Games and the Evolution of Animal Conflict. Journal of Theoretical Biology 47(1): 209–221

[35]Spence, M. 1977. Entry, Capacity, and Oligopolistic Pricing. Bell Journal of Economics 10: 1–19

[36]Stackelberg, H. 1934. Marktform und Gleichgewicht. Vienna: Springer.

[37]Stahl, I. 1972. Bargaining Theory. Stockholm School of Economics.

[38]Tirole, J. 1988. The Theory of Industrial Organization. The MIT Press.

[39]Vives, X. 1999. Oligopoly Pricing: Old Ideas and New Tools. The MIT Press.

ЛИТЕРАТУРА

107

[40]Weingast, Barry. 1997. Political Foundations of Democracy and the Rule of Law. American Political Science Review 91(2): 245–263

[41]Zakharov, Alexey. 2009. A model of candidate location with endogenous valence. Public Choice 138 (3-4): 347–366

108

ЛИТЕРАТУРА

Глава3

Статические игры с неполной информацией

Теплым июньским вечером вы снова вышли погулять в парк.Навс тречу вам приближается

субъект,угрожающий взорвать и вас,и себя,если вы не отдади

те ему свой кошелек.Стоит

ли вам отдавать кошелек,или нет?Если хулиган из второй глав

ы принимает окончательное

решение — взрывать или не взрывать гранату — после того,как в ы решили,отдавать ему кошелек,или нет,и если хулиган предпочитает остаться в жив ых и без денег,то вы можете не отдавать ему ваши деньги.Но что,если хулиган — сумасшедш ий,«уличный самурай»,для которого смерть представляет б´ольшую ценность,чем жизнь без кошелька?Вы заглядываете в бездонные голубые глаза хулигана,но не можете прочесть ег о мыслей.Кто он — нормальный человек или псих?Целевая функция хулигана известна только ему самому.Это — его частная информация.Игры,в которых целевая функция одного игрока может не быть известна другим игрокам,называются играми с неполной информацией.

3.1Байесовы игры

Два производителя безалкогольных напитков —Coca-ColaиPe psi— должны принять решение, стоит ли им осваивать новую рыночную нишу — производство энергетических напитков. Pepsi может либо войти на рынок( A),либо нет( B).УCoca-Colaуже освоена часть рынка;она может

попытаться расширить свое присутствие( A),или не расширять(

B).Издержки компанииCoca-

Colaпри расширении могут быть либо высокими,либо низкими(

на3единицы ниже).Матрицы

выигрышей для двух фирм,в зависимости от уровня издержекCo

ca-Cola,таковы(Coca-Cola

выбирает строки):

 

 

 

 

 

 

 

 

 

Высокие издержкиCoca-ColaНизкие издержкиCoca-Cola

 

 

 

 

 

A

B

 

 

A

B

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

0, −1 2, 0

 

A

3, −1 5, 0

 

 

 

 

B

2, 1 3, 0

 

B

2, 1 3, 0

 

 

 

 

В первой игре мы имеем одно равновесие (B, A);во второй — одно равновесие (A, B). Однако

как поведут себя игроки,еслиPepsiне знает уровень издерже

к компанииCoca-Cola?Напри-

мер,ей известно лишь то,что издержки могут быть высокими с в

ероятностью θ и низкими

с вероятностью 1 − θ.СамаCoca-Cola,конечно же,знает свои издержки.Ей также и

звестна

вероятность θ.Что будет являться описанием равновесия в этой модели?Пос колькуPepsiне может наблюдать издержки своего конкурента,в равновесии о на будет придерживаться какойто(возможно,смешанной)стратегии q (вероятности,с которой она выберет A).Равновесная стратегия компанииCoca-Colaбудет описываться двумя вели чинами: p1 — вероятностью выбрать A в случае,если издержки низкие,и p2 — вероятность выбрать A при высоких издержках.

109

110

ГЛАВА3.СТАТИЧЕСКИЕ ИГРЫ С НЕПОЛНОЙ ИНФОРМАЦИЕЙ

Равновесные стратегии q , p1 и p2 должны отвечать следующим условиям.Во-первых, Pepsiне сможет выбрать q,который принесет ей более высокую полезность при данных p1, p2. Во - вторых, Coca-Colaне сможет выбрать p1,который принесет ей больший выигрыш при низких издержках,и не сможет выбрать p2,который принесет ей больший выигрыш при высоких издержках.

Функция реакции дляPepsiбудет такой:

 

0,

θ 1 + (1p

θ)p2 > 21

 

1,

θ 1 + (1p

θ)p2

<

1

 

 

2

(3.1)

q(p1, p2) =

[0,1],

θ 1p+ (1

θ)p2

=

21

 

 

 

 

 

 

 

ДляCoca-Cola,мы имеем p1 = p1(q) = 0 и p2 = p2(q) = 1,так как при обоих уровнях издержек у этой фирмы есть доминирующие стратегии.В итоге мы имеем

 

0,

θ

21

<

1,

θ

1

.>

 

2

q = q(p1, p2) =

[0,1],

θ =

21

(3.2)

 

 

 

 

 

В итоге,решениеPepsiвходить на рынок зависит от вероятнос

 

ти того,что уCoca-Colaвысокие

издержки.Если эта вероятность велика,тоPepsiвойдет на ры

 

нок.Если вероятность низка,то

Pepsiвходить не будет.

 

 

 

 

3.1.1Определения

Рассмотрим игру

между I

=

{

1, . . . , N

}

игроками.Пусть T

i

— множество типов для игрока

N

T−i

 

ti Ti, t T , t−i

 

i.Обозначим T = ×i=1Ti,

= ×j̸=iTj,

T−i.Пусть P — распределение

вероятностей на множестве T .Мы предполагаем,что игроку

i известен его собственный тип ti.

Что известно игроку i про типы остальных игроков?Условные вероятности определя ются по формуле Байеса

P (t−i|ti) =

P (ti, t−i)

=

P (ti, t−i)

(3.3)

P (ti)

&t−i T−iNP (ti, t−i)

.

Обозначим за Ai множество действий игрока i, A = ×i=1Ai множество профилей действий.

Тогда функция полезности для игрока i должна определять его выигрыш в зависимости от его типа и от профиля действий,выбранного игроками: ui : A × Ti → R.Обозначим за u : A × T → R = (u1, . . . , uN ) профиль выигрышей игроков.В этом определении мы снова(как и в динамических играх)проводим различие между стратегией и действием.Действие игрока

— это один из возможных доступных ему ходов.Стратегия — это з ависимость хода,который сделает игрок,от его типа.

Пусть si : Ti → Ai — стратегия игрока i,определяющая,какой ход он должен совершить в

зависимости от его типа ti.Обозначим за

s : T → A профиль стратегий игроков.При данном

профиле стратегий s,ожидаемый выигрыш игрока i,имеющего тип ti,равен

 

(

P (t−i|ti)ui(si(ti), s−i(t−i), ti).

(3.4)

i(s, ti) =

t−i T−i

Мы теперь можем дать определение игры.

Определение27 Набор I, A, T, P, u называется игрой с неполной информацией или байесовой игрой.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]