Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Теория игр / Петросян_Теория_игр

.pdf
Скачиваний:
54
Добавлен:
13.02.2015
Размер:
6.14 Mб
Скачать

Сначала докажем существование ситуации равновесия в смешан­ ных стратегиях для биматричной игры. Это доказательство опира­ ется на известную теорему Какутани о неподвижной точке, кото­ рую приведем без доказательства [49].

Теорема. Пусть S компактное выпуклое множество в R иф многозначное отображение, переводящее точки S в компактные выпуклые подмножества S и удов­ летворяющее условию: если x„eS, хя-*х, у„еф(хп), у„-*у, то у еф (х).

Тогда существует такое x*eS, что х*еф (х*).

Теорема. Пусть Г (А, В) биматричная (тхп)-шр&. Тогда существуют смешанные стратегии x*eXt и у*е Х2 игроков 1 и 2 со­ ответственно, такие, что пара (х*, у*) является ситуацией равно­ весия по Нэшу.

Доказательство. Множества смешанных стратегий Xt и Х2 игроков 1 я 2 — выпуклые многогранники, поэтому множество ситуаций Х1хХ2 — компактное выпуклое множество.

Пусть ф — многозначное отображение,

ф-.Х^Х^Х^хХ»

определяемое соотношением

 

 

 

{(*,.

Kiix1,

j;0)=max ^ ( x ,

y0),

Ф-(.х00)^<(х',у')

 

 

 

Kz(x0,

y')=max K2(x0,

y),

т. е. образ отображения ф состоит из пар наилучших ответов игроков на стратегии у0 и х0 соответственно.

Функции Kt и К2 как математические ожидания выигрышей в ситуации (х, у) билинейны по х и у, а следовательно, образ ф (х0, у0) ситуации 0, у0) при отображении ф представляет собой выпук­ лое компактное подмножество в ^ х Х2. Более того, если последо­

вательности пар {(хЪ, уЬ)}, (Х"0, yb)eXi. хХ2 и {(х?т у'п)}, 04 у'п)еф(х%, Уо) имеют предельные точки, т. е.

lim (х"0, уЬ)=(х0, УО\ In» М, Ул) = (х', У%

то в силу билинейности функций Кх и К? и компактности множеств Хх и Х2 имеем, что (х', у')еф(х0, у0). Тогда по теореме Какутани существует ситуация (х*, y^eXj^xX^ для которой (х*, у*)еф(х*, у*), т. е.

Кг (х*, у*)>К, (х, у*), К2 (х*, у*)>К2 (х*, у)

для всех хвХ± И ye Y2. Теорема доказана.

4.2. Предыдущая теорема может быть обобщена на случай не­ прерывных функций выигрыша Нх и Н2. При доказательстве этого

130

результата потребуется хорошо известная теорема о неподвижной точке, принадлежащая Брауэру [49].

Теорема. Пусть S компактное выпуклое множество в R , имеющее внутрен­ ность. Если q> непрерывное отображение S в себя, то существует неподвижная точка х* отображения ср, т. е. x*eS и х*=(р{х*).

Теорема. Пусть Г=(Хи Х2, Ни Н2)бескоалиционная игра

двух лиц, пространства стратегий X1(^Rm, X2aRnкомпактные выпуклые подмножества, а множество Х1 х Х2 имеет внутрен­ ность. Пусть также функции выигрыша Нх (х, у) и Н2 (х, у) непреры­ вны на XY х Х2, причем HY (х, у) вогнута по х при каждом фик­ сированном у, а функция Н2{х, у) вогнута по у при каждом фик­ сированном х.

Тогда в игре Г существует ситуация равновесия по Нэшу (х*, у*).

Доказательство. Пусть р = (х, у)еХ1хХ2 и q = (x, y)eXixX2 — две ситуации игры Г. Рассмотрим функцию

в(р,д)=Н1(х,у)+Н2(х,у).

Покажем прежде всего, что существует ситуация q*=(x*, у*), для которой

 

max

0(p,q*)=e(q*,q*).

Действительно, пусть это не так. Тогда для каждого qeX1x.X2

найдется такое реХх

xX2,

p¥=q, что в(р, q)>6(q, q). Введем в рас­

смотрение множество

 

 

GP={q\e(p,q)>e(q,q)}.

Так как функция в непрерывна х и Н2 непрерывны по совокуп­ ности переменных), a Xt х Х2 — выпуклый компакт, то множества Gp открыты. Более того, согласно сделанному предположению,

Хх х Х2 покрыто множествами Gp.

Из компактности Хх х Х2 следует, что найдется конечная совоку­ пность этих множеств, которая покрывает XY x Х2. Пусть это мно­ жества GPl, ..., GPk. Обозначим

<Pj(q)=max.{0(pj, q)-9(q, q), 0}.

Функции q>j(q) не отрицательны, и по определению G>. в каждой точке q по крайней мере одна из функций cpj принимает положитель­

ное значение.

Определим отображение ф множества Xt x Х2 в себя следующим образом:

131

</>(я) j

где q>(q) =yj[1 (Pj(q). Функции ^непрерывны, поэтому ф — непрерыв­ ное отображение Х1хХ2в себя. Согласно теореме Брауэра^) непо­ движной точке, найдется такая точка qeXt хХ2, что ^(c[)=q, т. е.

?=(!/<? («))Х>Л?ХР./-

j

 

Следовательно,

 

0(q,q)=e(~Vcpj(q)Pj,q\

\Нч) J

)

Но функция 0(р, q) вогнута по р при фиксированном q и, следовате­ льно,

e(q,q)>-^l<PjW(Pj,~q). (4.1) <р(я)у

С другой стороны, если %О)>0, то 6(q, q)<d(pj, q), а если <pj(q)=О, то <Pj(q)e(pj, q) = (pj(q)eQ, q). Поскольку <pj(q)>0 для некоторого j ,

мы приходим к неравенству

0(5, 9)<-^. Z <PjG)0(py, q),

ч>(.я)У

которое противоречит (4.1).

Таким образом, всегда существует q*, для которого max 9(p, q*) = e(q*, q*).

Это означает, что

Нх (х, у*)+Н2(х*, уНН,(**, у*) + Н2(х*, у*)

при всех хеХу и yeY2. Последовательно полагая в последнем неравенстве х=х* и у=у*, получаем неравенства

Н2 (х*, у)^Н2 (х*, у*), Ht (х, у*)^ {х\ у*),

справедливые для всех xeXtH

уеХ2. Теорема доказана.

Для бескоалиционных игр

двух лиц, разыгрываемых на компакт­

ных множествах (в частности, на единичном квадрате) с непрерыв­ ной функцией выигрыша, справедлив следующий результат.

Теорема. Пусть Г=(Хи Х2, Ни Н2) бескоалиционная игра двух лиц, где HYu Н2 непрерывные функции на Xv х Х2; Хи Х2

132

компактные подмножества конечномерных евклидовых про­ странств. Тогда игра Г имеет ситуацию равновесия (ц, v) в смешан­ ных стратегиях.

Эту теорему приведем без доказательства, поскольку оно ос­ новывается на непрерывности и билинейности функций

K,(ji, v)= J J H,(x, y)dv(x)dv(y), i = l, 2,

_

_

Xl *2

на множестве Xl

x X2

и почти дословно повторяет доказательство

предыдущей теоремы.

 

Мы не будем подробно останавливаться на построении смешан­ ных стратегий в бескоалиционных играх п лиц с бесконечным числом стратегий и доказательстве существования ситуации равно­ весия по Нэшу. Отметим только, что если функции выигрыша

п

игроков Hi (х) непрерывны на декартовом произведении Аг=]~[ X,

f-i

компактных множеств чистых стратегий, то в такой бескоалицион­ ной игре всегда существует ситуация равновесия по Нэшу в смешан­ ных стратегиях. Для существования ситуаций, оптимальных по Парето, достаточно компактности множества {#(*)}, хеХ, что, в свою очередь, может быть обеспечено компактностью в некото­ рой топологии множества всех ситуаций X и непрерывностью в этой же топологии всех функций выигрыша Kh i=l, 2, ..., п. Очевидно,

что для конечных бескоалиционных игр это всегда имеет место.

§5. СВОЙСТВА ОПТИМАЛЬНЫХ РЕШЕНИЙ

5.1.Приведем свойства ситуации равновесия, которые помогают находить решение бескоалиционной игры двух лиц.

Теорема. Для того чтобы ситуация (/**, v*) в смешанных стратегиях в игре Г = (ЛГ1, Х2, Ни Н2) была ситуацией равновесия, необходимо и достаточно, чтобы для всех чистых стратегий xeXt

и уеХ2 игроков выполнялись следующие неравенства:

^ ( x . v - X ^ O i ' . v * ) ;

(5.1)

K2(n*,y)^K2Qi*,V*).

(5.2)

Доказательство. Необходимость очевидна, поскольку каждая чистая стратегия является частным случаем смешанной и, следова­ тельно, должны быть выполнены неравенства (5.1), (5.2). Для до­ казательства достаточности необходимо перейти к смешанным стратегиям игроков 1 я2 соответственно в неравенствах (5.1), (5.2).

Эта теорема (как и в случае антагонистических игр) показывает, что для доказательства равновесности ситуации в смешанных стра­ тегиях достаточно проверить неравенства (5.1), (5.2) только для чистых стратегий партнера. Для биматричной (/ихи)-игры Г (А, В)

133

эти неравенства принимают соответственно вид

 

К, {г, y*) = aty* ^х*Ау*=К, (x*, у*);

(5.3)

К2 (х*, j)=x*l/^x*By* = K2 (x*, у*),

(5.4)

где ai(ff) — строки (столбцы) матрицы А (В), i= 1, ..., т\ j= 1, ..., п.

5.2. Напомним, что для матричных игр каждая существенная чистая стратегия уравновешивает любую оптимальную стратегию противника (см. п. 7.6 гл. I). Аналогичный результат справедлив и для биматричных игр.

Теорема. Пусть Г (А, В) биматричная (тхп)-игра и пусть (х, y)eZ(T) ситуация равновесия по Нэшу в смешанных страте­ гиях. Тогда выполняются равенства

К^у^К^у);

(5.5)

K2(x,j)=K2(x,y)

(5.6)

для всех ieMx ujeNy, где Mx(Ny) спектр смешанной стратегии

х(у).

Доказательство. По теореме п. 5.1 имеем

К^уХК^у) (5.7)

для всех ieMx. Пусть выполняется хотя бы одно строгое неравенст­

во в (5.7), т. е.

К^уХК^ъу), (5.8)

где i0eMx. Обозначим & компоненты вектора х=(£и ..., £т). Тогда

K1(x,y)=fi^JK1(i,y)

=

i - i

 

 

= Е ^iK1(i,y)=Ki(x,y)

£

b=Kt(x,y).

ieMx

ieMx

 

Противоречие доказывает справедливость (5.5). Равенства (5.6) до­ казываются аналогично.

Данная теорема дает способ нахождения оптимальных смешан­ ных стратегий игроков в игре Г (А, В). Действительно, предполо­ жим, что мы ищем ситуацию равновесия (х, у), считая спектры стратегий М„ Ny заданными. Тогда оптимальные стратегии должны

удовлетворять системе линейных уравнений yat=vu

Xy=v2, (5.9)

}34

где ieMx,jeNy, vltv2 — некоторые числа. Если же ситуация равно­ весия (х, у) вполне смешанная, то система уравнений (5.9) принима­ ет вид

Ay =Vlu,

(5.10)

xB=v2w,

 

где ы = (1, ..., 1), и> = (1, ..., 1) — векторы соответствующей

размер­

ности, составленные из единиц, числа vx = xAy, v2 = xBy — выигры­ ши игроков в ситуации равновесия (х, у).

5.3. Теорема. Пусть Г (А, В) биматричная (тхп)-игра и ма­ трицы А, В невырожденные. Если игра Г имеет вполне смешанную

ситуацию равновесия, то она единственная и вычисляется

по фор­

мулам

 

 

 

x=vtuB~l;

 

(5.11)

y=VlA-lu,

 

(5.12)

где

 

 

 

Vl = \l{uA-lu),

ь2 = \1(иВ-хи).

 

(5.13)

Обратно, если для векторов х, у е FT, определяемых

равенствами

(5.11) — (5.13), справедливо х^О,

у^О, то пара (х,

у)

образует

ситуацию равновесия в смешанных стратегиях в игре Г (А, В) с век­

тором равновесных выигрышей (vlt v2).

 

 

 

ситуация

Доказательство. Если (х, у) — вполне смешанная

равновесия, то х и у с необходимостью

удовлетворяют

системе

(5.10). Умножая первое из равенств (5.10) на А'1,

а второе — на

В'1,

получаем (5.11), (5.12). С другой

стороны,

поскольку

хи=1

и уи=1,

находим значения для vx и

v2.

Единственность

вполне

смешанной ситуации (х, у) следует из единственности решения

системы (5.10) в условиях

теоремы.

 

 

 

 

 

Докажем

обратное

утверждение

 

 

 

 

 

теоремы. По

построению

векторов

 

 

 

 

 

х, у

согласно

(5.11) — (5.13) имеем

 

 

 

 

 

хи=уи=\.

 

Отсюда

и

из

условия

 

 

 

 

 

х^О,

у^О

следует,

что

(х, у) — си­

 

 

 

 

 

туация

в

смешанных

стратегиях

 

 

 

 

 

в игре Г.

 

 

 

 

 

 

 

 

•(5/2,5/2)

 

Согласно теореме п. 5.1 для того,

 

 

 

чтобы ситуация (х, у) являлась ситу­

 

 

 

 

 

ацией равновесия в смешанных стра­

 

 

 

 

 

тегиях в

игре Г (А,

В),

достаточно

 

 

 

 

 

выполнения условий

 

 

 

 

 

 

 

 

aiy = Kl(i,

y)^xAy,

i=T7rh,

 

 

 

 

 

 

хУ=К2

(х, J) ^ xBy,

j=T7m,

 

 

 

 

 

135

или

Ау^(хАу)и, хВ ^(хВу)и.

Проверим справедливость этих соотношений для х=

иВ-у

иВ~1и

А'

тя

 

 

и у=

. Имеем

 

 

иА'1и

ЛУ=~7^Т=,

„-1 » ,-i

МхАУ)и>

 

 

иА 1и

(иВ 1и)(иА '«)

 

 

uB~lu

(иВ-хи)(иА-хи)

v

что и требовалось доказать.

Проиллюстрируем применение теоремы на примере игры «се­ мейный спор» п. 1.4. Рассмотрим смешанное расширение игры. Множество точек, соответствующих векторам выигрышей в сме­ шанных стратегиях, можно изобразить графически (рис. 9, упр. 6). Нетрудно заметить, что игра удовлетворяет условиям теоремы, поэтому здесь имеется единственная вполне смешанная ситуация равновесия (х, у), вычисляемая по формулам (5.11) — (5.13): х=(4/5,

1/5),у=(1/5,4/5),(«12) = (4/5,4/5).

5.4. Рассмотрим свойства различных принципов оптимальности. Заметим, что определения оптимальности ситуации по Парето и Нэшу, приведенные в § 2, касаются произвольной бескоалицион­ ной игры (в частности, двух лиц), поэтому они справедливы и для смешанного расширения Г. Следовательно, для игры двух лиц

г(Г)=^Пг2

(где Z(T) — множество ситуаций равновесия по Нэшу, Z1 и Z2

.множества наилучших ответов игроков 1 и 2 соответственно в игре Г) и справедлива теорема о борьбе за лидерство (см. п. 2.5).

Вболее сложном отношении находятся ситуации, равновесные по Нэшу и оптимальные по Парето. Из примеров § 2 следует, что возможны случаи, когда ситуация равновесна по Нэшу, но не оп­ тимальна по Парето, и наоборот. Вместе с тем возможно, что одна

ита же ситуация оптимальна и в том и в другом смысле (п. 2.4).

Впримере 11 п. 3.3 было показано, что дополнительная ситуация равновесия, возникающая в смешанном расширении игры Г, не является оптимальной по Парето в смешанном расширении Г. Оказывается, что это довольно распространенное свойство биматричных игр.

Теорема. Пусть Г (А, В) биматричная (т х п)-игра. Тогда почти для всех (тхп)-игр (за исключением не более чем счетного множества игр) справедливо следующее утверждение.

136

Ситуации равновесия по Нэшу в смешанных стратегиях, которые не являются равновесными в исходной игре, не являются оптималь­ ными по Парето в смешанном расширении.

Доказательство теоремы основано на том, что ее результат справедлив для множества П так называемых регулярных игр, которое открыто и всюду плотно в множестве биматричных (т х л)-игр. Полное доказательство этой теоремы можно найти в [10].

5.5. Приведем без доказательства утверждения, касающиеся бес­ коалиционных игр и лиц, которые являются обобщением соответст­ вующих теорем из теории биматричных игр, рассмотренных в дан­ ном и предыдущем параграфах.

Теорема. Для того чтобы ситуация ц* в игре T = (N, {Xi}iBN,

{Hi}ieN) была ситуацией равновесия в смешанных стратегиях, необ­ ходимо и достаточно, чтобы для любого i и любой чистой страте­ гии XfSXt выполнялось неравенство

K^Wx^KiQi*).

Теорема. В любой конечной бескоалиционной игре существует хотя бы одна ситуация равновесия по Нэшу в смешанных стра­ тегиях.

Теорема. Если равновесная стратегия р.* игрока i входит в си­ туацию равновесия р.* и приписывает положительную вероятность чистой стратегии х^Х{ (р* (х,)>0), то

Ki(M*\\xi)=Ki(p*).

5.6. В заключение параграфа рассмотрим пример решения бима­ тричных игр с малым числом стратегий, который во многом поучи­ телен.

Пример 12. (Биматричные (2х2)-игры [10].) Рассмотрим игру Г (А, В), в которой у каждого из игроков по две чистые стратегии. Пусть

(A B)=3i R"11'

^n)

^12' ^1г) 1

^2 |_(а21>

/*2l)

(а22. hi)J

Здесь индексами 8lt 8г, т1( т2 обозначены чистые стратегии игроков 1 и 2 соответственно.

Предположим для простоты, что числа аи , а12, а21, а22 (/?и, /?12,

02И 02г) различны.

Случай 1. В исходной игре Г, по крайней мере, один игрок, пусть игрок 1, имеет строго доминирующую стратегию, скажем <5j (см. § 8 гл. I). Тогда игра Г и ее смешанное расширение Г имеют единственную ситуацию равновесия по Нэшу. Действительно, нера-

137

венства aii>a2 1 , a12>a22 приводят к тому, что в игре Г чистая стратегия д^ строго доминирует все остальные смешанные страте­ гии первого игрока. Поэтому ситуацией равновесия является пара

(<515 тД если /jjj.>Pi2i и @i. тгХ если Pu<Pi2-

Случай 2. Игра Г не имеет ситуации равновесия по Нэшу. Здесь возможны два взаимоисключающих случая а) или б):

а)

a21 <all9

a12<a22,

Pu<Pi2,

P22<Piv

б)

au <a2 1 ,

a22<ai2>

Pi2<Pu>

Ргх^гг*

причем det АФО, йеЬВфОя поэтому выполняются условия теоремы п. 5.3. Поэтому в игре существует ситуация равновесия (х*, у*), где

,J

bz.д.1

 

РП-РИ

,.

( 5 1 4 )

\Pii+Pii-

-Ри

Р11+Р22-Р21-Р12,

 

у* J

*HZ^

1

«AiZ^

\

(5.15)

 

\ * l l +a 2 2 - * a i _ " 1 2 Я 1 1 + а 2 2 _ а 2 1 _ а 1 2 /

 

а соответствующие равновесные выигрыши vi и v2 определяются по формулам

а 11Я 22- Я 12а 21 .

PllPl2-012011

+ a 2 2 _ a 1 2 _ « 2 1

Pll+P22-Pl2-P21

Случай 3. Игра Г имеет две ситуации равновесия по Нэшу. Этот случай получается, когда выполнено одно из условий:

а) a21<a11, a12<a22, Р12<Рц, Рг\.<Ргг>

б) au «X2 1 , «22<a12' Pll<Pl2> Pl2<Pll-

В случае а) равновесными будут ситуации (8Х, тД (52, т2), а в случае б) — ситуации (6т2), (82, тх). Однако в смешанном расширении есть еще одна вполне смешанная ситуация равновесия (х*, у*), определенная формулами (5.14), (5.15).

Рассмотренные случаи исчерпывают изучение (2х2)-игры при условии, что элементы в матрицах различны.

§ 6. РАВНОВЕСИЕ В СОВМЕСТНЫХ СМЕШАННЫХ СТРАТЕГИЯХ

6.1.Продолжим рассмотрение игр двух лиц. Как уже отмечалось

в§ 2, даже если ситуация равновесия является недоминируемой (оптимальной по Парето), возможны случаи, когда одна ситуация равновесия выгодна игроку 1, а другая — игроку 2. Это затрудняет нахождние взаимоприемлемого решения, возникающего неантаго­ нистического конфликта на уровне формализации бескоалиционной игры. Поэтому исследуем неантагонистический конфликт в фор­ мализации, разрешающей игрокам принимать совместные решения.

138

Проиллюстрируем этот подход на при­

 

мере игры «семейный спор» (см. при­

 

мер 1 п. 1.4).

 

 

 

Пример 13. Рассмотрим смешанное

 

расширение

игры

«семейный спор».

 

Множество

точек,

соответствующих

 

векторам выигрышей в смешанных

 

стратегиях в игре, можно изобразить

 

графически (см. рис. 9 п. 5.3). На рисун­

 

ке изображены две ситуации равнове­

 

сия по Нэшу с векторами выигрышей

 

(1, 4), (4, 1) в чистых стратегиях и одна

 

вполне смешанная равновесная ситуа­

 

ция с вектором выигрышей (4/5, 4/5)

Рис. 10

(ищется с использованием теоремы п.

 

5.3), которая менее предпочтительна для игроков, чем каждая из

ситуаций равновесия в чистых стратегиях. Напомним, что равновес­

ными здесь являются ситуации: (al5 /JJ,

(a2,

/?2), (x*> У*)' г л е

х* = (4/5, 1/5), У = (1/5, 4/5), а ситуации

(al5

0Д (<х2, р2) также

оптимальны по Парето.

 

 

Если игра повторяется многократно, то игрокам имеет смысл сделать совместный выбор: с вероятностью 1/2 выбирать ситуацию (al5 /?x) или (a2, f}2). Тогда средний ожидаемый выигрыш игроков будет (5/2, 5/2). Однако эта точка не лежит в множестве точек, соответствующих возможным ситуациям бескоалиционной игры (рис . 9), т. е. не может быть реализована, если игроки выбирают смешанные стратегии независимо.

Под совместной смешанной стратегией игроков будем понимать вероятностное распределение на множестве всевозможных пар (i, j) (ситуаций в чистых стратегиях), не обязательно порожденное неза­ висимыми случайными выборами чистых стратегий игроками 1 и 2. Такие стратегии могут быть реализованы посредником до начала игры.

Обозначим М совместную смешанную стратегию в игре Г (А, В). Тогда ожидаемые выигрыши Кх (Л/), К2 (М) игроков 1 и 2 при использовании совместной смешанной стратегии соответственно равны

К, (М) = £ <№ Кг (^) = Е Pvtb

'•J

где A = {a,j), B={p,j) — матрицы выигрышей игроков, М={/ху}, при

УгомиМп=\, Л/>0, « = (1, ..., l)eRm, w = (l, ..., l)eR". Геометричес­ ки множество точек, соответствующее множеству векторов выигры­ шей в совместных смешанных стратегиях,— это выпуклая оболочка

139

Соседние файлы в папке Теория игр