Петросян_Теория_игр
.pdfназывается граф вида (Xz, Fz), где XZ=FZ, a Fzx=Fx(^\Xz. На рис. 17
штриховой линией обведем подграф, берущий начало из вершины z. В древовидном графе для всех xeXz множество Fx и множество Fzx
совпадают, т. е. отображение F. является сужением отображения F на множество Xz. Поэтому для подграфов древовидного графа будем использовать обозначение Gz=(Xz, F).
1.4. Перейдем теперь к определению многошаговой игры с полной информацией на древовидном конечном графе.
Пусть G=(X, F) — древовидный граф. Рассмотрим разбиение
я+1
множества вершин X па. п+l множество Xt, ..., Хп, X„+l, [j Xt=X, Xk(\X,= 0, кф1, где FX=0 для хеХ„+1. Множество X„ /=1, ...,
п называется множеством очередности 1-го игрока, а множество
Xn+i —множеством окончательных позиций. На множестве окон чательных позиций Х„+1 определены п вещественных функций Ht(x), ..., Ня(х), хеХя+1. Функция #((х), /=1, ..., л, называется
выигрышем i-ro игрока.
Игра происходит следующим образом. Задано множество N иг роков, перенумерованных натуральными числами 1, ..., i, ..., п (в дальнейшем iV={l, 2, ..., п}). Пусть x0eA"ilS тогда в вершине (пози ции) х0 <аодит» игрок it и выбирает вершину Xj^eF^. Если ХуеХ^,
то в вершине х, «ходит» игрок г2 и выбирает следующую вершину (позицию) x2eFXi, и т. д. Таким образом, если на k-м шаге вершина
(позиция) дг*_1 еХь, то в ней «ходит» игрок /*и выбирает следующую вершину (позицию) из множества Fxk_i. Игра прекращается, как только достигается окончательная вершина (позиция) xieX„+u т. е. такая, для которой Fx,= 0.
В результате последовательного выбора позиций однозначно реализуется некоторая последовательность х0, ..., хк, ..., xh опреде ляющая путь в древовидном графе G, исходящий из начальной позиции х0 и достигающий одной из окончательных позиций игры. Такой путь в дальнейшем будем называть партией. Из-за древовидности графа G каждая партия однозначно определяет окончатель ную позицию Xi, в которую она приводит, и, наоборот, окончатель ная позиция X/ однозначно определяет партию. В позиции х, каждый из игроков I, i=l, ..., п, получает выигрыш Н((х1).
Будем предполагать, что игрок i при совершении выбора в пози-
180
ции xeXj знает эту позицию х, а следовательно, из-за древовид-
ности графа G может восстановить и все предыдущие позиции. В таком случае говорят, что игроки имеют полную информацию. Примером игр с полной информацией служат шахматы и шашки, поскольку в них игроки могут записывать ходы, и поэтому можно считать, что они знают предысторию игры при совершении каждого очередного хода.
Определение. Однозначное отображение и,, которое каждой вершине (позиции) хеХ, ставит в соответствие некоторую вершину (позицию) yeFx, называется стратегией игрока i.
Множество всевозможных стратегий игрока i будем обозначать через U,.
Таким образом, стратегия i'-го игрока предписывает ему в любой позиции х из множества его очередности X, однозначный выбор
следующей позиции.
Упорядоченный набор и=(их, ..., и„ ..., и,), где м(е Uh называется
л
ситуацией в игре, а декартово произведение U= Y[ Ut — множе
ством ситуаций. Каждая ситуация и = (и1, ..., и,-, ..., и„) однозначно
определяет партию в игре, а следовательно, и выигрыши игроков. Действительно, пусть x0eXtl. Тогда в ситуации и=(ии ..., и„ ..., и„)
следующая позиция хх определяется однозначно по правилу uil(x0)=x1. Пусть теперь х^еХ^. Тогда х2 определяется однозначно
по правилу и,2(х1)=х2. Если теперь на fc-м шаге реализовалась позиция х*_1бАГ^ то хк определяется однозначно по правилу
**=«*(**-0.ит- д-
Пусть ситуации u=(uv ..., и„ ..., ы„) в указанном смысле соответ ствует партия х0, хи ..., х/. Тогда можно ввести понятие функции выигрыша К, игрока i, положив ее значение в каждой ситуации и равным значению выигрыша Я, в окончательной позиции партии х0,..., xh соответствующей ситуации м=(их, ..., ы„), т. е.
K,(uv ..., и , ыя)=Я,(х,), i=l, ..., п.
л
Функции Kt, i= 1,..., п, определены на множестве ситуаций U= Y[ Ut. Таким образом, построив множества стратегий игроков U, и опре делив на декартовом произведении функции выигрыша К„ /=1, ...,
181
я, получаем некоторую игру в нормальной форме
T=(N, {и,},вК, {K,}ieN),
где iV={l, ..., i, ..., п) — множество игроков, С/, — множество стра тегий игрока I, Ki — функция выигрыша игрока /, /= 1, .., п.
1.5. Для дальнейшего исследования игры Г необходимо ввести в рассмотрение понятие подыгры, т. е. игры на подграфе графа G основной игры (ср. с. п. 1.1 гл. I).
Пусть zeX. Рассмотрим подграф GZ = (XZ, F), с которым свяжем подыгру Г2 следующим образом. Множества очередности игроков в подыгре Г2 определяются по правилу Yj=Xif)Xz, i=\, ..., п, множество окончательных позиций YI„+l=Xn+if]Xz, выигрыш игро ка г Щ(х) в подыгре полагается равным
H\(x) = Hi{x),xsYUx,i=\,...,n.
В соответствии с этим стратегия и] i-ro игрока в подыгре Гг опреде лена как сужение стратегии u, i-ro игрока в игре Г на множество Y],
т. е.
и]{х) = щ{х), хе У?=ЛГ,П*« i=l, .... п.
Множество всех стратегий г-го игрока в подыгре обозначается через Щ. В результате с каждым подграфом Gz мы связываем подыгру
в нормальной форме
Г,=(АГ, {с/?}, т\.
где функции выигрыша Щ, /=1, ..., п, определены на декартовом
л
произведении ( / = \ \ Щ.
i-l
§2. СИТУАЦИЯ АБСОЛЮТНОГО РАВНОВЕСИЯ
Вгл. III было введено понятие равновесия по Нашу для игры
плиц в нормальной форме. Оказывается, что для многошаговых игр можно усилить понятие равновесия, введя понятие абсолютного равновесия.
2.1. Определевие. Ситуация равновесия по Нэшу u* = (uf,..., uf) называется ситуацией абсолютного равновесия по Нэшу в игре Г,
если для любого zeX ситуация (ы*У = ((«*/, ..., (u*)z), где (uf)z — сужение стратегии uf на подыгру Гг, является ситуацией равнове сия по Нэшу в подыгре Tz.
182
Имеет место следующая основная теорема.
Теорема. В любой многошаговой игре с полной информацией на конечном древовидном графе существует ситуация абсолютного равновесия по Нэшу.
Прежде чем перейти к ее доказательству, введем понятие длины игры. Под длиной игры Г будем понимать длину наибольшего пути в графе G=(X, F).
Доказательство проведем индукцией по длине игры. Если длина игры Г равна 1, то может ходить лишь один из игроков, который, выбирая следующую вершину из условия максимизации своего выигрыша, будет действовать согласно стратегии, образу ющей абсолютное равновесие по Нэшу.
Пусть теперь игра Г имеет длину к и x0eXit (т. е. в начальной позиции х0 ходит игрок i\). Рассмотрим семейство подыгр Г„ zeFXo,
длина каждой из которых не превосходит к— 1. Предположим, что теорема справедлива для всех игр, длина которых не превосходит А:— 1, и докажем ее для игры длины к. Поскольку подыгры Г„ zeFXti,
имеют длину не более к—\, по предположению индукции для них теорема справедлива и тем самым существует ситуация абсолют ного равновесия по Нэшу. Обозначим для каждой подыгры Г2,
zeFX(t, эту ситуацию через
(ц*)'=ыУ,..., (и*П |
(2.1) |
Используя ситуации абсолютного равновесия в подыграх Гг, построим ситуацию абсолютного равновесия в игре Г. Пусть uf(x) = (uf(x))z, для xeXif)Xz, zeF^, i=l, ..., п, ufl(x0)=z*, где z*
находится из условия
*СК"*)1=тах*и("*Л- (2-2)
*ерх0
Функция uf определена на множестве Xh i= l, ..., л, очередности 1-го игрока, а при каждом фиксированном xeXt значение uf(x)eFx. Таким образом, uf, i= 1,..., и, является стратегией z'-ro игрока в игре Г, т. е. ufeUt. По построению, сужение (м,*)г стратегии uf на множество Xtf\Xz является стратегией, входящей в абсолютное равновесие по Нэшу игры Г„ zeFx<>. Следовательно, для завершения
доказательства теоремы |
достаточно показать, что стратегии uf, |
|
/=1, ..., и, построенные |
по формулам |
(2.2), образуют ситуацию |
равновесия по Нэшу в игре Г. Пусть i^iv |
По построению стратегии |
183
и* после выбора игроком ii позиции z* на первом шаге |
игра |
Г переходит в подыгру Tz.. Поэтому |
|
К, (и*) = К? {(u*f) > Щ' {(и* || uf) = К, (и* ||i0, |
|
u,eU„i=l, ...,п,1ф^, |
(2.3) |
z*
так как (и*) — ситуация абсолютного равновесия в подыгре Г2*. Пусть ин е Uh — произвольная стратегия игрока il в игре Г. Обозна чим z0 = uh (x0). Тогда
Кн (и*)=К* {(и*)2*} =max K\ {(u*)z) > |
|
Ж*; {(u*)z°}>K% {(и*|кЛ =КН (и*\\ин). |
(2.4) |
Утверждение теоремы следует теперь из (2.3), (2.4).
2.2. Пример 4. Пусть игра Г происходит на графе, изображенном на рис. 18, и пусть множество N состоит из двух игроков: JV={1, 2}. На рис. 18 определим множества очередности. Изобразим вершины множества Х1 в виде кружков, а вершины множества Хг — в виде квадратиков. Выигрыши игроков записаны в окончательных пози-
Рис 18
184
циях. Перенумеруем |
двойными индексами позиции, входящие |
в множества Xt и Х2, |
а дуги, выходящие из каждой вершины,— |
одним индексом. Выбор в вершине х эквивалентен выбору следу ющей вершины х"eFx, поэтому будем предполагать, что стратегии
указывают в каждой вершине номер дуги, по которой следует двигаться дальше. Например, стратегия «! = (2, 1, 2, 3, 1, 2, 1, 1) игрока 1 предписывает ему выбор дуги 2 в вершине 1, дуги 1 — в вершине 2, дуги 2 — в вершине 3, дуги 3 — в вершине 4 и т. д. Так как множество очередности первого игрока состоит из восьми вершин, то его стратегия представляет собой восьмимерный вектор. Аналогично, любая стратегия игрока 2 представляет собой семи мерный вектор. Всего у первого игрока 864 стратегии, а у второго игрока — 576 стратегий. Таким образом, соответствующая нор мальная форма оказывается биматричной игрой с матрицами раз мера 864x576. Естественно, что решение таких биматричных игр методами, предложенными в гл. III, не только затруднительно, но и невозможно. Вместе с тем рассматриваемая игра достаточно проста и ее можно решить, используя попятную процедуру постро ения абсолютного равновесия по Нэшу, предложенную при до казательстве теоремы 1 п. 2.1.
Действительно, обозначим через v1 (x), v2 (х) выигрыши в подыг ре Гх в некоторой фиксированной ситуации абсолютного равнове сия. Сначала решаем подыгры Г16, Г17, Г2л- Как легко убедиться,
*.(1.7) = 6, »2(1.6)=2, M1.7)=2, »2(1.7)=4, Vl(2.7) = l, «2(2.7) = 8. Далее решаем подыгры Г25, Г2.6, Г] 8. В подыгре Г25 два равновесия
по Нэшу, поскольку игроку 2 безразлично, какую альтернативу выбрать. Вместе с тем его выбор оказывается существенным для игрока 1, поскольку при выборе игроком 2 левой дуги первый игрок выигрывает +1, а при выборе игроком 2 второй дуги +6. Отметим это обстоятельство и предположим, что игрок 2 «благожелателен» и выбирает в позиции (2.5) правую дугу. Тогда «1(2.5)=«1(1.6) = 6, v2(2.5)=v2(1.6)=2, vl(2.6)=vl(l.1)=2, «2(2.6)=t>2(1.7)=4,
v1(1.8) = 2, «2(1.8) = 3. Далее решаем игры Г13, Гм , Г23, Г^, Г24.
В подыгре Tj 3 два равновесия по Нэшу, поскольку игроку 1 безраз лично, какую альтернативу выбрать. Вместе с тем его выбор оказы вается существенным для игрока 2, так как при выборе игроком 1 левой альтернативы он выигрывает 1, а при выборе правой — 10. Предположим, что игрок 1 «благожелателен» и выбирает в позиции
(1.3) |
правую |
альтернативу. |
Тогда |
«1(1.3) = 5, v2 (1.3) =10, |
||
»1(1.4) |
= «1(2.5) = 6, |
„2(1.4)=г,2(2.5)=2, |
^(1.5)=„,(2.6) = 2, |
|||
«2(1.5) |
= «2(2.6)=4, в1(2.3) = 0, *2(2.3) = 6, |
Vl(2.4) = 3, *,(2.^=5. Да |
||||
лее |
решаем |
игры |
Г2Ь |
Ги , |
Г2^: |
v1(2.1)=vi(\.3) = 5, |
•2(2.1) = «2(1.3) = 10, |
«1(1.2)=«1(2.4) = 3, |
«2(1.2)=»2(2.4) = 5, |
185
w1(2.2)=—5, «2(2.2) = 6. Теперь решаем игру Г=Г1Л. Здесь
»1(l.l) = »1(2.1) = 5,e2(l.l)=i»a(2.1)=10.
Врезультате мы получаем ситуацию абсолютного равновесия по Нэшу (и?, м?), где
М? = (1,2,2,2,2,3,2,1), н! = (1,3,2,2,2,1,2). |
(2.5) |
В ситуации (uf, uf) игра развивается по пути (1.1), (2.1), (1.3). |
|
В процессе построения было замечено, что стратегии uf, |
i=l, 2, |
«доброжелательны» в том смысле, что игрок i при совершении своего хода, будучи в равной степени заинтересован в выборе последующих альтернатив, выбирает ту из них, которая более благоприятна для игрока 3 — i.
В игре Г существуют ситуации абсолютного равновесия, в кото рых выигрыши игроков будут другими. Для построения таких равновесий достаточно снять условие «доброжелательности» иг роков и заменить его обратным условием «недоброжелательности». Обозначим через vt (x), v2 (х) выигрыши игроков в подыгре Гх при
использовании игроками «недоброжелательного» равновесия. Тог
да |
имеем: |
«, (1.6)=«,(1.6)=6, |
«,(1.6)=«,(1.6)=2, |
«i(l-7) = ix(1.7)=2, |
„2(1.7)=t,2(1.7)=4, |
«1(5.7)=-2, |
«2 (2.7)=«2 (2.7) = 8. Как уже отмечалось, в подыгре Г2.5 два равнове сия по Нэшу. В отличие от предыдущего случая предположим, что игрок 2 «недоброжелателен» и выбирает ту из вершин, в которой при его максимальном выигрыше выигрыш игрока 1 минимален. Тогда 1Х(2.5) = \, «2_(2.5)=2, «1(2.6)=«1(1.7)=2, «2(2.6)=i;2(1.7)=4, их (1.8)=«х (1.8)=2, «2 (1.8)=«2 (1.8) = 3. Далее ищем решение игр Г1.3,
Гц, IYJ, Г2.з, Г2.4. В подыгре Ги два равновесия по Нэшу. Как
и в предыдущем случае, выберем «недоброжелательные»^ действия игрока 1. Тогда имеем: «, (1.3)=v, (1.3) = 5, «2(1.3) = 1, »,(1.4) = 2, «2(1.4) = 3, «1(1.5)=«1(2.6)=Vl(l.5)=2, „2(1.5)=i;2(2.6)=V2(2.6)=4,
£l(2.3)=i;1(2.3)=0, |
i;2 (2.3)=«2 (2.3) = 6, |
v. (2.4)=Vl(2.4) = 3, |
|
»2 (2.4)=«2 (2.4) = 5. |
Далее решаем игры Г2.ь |
Ги , |
Г2.2. Имеем: |
Hi(2.1) = i1(1.5)=2, |
*2(2.1)=«2(1.5)_=4, |
«1(1.2)=»1(2.4) = 3, |
|
«2 (1.2) = v2 (2.4) = 5, «2 (2.2) =_«2 (2.2) = 6,Vi (2.2) = Л (2.2) =_- 5. Теперь |
|||
решаем игру Г=Г и . Здесь «1(1.1)=»1(1.2) = 3, w2(l.l)=«2(1.2)=5. |
|||
Таким образом, получена новая ситуация равновесия по Нэшу |
|||
Й?С) = (2,2,1,1,2,3,2,1), ы?()=(3,3,2,2,1,1,3). |
(2.6) |
Выигрыши обоих игроков в ситуации (2.6) меньше таковых в ситу ации (2.5). Ситуация (2.6), так же как и ситуация (2.5), является ситуацией абсолютного равновесия.
2.3. Очевидно, что кроме «доброжелательных» и «недоброжела тельных» ситуаций абсолютного равновесия по Нэшу существует
186
целое семейство промежуточных ситуаций абсолютного равнове сия. Интересным является вопрос о том, когда можно утверждать отсутствие двух различных ситуаций абсолютного равновесия, от личающихся выигрышами игроков.
Теорема. Пусть выигрыши игроков Н,(х), i=l, ..., п, в игре
Г таковы, что если существует такое i0 и такие х, у, что Я,0(х)=Hh(y), то Hi(x) = H,(y) для всех ieN. Тогда в игре Г выигры ши игроков во всех ситуациях абсолютного равновесия совпадают.
Доказательство. Рассмотрим семейство подыгр Г* игры
Г и доказательство проведем индукцией по их длине 1(х). Пусть 1(х)= 1 и в единственной нетерминальной позиции х ходит игрок iv Тогда в ситуации равновесия он осуществляет выбор из условия
|
Я1( (Зс)=max Hk (У). |
Если точка х |
единственная, то единствен и вектор выигрышей |
в ситуации равновесия, равный в данном случае Н(х) = {Н1(х), ..., |
|
Я„(3с)}. Если существует такая точка хфх, что Я,1(Зс)=Я,1(х), то |
|
имеется еще |
одна ситуация равновесия с выигрышами |
Н(х) = {Н1(х), |
..., Нк{5с), ..., Н„(х)}. Однако из условия теоремы |
следует, что если H,i{x)=Hil(x), то Я,(Зс)=Я;(Зс) для всех ieN.
Пусть v(x) = {vi(x)} — вектор выигрышей в ситуациях равнове сия в одношаговой подыгре Гх, который, как уже показано, опреде ляется единственным образом. Покажем, что если для некоторого i0 выполнено равенство vi(i(xr)=vh(x"), (х!, х" таковы, что длины
подыгр Гу, Г*. равны единице), то vl(x')=vi(x") для всех ieN. Действительно, пусть x'eXil, х"еХ^, тогда
vit (x?)=Hk (x1)=max Hh (у),
vii(x")=Hii(x')=maxHii(y)
yeFx-
и vi(x') = Hi(x'), vl(x")=Hi(x") для всех ieN. Из равенства vh(x')=vio(x") следует, что Я,0(Зс') = Я)0(х")- Но тогда по условию теоремы Н,(хг) = Н1(х") для всех ieN. Отсюда vi(x") = vl(xH) для всех
ieN.
Предположим теперь, что во всех подыграл Гх с длиной /(*)<£— 1 вектор выигрышей в ситуациях равновесия определяется
187
единственным образом и если для каких-нибудь двух подыгр Гу, IV с длиной, не превосходящей к=\, vio(x')=vii>(x") для некоторого
i0, то Vi(x')=Vi(x") для всех ieN.
Пусть игра ГХо имеет длину к и в начальной позиции х0 ходит игрок i\. По предположению индукции для всех zeFXo в игре Гг вы игрыши в ситуациях равновесия по Нэшу определяются единствен ным образом. Пусть вектор выигрышей в ситуациях равновесия по Нэшу в игре Гг равен {«;(z)J. Тогда, как это следует из (2.2), игрок ix
в вершине х0 выбирает следующую вершину zeFx> из условия |
|
»it(z)=max «^(z). |
(2.8) |
Если точка z, определяемая (2.8), единственна, то вектор с ком понентами Vi(x0)=Vi(z)f i=l, ..., и, и является единственным век тором выигрышей в ситуациях равновесия по Нэшу в игре 1\. Если же существуют две вершины z, z, для которых vii(z)=vii(z), то по предположению индукции, поскольку длины подыгр Г; и Г2 не превосходят к— 1 из равенства vil(z)=vil(z), следует равенство Vi(z)=Vi(z) для всех ieN. Таким образом, и в этом случае выигрыши в ситуациях равновесия vt(x0), ieN, определяются единственным образом.
§3. ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ УРАВНЕНИЯ
3.1.Рассмотрим многошаговые антагонистические игры с полной информацией. Если в условиях п. 1.4 множество игроков состоит из двух элементов N={1, 2} и Н2(х) = —Н^{х) для всех хеХ3 (Х3 — множество окончательных позиций в игре Г), то
г=<#, и„кь
оказывается антагонистической многошаговой игрой с полной ин формацией. Очевидно, что этим же свойством обладают и все подыгры Гг-игры Г.
Так как из условия Н2(х)=—Н1(х) немедленно следует, что К2(ut, u2)=— Kt(и,, и2) для(всехtuteUY, u2eU2, то в ситуации равновесия по Нэшу (и*, и'2) выполняются неравенства
^i(«к "2X^1 ("I, "гХ-^!(«!, и2) для всех «ieUlt u2eU2. Пару (и'и и'2) в этом случае будем называть ситуацией равновесия или седловой
188
точкой, а стратегии, образующие ситуацию равновесия, оптималь ными. Значение функции выигрыша в ситуации равновесия обозна чим буквой v и назовем значением игры Г.
3.2. Из теоремы п. 2.1 следует, что в антагонистической много шаговой игре с полной информацией на конечном древовидном графе существует ситуация абсолютного равновесия, т. е. такая ситуация (и\, и\), сужение которой на любую подыгру Гг игры
Г образует в Гг ситуацию равновесия. Для любой подыгры Г, мож но также определить число v{y), представляющее значение функции выигрыша в ситуации равновесия этой подыгры и называемое значением подыгры Гг Как было показано в п. 3.2 гл. I, значение
антагонистической игры (т. е. значение функции выигрыша игрока 1 в ситуации равновесия) определяется единственным образом, поэтому функция v(y) определена для всех уеХ±, уеХ2 и является однозначной функцией.
3.3. Выведем функциональные уравнения для вычисления функ ции v(y). Из определения v(y) следует, что
ь(у)=Щ((и\У, (ulf)= -К\ ((«У, (иЩ
где ((u\f, (и2У) — ситуация равновесия в подыгре Гу, являющаяся
сужением ситуации абсолютного равновесия (и\, MJ). Пусть ,yeXt и zeFy. Тогда, как это следует из (2.2),
имеем |
|
|
|
v(y)=max K\ ((«tf, (utf)= |
-max v(z). |
(3.1) |
|
zeFy |
|
zeFy |
|
Для yeX2 аналогично получаем |
|
|
|
v(y)= -K\ ((«У, («У)= -max K\ ((u\f, ( м ^ = |
|
||
|
zeFy |
|
|
= —max (—w(z))=min v(z). |
(3.2) |
||
zeFy |
zeFy |
|
|
Из (3.1) и (3.2) окончательно имеем |
|
|
|
v(y)=maxi;(z),>'eAr1; |
(3.3) |
||
zeFy |
|
|
|
v(y)=mmv(z),yeX2. |
|
(3.4) |
|
zeFy |
|
|
|
Уравнения (3.3), (3.4) решаются при граничном условии |
|
||
*(y)Ux,=^1 C). |
(3.5) |
Система уравнений (3.3), (3.4) с граничным условием (3.5) позво-
189