Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Петросян_Теория_игр

.pdf
Скачиваний:
34
Добавлен:
19.09.2019
Размер:
6.14 Mб
Скачать

называется граф вида (Xz, Fz), где XZ=FZ, a Fzx=Fx(^\Xz. На рис. 17

штриховой линией обведем подграф, берущий начало из вершины z. В древовидном графе для всех xeXz множество Fx и множество Fzx

совпадают, т. е. отображение F. является сужением отображения F на множество Xz. Поэтому для подграфов древовидного графа будем использовать обозначение Gz=(Xz, F).

1.4. Перейдем теперь к определению многошаговой игры с полной информацией на древовидном конечном графе.

Пусть G=(X, F) — древовидный граф. Рассмотрим разбиение

я+1

множества вершин X па. п+l множество Xt, ..., Хп, X„+l, [j Xt=X, Xk(\X,= 0, кф1, где FX=0 для хеХ„+1. Множество X„ /=1, ...,

п называется множеством очередности 1-го игрока, а множество

Xn+i множеством окончательных позиций. На множестве окон­ чательных позиций Х„+1 определены п вещественных функций Ht(x), ..., Ня(х), хеХя+1. Функция #((х), /=1, ..., л, называется

выигрышем i-ro игрока.

Игра происходит следующим образом. Задано множество N иг­ роков, перенумерованных натуральными числами 1, ..., i, ..., п (в дальнейшем iV={l, 2, ..., п}). Пусть x0eA"ilS тогда в вершине (пози­ ции) х0 <аодит» игрок it и выбирает вершину Xj^eF^. Если ХуеХ^,

то в вершине х, «ходит» игрок г2 и выбирает следующую вершину (позицию) x2eFXi, и т. д. Таким образом, если на k-м шаге вершина

(позиция) дг*_1 еХь, то в ней «ходит» игрок /*и выбирает следующую вершину (позицию) из множества Fxk_i. Игра прекращается, как только достигается окончательная вершина (позиция) xieX„+u т. е. такая, для которой Fx,= 0.

В результате последовательного выбора позиций однозначно реализуется некоторая последовательность х0, ..., хк, ..., xh опреде­ ляющая путь в древовидном графе G, исходящий из начальной позиции х0 и достигающий одной из окончательных позиций игры. Такой путь в дальнейшем будем называть партией. Из-за древовидности графа G каждая партия однозначно определяет окончатель­ ную позицию Xi, в которую она приводит, и, наоборот, окончатель­ ная позиция X/ однозначно определяет партию. В позиции х, каждый из игроков I, i=l, ..., п, получает выигрыш Н((х1).

Будем предполагать, что игрок i при совершении выбора в пози-

180

ции xeXj знает эту позицию х, а следовательно, из-за древовид-

ности графа G может восстановить и все предыдущие позиции. В таком случае говорят, что игроки имеют полную информацию. Примером игр с полной информацией служат шахматы и шашки, поскольку в них игроки могут записывать ходы, и поэтому можно считать, что они знают предысторию игры при совершении каждого очередного хода.

Определение. Однозначное отображение и,, которое каждой вершине (позиции) хеХ, ставит в соответствие некоторую вершину (позицию) yeFx, называется стратегией игрока i.

Множество всевозможных стратегий игрока i будем обозначать через U,.

Таким образом, стратегия i'-го игрока предписывает ему в любой позиции х из множества его очередности X, однозначный выбор

следующей позиции.

Упорядоченный набор и=(их, ..., и„ ..., и,), где м(е Uh называется

л

ситуацией в игре, а декартово произведение U= Y[ Ut множе­

ством ситуаций. Каждая ситуация и = (и1, ..., и,-, ..., и„) однозначно

определяет партию в игре, а следовательно, и выигрыши игроков. Действительно, пусть x0eXtl. Тогда в ситуации и=(ии ..., и„ ..., и„)

следующая позиция хх определяется однозначно по правилу uil(x0)=x1. Пусть теперь х^еХ^. Тогда х2 определяется однозначно

по правилу и,21)=х2. Если теперь на fc-м шаге реализовалась позиция х*_1бАГ^ то хк определяется однозначно по правилу

**=«*(**-0.ит- д-

Пусть ситуации u=(uv ..., и„ ..., ы„) в указанном смысле соответ­ ствует партия х0, хи ..., х/. Тогда можно ввести понятие функции выигрыша К, игрока i, положив ее значение в каждой ситуации и равным значению выигрыша Я, в окончательной позиции партии х0,..., xh соответствующей ситуации м=(их, ..., ы„), т. е.

K,(uv ..., и , ыя)=Я,(х,), i=l, ..., п.

л

Функции Kt, i= 1,..., п, определены на множестве ситуаций U= Y[ Ut. Таким образом, построив множества стратегий игроков U, и опре­ делив на декартовом произведении функции выигрыша К„ /=1, ...,

181

я, получаем некоторую игру в нормальной форме

T=(N, {и,},вК, {K,}ieN),

где iV={l, ..., i, ..., п) — множество игроков, С/, — множество стра­ тегий игрока I, Ki — функция выигрыша игрока /, /= 1, .., п.

1.5. Для дальнейшего исследования игры Г необходимо ввести в рассмотрение понятие подыгры, т. е. игры на подграфе графа G основной игры (ср. с. п. 1.1 гл. I).

Пусть zeX. Рассмотрим подграф GZ = (XZ, F), с которым свяжем подыгру Г2 следующим образом. Множества очередности игроков в подыгре Г2 определяются по правилу Yj=Xif)Xz, i=\, ..., п, множество окончательных позиций YI+l=Xn+if]Xz, выигрыш игро­ ка г Щ(х) в подыгре полагается равным

H\(x) = Hi{x),xsYUx,i=\,...,n.

В соответствии с этим стратегия и] i-ro игрока в подыгре Гг опреде­ лена как сужение стратегии u, i-ro игрока в игре Г на множество Y],

т. е.

и]{х) = щ{х), хе У?=ЛГ,П*« i=l, .... п.

Множество всех стратегий г-го игрока в подыгре обозначается через Щ. В результате с каждым подграфом Gz мы связываем подыгру

в нормальной форме

Г,=(АГ, {с/?}, т\.

где функции выигрыша Щ, /=1, ..., п, определены на декартовом

л

произведении ( / = \ \ Щ.

i-l

§2. СИТУАЦИЯ АБСОЛЮТНОГО РАВНОВЕСИЯ

Вгл. III было введено понятие равновесия по Нашу для игры

плиц в нормальной форме. Оказывается, что для многошаговых игр можно усилить понятие равновесия, введя понятие абсолютного равновесия.

2.1. Определевие. Ситуация равновесия по Нэшу u* = (uf,..., uf) называется ситуацией абсолютного равновесия по Нэшу в игре Г,

если для любого zeX ситуация (ы*У = ((«*/, ..., (u*)z), где (uf)z сужение стратегии uf на подыгру Гг, является ситуацией равнове­ сия по Нэшу в подыгре Tz.

182

Имеет место следующая основная теорема.

Теорема. В любой многошаговой игре с полной информацией на конечном древовидном графе существует ситуация абсолютного равновесия по Нэшу.

Прежде чем перейти к ее доказательству, введем понятие длины игры. Под длиной игры Г будем понимать длину наибольшего пути в графе G=(X, F).

Доказательство проведем индукцией по длине игры. Если длина игры Г равна 1, то может ходить лишь один из игроков, который, выбирая следующую вершину из условия максимизации своего выигрыша, будет действовать согласно стратегии, образу­ ющей абсолютное равновесие по Нэшу.

Пусть теперь игра Г имеет длину к и x0eXit (т. е. в начальной позиции х0 ходит игрок i\). Рассмотрим семейство подыгр Г„ zeFXo,

длина каждой из которых не превосходит к— 1. Предположим, что теорема справедлива для всех игр, длина которых не превосходит А:— 1, и докажем ее для игры длины к. Поскольку подыгры Г„ zeFXti,

имеют длину не более к—\, по предположению индукции для них теорема справедлива и тем самым существует ситуация абсолют­ ного равновесия по Нэшу. Обозначим для каждой подыгры Г2,

zeFX(t, эту ситуацию через

(ц*)'=ыУ,..., (и*П

(2.1)

Используя ситуации абсолютного равновесия в подыграх Гг, построим ситуацию абсолютного равновесия в игре Г. Пусть uf(x) = (uf(x))z, для xeXif)Xz, zeF^, i=l, ..., п, ufl(x0)=z*, где z*

находится из условия

*СК"*)1=тах*и("*Л- (2-2)

*ерх0

Функция uf определена на множестве Xh i= l, ..., л, очередности 1-го игрока, а при каждом фиксированном xeXt значение uf(x)eFx. Таким образом, uf, i= 1,..., и, является стратегией z'-ro игрока в игре Г, т. е. ufeUt. По построению, сужение (м,*)г стратегии uf на множество Xtf\Xz является стратегией, входящей в абсолютное равновесие по Нэшу игры Г„ zeFx<>. Следовательно, для завершения

доказательства теоремы

достаточно показать, что стратегии uf,

/=1, ..., и, построенные

по формулам

(2.2), образуют ситуацию

равновесия по Нэшу в игре Г. Пусть i^iv

По построению стратегии

183

и* после выбора игроком ii позиции z* на первом шаге

игра

Г переходит в подыгру Tz.. Поэтому

 

К, (и*) = К? {(u*f) > Щ' {(и* || uf) = К, (и* ||i0,

 

u,eU„i=l, ...,п,1ф^,

(2.3)

z*

так как (и*) — ситуация абсолютного равновесия в подыгре Г2*. Пусть ин е Uh — произвольная стратегия игрока il в игре Г. Обозна­ чим z0 = uh (x0). Тогда

Кн (и*)=К* {(и*)2*} =max K\ {(u*)z) >

 

Ж*; {(u*)z°}>K% {(и*|кЛ Н (и*\\ин).

(2.4)

Утверждение теоремы следует теперь из (2.3), (2.4).

2.2. Пример 4. Пусть игра Г происходит на графе, изображенном на рис. 18, и пусть множество N состоит из двух игроков: JV={1, 2}. На рис. 18 определим множества очередности. Изобразим вершины множества Х1 в виде кружков, а вершины множества Хг — в виде квадратиков. Выигрыши игроков записаны в окончательных пози-

Рис 18

184

циях. Перенумеруем

двойными индексами позиции, входящие

в множества Xt и Х2,

а дуги, выходящие из каждой вершины,—

одним индексом. Выбор в вершине х эквивалентен выбору следу­ ющей вершины х"eFx, поэтому будем предполагать, что стратегии

указывают в каждой вершине номер дуги, по которой следует двигаться дальше. Например, стратегия «! = (2, 1, 2, 3, 1, 2, 1, 1) игрока 1 предписывает ему выбор дуги 2 в вершине 1, дуги 1 — в вершине 2, дуги 2 — в вершине 3, дуги 3 — в вершине 4 и т. д. Так как множество очередности первого игрока состоит из восьми вершин, то его стратегия представляет собой восьмимерный вектор. Аналогично, любая стратегия игрока 2 представляет собой семи­ мерный вектор. Всего у первого игрока 864 стратегии, а у второго игрока — 576 стратегий. Таким образом, соответствующая нор­ мальная форма оказывается биматричной игрой с матрицами раз­ мера 864x576. Естественно, что решение таких биматричных игр методами, предложенными в гл. III, не только затруднительно, но и невозможно. Вместе с тем рассматриваемая игра достаточно проста и ее можно решить, используя попятную процедуру постро­ ения абсолютного равновесия по Нэшу, предложенную при до­ казательстве теоремы 1 п. 2.1.

Действительно, обозначим через v1 (x), v2 (х) выигрыши в подыг­ ре Гх в некоторой фиксированной ситуации абсолютного равнове­ сия. Сначала решаем подыгры Г16, Г17, Г2л- Как легко убедиться,

*.(1.7) = 6, »2(1.6)=2, M1.7)=2, »2(1.7)=4, Vl(2.7) = l, «2(2.7) = 8. Далее решаем подыгры Г25, Г2.6, Г] 8. В подыгре Г25 два равновесия

по Нэшу, поскольку игроку 2 безразлично, какую альтернативу выбрать. Вместе с тем его выбор оказывается существенным для игрока 1, поскольку при выборе игроком 2 левой дуги первый игрок выигрывает +1, а при выборе игроком 2 второй дуги +6. Отметим это обстоятельство и предположим, что игрок 2 «благожелателен» и выбирает в позиции (2.5) правую дугу. Тогда «1(2.5)=«1(1.6) = 6, v2(2.5)=v2(1.6)=2, vl(2.6)=vl(l.1)=2, «2(2.6)=t>2(1.7)=4,

v1(1.8) = 2, «2(1.8) = 3. Далее решаем игры Г13, Гм , Г23, Г^, Г24.

В подыгре Tj 3 два равновесия по Нэшу, поскольку игроку 1 безраз­ лично, какую альтернативу выбрать. Вместе с тем его выбор оказы­ вается существенным для игрока 2, так как при выборе игроком 1 левой альтернативы он выигрывает 1, а при выборе правой — 10. Предположим, что игрок 1 «благожелателен» и выбирает в позиции

(1.3)

правую

альтернативу.

Тогда

«1(1.3) = 5, v2 (1.3) =10,

»1(1.4)

= «1(2.5) = 6,

2(1.4)=г,2(2.5)=2,

^(1.5)=„,(2.6) = 2,

«2(1.5)

= «2(2.6)=4, в1(2.3) = 0, *2(2.3) = 6,

Vl(2.4) = 3, *,(2.^=5. Да­

лее

решаем

игры

Г

Ги ,

Г2^:

v1(2.1)=vi(\.3) = 5,

2(2.1) = «2(1.3) = 10,

«1(1.2)=«1(2.4) = 3,

«2(1.2)=»2(2.4) = 5,

185

w1(2.2)=—5, «2(2.2) = 6. Теперь решаем игру Г=Г. Здесь

»1(l.l) = »1(2.1) = 5,e2(l.l)=i»a(2.1)=10.

Врезультате мы получаем ситуацию абсолютного равновесия по Нэшу (и?, м?), где

М? = (1,2,2,2,2,3,2,1), н! = (1,3,2,2,2,1,2).

(2.5)

В ситуации (uf, uf) игра развивается по пути (1.1), (2.1), (1.3).

В процессе построения было замечено, что стратегии uf,

i=l, 2,

«доброжелательны» в том смысле, что игрок i при совершении своего хода, будучи в равной степени заинтересован в выборе последующих альтернатив, выбирает ту из них, которая более благоприятна для игрока 3 — i.

В игре Г существуют ситуации абсолютного равновесия, в кото­ рых выигрыши игроков будут другими. Для построения таких равновесий достаточно снять условие «доброжелательности» иг­ роков и заменить его обратным условием «недоброжелательности». Обозначим через vt (x), v2 (х) выигрыши игроков в подыгре Гх при

использовании игроками «недоброжелательного» равновесия. Тог­

да

имеем:

«, (1.6)=«,(1.6)=6,

«,(1.6)=«,(1.6)=2,

«i(l-7) = ix(1.7)=2,

2(1.7)=t,2(1.7)=4,

«1(5.7)=-2,

«2 (2.7)=«2 (2.7) = 8. Как уже отмечалось, в подыгре Г2.5 два равнове­ сия по Нэшу. В отличие от предыдущего случая предположим, что игрок 2 «недоброжелателен» и выбирает ту из вершин, в которой при его максимальном выигрыше выигрыш игрока 1 минимален. Тогда 1Х(2.5) = \, «2_(2.5)=2, «1(2.6)=«1(1.7)=2, «2(2.6)=i;2(1.7)=4, их (1.8)=«х (1.8)=2, «2 (1.8)=«2 (1.8) = 3. Далее ищем решение игр Г1.3,

Гц, IYJ, Г2.з, Г2.4. В подыгре Ги два равновесия по Нэшу. Как

и в предыдущем случае, выберем «недоброжелательные»^ действия игрока 1. Тогда имеем: «, (1.3)=v, (1.3) = 5, «2(1.3) = 1, »,(1.4) = 2, «2(1.4) = 3, «1(1.5)=«1(2.6)=Vl(l.5)=2, „2(1.5)=i;2(2.6)=V2(2.6)=4,

£l(2.3)=i;1(2.3)=0,

i;2 (2.3)=«2 (2.3) = 6,

v. (2.4)=Vl(2.4) = 3,

»2 (2.4)=«2 (2.4) = 5.

Далее решаем игры Г2

Ги ,

Г2.2. Имеем:

Hi(2.1) = i1(1.5)=2,

*2(2.1)=«2(1.5)_=4,

«1(1.2)=»1(2.4) = 3,

«2 (1.2) = v2 (2.4) = 5, «2 (2.2) =_«2 (2.2) = 6,Vi (2.2) = Л (2.2) =_- 5. Теперь

решаем игру Г=Г и . Здесь «1(1.1)=»1(1.2) = 3, w2(l.l)=«2(1.2)=5.

Таким образом, получена новая ситуация равновесия по Нэшу

Й?С) = (2,2,1,1,2,3,2,1), ы?()=(3,3,2,2,1,1,3).

(2.6)

Выигрыши обоих игроков в ситуации (2.6) меньше таковых в ситу­ ации (2.5). Ситуация (2.6), так же как и ситуация (2.5), является ситуацией абсолютного равновесия.

2.3. Очевидно, что кроме «доброжелательных» и «недоброжела­ тельных» ситуаций абсолютного равновесия по Нэшу существует

186

целое семейство промежуточных ситуаций абсолютного равнове­ сия. Интересным является вопрос о том, когда можно утверждать отсутствие двух различных ситуаций абсолютного равновесия, от­ личающихся выигрышами игроков.

Теорема. Пусть выигрыши игроков Н,(х), i=l, ..., п, в игре

Г таковы, что если существует такое i0 и такие х, у, что Я,0(х)=Hh(y), то Hi(x) = H,(y) для всех ieN. Тогда в игре Г выигры­ ши игроков во всех ситуациях абсолютного равновесия совпадают.

Доказательство. Рассмотрим семейство подыгр Г* игры

Г и доказательство проведем индукцией по их длине 1(х). Пусть 1(х)= 1 и в единственной нетерминальной позиции х ходит игрок iv Тогда в ситуации равновесия он осуществляет выбор из условия

 

Я1( (Зс)=max Hk (У).

Если точка х

единственная, то единствен и вектор выигрышей

в ситуации равновесия, равный в данном случае Н(х) = {Н1(х), ...,

Я„(3с)}. Если существует такая точка хфх, что Я,1(Зс)=Я,1(х), то

имеется еще

одна ситуация равновесия с выигрышами

Н(х) = {Н1(х),

..., Нк{5с), ..., Н„(х)}. Однако из условия теоремы

следует, что если H,i{x)=Hil(x), то Я,(Зс)=Я;(Зс) для всех ieN.

Пусть v(x) = {vi(x)} — вектор выигрышей в ситуациях равнове­ сия в одношаговой подыгре Гх, который, как уже показано, опреде­ ляется единственным образом. Покажем, что если для некоторого i0 выполнено равенство vi(i(xr)=vh(x"), (х!, х" таковы, что длины

подыгр Гу, Г*. равны единице), то vl(x')=vi(x") для всех ieN. Действительно, пусть x'eXil, х"еХ^, тогда

vit (x?)=Hk (x1)=max Hh (у),

vii(x")=Hii(x')=maxHii(y)

yeFx-

и vi(x') = Hi(x'), vl(x")=Hi(x") для всех ieN. Из равенства vh(x')=vio(x") следует, что Я,0(Зс') = Я)0(х")- Но тогда по условию теоремы Н,(хг) = Н1(х") для всех ieN. Отсюда vi(x") = vl(xH) для всех

ieN.

Предположим теперь, что во всех подыграл Гх с длиной /(*)<£— 1 вектор выигрышей в ситуациях равновесия определяется

187

единственным образом и если для каких-нибудь двух подыгр Гу, IV с длиной, не превосходящей к=\, vio(x')=vii>(x") для некоторого

i0, то Vi(x')=Vi(x") для всех ieN.

Пусть игра ГХо имеет длину к и в начальной позиции х0 ходит игрок i\. По предположению индукции для всех zeFXo в игре Гг вы­ игрыши в ситуациях равновесия по Нэшу определяются единствен­ ным образом. Пусть вектор выигрышей в ситуациях равновесия по Нэшу в игре Гг равен {«;(z)J. Тогда, как это следует из (2.2), игрок ix

в вершине х0 выбирает следующую вершину zeFx> из условия

 

»it(z)=max «^(z).

(2.8)

Если точка z, определяемая (2.8), единственна, то вектор с ком­ понентами Vi(x0)=Vi(z)f i=l, ..., и, и является единственным век­ тором выигрышей в ситуациях равновесия по Нэшу в игре 1\. Если же существуют две вершины z, z, для которых vii(z)=vii(z), то по предположению индукции, поскольку длины подыгр Г; и Г2 не превосходят к— 1 из равенства vil(z)=vil(z), следует равенство Vi(z)=Vi(z) для всех ieN. Таким образом, и в этом случае выигрыши в ситуациях равновесия vt(x0), ieN, определяются единственным образом.

§3. ОСНОВНЫЕ ФУНКЦИОНАЛЬНЫЕ УРАВНЕНИЯ

3.1.Рассмотрим многошаговые антагонистические игры с полной информацией. Если в условиях п. 1.4 множество игроков состоит из двух элементов N={1, 2} и Н2(х) = —Н^{х) для всех хеХ3 3 — множество окончательных позиций в игре Г), то

г=<#, и„кь

оказывается антагонистической многошаговой игрой с полной ин­ формацией. Очевидно, что этим же свойством обладают и все подыгры Гг-игры Г.

Так как из условия Н2(х)=—Н1(х) немедленно следует, что К2(ut, u2)=— Kt(и,, и2) для(всехtuteUY, u2eU2, то в ситуации равновесия по Нэшу (и*, и'2) выполняются неравенства

^i(«к "2X^1 ("I, "гХ-^!(«!, и2) для всех «ieUlt u2eU2. Пару (и'и и'2) в этом случае будем называть ситуацией равновесия или седловой

188

точкой, а стратегии, образующие ситуацию равновесия, оптималь­ ными. Значение функции выигрыша в ситуации равновесия обозна­ чим буквой v и назовем значением игры Г.

3.2. Из теоремы п. 2.1 следует, что в антагонистической много­ шаговой игре с полной информацией на конечном древовидном графе существует ситуация абсолютного равновесия, т. е. такая ситуация (и\, и\), сужение которой на любую подыгру Гг игры

Г образует в Гг ситуацию равновесия. Для любой подыгры Г, мож­ но также определить число v{y), представляющее значение функции выигрыша в ситуации равновесия этой подыгры и называемое значением подыгры Гг Как было показано в п. 3.2 гл. I, значение

антагонистической игры (т. е. значение функции выигрыша игрока 1 в ситуации равновесия) определяется единственным образом, поэтому функция v(y) определена для всех уеХ±, уеХ2 и является однозначной функцией.

3.3. Выведем функциональные уравнения для вычисления функ­ ции v(y). Из определения v(y) следует, что

ь(у)=Щ((и\У, (ulf)= -К\ ((«У, (иЩ

где ((u\f, (и2У) — ситуация равновесия в подыгре Гу, являющаяся

сужением ситуации абсолютного равновесия (и\, MJ). Пусть ,yeXt и zeFy. Тогда, как это следует из (2.2),

имеем

 

 

 

v(y)=max K\ ((«tf, (utf)=

-max v(z).

(3.1)

zeFy

 

zeFy

 

Для yeX2 аналогично получаем

 

 

 

v(y)= -K\ ((«У, («У)= -max K\ ((u\f, ( м ^ =

 

 

zeFy

 

 

= —max (—w(z))=min v(z).

(3.2)

zeFy

zeFy

 

Из (3.1) и (3.2) окончательно имеем

 

 

 

v(y)=maxi;(z),>'eAr1;

(3.3)

zeFy

 

 

 

v(y)=mmv(z),yeX2.

 

(3.4)

zeFy

 

 

 

Уравнения (3.3), (3.4) решаются при граничном условии

 

*(y)Ux,=^1 C).

(3.5)

Система уравнений (3.3), (3.4) с граничным условием (3.5) позво-

189