Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
32
Добавлен:
02.05.2014
Размер:
1.28 Mб
Скачать

9. Ситуации равновесия в играх двух лиц

равновесные стратегии x0, y0 находятся из системы уравнений

 

Fx0 (x0, y0) =

 

K

 

 

 

− c1

 

 

 

αKx0

 

 

 

 

 

 

 

 

= 0,

 

(x0 + y0)α

 

(x0 + y0)α+1

 

Gy0 (x0, y0) =

K

 

 

 

− c2

 

 

 

αKy0

 

 

 

 

 

 

 

= 0.

 

(x0 + y0)α

 

 

(x0 + y0)α+1

Складывая уравнения, находим сначала сумму

 

 

 

 

 

 

 

 

α)K

1/α

 

 

 

 

 

 

x0 + y0

=

(2 −

 

 

 

, а затем

 

 

 

c1 + c2

 

 

 

 

 

1

 

(2

α)K

 

(α+1)/α

c2 + (α − 1)c1, c1 + (α − 1)c2 .

(x0, y0) =

 

 

 

 

 

 

α(2 − α)K

c1 + c2

 

 

 

 

 

Поскольку y0 > 0, то необходимо c1 + (α − 1)c2 > 0. Если выполнено

неравенство c1 + (α − 1)c2

≤ 0,

то первая фирма является на рынке

монополистом и равновесные стратегии имеют вид

 

 

 

x0 =

(1 − α)K

1/α, y0 = 0.

 

 

 

c1

 

 

Байесовское равновесие

 

 

 

 

 

 

 

 

 

 

 

 

 

функции

Пусть в игре двух лиц =

X, Y, F (x, y, c),

F (x, y, c)

 

выигрыша игроков F

(

x, y, c

)

è G(x, y, c) зависят не только от ситуации

 

 

 

 

 

 

(x, y), но и от случайного вектора параметров c = (c1, c2) C. Предположим, что множество C конечно и p(c), c C − вероятностное распределение на C, известное всем игрокам. Пусть Ck множество значений, принимаемых параметром ck, когда вектор c пробегает множество C. Игроку k перед выбором стратегии становится известным значение "свое-

го"параметра ck, k = 1, 2. Поэтому стратегией первого игрока является функция x˜ : C1 → X, а второго функция y˜ : C2 → Y, Множество всех

 

 

 

˜

 

 

через ˜

таких функций обозначим через X, а функций

 

Y .

Определим осредненные функции выигрыша игроков

 

˜

X

 

 

˜

X

 

 

 

F (˜x, y˜) =

p(c)F (˜x(c), y˜(c), c), G(˜x, y˜) =

p(c)G(˜x(c), y˜(c), c).

 

c C

 

 

 

c C

 

 

 

Определение. Èãðà ˜

 

˜ ˜ ˜

˜

 

и ситуации равнове-

сия в ней называются

 

 

 

 

 

 

=

 

X, Y , F (˜x, y˜), G(˜x, y˜)

 

 

 

байесовскими.

101

ГЛАВА II. ИГРЫ ДВУХ ЛИЦ

Пример 9.10. В продолжение примера 9.9 рассмотрим модель дуополии c функциями выигрыша игроков F (x, y, c1) = (p(x + y) − c1)x, G(x, y, c2) = (p(x+y)−c2)y и линейной функцией цены p(x+y) = a−x−y.

Пусть себестоимость c1 известна обоим игрокам, а себестоимость c2 ïðåä- ставляет собой случайную величину, принимающую значения c12 è c22 ñ вероятностью 1/2. В этих предположениях стратегия игрока 1 являет-

ся функцией-константой и совпадает с x. Положим yi = y˜(c2i ), i = 1, 2.

Тогда в байесовской игре функции выигрыша игроков имеют вид

F˜(˜x, y˜) = a − x −

y1 + y2

− c1 x,

 

 

 

 

2

 

 

 

 

˜

1

 

1

1

1

1

 

 

2

2

2

 

G(˜x, y˜) =

2

(a − x − y

 

− c2)y

 

+

2

(a − x − y

 

− c2)y

.

Найдем байесовскую ситуацию равновесия (x0, (y01, y02)) ïðè

a > 2 max[c1, c12, c22]. Функции наилучшего ответа игроков имеют вид

x˜ (y1, y2) = max

 

a − c1

 

y1 + y2

, 0 ,

 

 

 

4

 

 

"

 

 

2

 

 

 

#

y˜ (ci

"

a − c2i

x

#

 

 

, x) = max

 

 

, 0 ,

i = 1, 2.

2

 

 

2

 

2

 

 

 

 

Решая систему уравнений

x˜ (y1, y2) = x, y˜ (ci2, x) = yi, i = 1, 2,

находим ситуацию равновесия

 

 

x0 = 3

a − 2c1 +

2

2

2 !,

 

 

 

 

 

 

 

 

1

 

 

c1

+ c2

 

 

 

 

y01 = 3

 

4c21

 

 

 

4c22!, y02

 

 

 

 

 

4c22

 

4c21!.

a + c1

= 3

a + c1

1

 

7

 

 

 

1

 

 

1

 

 

7

 

 

1

102

10. Ситуации равновесия в биматричных играх

10. Ситуации равновесия в биматричных играх

Перейдем к смешанным расширениям биматричных игр , задаваемых матрицами

A = (aij)m×n, B = (bij)m×n.

Смешанные стратегии игроков здесь такие же, как и в матричной игре: p P, q Q. Ожидаемые выигрыши игроков

m n

m

n

X X

Xi

X

A(p, q) =

piaijqj, B(p, q) =

pibijqj.

i=1 j=1

=1 j=1

В результате получили смешанное расширение биматричной игры

= P, Q, A(p, q), B(p, q) .

Ситуации равновесия игры будем называть ситуациями равновесия в смешанных стратегиях (или смешанными равновесиями по Нэшу) исходной игры .

Множества смешанных стратегий P è Q − выпуклые компакты евклидовых пространств, а функции A(p, q) è B(p, q) билинейны. По теореме 9.2 в игре существует ситуация равновесия с смешанных стратегиях (p0, q0). Для нее по определению выполнены неравенства

A(p, q0) ≤ A(p0, q0) p P, B(p0, q) ≤ B(p0, q0) q Q.

Рассмотрим свойства ситуаций равновесия в смешанных стратегиях, аналогичные свойствам решений матричных игр.

Лемма 10.1. Для того чтобы ситуация (p0, q0) была ситуацией равновесия в смешанных стратегиях биматричной игры , необходимо и достаточно, чтобы было выполнено условие

(

A(i, q0) B(p0, j)

≤ A(p0, q0),

i = 1, ..., m,

(

)

≤ B(p0, q0),

j = 1, ..., n.

 

 

Доказательство. Необходимость. Пусть (p0, q0) − ситуация равновесия. Тогда A(p, q0) ≤ A(p0, q0) p P. Полагая p = (0, ...0, 1, 0, ..., 0),

получим неравенства условия ( ) для матрицы A. Аналогично выводятся неравенства для матрицы B.

103

ГЛАВА II. ИГРЫ ДВУХ ЛИЦ

Достаточность. Пусть ситуация (p0, q0) удовлетворяет условию ( ). Возьмем произвольную смешанную стратегию p первого игрока, домно-

жим неравенства A(i, q0) ≤ A(p0, q0) íà pi и сложим их. В результате получим неравенство A(p, q0) ≤ A(p0, q0). Аналогично, для любой сме-

шанной стратегии q второго игрока справедливо неравенство

B(p0, q) ≤ B(p0, q0).

Теорема 10.1 (свойство дополняющей нежесткости). Пусть

(p0, q0) − ситуация равновесия в смешанных стратегиях биматричной игры . Тогда

1)p0i > 0 A(i, q0) = A(p0, q0);

2)qj0 > 0 B(p0, j) = B(p0, q0).

Доказательство. Докажем утверждение 1). Предположим, что для

некоторого i1

pi0 > 0 è A(i1, q0) < A(p0, q0). В условии (

 

)

каждое

неравенство A

i, q01

A

p0, q0

 

,

i

 

, ..., m умножим на p0

 

сложим

(

) ≤

(

 

)

 

 

= 1

i è

0

0

) <

их. Поскольку i1-е неравенство сохранится строгим, получим A(p

, q

A(p0, q0) (противоречие). Утверждение 2) доказывается аналогично.

Следствие. Пусть (p0, q0) − ситуация равновесия в смешанных стратегиях биматричной игры . Тогда

1)A(i, q0) < A(p0, q0) p0i = 0;

2)B(p0, j) < B(p0, q0) qj0 = 0.

Теорема 10.2. Для того чтобы ситуация (p0, q0) была ситуацией равновесия в смешанных стратегиях биматричной игры , необходимо и до-

статочно, чтобы нашлись множества X0 X, Y 0 Y и числа v1, v2, для которых выполнены условия

X

j Y 0

P

j Y 0

P

j Y 0

X

i X0

P

i X0

P

i X0

aijqj0 = v1

i X0,

 

aijqj0 ≤ v1

i / X0,

(10.1)

qj0 = 1, qj0 ≥ 0 j Y 0,

 

pi0bij

= v2

j Y 0,

 

pi0bij

≤ v2

j / Y 0,

(10.2)

p0i = 1, p0i ≥ 0 i X0.

104

10. Ситуации равновесия в биматричных играх

Доказательство. Необходимость. Пусть (p0, q0) − ситуация равновесия. Положим v1 = A(p0, q0), v2 = B(p0, q0),

X0 = {i X | p0i > 0}, Y 0 = {j Y | qj0 > 0}.

Условия (10.1) и (10.2) вытекают из леммы 10.1 и теоремы 10.1. Достаточность. Пусть для ситуации (p0, q0) выполнены условия (10.1)

и (10.2). Покажем, что тогда необходимо A(p0, q0) = v1. Действительно,

èç (10.1)

n

XX

aijqj0 = aijqj0 = v1 i X0.

j Y

0

j=1

 

 

Умножая эти равенства на

0

 

0

 

и складывая их, получим

0

0

 

pi , i X

 

,

 

 

 

0

0

) = v2. По лемме

A(p

, q

) = v1. Аналогично доказывается, что B(p

, q

10.1 (p0

, q0) является ситуацией равновесия.

 

 

 

 

 

 

 

 

 

 

Упражнение 10.1. Докажите, что в игре с матрицами

 

 

A = 1 2

0 , B = 2

1

0

 

 

 

2

0

1

 

 

1

0

2

 

 

 

 

0

1

2

 

 

0

2

1

 

cуществует единственное равновесие по Нэшу

(p0, q0) = ((1/3, 1/3, 1/3), (1/3, 1/3, 1/3)).

Сформулируем условие, обеспечивающее равенство |X0| = |Y 0|1. В этом случае матрицы систем (9.7) и (9.8)

A = (aij)i X0j Y 0 , B = (bij)i X0j Y 0

являются квадратными.

Определение. Говорят, что система векторов a(i) Em, i X0, |X0| ≥ m + 1 имеет максимальный аффинный ранг, если найдутся такой номер

i0 X0 и такое множество X1 X0, i0 / X1, |X1| = m, что векторы a(i) − a(i0), i X1 линейно независимы. Например, при m = 2 система

точек на плоскости тогда и только тогда имеет максимальный аффинный ранг, когда точки не лежат на одной прямой.

Определение. Говорят, что матрица A (матрица B) находится в общем положении, если система строк (столбцов) любой ее подматрицы A =

1Множества X0 è Y 0 содержат равное число элементов.

105

ГЛАВА II. ИГРЫ ДВУХ ЛИЦ

(aij)i X0j Y 0 ñ |X0| > |Y 0| (подматрицы B = (bij)i X0j Y 0 c |X0| < |Y 0|) имеет максимальный аффинный ранг.

Отметим, что для любых двух матриц A è B найдутся сколь угодно поэлементно близкие матрицы A0 è B0, для которых выполнено усло-

вие общности положения. Это утверждение можно доказать, используя непрерывность определителя матрицы как функции ее элементов.

Теорема 10.3. Пусть матрицы A è B игры находятся в общем положении. Тогда для любой ситуации равновесия (p0, q0) в смешанных

стратегиях найдутся такие множества X0

X,0

Y 0

 

0Y и такие числа

(10.1), (10.2) è

|X

| =

|Y

|.

v1, v2, что выполнены условия0

, q

0

 

 

Доказательство. Пусть (p

 

) − произвольная ситуация равновесия

в смешанных стратегиях. Тогда по теореме 10.2 найдутся такие множества X0 X, Y 0 Y и такие числа v1, v2, что выполнены условия (10.1) и (10.2).

Докажем, что |X0| = |Y 0|. Предположим, что |X0| > |Y 0|. Рассмотрим

подматрицу A = (aij)i X0j Y 0 , отвечающую системе уравнений (10.1). Из условия общности положения найдутся такой номер i0 X0 и такое множество X1 X0, i0 / X1, |X1| = |Y 0|, что матрица (aij −ai0j)i X1j Y 0 невырожденная.

Из (10.1) получаем систему уравнений

X

(aij − ai0j)qj0 = 0 i X1,

j Y 0

имеющую нулевое решение qj0 = 0, j Y 0, что противоречит равенству

P qj0 = 1.

j Y 0

Аналогично приходим к противоречию, предполагая, что |X0| < |Y 0|.

Условие общности положения для матриц A è B трудно проверить.

Отказавшись от него, можно получить утверждение, более слабое, чем теорема 10.3.

Теорема 10.3 0. В любой биматричной игре для некоторой ситуации равновесия (p0, q0) в смешанных стратегиях найдутся такие множе-

ñòâà X0 X, Y 0 Y и такие числа v1, v2, что выполнены условия (10.1), (10.2) и |X0| = |Y 0|.

Доказательство. Для матриц A è B найдутся такие последовательности матриц {Ak}, {Bk}, удовлетворяющих условию общности положения, что поэлементно Ak → A, Bk → B.

106

вытекает, что
10.1 и 10.2, то, добавляя компоненты
p0, q0.

10. Ситуации равновесия в биматричных играх

Возьмем последовательность ситуаций равновесия {(pk, qk)} èãð k ñ матрицами Ak, Bk. По теореме 10.3 найдутся такие множества

Xk X, Y k Y и числа v1k, v2k, ÷òî |Xk| = |Y k| и выполнены условия

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

aijk qjk = v1k

 

i Xk,

 

X

pikbijk = v2k

 

j Y k,

 

 

 

 

aijqjk v1k

 

i / Xk,

 

 

 

 

 

pikbij v2k

 

j / Y k,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

 

 

 

 

 

 

k

 

 

 

 

 

j Y k

 

 

 

 

 

 

 

i

Xk

 

 

 

 

 

 

j

Y

 

 

 

 

 

 

 

i

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

k

 

k

≥ 0

k

,

P

k

 

k

≥ 0

k

.

j

Y k qj

= 1, qj

j Y

i Xk pi

= 1, pi

i X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

P

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Без потери общности (выделяя соответствующие подпоследовательности) можно считать, что pk → p0, qk → q0 è Xk = X0, Y k = Y 0 ïðè

всех k. Переходя в последних уравнениях и неравенствах к пределу при k → ∞, получим условия (10.1),(10.2) для смешанных стратегий

По теореме 10.2 ситуация (p0, q0) будет равновесием по Нэшу.

Рассмотрим алгоритм поиска ситуаций равновесия в смешанных стратегиях. Перебираем квадратные подматрицы

A = (aij)i X0j Y 0 , B = (bij)i X0j Y 0

и решаем системы уравнений из (10.1),(10.2). Если решения этих систем p0i , i X0, v1 è qj0, j Y 0, v2 удовлетворяют неравенствам из условий pi = 0, i / X0, qj = 0, j / Y 0,

получим ситуацию равновесия (p0, q0). Из теоремы 10.3 0

через конечное число шагов алгоритм приводит к ситуации равновесия. Проиллюстрируем работу алгоритма для игр с матрицами размеров

2 × n :

A =

a11

· · ·

a1n

, B =

 

a21

· · ·

a2n

 

b11

· · ·

b1n .

b21

· · ·

b2n

В данном случае смешанная стратегия первого игрока имеет вид p = (p1, 1 −p1), ãäå 0 ≤ p1 ≤ 1. Перебирать нужно 2 Ч2-подматрицы. Каждая из них задается номерами двух столбцов j1, j2. Запишем систему (10.2)

p01b1j1 + (1 − p01)b2j1 = v2, p01b1j2 + (1 − p01)b2j2 = v2,

p01b1j + (1 − p01)b2j ≤ v2 j 6= j1, j2, 0 ≤ p01 ≤ 1.

Если эта система несовместна, то перейдем к другой паре j1, j2. Åñëè решение p01, v1 системы (10.2) существует, то рассмотрим систему (10.1)

a1j1 q + a1j2 (1 − q ) = v1, a2j1 q + a2j2 (1 − q ) = v1, 0 ≤ q ≤ 1.

107

ГЛАВА II. ИГРЫ ДВУХ ЛИЦ

Пусть существует ее решение1 q , v1. Определим стратегию

 

q0 : qj0 =

1 q , j = j2

,

 

 

 

 

q ,

j = j1

,

 

 

 

 

 

0 0

 

 

0,

j = j1, j2,

 

смешанным

равновесием по Нэшу.

 

 

 

 

 

6

 

и ситуация (p , q ) будет

 

 

 

 

Здесь алгоритму можно дать геометрическую интерпретацию. На отрезке 0 ≤ p1 ≤ 1 строим прямые lj(p1) = b1jp1 + b2j(1 − p1), j = 1, ..., n.

Точки излома верхней огибающей семейства прямых lj соответствуют

парам j1, j2, для которых существует решение p01, v2 системы (10.2). По- этому последовательно перебираем точки верхней огибающей и решаем систему уравнений из (10.1) с проверкой неравенств 0 ≤ q ≤ 1.

Ïðè n = 2 обе матрицы A è B имеют размеры 2 × 2. В этом случае

прямые l1(p1) = b11p1+b21(1−p1) è l2(p1) = b12p1+b22(1−p1) тогда и только

тогда пересекаются в точке 0 ≤ p01 ≤ 1, когда выполнено неравенство (рис. 10.1)

 

 

 

 

 

(b22 − b21)(b11 − b12) ≥ 0.

(10.3)

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b22

 

P

 

 

 

 

 

 

 

PP

PPPPP

 

 

 

 

 

b

11

 

 

PP

 

l1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b12

 

 

 

 

PP

l2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-

 

p1

 

0

 

 

 

p10

1

 

 

 

 

 

 

Ðèñ. 10.1

Если столбцы матрицы B (и соответствующие прямые l1 è l2) íå ñîâ- падают, то компоненты смешанной стратегии p0, удовлетворяющей си- стеме (10.2), можно записать в явном виде

p10 =

 

b22

− b21

 

, p20 =

b11

− b12

 

.

(10.4)

 

− b21

 

b22 b21

 

+ b11

 

+ b11

 

b22

− b12

− b12

 

1В противном случае переходим к другой паре j1, j2.

108

10. Ситуации равновесия в биматричных играх

Для системы (10.1), из которой вычисляется смешанная стратегия второго игрока, все рассуждения проводятся аналогичным образом. В результате мы получим следующее условие на матрицу первого игрока, обеспечивающее существование решения системы (10.1):

(a22 − a12)(a11 − a21) ≥ 0.

(10.5)

Это условие можно выписать и сразу, исходя из следующих соображений: надо заменить второго игрока первым и учесть, что второй игрок выбирал свои стратегии по столбцам, а первый выбирает их по строкам. Поэтому, чтобы выписать условие существования решения, надо выписать условие (10.3), заменив одну матрицу на другую, а строки на столб-

цы. Если строки матрицы A не совпадают, то компоненты смешанной стратегии q0, удовлетворяющей системе (10.1), можно записать в явном виде

q10 =

 

a22

− a12

 

, q20 =

a11

− a21

 

.

(10.6)

 

− a12

 

a22 a12

a22

+ a11

 

+ a11

 

 

− a21

− a21

 

Пример 10.1. Модель технического контроля за качеством продукции.

Завод выпускает автомобили партиями по 100 штук. За каждую автомашину завод получает от концерна 1.3 ед. оплаты, из которых 1 ед. составляют премиальные, а 0.3 ед. предназначены для операций техни- ческого контроля (ОТК). Завод (игрок 1) может выпускать партию автомобилей либо с ОТК (стратегия 1), либо без ОТК (стратегия 2), увеличи- вая сумму премиальных. При использовании первой стратегии итоговая сумма премиальных, полученная заводом за партию, составляет 100 ед.,

при использовании второй стратегии 130 åä.

С целью уменьшения производственного брака концерн решил привлечь независимую фирму, осуществляющую технический контроль за качеством продукции. Стоимость проверки автомобиля для фирмы составляет 0.12 ед. Если ОТК заводом не проводится, то автомобиль неис-

правен с вероятностью 4/5. В случае обнаружения неисправностей завод

обязан их устранить, затратив 0.3 ед., и заплатить дополнительно фирме 0.2 ед. из своих премиальных. Фирма (игрок 2) может либо проверить партию (стратегия 1), либо отказаться от ее проверки (стратегия 2).

Выигрышем первого игрока является ожидаемая сумма премиальных, полученная заводом от концерна за партию автомобилей с учетом

109

ГЛАВА II. ИГРЫ ДВУХ ЛИЦ

издержек на ОТК и возможных выплат фирме. Выигрышем второго игрока является ожидаемая сумма выплат, полученных от завода при проверке партии автомобилей с учетом затрат на эту проверку. Выпишем матрицы игры

A =

 

90

130

,

B =

4

0 .

 

 

100

100

 

 

 

12

0

Например, если завод не проводит ТК, а фирма проверяет партию, то средние премиальные равны 100(0.8(4/5) + 1.3(1/4)) = 90 ед., а ожидае-

мая прибыль фирмы составит 100(0.08(4/5)−0.12(1/5)) = 4 ед. Нетрудно

видеть, что в данной игре не существует ситуации равновесия в чистых стратегиях. Условия (10.3) и (10.5) выполнены и ситуацию равновесия находим по формулам (10.4) и (10.6)

(p0, q0) = ((1/4, 3/4), (3/4, 1/4)).

Равновесные стратегии p0 è q0 могут быть реализованы в виде "физи-

ческих смесей": первый игрок "должен"25 автомобилей каждой партии выпускать c ОТК, второй игрок должен проверять по 75 автомобилей каждой партии.

Пример 10.2. Пусть

 

A =

4 2 1

, B =

0 2 3 .

 

 

 

2

4

5

 

3

2

0

 

6

 

 

 

 

 

l1

 

 

 

 

 

 

 

 

 

 

 

 

 

3

Q

 

 

 

 

 

 

 

 

2

QQQbQQ b

l2

 

 

 

 

 

 

Q

Q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q

Q

l3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q

 

 

 

 

 

 

 

 

 

 

 

 

Q

 

 

-

p1

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

1

 

2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

3

 

3

 

 

 

 

 

 

Ðèñ. 10.2

Здесь l1(p1) = 3p1, l2(p1) ≡ 2, l3(p1) = 3(1 −p1). Первая точка верхней огибающей ( пересечение прямых l2 è l3 на рис. 10.2) имеет абсциссу

110