Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
32
Добавлен:
02.05.2014
Размер:
1.28 Mб
Скачать

4. Свойства решений в смешанных стратегиях

трех сторон треугольника. На рис. 4.1 изображены линии x1 = y1, x2 =

y2, x3 = y3.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(A, 0, 0)

 

 

 

 

 

x3 = y3

 

J

x2 = y2

 

 

 

J

 

 

J

 

 

 

J

 

J

 

 

 

 

 

 

J

 

J

 

 

 

 

 

 

 

J

 

J

 

 

 

 

 

 

 

 

J

y

J

 

x1 = y1

 

 

 

 

 

 

J

J

 

 

 

 

 

J

 

J

 

 

 

 

J

 

J

 

 

 

 

 

 

J

 

J

 

 

 

 

 

 

J

 

J

 

 

 

 

 

 

J

 

J

(0, A, 0)

(0, 0, A)

 

 

 

 

 

 

Ðèñ. 4.1

Множество стратегий вне этих линий разобьем на два подмножества

X1(y) = {x X | x y}, X2(y) = {x X | y x}.

Заметим, что X1(y) является объединением трех треугольников. Например, нижний треугольник на рис. 4.1 состоит из таких векторов x, äëÿ

которых x2 > y2, x3 > y3.

Множество

C = {x X | 0 ≤ xi ≤ 2A/3, i = 1, 2, 3}

0

, совпадаю-

представляет собой правильный шестиугольник с центром y

 

щим с центром треугольника X (ðèñ. 4.2).

 

 

 

 

 

 

 

 

 

 

 

J

 

 

 

 

 

 

 

 

 

 

 

J

 

 

 

 

 

 

 

 

 

 

 

J

 

 

 

 

 

 

 

 

 

 

J

 

 

 

 

 

 

 

 

 

J

J

 

 

 

 

 

 

 

 

J

J

 

 

 

 

 

 

 

 

J

y0

J

 

 

 

 

 

 

 

J

J

J

 

 

 

 

J

 

 

1

J

 

 

 

 

J

y

J

J

 

 

 

 

 

 

ay JJ

 

JJ

 

 

 

 

 

JJ a

 

 

 

 

Ðèñ. 4.2

Пусть ϕ0 равномерное распределение на C. Докажем, что тройка

31

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

0, ϕ0, 1/2) − решение игры в смешанных стратегиях. Для этого достаточно проверить условие ( ) теоремы 4.1.

Обозначим через mes(S) площадь фигуры S X. Тогда

F (ϕ0, y) = mes(X1(y) ∩ C) y Y. mes(C)

Нетрудно показать, что mes(X1(y) ∩ C) = 0.5mes(C) äëÿ âñåõ y C. Действительно, для центра шестиугольника y0 это утверждение очевид-

но. Пусть y 6= y0. Определим вектор y1 C :

y11 = y1, y21 = y20 = A/3, y31 = 2A/3 − y1.

Сравнивая фигуры X1(y) ∩ C, X1(y1) ∩ C è X1(y0) ∩ C, убеждаемся, что их площади равны. Следовательно, при y C F (ϕ0, y) = 1/2. Ìåòî-

дом сравнения площадей можно также показать, что mes(X1(y) ∩ C) > 0.5mes(C), åñëè y / C. Итак, доказано, что F (ϕ0, y) ≥ 1/2 y Y. Ïî-

скольку

F (x, ϕ0) = mes(X2(x) ∩ C) x X, mes(C)

для доказательства неравенства F (x, ϕ0) ≤ 1/2 x X достаточно заметить, что

mes(X1(x) ∩ C) + mes(X2(x) ∩ C) = mes(C) x X.

Пусть смешанное расширение произвольной антагонистической игры .

Определение. Смешанная стратегия ψ0 второго игрока называется âû- равнивающей, åñëè F (x, ψ0) ≡ const на множестве X.

Аналогично определяется выравнивающая стратегия первого игрока.

Утверждение 4.1. Если в игре у обоих игроков существуют выравнивающие стратегии ϕ0, ψ0, то они оптимальны.

Доказательство. Действительно, по определению

F (ϕ0, y) = c1 y Y, F (x, ψ0) = c2 x X.

Интегрируя эти равенства по ψ0 è ϕ0 соответственно, получим F (ϕ0, ψ0) =

c1 = c2. Ïðè v = F (ϕ0, ψ0) неравенства из условия ( ) теоремы 4.1 для тройки 0, ψ0, v) выполнены как равенства.

Доказанное утверждение можно усилить.

32

4. Свойства решений в смешанных стратегиях

Упражнение 4.3. Пусть в игре ψ0 выравнивающая стратегия второго игрока и найдется такая смешанная стратегия ϕ0 первого игро- êà, ÷òî F (ϕ0, ψ0) = min F (ϕ0, ψ). Докажите, что ϕ0, ψ0 оптимальные

ψ{ψ}

смешанные стратегии игроков.

Упражнение 4.4. Приведите пример игры с матрицей размеров 2 × 3, в которой второй игрок имеет выравнивающую, но не оптимальную смешанную стратегию.

Пример 4.3. Первый игрок ведет стрельбу по цели, которая может находиться в одной из трех точек: либо в концах отрезка [B, C] длины

2, либо в его середине D. Первый игрок выбирает точку прицела B, C èëè D. Пусть d − расстояние от точки прицела до положения цели, а вероятности ее поражения равны 1, a, 0 для расстояний d = 0, 1, 2 соответственно. Выигрыш первого игрока вероятность поражения цели.

Требуется определить оптимальную стратегию стрельбы в зависимости от значения параметра a (0, 1).

B C D

Составим матрицу игры A =

C a

1

a .

 

B

1

a

0

 

 

D

0

a

1

Пусть q0 = (q10, q20, q30) − выравнивающая стратегия второго игрока. Матрица A симметрична и смешанная стратегия p0 = q0 первого игро-

ка также является выравнивающей. Из утверждения 4.1 вытекает, что стратегии p0 è q0 оптимальны. Найдем q0. В силу симметрии концов от-

резка [B, C] по отношению к его середине D можно считать, что q10 = q30. Следовательно,

2q10 + q20 = 1, q10 + aq20 = v, 2aq10 + q20 = v.

Выпишем решение полученной системы уравнений

q0

=

1 − a

, q0

=

1 − 2a

, v =

1 − 2a2

.

1

 

3 − 4a

2

3 − 4a

 

3 − 4a

 

 

 

 

Из условия неотрицательности q10, q20 находим, что a ≤ 1/2. При a > 1/2 покажите, что тройка (p0, q0, v) = ((0, 1, 0), (1/2, 0, 1/2), a) − решение

игры в смешанных стратегиях.

Упражнение 4.5. Используя выравнивающие стратегии, решите ана-

33

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

логичную игру с матрицей

A =

a

1

a 0

, 0 < a < 1.

 

 

1

a

0

0

 

 

 

0

0

a

1

 

 

 

0

a

1

a

 

 

 

 

 

 

 

 

 

 

Теорема 4.2. Для непрерывной игры справедливы следующие два утверждения:

1) inf F (ϕ, ψ) = min F (ϕ, y) ϕ {ϕ};

ψ{ψ} y Y

2)sup F (ϕ, ψ) = max F (x, ψ) ψ {ψ}.

ϕ{ϕ} x X

Доказательство. Докажем 1). Возьмем любую стратегию ϕ. Заметим, что min F (ϕ, y) достигается, поскольку функция F (ϕ, y) непрерывна

y Y

 

 

 

 

 

 

 

 

 

ïî y. Далее,

 

 

 

 

 

 

 

 

 

ψ

inf

 

F (ϕ, ψ)

min F (ϕ, y)

(4.1)

{

ψ

}

 

 

y

 

Y

 

 

 

 

 

 

 

 

и для любого ψ {ψ}

 

 

 

 

YZ

 

 

 

 

F (ϕ, ψ) = F (ϕ, y)dψ(y)

min F (ϕ, y)dψ(y) = min F (ϕ, y).

YZ

 

 

 

 

y Y

 

 

y Y

Отсюда

 

 

 

F (ϕ, ψ) ≥ min F (ϕ, y).

 

inf

 

(4.2)

ψ{ψ}

 

 

y Y

 

Из (4.1) и (4.2) следует первое утверждение теоремы. Утверждение 2) доказывается аналогично.

Следствие. Значение v непрерывной игры может быть представлено в виде следующих двух формул:

v = max min F (ϕ, y) = min max F (x, ψ).

ϕ{ϕ} y Y

ψ{ψ} x X

Доказательство. По теоремам 2.1,3.2 и 4.2 получаем

v = max

ψ

inf

F (ϕ, y)

 

v = max inf F (ϕ, y).

ϕ

ϕ

}

{

ψ

}

ϕ

ϕ

}

y

 

Y

 

{

 

 

 

 

{

 

 

Вторая формула выводится аналогично.

34

4. Свойства решений в смешанных стратегиях

Упражнение 4.6. Докажите, что значение v непрерывной игры удовлетворяет неравенствам

v max min F (x, y)

v min max F (x, y) =

 

 

v.

 

X y

 

Y

≤ ≤ y

 

 

X

= x

 

 

Y x

Теорема 4.2 0. Для игры с матрицей A справедливы следующие два утверждения:

1)

min A(p, q) =

min A(p, j)

 

p

 

P ;

q Q

1≤j≤n

 

 

 

 

2)

max A(p, q) = max A

i, q

)

 

q

 

Q.

p P

1≤i≤m (

 

 

 

Докажите самостоятельно.

Следствие. Значение v игры с матрицей A может быть представлено

âвиде следующих двух формул:

v = max min A(p, j) = min max A(i, q).

p P 1≤j≤n

q Q 1≤i≤m

Теперь обсудим так называемое свойство дополняющей нежесткости. Определим множество Sp(ϕ) X − спектр смешанной стратегии

ϕ, заданной на отрезке X.

Определение. Будем говорить, что точка x0 X = [a, b] принадлежит спектру стратегии ϕ, если для всякого ε > 0 существует такой отрезок [a0, b0], содержащий x0, ÷òî b0 − a0 < ε è ϕ(b0) − ϕ(a0) > 0. Множество всех точек спектра обозначим через Sp(ϕ).

Упражнение 4.7. Докажите, что точки скачка функции распределения ϕ и точки, где ее производная существует и положительна, принад-

лежат спектру Sp(ϕ).

Теорема 4.3 (Свойство дополняющей нежесткости). Пусть

0, ψ0, v) − решение в смешанных стратегиях непрерывной игры . Тогда

1)x Sp(ϕ0) F (x, ψ0) = v;

2)y Sp(ψ0) F (ϕ0, y) = v.

Доказательство. Докажем утверждение 1). Предположим противное, т.е. найдется такая точка x0 Sp(ϕ0), ÷òî F (x0, ψ0) 6= v. Тогда по

свойству ( ) теоремы 4.1 будет выполнено неравенство F (x0, ψ0) < v. Из непрерывности функции F (x, ψ0) и определения спектра стратегии ϕ0

35

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

вытекает, что для всякого ε > 0 найдется такой отрезок [a0, b0], содержа-

щий точку x0, и такое число v0

< v , ÷òî äëÿ âñåõ x [a0, b0]

 

 

F (x, ψ0) ≤ v0 < v, b0 − a0 < ε, ϕ0(b0) − ϕ0(a0) > 0.

Теперь

 

 

F (ϕ0, ψ0) = XZ F (x, ψ0)dϕ0(x) =

 

 

 

Z

 

 

 

=

F (x, ψ0)dϕ0(x) +

Z

F (x, ψ0)dϕ0(x) ≤ Z

v00(x)+

 

(a0,b0]

Z

X\(a0,b0]

 

Z

(a0,b0]

 

 

+

vdϕ0(x) < (ϕ0(b0) − ϕ0(a0))v +

vdϕ0(x) = v,

 

X\(a0,b0]

 

 

 

X\(a0,b0]

 

 

что противоречит определению значения игры. Утверждение 2) доказывается аналогично.

Следствие. Пусть 0, ψ0, v) − решение в смешанных стратегиях непрерывной игры . Тогда

1)F (x, ψ0) < v x / Sp(ϕ0);

2)F (ϕ0, y) > v y / Sp(ψ0).

Сформулируем аналогичную теорему для матричных игр.

Теорема 4.3 0 (Свойство дополняющей нежесткости). Пусть

(p0, q0, v) − решение в смешанных стратегиях игры с матрицей A. Тогда

1)p0i > 0 A(i, q0) = v;

2)qj0 > 0 A(p0, j) = v.

Упражнение 4.8. Докажите теорему 4.3 0.

Следствие. Пусть (p0, q0, v) − решение в смешанных стратегиях игры

ñматрицей A. Тогда

1)A(i, q0) < v p0i = 0;

2)A(p0, j) > v qj0 = 0.

Поясним выражение "дополняющая нежесткость", заимствованное из теории двойственности линейного программирования. Поставим в соответствие неравенству A(i, q0) ≤ v (A(p0, j) ≥ v) из условия ( ) неравен-

ñòâî p0i ≥ 0 (qj0 ≥ 0) с тем же номером. Тогда если одно из этих неравенств выполнено строго ("нежестко"), то по теореме 4.3 0 и ее следствию

36

5. Методы решения матричных игр

соответствующее неравенство выполнено как равенство ("жестко"). Все это можно записать в следующей краткой форме: для решения (p0, q0, v)

в смешанных стратегиях игры с матрицей A справедливы равенства p0i (v − A(i, q0)) = qj0(A(p0, j) − v) = 0, i = 1, ..., m, j = 1, ..., n.

Пример 4.4. Решим игру с диагональной матрицей A, в которой диа-

гональные элементы ai > 0. Предположим, что все компоненты опти- мальных смешанных стратегий p0, q0 положительны. Тогда по теореме 4.3 0

 

n

 

Xi

A(i, q0) = aiqi0 = v, i = 1, ..., n,

qi0 = 1.

 

=1

Решая эту систему относительно n + 1 неизвестных qi0, i = 1, ..., n, v,

n

получим qi0 = v/ai, i = 1, ..., n, ãäå v = 1/ P a1 .

k=1 k

Аналогично можно найти, что p0 = q0.

Приведем одну интерпретацию этой игры. Пусть милиционер (первый игрок) ищет преступника (второго игрока) в одном из n баров. Если

милиционер приходит в бар i, где находится преступник, то вероятность

его задержания равна ai. Оптимальные смешанные стратегии предписы-

вают игрокам идти с большей вероятностью в тот бар, где вероятность задержания меньше. Поэтому оптимальная стратегия преступника есте-

ственна, а милиционера парадоксальна. Отметим также, что мы одновременно решили следующую задачу поиска максимина:

v = max min A(p, i) = max min aipi.

p P 1≤i≤n

p P 1≤i≤n

5. Методы решения матричных игр

В этом параграфе изложены некоторые методы решения матричных игр в смешанных стратегиях. При этом наша цель будет состоять в поиске хотя бы одного решения игры.

I. Доминирование строк и столбцов.

Если элементы некоторой строки i1 матрицы A меньше соответству-

ющих элементов другой строки i2, то интуитивно ясно, что строку i1

первому игроку можно не использовать. Сформулируем условия доминирования строк и столбцов матрицы игры, позволяющие уменьшить ее размеры.

37

a = (a1, ..., al) слабо доми-

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

Определение. Будем говорить, что вектор

нирует вектор b = (b1, ..., bl), åñëè ai ≥ bi, i = 1, ..., l. Будем говорить о строгом доминировании, если все нестрогие неравенства заменены на

строгие >. Заметим, что слабое доминирование возможно даже в случае равенства векторов a è b.

Определение. Для векторов a(i), i = 1, ..., m, евклидова пространства

 

m

 

 

 

m

и чисел pi ≥ 0, i = 1, ..., m,

i=1 pi

= 1, линейная комбинация i=1 pia(i)

 

P

векторов a

(i)

ñ

P pi.

называется выпуклой комбинацией

 

 

коэффициентами

Теорема 5.1 (О доминировании строк). Пусть некоторая строка матрицы A слабо доминируется выпуклой комбинацией остальных строк.

Тогда эта строка входит с нулевой вероятностью в некоторую оптимальную смешанную стратегию первого игрока. Если указанное доминирование строгое, то эта строка входит с нулевой вероятностью в любую оптимальную смешанную стратегию первого игрока. Доминируемые строки можно вычеркнуть из матрицы игры.

Доказательство. Пусть строка матрицы A с номером i1 слабо до- минируется выпуклой комбинацией остальных строк с коэффициентами pi ≥ 0, i 6= i1 :

X

X

 

ai1j ≤ piaij, j = 1, ..., n,

pi = 1.

(5.1)

i6=i1

i6=i1

 

Рассмотрим матрицу ˆ

 

 

 

 

 

 

 

 

 

A, полученную из A вычеркиванием (исключени-

åì)

 

-ой строки. Пусть

 

0

, v) −

решение игры с матрицей ˆ Положим

p

0

 

i1

 

(ˆp, q

 

0

, q

0A.

 

= (ˆp1, ..., pˆi1−1, 0, pˆi1+1, ..., pˆm) и докажем, что тройка (p

, v) − ðåøå-

ние игры с матрицей A. Тем самым будет доказано второе утверждение

теоремы и обосновано вычеркивание i1-îé строки. Действительно, решая

игру с матрицей ˆ

A, мы находим решение исходной игры, добавляя в

нулевую i1-ую компоненту.

Проверим условие ( ) для тройки (p0, q0, v) в игре с матрицей A. Èìå-

åì

0

ˆ

0

ˆ

0

) ≤ v

i 6= i1.

A(p

, j) = A(ˆp, j) ≥ v, j = 1, ..., n;

A(i, q

) = A(i, q

Пусть i = i1. Тогда, полагая p0 = (pi, i 6= i1), получим

nn

 

 

X

 

X X

ˆ 0

 

 

0

) =

0

 

0

0

) ≤ v,

A(i1, q

ai1jqj

 

( aijpi)qj

= A(p

, q

 

 

j=1

 

j=1

i6=i1

 

 

 

 

 

 

 

 

 

 

 

38

5. Методы решения матричных игр

поскольку стратегия q

0

второго игрока оптимальна в игре с матрицей

ˆ

 

 

A.

Èòàê, (p0, q0, v) − решение игры с матрицей A.

Предположим, что неравенства в (5.1) строгие. Тогда в последних выкладках первое неравенство также строгое и A(i1, q0) < v. Пусть p −

произвольная оптимальная смешанная стратегия первого игрока. Тогда (p , q0, v) − решение игры с матрицей A. Из последнего неравенства по

свойству дополняющей нежесткости получаем pi1 = 0.

Отметим, что при исключении строго доминируемых строк оптимальные смешанные стратегии первого игрока сохраняются. При слабом доминировании оптимальные стратегии могут теряться. В качестве примера достаточно рассмотреть матрицу игры с равными элементами.

Следующую теорему докажите самостоятельно.

Теорема 5.1 0 (О доминировании столбцов). Пусть некоторый

столбец матрицы A слабо доминирует выпуклую комбинацию остальных

столбцов этой матрицы. Тогда этот столбец входит с нулевой вероятностью в некоторую оптимальную смешанную стратегию второго игрока. Если указанное доминирование строгое, то этот столбец входит с нулевой вероятностью в любую оптимальную смешанную стратегию второго игрока. Доминирующие столбцы можно вычеркнуть из матрицы игры.

Пример 5.1. Решить игру с матрицей

3 1 5

A = 1 3 3 . 2 2 1

Здесь полусумма первых двух строк слабо доминирует третью строку и ее можно вычеркнуть. В полученной матрице третий столбец слабо доминирует второй. После его вычеркивания получим циклическую матрицу

Aˆ =

1

3

с решением (ˆp, q,ˆ v) = ((1/2, 1/2), (1/2, 1/2), 2). Поэтому ис-

 

3

1

 

ходная игра имеет решение

(p0, q0, v) = ((1/2, 1/2, 0), (1/2, 1/2, 0), 2).

Упражнение 5.1. Пусть матрица A имеет седловую точку. Показать,

что после исключения слабо доминируемых строк и слабо доминирующих столбцов без использования выпуклых комбинаций редуцированная

матрица имеет седловую точку матрицы A.

39

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

Упражнение 5.2. Полковнику Блотто1 (первому игроку) поставлена задача прорыва тремя полками через два горных перевала, охраняемых двумя полками противника (второго игрока). Стратегия Блотто

(k1, k2) X = {(3, 0), (2, 1), (1, 2), (0, 3)} состоит в том, что k1 полков направляются на первый перевал, а k2 на второй. Противник распола-

гает аналогичными стратегиями (l1, l2) Y = {(2, 0), (1, 1), (0, 2)}. Полки

Блотто и противника, встретившись на перевале, взаимно уничтожают друг друга. Выигрышем Блотто является общее число его полков, про-

рвавшихся через два перевала, т.е. величина max[k1 −l1, 0]+max[k2 −l2, 0]. Решить матричную игру и найти оптимальную стратегию Блотто.

II. Графический метод решения игр с матрицами размеров 2 Ч n и m Ч 2.

Рассмотрим игру с 2 × n-матрицей A. Смешанная стратегия первого

игрока p = (p1, 1 −p1) определяется величиной p1 [0, 1]. Значение игры, согласно следствию теоремы 4.2 0, представимо в виде

v = max min A(p, j) =

0

max

min [a

1j

p

1

+ a

2j

(1

p

)].

p

 

P 1

j

n

p1

1 1

j

n

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для нахождения значения игры и оптимальной смешанной стратегии первого игрока достаточно на отрезке [0,1] построить графики семейства

линейных функций lj(p1) = a1jp1 + a2j(1 − p1) с угловыми коэффициентами kj = a1j − a2j, j = 1, ..., n, и найти точку максимума p01 функции

min lj(p1) − нижней огибающей семейства (рис. 5.1).

1≤j≤n

6S

Slj1

QS

 

Q

S

 

 

 

 

 

 

v

Q

 

 

 

 

 

 

 

Q S

 

 

 

 

 

 

 

Q

S

 

 

 

 

 

 

 

Q

 

 

 

 

 

 

 

QS

 

 

 

 

 

 

 

 

Q

l

 

 

 

 

SQ

 

 

 

 

SQ j2

 

 

 

 

 

S Q

 

p1

 

 

 

 

S

 

 

-

0

 

p10

 

 

 

1

 

 

Ðèñ. 5.1

1Полковник Блотто − анекдотический персонаж, действующее лицо многих иллюстративных примеров из области антагонистических игр.

40