Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
32
Добавлен:
02.05.2014
Размер:
1.28 Mб
Скачать

2. Седловые точки и антагонистические игры

Поэтому

inf F

 

x, y

) ≤ sup

F

 

x, y

)

y

 

Y

 

v

 

 

 

 

 

v.

 

sup y

Y

(

 

 

(

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x X

 

 

 

x X

 

 

 

 

 

 

 

 

 

 

 

 

 

Теперь сформулируем необходимое и достаточное условие существования седловой точки для функции двух переменных.

Теорема 2.1. 1) Для того чтобы функция F (x, y) íà X × Y имела

седловую точку, необходимо и достаточно, чтобы было выполнено равенство

max inf F (x, y) = min sup F (x, y).

(2.3)

x X y Y

y Y x X

 

2) Пусть выполнено равенство (2.3). Пара (x0, y0) тогда и только тогда является седловой точкой, когда x0 максиминная, а y0 минимаксная

стратегии игроков.

Доказательство. Утверждения 1) и 2) будем доказывать одновременно.

Необходимость. Пусть (x0, y0) − седловая точка функции F (x, y). Покажем, что выполнено равенство (2. 3), а x0, y0 максиминная и минимаксные стратегии. Имеем

 

≤ sup

F x, y0

 

F x0

, y0

 

v

inf F (x0, y)

v

 

 

v.

v

) =

) =

v

 

(

(

 

 

= y

Y

 

 

 

 

x X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Но неравенство v ≤ v верно в силу леммы 2.2. Поэтому v = v è â ïî-

следних неравенствах всюду можно поставить знаки равенств. Из полу- ченных равенств следует, что x0 максиминная, а y0 минимаксная

стратегии игроков.

Достаточность. Пусть равенство (2.3) выполнено. Возьмем x0, y0

максиминную и минимаксную стратегии и покажем, что они образуют седловую точку. Имеем

 

 

x0

, y0

inf F (x0

(2.3)

 

 

 

 

x, y0

 

F (x0

, y0).

F

(

, y) = v =

v

= sup

F

(

) ≥

 

 

 

) ≥ y

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x X

 

 

 

 

 

 

Во всех неравенствах можно поставить знаки равенств и получаем, что (x0, y0) − седловая точка функции F (x, y).

Замечание. Если выполнено равенство (2.3), то множество всех седловых точек прямоугольно и совпадает с X0 ×Y 0, ãäå X0 è Y 0 множества

всех максиминных и минимаксных стратегий игроков.

11

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

Упражнение 2.1. Докажите, что 3×3-матрица не может иметь ровно 7 седловых точек.

Пример 2.3. Найдем все седловые точки матрицы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

7

−1

−4

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

2

 

3

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A =

4

 

3

7

 

 

2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

 

5

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Здесь ( min a

 

 

) = (

4, 2, 2,

3) è ( max a

 

) = (7, 2, 7, 2). Отсюда

 

=

ij

ij

v

 

 

1≤j≤4

 

 

 

 

 

 

 

 

 

1≤i≤4

 

 

 

 

 

 

v

 

, X0

=

 

{

2, 3

 

,

Y 0 =

{

2, 4

}

. Четыре седловые точки образуют

 

= 2

 

 

0

 

 

0 }

 

 

 

 

 

 

 

 

 

 

 

 

 

множество X

 

 

× Y

.

 

 

 

 

 

 

 

 

F (x, y) = 2x2 − 3xy + 2y2. Найдем

 

Пример 2.4. Пусть X = Y = [0, 1],

величины v и v. При фиксированном x минимум по y функции F (x, y) достигается в точке y(x) = 3x/4 Y. Поэтому функция минимума −

W (x) = min F (x, y) = 7x2/8. Отсюда v = 7/8 è x0 = 1 − максиминная

0≤y≤1

стратегия. Зафиксируем y. Максимум функции F (x, y) по x достигается в концах отрезка [0, 1] и равен

 

def

 

 

 

 

M(y) = max F (x, y) = max[F (0, y), F (1, y)] =

 

 

 

0≤x≤1

(2y2,

 

 

 

 

 

2/3 < y

1.

= max[2y2

, 2

 

3y + 2y2] =

2 − 3y + 2y2,

0 ≤ y ≤ 2/3,

Минимум функции M(y) достигается при y0 = 2/3 è v = M(y0) = 8/9 > v = 7/8. Следовательно, функция F (x, y) не имеет седловой точки.

Упражнение 2.2. Найдите максиминную и минимаксную стратегии, а также нижнее и верхнее значения игры , в которой

X = [−2, 3], Y = [−1, 2], F (x, y) = −x2 + 4xy − 5y2 + 3x − 2y.

Иногда в выражениях

v = sup inf F (x, y),

v

= inf sup F (x, y)

 

x X y Y

 

y Y x X

 

внешние sup è inf не достигаются, но

 

sup inf F (x, y) = inf sup F (x, y).

(2.4)

x X y Y

y Y x X

 

12

2. Седловые точки и антагонистические игры

Тогда максиминная (или минимаксная) стратегия не ñуществует и седловой точки нет. Возможен другой случай, когда v < v, но эти величины близки. В подобных случаях используют понятие

ε-седловой точки.

Определение. Пусть задано ε > 0. Ïàðà (xε, yε) X × Y называется ε-седловой точкой функции F (x, y) íà X × Y , åñëè

F (x, yε) − ε ≤ F (xε, yε) ≤ F (xε, y) + ε x X, y Y.

Упражнение 2.3. Пусть x0, y0 максиминная и минимаксная стратегии, a ε = v − v > 0. Доказать, что (x0, y0) − ε-седловая точка функции

F (x, y).

Определение. Пусть задано ε > 0. Стратегия первого игрока xε íà-

зывается ε-максиминной, åñëè inf F (xε, y) ≥ v − ε. Стратегия второго

y Y

игрока yε называется ε-минимаксной, åñëè sup F (x, yε) ≤ v + ε.

x X

Эти стратегии обеспечивают игрокам получение своих наилучших гарантированных результатов с точностью до ε. Сформулируем аналог теоремы 2.1.

Теорема 2.1 0. 1) Для того чтобы при любом ε > 0 функция F (x, y) íà X ×Y имела ε-седловую точку, необходимо и достаточно, чтобы было

выполнено равенство (2.4).

2) Пусть равенство (2.4) выполнено. Тогда компоненты ε-седловой точки являются -максиминной и -минимаксной страте-

гиями. Обратно, ε-максиминная и ε-минимаксная стратегии образуют -седловую точку.

Упражнение 2.4. Докажите теорему 2.10.

Представляют интерес условия топологического характера, при которых существуют максиминные и минимаксные стратегии.

Теорема 2.2. Пусть функция F (x, y) непрерывна на X × Y, ãäå X, Y − компакты метрических пространств1. Положим

def

Y (x) = Argmin F (x, y). Тогда

y Y

1Недостаточно подготовленный читатель здесь и далее может заменить выражение "компакт метрического пространства"на выражение "замкнутое ограниченное множество евклидова пространства".

13

{xk}

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

1) Функция минимума W (x) = min F (x, y) непрерывна на X.

y Y

2) Предположим дополнительно, что при каждом x X множество Y (x) состоит из единственного элемента y(x). Тогда функция y(x) непрерывна на X.

Доказательство. 1) Возьмем произвольную последовательность

элементов из X, сходящуюся к x0. Покажем, что lim W (xk) существует

k→∞

и равен W (x0). Предположим противное. Тогда найдется такая подпо-

следовательность {kl}, ÷òî lim W (xkl ) = A 6= W (x0). Возьмем последо-

l→∞

вательность {ykl Y (xkl )}. В силу компактности множества Y можно

считать, что2 lim ykl = y0. Покажем, что y0 Y (x0). Действительно, по

l→∞

определению ykl

W (xkl ) = F (xkl , ykl ) ≤ F (xkl , y) y Y.

Переходя в этом неравенстве к пределу при l → ∞ и используя непрерывность функции F (x, y), получим

F (x0, y0) ≤ F (x0, y) y Y y0 Y (x0).

Наконец, A = lim F (xkl , ykl ) = F (x0, y0) = W (x0) (противоречие).

l→∞

2) Покажем, что функция y(x) непрерывна на X. Предположим, что она разрывна в некоторой точке x0 X. Тогда найдется такая последовательность {xk} элементов из X, сходящаяся к x0, что соответствующая последовательность {y(xk)} не сходится к y(x0). Поэтому существует окрестность U точки y(x0), вне которой находится бесконечное число членов последовательности {y(xk)}. В силу компактности множества Y \U из этой последовательности можно выделить подпоследовательность {y(xkl )} Y \U, сходящуюся к некоторому элементу y0 6= y(x0). Но, как и в части 1), нетрудно доказать, что y0 Y (x0). Получили противоречие с тем, что множество Y (x0) состоит из единственного элемента.

Замечание. В процессе доказательства теоремы мы также установили замкнутость множества {(x, y) | x X, y Y (x)}. Отметим также, что

в теореме 2.2 компактность множества Y существенна.

2Здесь использовано следующее свойство компакта метрического пространства: из любой последовательности элементов компакта Y можно выделить подпоследо-

вательность, сходящуюся к некоторому элементу из Y. Считаем, что {ykl } и есть соответствующая выделенная подпоследовательность.

14

2. Седловые точки и антагонистические игры

Пример 2.5. Пусть

X = [−1, 1], Y = (−∞, +∞), F (x, y) = (y2 + 1)(xy − 1)2.

Здесь множество Y не является компактом, а функции

 

(0,

x = 0,

y Y

(1,

x = 0,

y(x) =

1/x ,

x 6= 0,

W (x) = min F (x, y) =

0,

x 6= 0,

разрывны.

Определение. Антагонистическая игра называется непрерывной, åñëè X, Y − параллелепипеды евклидовых пространств, а функция F (x, y) непрерывна на X × Y . В частности, при

X = [a, b], Y = [c, d] будем говорить о непрерывной игре на прямоугольнике.

Из теоремы 2.2 следует, что в непрерывной игре существуют мак-

симинные и минимаксные стратегии игроков.

Теперь займемся достаточными условиями существования седловой точки функции двух переменных. Их можно сформулировать в терминах выпуклого анализа. Напомним некоторые определения.

Определение. Множество Z евклидова пространства называется выпуклым, если для любых точек z0 6= z00 èç Z и любого числа 0 < λ < 1 точка λz0 + (1 − λ)z00 также принадлежит множеству Z.

Определение. Функция h(z), определенная на выпуклом множестве Z, называется выпуклой, если для любых точек z0 6= z00 èç Z и любого числа 0 < λ < 1 выполнено неравенство

h(λz0 + (1 − λ)z00) ≤ λh(z0) + (1 − λ)h(z00).

(2.4)

Если последнее неравенство выполнено как строгое, то функция h(z) называется строго выпуклой. Если вместо неравенства в (2.4) фигурирует неравенство ≥ (>), то функция h(z) называется вогнутой (строго вогнутой).

m

Упражнение 2.5. Докажите, что функция P zi2 строго выпукла.

i=1

Упражнение 2.6. Докажите, что строго выпуклая непрерывная функция на выпуклом компакте1 евклидова пространства достигает минимума в единственной точке.

1Замкнутом ограниченном множестве.

15

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

Теорема 2.3. Пусть X Em è Y En выпуклые компакты евклидовых пространств, а функция F (x, y) непрерывна на X ×Y. Предположим, что при любом y Y функция F (x, y) вогнута по x и при любом x X она выпукла по y. Тогда функция F (x, y) имеет на X ×Y седловую

точку.

Доказательство. Вначале докажем существование седловой точки в случае, когда функция F (x, y) строго выпукла по y. Тогда для всякого

x X функция F (x, y) достигает минимума на Y в единственной точке

y(x). По теореме 2.2 функции W (x) = min F (x, y) è y(x) непрерывны

y Y

íà X. Возьмем точку x , максимизирующую функцию W (x) íà X, и докажем, что пара (x , y(x )) является седловой точкой функции F (x, y). Для любых x è 0 < t < 1 положим y˜ = y((1−t)x +tx). В силу вогнутости по x функции F (x, y) имеем

W (x ) ≥ W ((1 − t)x + tx) = F ((1 − t)x + tx, y˜) ≥

≥ (1 − t)F (x , y˜) + tF (x, y˜) ≥ (1 − t)W (x ) + tF (x, y˜).

Отсюда tF (x, y˜) ≤ tW (x ). Сократив на положительное t и устремив t → 0+, получим неравенства для седловой точки

F (x, y(x )) ≤ W (x ) = F (x , y(x )) ≤ F (x , y) x X, y Y.

Докажем теорему в общем случае. При ε > 0 функция

def

n

yj2

 

Fε(x, y) = F (x, y) + ε

 

непрерывна, вогнута по x и строго выпукла

ïî y. По доказанномуP

 

Fε(x, y) имеет седловую точку (x , y ) íà

 

j=1

 

 

функция

ε ε

 

X × Y :

 

Fε(x, yε) ≤ Fε(xε, yε) ≤ Fε(xε, y) x X, y Y.

 

Возьмем последовательность положительных чисел {εk}, сходящуюся к нулю. Из компактности множеств X и Y следует, что без потери общности xεk → x0, yεk → y0. Полагая в последних неравенствах ε = εk è переходя к пределу при k → ∞, получим неравенства (2.1) из определе-

ния седловой точки. Заметим, что первая часть доказательства теоремы конструктивна:

для поиска седловой точки функции F (x, y), строго выпуклой по y, достаточно найти максиминную стратегию x и наилучший ответ на нее

16

3. Смешанные расширения антагонистических игр
y(x ) второго игрока. Аналогично, пусть в условиях теоремы 2.3 функция F (x, y) строго вогнута по x, y − минимаксная стратегия, а x(y ) Arg max F (x, y ) − наилучший ответ на нее первого игрока. Тогда

x X

(x(y ), y ) − седловая точка функции F (x, y).

Из первой части доказательства вытекает, что для существования седловой точки вместо строгой выпуклости функции F (x, y) ïî ïåðå-

менной y достаточно потребовать при любом x X единственность наилучшего ответа y(x) второго игрока. Если последнее условие не выполнено, то пара (x , y ), ãäå y Y (x ), может не быть седловой точкой. Например, для функции F (x, y) = xy íà X × Y = [0, 1] × [0, 1] ïàðà (x , y ) = (0, 1) седловой точкой не является.

Пример 2.6. X = Y = [0, 1], F (x, y) = −x2 +y3 +xy2 −4y. Здесь функция F (x, y) выпукла по y и строго вогнута по x. Функция наилучшего ответа первого игрока − x(y) = y2/2 è

M(y) = max F (x, y) = F (x(y), y) = y4/4 + y3 − 4y.

0≤x≤1

Производная M0(y) = y3 + 3y2 − 4 обращается в нуль в точках 1,2. Отсюда y0 = 1 − минимаксная стратегия и x(y0) = 1/2. Следовательно, (1/2, 1) − седловая точка функции F (x, y).

3. Смешанные расширения антагонистических игр

В предыдущем параграфе приводился пример антагонистической игры, не имеющей решения ("орлянка"). Играть в подобные игры весьма непросто. Проигравшему игроку каждый раз хочется сменить свою стратегию, но он будет бояться это сделать (а вдруг партнер догадается?). Теория игр предлагает игрокам использовать смешанные стратегии.

Определение. Смешанной стратегией первого игрока в игре называется вероятностное распределение ϕ на множестве стратегий X.

Для первого игрока применить смешанную стратегию ϕ − это выбрать стратегию x X как реализацию случайной величины, имеющей закон распределения ϕ. Далее рассматриваются три вида смешанных

стратегий.

1) Пусть X = {1, ..., m}, как это имеет место в матричной игре. Тогда вместо ϕ для обозначения смешанной стратегии будем использовать "вероятностный"вектор p = (p1, ..., pm), удовлетворяющий ограничениям

17

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

m

P

pi = 1, pi ≥ 0, i = 1, ..., m. Если применяется p, то стратегия i âûáè-

i=1

рается с вероятностью pi. Например, в игре "орлянка"опытные игроки используют смешанную стратегию p0 = (1/2, 1/2), подбрасывая монету и выбирая "орел"или "решку"в зависимости результата бросания.

Вообще, одна из возможных реализаций смешанной стратегии это бросание монет. С помощью одного бросания одной монеты можно осуществить только вероятность 1/2. С помощью двух монет или двукрат-

ного бросания одной монеты можно уже реализовать вероятности 1/2, 1/4 è 3/4. Ясно, что бросанием нескольких монет или многократным бро-

санием одной монеты можно реализовать широкий спектр вероятностей. Другой возможный и более удобный способ реализации смешанной стра-

тегии использовать рулетку. Делим круг рулетки на сектора с площа-

дями, пропорциональными заданным вероятностям использования чи- стых стратегий. Затем вращаем стрелку и используем ту стратегию, в секторе которой она остановится.

2) Пусть X = [a, b], как это имеет место в непрерывной игре на прямоугольнике. Здесь смешанная стратегия функция распределения ϕ на отрезке [a, b].

Пример 3.1. Пусть X = [0, 1], c(x) − неубывающая дифференцируемая функция, определенная на отрезке [1/2, 1] и удовлетворяющая условиям c(1/2) = 1/2, c(1) = 1. Определим функцию распределения

0, −∞ < x < 0,

ϕ0(x) =

1/4, 0 ≤ x < 1/2,

c(x), 1/2 ≤ x ≤ 1,

1, 1 < x < +∞.

Интеграл Стилтьеса от непрерывной функции h(x) по функции распределения ϕ0(x) вычисляется по формуле

1

h(x)dϕ0

(x) = 4h(0) +

1

h(x)c0(x)dx.

Z

4h(1/2) + Z

 

 

 

1

1

 

0

 

 

 

 

 

1/2

 

3) Пусть X − выпуклый компакт евклидова пространства. Здесь примером смешанной стратегии может служить вероятностная мера, сосре-

18

3. Смешанные расширения антагонистических игр

доточенная в конечном числе точек:

mm

X

 

X

pi ≥ 0, x(i) X, i = 1, ..., m,

 

ϕ(x) =

piIx(i) (x),

pi = 1,

 

i=1

 

i=1

 

 

 

ãäå

Ix(i) (x) = (0, x = x(i).

 

 

 

 

 

 

 

1,

x = x(i),

 

 

 

 

 

6

P

 

При использовании меры ϕ стратегия x выбирается с

pi.

Отметим, что для любого борелевского множества B

ϕ(B) =

pi.

(i)

i:x(i) B

вероятностью

 

Интеграл от непрерывной функции h(x) по рассматриваемой мере имеет

âèä

 

pih(x(i)).

Z h(x)dϕ(x) =

m

 

X

 

Xi=1

Обозначим через {ϕ} − множество всех смешанных стратегий первого игрока на множестве X. Можно считать, что X {ϕ}. Действительно, в последнем случае стратегию x можно отождествить с вероятностной мерой Ix. Если множество X конечно, то выбор i эквивалентен выбору смешанной стратегии p = (0, ..., 0, 1, 0, ..., 0), где единица стоит на i-м месте, а при X = [a, b] стратегию x [a, b] можно отождествить с функцией распределения, имеющей скачок 1 в точке x.

Множество X будем называть множеством чистых стратегий первого

игрока (в противовес смешанным).

Займемся построением смешанного расширения антагонистической игры = X, Y, F (x, y) . Мы определили множество {ϕ} смешанных

стратегий первого

игрока. Аналогично, пусть

{ψ} −

множество смешан-

 

 

ных стратегий второго игрока, т.е. вероятностных распределений ψ на множестве Y его чистых стратегий. При заданных стратегиях ϕ и ψ

математическое ожидание выигрыша первого игрока определяется формулой Z Z

F (ϕ, ψ) = F (x, y)dϕ(x)dψ(y).

X Y

Здесь предполагается, что двойной интеграл существует. Определение. Антагонистическая игра

= {ϕ}, {ψ}, F (ϕ, ψ)

19

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

называется смешанным расширением игры .

Определение. Решение 0, ψ0, v = F (ϕ0, ψ0)) игры называется решением исходной игры в смешанных стратегиях. При этом ϕ0, ψ0 íà- зываются оптимальными смешанными стратегиями игроков, а v − зна- чением èãðû .

Далее будут построены смешанные расширения матричных и непрерывных игр и будет показано, что эти игры всегда имеют решение в смешанных стратегиях.

Напомним, что матричная игра задается матрицей A = (aij)m×n. Множество смешанных стратегий первого игрока

m

X

P = {p = (p1, ..., pm) | pi = 1, pi ≥ 0, i = 1, ..., m},

i=1

множество смешанных стратегий второго игрока

n

X

Q = {q = (q1, ..., qn) | qj = 1, qj ≥ 0, j = 1, ..., n},

j=1

а математическое ожидание выигрыша первого игрока

m

n

Xi

X

A(p, q) =

piaijqj.

=1 j=1

Таким образом, = P, Q, A(p, q) − смешанное расширение матричной игры .

Теорема 3.1 (Основная теорема матричных игр). Всякая матричная игра имеет решение в смешанных стратегиях.

Доказательство. Достаточно доказать ,что функция A(p, q) имеет седловую точку на P ЧQ. Множества P, Q − многогранники евклидовых пространств, а функция A(p, q) билинейна и поэтому непрерывна на P Ч Q, вогнута по p и выпукла по q. По теореме 2.3 функция A(p, q) имеет на P Ч Q седловую точку.

Упражнение 3.1. Покажите, что тройка

(p0, q0, v) = ((1/2, 1/2), (1/2, 1/2), 0)

решение в смешанных стратегиях игры "орлянка".

Отметим типичные случаи, когда применяются смешанные стратегии.

20