Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
27
Добавлен:
02.05.2014
Размер:
1.28 Mб
Скачать

6. Игры с вогнутой функцией выигрыша

Найдем величину

w = min max min[F (x, y1), F (x, y2)].

0≤y1≤y2≤1 0≤x≤1

При фиксированных y1, y2

0≤x≤1

 

 

 

 

y1

2

!

2

 

 

 

 

 

max min[1

 

(x

 

y1)2, 1

 

(x

 

y2)2] = 1

 

− y2

.

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда

0≤y1≤y2

≤1

 

 

2

!

2

 

 

 

 

 

 

 

 

4

 

 

 

 

 

w = min

 

1

 

y1

− y2

 

=

3

,

 

1 = 0,

 

2 = 1.

 

 

 

 

 

 

y

y

Найдем теперь q10, q20, решая задачу

 

0

min

max Φ(x, q) =

 

min

 

max [(1

x2)q

1

+ (1

(x

1)2)q

].

 

 

 

q1

1 0

x

1

 

 

 

 

 

0

q1

1 0

 

x

1

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Имеем Φ0 (x, q) =

2xq

1

2(x

1)q

 

= 0. Отсюда стратегия

 

 

= q

 

2

x

2

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

максимизирует функцию Φ(x, q) по переменной x. Следовательно,

 

 

max Φ(x, q) = 1

q

 

(1

q

)

 

 

q0

= q0 =

1

 

ψ0 =

 

1

I

 

+

1

I .

 

 

 

2

 

0

 

 

0

x

1

 

 

 

 

 

 

1

 

 

1

 

 

 

1

 

 

2

 

 

2

 

2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отметим, что полученное решение игры можно было предугадать и проверить лишь условие ( ).

Упражнение 6.2. Решите игру с вогнутой функцией выигрыша

X = {(x1, x2) | 0 ≤ xi ≤ 1, i = 1, 2}, Y = X,

F (x1, x2, y1, y2) = 1 − (x1 − y1)2 − (x2 − y2)2.

Широкий класс игр с выпуклыми функциями выигрыша образуют статистические игры. Дадим необходимые определения.

Статистик наблюдает реализации zi независимых, одинаково распре- деленных случайных величин Zi, i = 1, ..., n, имеющих плотность распределения g(zi|x), зависящую от вектора неизвестных параметров x X. Здесь X − выпуклое множество евклидова пространства. Пусть Z =

61

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

(Z1, ..., Zn) − векторная случайная величина, принимающая

значения

 

n

 

 

 

 

iQ

z = (z1, ..., zn) Z и имеющая плотность распределения

g

(z|x) =

=1 g(zi|x).

Статистик оценивает вектор x, используя решающую функцию y : Z → A = X. Величина a = y(z) называется оценкой вектора x из множества оценок A. Ошибка в определении вектора x задается с помощью функции потерь L(x, a). Математическое ожидание этой функции

F (x, y) = E[L(x, y(Z))] = Z

L(x, y(z))g(z|x)dz

def

 

 

 

Z

называется функцией риска.

Статистик (второй игрок) использует решающее правило (стратегию) y из некоторого множества Y и стремится минимизировать функцию риска. Природа (первый игрок) стремится ее максимизировать, выбирая

x X.

Построенная антагонистическая игра

 

называется статистической.

= X, Y, F (x, y)

 

Пусть оцениваемый вектор является случайной величиной X, принимающей значения x X и имеющей плотность распределения f. С

игровой точки зрения это означает, что природа использует смешанные стратегии f {f}.

Обычно используется следующий метод решения статистической игры. Сначала строится уравнивающая риск решающая функция стати-

стика y0

: F (x, y0) ≡ const íà X. 0Затем подбирается стратегия при-

ðîäû

плотность распределения f , относительно которой решающая

 

0 является байесовской, т.е. минимизирующей функцию риска:

функция y

F (f0, y0) = min F (f0, y). Тогда в соответствии с результатом упражнения

y Y

4.3 f0, y0 − оптимальные стратегии природы и статистика. Плотность распределения f0 называется априорной.

Покажем, что для плотности распределения f0 при квадратичной функции потерь L(x, a) = |x − a|2 байесовская решающая функция y0

определяется одноçначно. Определим апостериорную плотность распределения f0(x|z) = g(z|x)f0(x)/p(z), ãäå

Z

p(z) = g(z|x)f0(x)dx.

X

Утверждение 6.1. Пусть y0 − байесовская решающая функция относительно плотности распределения f0. Тогда при квадратичной функции

62

L(x, a) = (x − a)2.

6. Игры с вогнутой функцией выигрыша

потерь

XZ

xf0(x|z)dx z Z.

(6.1)

y0(z) = E[X|z] =

def

 

 

 

Доказательство. Поскольку множество X выпукло, можно показать, что y0(z) A = X z Z. Для произвольной решающей функции y Y

Z Z

F (f0, y) = L(x, y(z))g(z|x)dzf0(x)dx =

X Z

ZZ

=[ |x − y(z)|2f0(x|z)dx]p(z)dz.

ZX

При фиксированном z Z внутренний интеграл является квадратичной функцией от a = y(z). Поэтому его минимум достигается при a0 = y0(z) èç (6.1).

В дальнейшем будем считать, что функция распределения g каждой

случайной величины Zi зависит только от одного неизвестного параметра математического ожидания x. Дисперсию случайной величины Zi обозначим через D(x). Для математического ожидания часто использу-

÷òî

 

 

n

n

 

 

iP

åòñÿ несмещенная оценка

z

=

 

zi/n. Свойство несмещенности означает,

 

 

 

=1

 

P

EZi

 

 

 

i=1

 

EZ =

= x.

n

 

 

 

 

Поэтому естественно рассмотреть множество решающих правил вида

Y = {y | y(z) = c1z + c2, c1, c2 ≥ 0}.

Функцию потерь будем предполагать квадратичной: Положим c = (c1, c2). Тогда функция риска

 

 

def

 

 

 

 

 

2

 

 

 

 

F (x, c) = F (x, y) = E(x − c1Z − c2)2

= c12EZ + 2c1

(c2 − x)EZ + (x − c2)2 =

= c12

 

n

+ x2! + 2c1(c2 − x)x + (x − c2)2 = c12

n + (c1x − x + c2)2

 

 

 

D(x)

 

 

 

 

 

 

 

D(x)

выпукла по c.

63

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

Рассмотрим конкретные примеры статистических игр.

Пример 6.2. Пусть случайные величины Zi имеют биномиальное ðàñ- пределение:

 

 

 

 

 

 

g(zi|x) = (1 − x, zi

= 0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x,

 

 

zi

= 1,

 

 

 

 

 

 

 

 

n

D(x) = x(1 − x), x X = [0, 1].

 

 

 

 

 

 

iP

 

 

 

g(z|x) = xk(1 − x)n−k,

 

 

 

 

 

 

 

Положим k =

zi

= nz.

Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x, c) = c1

n

 

+ x

 

! − 2c1x

 

+ 2c1c2x + x

 

− 2c2x + c2 =

 

 

 

2

 

x(1−x)

 

 

 

 

 

2

!

2

 

 

 

 

 

 

2

 

2!

2

 

 

 

n

1

 

 

 

1

 

 

 

n

1

 

2

 

 

2

=

n − 1

c2

2c

 

 

+ 1 x2 +

c12

+ 2c

c

 

 

2c

 

x + c2.

 

 

 

 

 

 

 

Найдем выравнивающую решающую функцию y0(z) = c01z+c02. Для этого решим систему уравнений

2

 

n −n 1c12 − 2c1 + 1 = 0, cn1 + 2c1c2 − 2c2 = 0

(6.2)

и получим

Второе решение

c01 =

c1 =

 

 

 

 

 

 

 

 

1

 

 

n

, c20 =

 

 

 

 

+ 1

2(

 

 

+ 1)

.

n

n

 

 

 

 

 

 

1

 

n

 

, c2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n − 1

 

2( n − 1)

отбросим.

Рассмотрим на отрезке X = [0, 1] бета-распределение с плотностью

f0(x) = xp−1(1 − x)q−1 , B(p, q)

1

ãäå B(p, q) = R xp1−1(1 − x1)q−1dx1 − бета-функция, а параметры p è q

0

положительны. Интегрируя по частям, нетрудно вывести, что

1

Z

EX = xf0(x)dx = p +p q .

0

64

6. Игры с вогнутой функцией выигрыша

Покажем, что при подходящем выборе параметров p è q решающая

функция y0 является байесовской относительно бета-распределения

 

f0.

Найдем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p(z) = Z0

 

 

 

(z|x)f0(x)dx =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

x)n−kxp−1(1

 

 

 

x)q−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xk(1

 

 

 

 

B(k + p, n + q

 

 

k)

 

 

 

= Z0

 

 

 

 

 

B(p, q)

 

 

 

 

 

 

 

 

dx =

 

 

 

 

 

 

B(p, q)

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда условная плотность

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f0(x z) =

 

 

(z|x)f0(x)

=

xk+p−1(1 − x)n−k+q−1

 

 

 

 

 

 

 

 

 

 

g

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

|

 

 

 

 

 

 

 

p(z)

 

 

 

 

 

 

 

 

 

B(k + p, n + q

k)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

задает бета-распределение с параметрами p

 

= k + p è q = n + q

k.

Байесовская решающая функция

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E[X|z] = XZ xf0(x|z)dx =

 

 

 

p

 

 

 

 

 

 

 

 

 

k + p

 

 

 

 

 

 

+ p

 

 

 

 

 

 

 

 

 

 

 

=

 

 

=

 

nz

 

 

 

p + q

n + p + q

 

n + p + q

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

совпадает с выравнивающей функцией y0 ïðè p = q =

n

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

Итак, доказано, что для оценки параметра биномиального распреде-

ления

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ 0.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y0(z) =

nz

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

+ 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

минимаксная решающая функция.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0 è

Интересно сравнить значения функции риска при минимаксной y

 

 

классической

 

решающих функциях. Имеем

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F (x, y0)

 

 

 

=

 

 

 

 

 

1

 

 

 

 

 

 

, F (x,

 

 

) =

x(1 − x)

.

 

 

 

 

 

 

 

v

 

 

 

 

 

 

 

 

 

 

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4(1 + n)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

Неравенство F (x, y0) < F (x,

 

 

) выполнено лишь при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

z

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x − 2

< ε

=

 

2(1 + n) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

def 1 + 2

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если n велико, то минимаксная оценка лучше классической лишь при значениях x, принадлежащих малой ε-окрестности точки 1/2. Однако,

65

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

при малых n интервал значений x, где минимаксная оценка лучше, зна- чительно увеличивается.

Во многих задачах не существует выравнивающей решающей функции и указанный выше метод решения статистической игры использовать нельзя. В таких случаях минимаксную стратегию статистика y0 можно

найти, решая непосредственно задачу

v = min max F (x, y) = max F (x, y0).

y Y x X

x X

Пример 6.3. Страховая компания осуществляет страхование гражданской ответственности автомобилистов. Водители обычно разбиваются на группы по нескольким признакам (профессия, стаж вождения и т.п.).

Рассмотрим некоторую группу, состоящую из n водителей. Требуется оценить среднее число x дорожных происшествий в расчете на одного

водителя, которые произойдут в течение ближайшего года, исходя из информации о происшествиях прошедшего года. Задачу можно свести к решению статистической игры.

Пусть число дорожных происшествий с водителем i является случайной величиной Zi, распределенной по закону Пуассона

 

 

 

 

 

 

xzi e−x

 

 

g(zi|x) =

 

, zi Z = {0, 1, 2, ..., }.

zi!

Здесь EZi = x, V arZi

= D(x) = x, x X = [0, x ], ãäå x − верхняя

грань возможных значений параметра x. Имеем

 

 

 

D(x)

 

 

 

x

F (x, c) = c12

 

 

+ (c1x − x + c2)2 = c12

 

+ (c1x − x + c2)2.

n

n

Нетрудно проверить, что не существует выравнивающей решающей функции.

Обозначим M(c) = sup

F (x, c) и найдем

0≤x≤x

 

 

=

min M(c) = M(c0).

 

v

 

 

 

c1,c2≥0

Поскольку F (x, c) выпукла по x, M(c) = max[F (0, c), F (x , c)].

Утверждение 6.2. Для минимаксной стратегии y0(z) = c01z + c02 âû- полнено условие F (0, c0) = F (x , c0) èëè

1

(c0)2

+ (c0

1)2x

c20 =

n

1

1

 

.

 

2(1 − c10)

 

 

 

 

 

66

6. Игры с вогнутой функцией выигрыша

Доказательство. Допустим, что F (x , c0) > F (0, c0). Åñëè c01 > 0, то при малом ε > 0

(c0)2x

+ (c10x + c20 − x )2 > F (x , c10 − ε, c20 + εx ) =

F (x , c0) = 1n

= (c01 − ε)2x + (c0x + c0 − x )2 > F (0, c0 − ε, c0 + εx ) = (c0 + εx )2

n 1 2 1 2 2

è M(c01 − ε, c02 + εx ) < M(c0) (противоречие). Если c01 = 0, òî

F (x , c0) = (c02 − x )2 > F (0, c0) = (c02)2.

Отсюда следует, что c02 < x /2. Увеличивая c02 на малое ε > 0, придем к противоречию. Случай F (x , c0) < F (0, c0) разбирается аналогично.

Из доказанного утверждения вытекает, что

c1,c2≥0

(

) =

0≤c1<1

n1

2(1 − c1)

!

2

 

min

M c

 

min

(c1)2 + (c1 − 1)2x

.

 

 

 

Последний минимум достигается при

 

 

 

 

c0

=

x n + 1 − x n + 1

 

1

 

x n + 1

 

 

 

 

 

 

 

 

 

c0

=

 

x n + 1 − 1

.

2

 

 

n

Таким образом, при оценке параметра распределения Пуассона

y0(z) =

x n + 1 − x n + 1

 

 

+

x n + 1 − 1

 

z

 

x n + 1

n

минимаксная стратегия статистика. В частном случае при n = 30, x = 0.5, z = 0.2 получаем оценку y0(z) = 0.16.

Упражнение 6.3. Пусть все случайные величины Zi имеют нормаль- íîå распределение с плотностью

1

 

e

(zi−x)2

g(zi|x) =

 

 

2

, zi E1,

2πσ

где дисперсия σ2 статистику известна, а математическое ожидание x − íåò: x X = E1.

Показать, что классическая решающая функция z является выравнивающей и минимаксной стратегией статистика.

67

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

7. Исследование игровых моделей

Модель "нападение-оборона".

Имеется n обороняемых пунктов с номерами i = 1, ..., n возможного прорыва средств нападения. Пусть A è B − количества средств напа-

дения и обороны. Эти средства предполагаются бесконечно-делимыми. Стратегия первого игрока (нападения) состоит в распределении своих средств по пунктам в соответствии с вектором

n

X

x = (x1, ..., xn) X = {x | xi = A, xi ≥ 0, i = 1, ..., n}.

i=1

Второй игрок (оборона) использует аналогичную стратегию

n

X

y = (y1, ..., yn) Y = {y | yi = B, yi ≥ 0, i = 1, ..., n}.

i=1

Пусть µi количество средств нападения, которое может уничтожить одна единица средств обороны на i-ом пункте. Если xi > µiyi, то через

i-й пункт прорывается xi −µiyi средств нападения. Если xi ≤ µiyi, то че- рез этот пункт нападение не прорвется. Объединяя оба случая, находим формулу для количества средств нападения, прорвавшегося через i

пункт: max[xi − µiyi, 0]. Определим функцию выигрыша первого игрока

n

X

F (x, y) = max[xi − µiyi, 0]

i=1

общее количество средств нападения, прорвавшееся через все пункты. Заметим, что функция F (x, y) выпукла по y. По теореме 6.4 значение игры v = v и минимаксная стратегия y0 обороны оптимальна. Займемся исследованием этой игры в чистых и смешанных стратегиях. Без потери общности предположим, что коэффициенты эффективности обороны µi

упорядочены: µ1 ≥ µ2 ≥ ... ≥ µn è n-й пункт обороны является слабей-

øèì.

а) Покажем, что

v = max min F (x, y) = max[A

µ

B, 0], x(n) = (0, ..., 0, A)

x

X y

Y

n

 

 

 

 

 

 

 

максиминная стратегия нападения, состоящая в нанесении "концентрированного"удара по слабейшему пункту.

68

Таким образом, для любой стратегии
В противном случае

7. Исследование игровых моделей

Для любой стратегии нападения x определим вспомогательную стратегию обороны y :

yi

n

µk

, i = 1, ..., n.

= Bxi µi k=1

 

X

xk

1

Тогда

Åñëè B ≥

n

 

min F (x, y)

F (x,

 

) =

max[x

i

µ

 

 

, 0].

 

y

y

 

y

Y

 

 

 

 

=1

 

 

i i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi

 

 

 

 

 

 

 

 

xk

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, òî yi

≥ xii, i = 1, ..., n

F (x, y) = 0.

=1

µk

kP

 

 

 

 

 

 

 

 

 

i

≤ xii, i = 1, ..., n, è

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

F (x,

 

) =

 

(xi − µi

 

i) ≤ A − µn

 

i = A − µnB.

y

 

y

y

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

Xi

 

 

 

 

 

 

 

x

min F (x, y)

≤ max[

A

µ

B,

min max[A

µ y

, 0] = min F (x(n), y)

y

Y

 

n

 

0] = y

Y

n n

y

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

è x(n) − максиминная стратегия нападения. б) Покажем, что

 

 

 

n

1

 

−1

 

= y Y x X

k=1

 

 

µk

 

 

 

 

X

 

 

v

min max F (x, y) = max[A

 

B

 

 

, 0],

à

n

 

 

 

µk

, i = 1, ..., n,

 

y0 : yi0 = B µi k=1

 

X

1

 

1

минимаксная стратегия обороны. Сначала докажем равенство

max F (x, y) = max F (x(i), y)

y

 

Y,

(7.1)

 

X

1

≤ ≤

 

 

 

 

x

i n

 

 

ãäå x(i) = (0, ..., A , 0, ..., 0) − стратегия нападения, состоящая в нанесе-

|{z}

i

нии концентрированного удара по i-му пункту.

69

ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ

n

Представим стратегию x â âèäå x = P xAi x(i). По определению выпук-

лой функции

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F x, y

n

xi

F x(i), y

 

max F (x(i), y).

Xi

 

) ≤

 

(

A

(

1

i n

 

 

) ≤

 

 

 

 

 

=1

 

 

 

 

 

 

 

≤ ≤

 

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

max F (x, y)

max F (x(i), y)

max F (x, y)

 

X

 

1

n

 

 

 

X

x

 

 

 

i

 

 

 

x

è(7.1) доказано. Далее имеем

v = min max F (x, y) = min max F (x(i), y) =

y Y x X y Y 1≤i≤n

min max max[A

µ y

, 0] = min max[A

min µ y

, 0] =

= y

Y 1

i

n

i i

y

Y

1

i

n

i i

 

 

 

 

 

 

 

 

 

 

 

 

 

= max[

A

B max min µ y

/B, 0] = [замена переменных

 

y

Y 1

i n

i i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

≤ ≤

 

 

n

 

 

 

 

 

 

 

 

 

= max[

 

 

 

 

 

P

i

i

 

 

 

p = y/B P = {p = (p1, ..., pn) | i=1 pi = 1,

 

pi ≥ 0, i = 1, ..., n}] =

 

 

 

 

 

A

B max min µ p , 0] =

 

 

 

 

 

 

 

 

 

 

P 1

≤ ≤

n

 

 

 

 

 

 

 

 

 

 

 

p

 

i

 

n

−1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, 0].

=[ см. пример 4.4] = max[A − B k=1 µ1k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

 

Ïðè ýòîì

n

µk

, i = 1, ..., n.

yi0 = Bpi0 = B µi k=1

X

1

 

1

Когда в игре Если B ≥ A

существует решение в чистых стратегиях?

n

P 1 , òî v = 0 ≥ v ≥ 0 и, следовательно, v = v = 0.

k=1

µk

Для нападения любая стратегия оптимальна. В этом случае оборона так может распределить свои силы, чтобы не позволить нападению, исполь-

зующему концентрированный удар, прорваться на каком-либо пункте.

n

Åñëè B < A

kP

1

, то функция F (x, y) седловой точки не имеет. Дей-

µk

ствительно,

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

n

µk

 

> A − B µn

= A − µnB.

v = A − B k=1

1

 

 

 

X

1

 

1

 

1

70