Васии А.А., Морозов B.B. Введение в теорию игр / Vasin_-_Vvedenie_v_teoriu_igr
.PDF6. Игры с вогнутой функцией выигрыша
Найдем величину
w = min max min[F (x, y1), F (x, y2)].
0≤y1≤y2≤1 0≤x≤1
При фиксированных y1, y2
0≤x≤1 |
− |
|
− |
|
− |
|
− |
|
− |
y1 |
2 |
! |
2 |
|
|
|
|
|
|||||||||
max min[1 |
|
(x |
|
y1)2, 1 |
|
(x |
|
y2)2] = 1 |
|
− y2 |
. |
||
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
Отсюда
0≤y1≤y2 |
≤1 |
|
− |
|
2 |
! |
2 |
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
||||||
w = min |
|
1 |
|
y1 |
− y2 |
|
= |
3 |
, |
|
1 = 0, |
|
2 = 1. |
|
|
|
|
|
|
y |
y |
Найдем теперь q10, q20, решая задачу
|
0 |
min |
max Φ(x, q) = |
|
min |
|
max [(1 |
− |
x2)q |
1 |
+ (1 |
− |
(x |
− |
1)2)q |
]. |
|
|
|||||||||||||||||||||||||||||
|
≤ |
q1 |
≤ |
1 0 |
x |
≤ |
1 |
|
|
|
|
|
0 |
≤ |
q1 |
≤ |
1 0 |
|
x |
≤ |
1 |
|
|
|
|
|
|
|
2 |
|
|
|
|
||||||||||||||
|
|
|
|
|
≤ |
|
|
|
|
|
|
|
|
|
|
|
|
≤ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
Имеем Φ0 (x, q) = |
− |
2xq |
1 − |
2(x |
− |
1)q |
|
= 0. Отсюда стратегия |
|
|
= q |
|
|||||||||||||||||||||||||||||||||||
2 |
x |
2 |
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
максимизирует функцию Φ(x, q) по переменной x. Следовательно, |
|
|
|||||||||||||||||||||||||||||||||||||||||||||
max Φ(x, q) = 1 |
− |
q |
|
(1 |
− |
q |
) |
|
|
q0 |
= q0 = |
1 |
|
ψ0 = |
|
1 |
I |
|
+ |
1 |
I . |
|
|||||||||||||||||||||||||
|
|
2 |
|
0 |
|
|
|||||||||||||||||||||||||||||||||||||||||
0 |
x |
≤ |
1 |
|
|
|
|
|
|
1 |
|
|
1 |
|
|
|
1 |
|
|
2 |
|
|
2 |
|
2 |
1 |
|
||||||||||||||||||||
|
≤ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Отметим, что полученное решение игры можно было предугадать и проверить лишь условие ( ).
Упражнение 6.2. Решите игру с вогнутой функцией выигрыша
X = {(x1, x2) | 0 ≤ xi ≤ 1, i = 1, 2}, Y = X,
F (x1, x2, y1, y2) = 1 − (x1 − y1)2 − (x2 − y2)2.
Широкий класс игр с выпуклыми функциями выигрыша образуют статистические игры. Дадим необходимые определения.
Статистик наблюдает реализации zi независимых, одинаково распре- деленных случайных величин Zi, i = 1, ..., n, имеющих плотность распределения g(zi|x), зависящую от вектора неизвестных параметров x X. Здесь X − выпуклое множество евклидова пространства. Пусть Z =
61
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
(Z1, ..., Zn) − векторная случайная величина, принимающая |
значения |
|||
|
n |
|||
|
|
|
|
iQ |
z = (z1, ..., zn) Z и имеющая плотность распределения |
g |
(z|x) = |
=1 g(zi|x). |
Статистик оценивает вектор x, используя решающую функцию y : Z → A = X. Величина a = y(z) называется оценкой вектора x из множества оценок A. Ошибка в определении вектора x задается с помощью функции потерь L(x, a). Математическое ожидание этой функции
F (x, y) = E[L(x, y(Z))] = Z |
L(x, y(z))g(z|x)dz |
||
def |
|
|
|
Z
называется функцией риска.
Статистик (второй игрок) использует решающее правило (стратегию) y из некоторого множества Y и стремится минимизировать функцию риска. Природа (первый игрок) стремится ее максимизировать, выбирая
x X. |
Построенная антагонистическая игра |
|
|
называется статистической. |
|
= X, Y, F (x, y) |
|
Пусть оцениваемый вектор является случайной величиной X, принимающей значения x X и имеющей плотность распределения f. С
игровой точки зрения это означает, что природа использует смешанные стратегии f {f}.
Обычно используется следующий метод решения статистической игры. Сначала строится уравнивающая риск решающая функция стати-
стика y0 |
: F (x, y0) ≡ const íà X. 0Затем подбирается стратегия при- |
|
ðîäû |
− |
плотность распределения f , относительно которой решающая |
|
0 является байесовской, т.е. минимизирующей функцию риска: |
функция y
F (f0, y0) = min F (f0, y). Тогда в соответствии с результатом упражнения
y Y
4.3 f0, y0 − оптимальные стратегии природы и статистика. Плотность распределения f0 называется априорной.
Покажем, что для плотности распределения f0 при квадратичной функции потерь L(x, a) = |x − a|2 байесовская решающая функция y0
определяется одноçначно. Определим апостериорную плотность распределения f0(x|z) = g(z|x)f0(x)/p(z), ãäå
Z
p(z) = g(z|x)f0(x)dx.
X
Утверждение 6.1. Пусть y0 − байесовская решающая функция относительно плотности распределения f0. Тогда при квадратичной функции
62
6. Игры с вогнутой функцией выигрыша
потерь |
XZ |
xf0(x|z)dx z Z. |
(6.1) |
y0(z) = E[X|z] = |
|||
def |
|
|
|
Доказательство. Поскольку множество X выпукло, можно показать, что y0(z) A = X z Z. Для произвольной решающей функции y Y
Z Z
F (f0, y) = L(x, y(z))g(z|x)dzf0(x)dx =
X Z
ZZ
=[ |x − y(z)|2f0(x|z)dx]p(z)dz.
ZX
При фиксированном z Z внутренний интеграл является квадратичной функцией от a = y(z). Поэтому его минимум достигается при a0 = y0(z) èç (6.1).
В дальнейшем будем считать, что функция распределения g каждой
случайной величины Zi зависит только от одного неизвестного параметра − математического ожидания x. Дисперсию случайной величины Zi обозначим через D(x). Для математического ожидания часто использу-
÷òî |
|
|
n |
n |
|
|
iP |
||
åòñÿ несмещенная оценка |
z |
= |
|
zi/n. Свойство несмещенности означает, |
|
|
|
=1 |
|
P
EZi
|
|
|
i=1 |
|
|
EZ = |
= x. |
||||
n |
|||||
|
|
|
|
Поэтому естественно рассмотреть множество решающих правил вида
Y = {y | y(z) = c1z + c2, c1, c2 ≥ 0}.
Функцию потерь будем предполагать квадратичной: Положим c = (c1, c2). Тогда функция риска
|
|
def |
|
|
|
|
|
2 |
|
|
|
|
|
F (x, c) = F (x, y) = E(x − c1Z − c2)2 |
= c12EZ + 2c1 |
(c2 − x)EZ + (x − c2)2 = |
|||||||||||
= c12 |
|
n |
+ x2! + 2c1(c2 − x)x + (x − c2)2 = c12 |
n + (c1x − x + c2)2 |
|||||||||
|
|
|
D(x) |
|
|
|
|
|
|
|
D(x) |
выпукла по c.
63
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
Рассмотрим конкретные примеры статистических игр.
Пример 6.2. Пусть случайные величины Zi имеют биномиальное ðàñ- пределение:
|
|
|
|
|
|
g(zi|x) = (1 − x, zi |
= 0; |
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x, |
|
|
zi |
= 1, |
|
|
|
|
|
||
|
|
|
n |
D(x) = x(1 − x), x X = [0, 1]. |
|
|
|
||||||||||||||||||
|
|
|
iP |
|
|
|
g(z|x) = xk(1 − x)n−k, |
|
|
|
|
|
|
|
|||||||||||
Положим k = |
zi |
= nz. |
Тогда |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F (x, c) = c1 |
n |
|
+ x |
|
! − 2c1x |
|
+ 2c1c2x + x |
|
− 2c2x + c2 = |
|||||||||||||||
|
|
|
2 |
|
x(1−x) |
|
|
|
|
|
2 |
! |
2 |
|
|
|
|
|
|
2 |
|
2! |
2 |
||
|
|
|
n |
1 − |
|
|
|
1 |
|
|
|
n |
1 |
|
2 |
− |
|
|
2 |
||||||
= |
n − 1 |
c2 |
2c |
|
|
+ 1 x2 + |
c12 |
+ 2c |
c |
|
|
2c |
|
x + c2. |
|||||||||||
|
|
|
|
|
|
|
Найдем выравнивающую решающую функцию y0(z) = c01z+c02. Для этого решим систему уравнений
2 |
|
n −n 1c12 − 2c1 + 1 = 0, cn1 + 2c1c2 − 2c2 = 0 |
(6.2) |
и получим
Второе решение
c01 =
c1 =
|
|
√ |
|
|
|
|
|
|
1 |
|
|
||||||||
n |
, c20 = |
|
|
||||||||||||||||
√ |
|
|
+ 1 |
2(√ |
|
|
+ 1) |
. |
|||||||||||
n |
n |
||||||||||||||||||
|
√ |
√ |
|
|
|
|
|
√ |
1 |
|
|||||||||
n |
|
, c2 = |
|
|
|||||||||||||||
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
n − 1 |
|
2( n − 1) |
отбросим.
Рассмотрим на отрезке X = [0, 1] бета-распределение с плотностью
f0(x) = xp−1(1 − x)q−1 , B(p, q)
1
ãäå B(p, q) = R xp1−1(1 − x1)q−1dx1 − бета-функция, а параметры p è q
0
положительны. Интегрируя по частям, нетрудно вывести, что
1
Z
EX = xf0(x)dx = p +p q .
0
64
6. Игры с вогнутой функцией выигрыша
Покажем, что при подходящем выборе параметров p è q решающая
функция y0 является байесовской относительно бета-распределения |
|
f0. |
||||||||||||||||||||||||||||||||||||||||||||||||||||
Найдем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
p(z) = Z0 |
|
|
|
(z|x)f0(x)dx = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
g |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||
1 |
|
|
|
|
x)n−kxp−1(1 |
|
|
|
x)q−1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
xk(1 |
|
|
|
|
B(k + p, n + q |
|
|
k) |
|
|
|
|||||||||||||||||||||||||||||||||||||||||||
= Z0 |
|
|
|
− |
|
|
B(p, q) |
|
− |
|
|
|
|
|
|
|
dx = |
|
|
|
|
|
|
B(p, q) |
− |
|
. |
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||
Отсюда условная плотность |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
f0(x z) = |
|
|
(z|x)f0(x) |
= |
xk+p−1(1 − x)n−k+q−1 |
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
g |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
| |
|
|
|
|
|
|
|
p(z) |
|
|
|
|
|
|
|
|
|
B(k + p, n + q |
− |
k) |
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
задает бета-распределение с параметрами p |
|
= k + p è q = n + q |
− |
k. |
||||||||||||||||||||||||||||||||||||||||||||||||||
Байесовская решающая функция |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
E[X|z] = XZ xf0(x|z)dx = |
|
|
|
p |
|
|
|
|
|
|
|
|
|
k + p |
|
|
|
|
|
|
+ p |
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
= |
|
|
= |
|
nz |
|
|
|
||||||||||||||||||||||||||||||||||||||
p + q |
n + p + q |
|
n + p + q |
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
√ |
|
. |
|
|
|
|
|
|
|
|
|||||||||||||||||||||
совпадает с выравнивающей функцией y0 ïðè p = q = |
n |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
2 |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||
Итак, доказано, что для оценки параметра биномиального распреде- |
||||||||||||||||||||||||||||||||||||||||||||||||||||||
ления |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
√ |
|
|
|
+ 0.5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
y0(z) = |
nz |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
√ |
|
|
+ 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
− минимаксная решающая функция. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 è |
|||||||||||||||||||||||||
Интересно сравнить значения функции риска при минимаксной y |
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
классической |
|
решающих функциях. Имеем |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
z |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||
F (x, y0) |
|
|
|
= |
|
|
|
|
|
1 |
|
|
|
|
|
|
, F (x, |
|
|
) = |
x(1 − x) |
. |
|
|
|
|
|
|
||||||||||||||||||||||||||
|
v |
|
|
|
|
|
|
|
|
|
|
|
z |
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
≡ |
|
|
|
|
|
4(1 + √n)2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
||||||||||||||||||
Неравенство F (x, y0) < F (x, |
|
|
) выполнено лишь при |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||
z |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
x − 2 |
< ε |
= |
|
2(1 + √n) . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
p |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
def 1 + 2√ |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если n велико, то минимаксная оценка лучше классической лишь при значениях x, принадлежащих малой ε-окрестности точки 1/2. Однако,
65
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
при малых n интервал значений x, где минимаксная оценка лучше, зна- чительно увеличивается.
Во многих задачах не существует выравнивающей решающей функции и указанный выше метод решения статистической игры использовать нельзя. В таких случаях минимаксную стратегию статистика y0 можно
найти, решая непосредственно задачу
v = min max F (x, y) = max F (x, y0).
y Y x X |
x X |
Пример 6.3. Страховая компания осуществляет страхование гражданской ответственности автомобилистов. Водители обычно разбиваются на группы по нескольким признакам (профессия, стаж вождения и т.п.).
Рассмотрим некоторую группу, состоящую из n водителей. Требуется оценить среднее число x дорожных происшествий в расчете на одного
водителя, которые произойдут в течение ближайшего года, исходя из информации о происшествиях прошедшего года. Задачу можно свести к решению статистической игры.
Пусть число дорожных происшествий с водителем i является случайной величиной Zi, распределенной по закону Пуассона
|
|
|
|
|
|
xzi e−x |
|||
|
|
g(zi|x) = |
|
, zi Z = {0, 1, 2, ..., }. |
|||||
zi! |
|||||||||
Здесь EZi = x, V arZi |
= D(x) = x, x X = [0, x ], ãäå x − верхняя |
||||||||
грань возможных значений параметра x. Имеем |
|||||||||
|
|
|
D(x) |
|
|
|
x |
||
F (x, c) = c12 |
|
|
+ (c1x − x + c2)2 = c12 |
|
+ (c1x − x + c2)2. |
||||
n |
n |
Нетрудно проверить, что не существует выравнивающей решающей функции.
Обозначим M(c) = sup |
F (x, c) и найдем |
||
0≤x≤x |
|||
|
|
= |
min M(c) = M(c0). |
|
v |
||
|
|
|
c1,c2≥0 |
Поскольку F (x, c) выпукла по x, M(c) = max[F (0, c), F (x , c)].
Утверждение 6.2. Для минимаксной стратегии y0(z) = c01z + c02 âû- полнено условие F (0, c0) = F (x , c0) èëè
1 |
(c0)2 |
+ (c0 |
− |
1)2x |
||
c20 = |
n |
1 |
1 |
|
. |
|
|
2(1 − c10) |
|
||||
|
|
|
|
66
6. Игры с вогнутой функцией выигрыша
Доказательство. Допустим, что F (x , c0) > F (0, c0). Åñëè c01 > 0, то при малом ε > 0
(c0)2x |
+ (c10x + c20 − x )2 > F (x , c10 − ε, c20 + εx ) = |
F (x , c0) = 1n |
= (c01 − ε)2x + (c0x + c0 − x )2 > F (0, c0 − ε, c0 + εx ) = (c0 + εx )2
n 1 2 1 2 2
è M(c01 − ε, c02 + εx ) < M(c0) (противоречие). Если c01 = 0, òî
F (x , c0) = (c02 − x )2 > F (0, c0) = (c02)2.
Отсюда следует, что c02 < x /2. Увеличивая c02 на малое ε > 0, придем к противоречию. Случай F (x , c0) < F (0, c0) разбирается аналогично.
Из доказанного утверждения вытекает, что
c1,c2≥0 |
( |
) = |
0≤c1<1 |
n1 |
2(1 − c1) |
! |
2 |
|
|||||||
min |
M c |
|
min |
(c1)2 + (c1 − 1)2x |
. |
||
|
|
|
Последний минимум достигается при
|
|
√ |
|
|
c0 |
= |
x n + 1 − x n + 1 |
|
|
1 |
|
x n + 1 |
||
|
|
|
|
|
√ |
|
|
|
|
c0 |
= |
|
x n + 1 − 1 |
. |
|
2 |
|
|
n |
Таким образом, при оценке параметра распределения Пуассона
√√
y0(z) = |
x n + 1 − x n + 1 |
|
|
+ |
x n + 1 − 1 |
|
z |
||||
|
x n + 1 |
n |
− минимаксная стратегия статистика. В частном случае при n = 30, x = 0.5, z = 0.2 получаем оценку y0(z) = 0.16.
Упражнение 6.3. Пусть все случайные величины Zi имеют нормаль- íîå распределение с плотностью
1 |
|
e− |
(zi−x)2 |
|||
g(zi|x) = |
√ |
|
|
2σ2 |
, zi E1, |
|
2πσ |
где дисперсия σ2 статистику известна, а математическое ожидание x − íåò: x X = E1.
Показать, что классическая решающая функция z является выравнивающей и минимаксной стратегией статистика.
67
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
7. Исследование игровых моделей
Модель "нападение-оборона".
Имеется n обороняемых пунктов с номерами i = 1, ..., n возможного прорыва средств нападения. Пусть A è B − количества средств напа-
дения и обороны. Эти средства предполагаются бесконечно-делимыми. Стратегия первого игрока (нападения) состоит в распределении своих средств по пунктам в соответствии с вектором
n
X
x = (x1, ..., xn) X = {x | xi = A, xi ≥ 0, i = 1, ..., n}.
i=1
Второй игрок (оборона) использует аналогичную стратегию
n
X
y = (y1, ..., yn) Y = {y | yi = B, yi ≥ 0, i = 1, ..., n}.
i=1
Пусть µi − количество средств нападения, которое может уничтожить одна единица средств обороны на i-ом пункте. Если xi > µiyi, то через
i-й пункт прорывается xi −µiyi средств нападения. Если xi ≤ µiyi, то че- рез этот пункт нападение не прорвется. Объединяя оба случая, находим формулу для количества средств нападения, прорвавшегося через i-é
пункт: max[xi − µiyi, 0]. Определим функцию выигрыша первого игрока
n
X
F (x, y) = max[xi − µiyi, 0]
i=1
− общее количество средств нападения, прорвавшееся через все пункты. Заметим, что функция F (x, y) выпукла по y. По теореме 6.4 значение игры v = v и минимаксная стратегия y0 обороны оптимальна. Займемся исследованием этой игры в чистых и смешанных стратегиях. Без потери общности предположим, что коэффициенты эффективности обороны µi
упорядочены: µ1 ≥ µ2 ≥ ... ≥ µn è n-й пункт обороны является слабей-
øèì.
а) Покажем, что
v = max min F (x, y) = max[A |
− |
µ |
B, 0], x(n) = (0, ..., 0, A) |
||
x |
X y |
Y |
n |
|
|
|
|
|
|
|
|
− максиминная стратегия нападения, состоящая в нанесении "концентрированного"удара по слабейшему пункту.
68
7. Исследование игровых моделей
Для любой стратегии нападения x определим вспомогательную стратегию обороны y :
yi |
n |
µk − |
, i = 1, ..., n. |
= Bxi µi k=1 |
|||
|
X |
xk |
1 |
Тогда
Åñëè B ≥
n
|
min F (x, y) |
≤ |
F (x, |
|
) = |
max[x |
i − |
µ |
|
|
, 0]. |
|||||||||||||
|
y |
y |
||||||||||||||||||||||
|
y |
Y |
|
|
|
|
=1 |
|
|
i i |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Xi |
|
|
|
|
|
|
|
|
xk |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, òî yi |
≥ xi/µi, i = 1, ..., n |
F (x, y) = 0. |
|||||||||||||||||||||
=1 |
µk |
|||||||||||||||||||||||
kP |
|
|
|
|
|
|
|
|
|
i |
≤ xi/µi, i = 1, ..., n, è |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
F (x, |
|
) = |
|
(xi − µi |
|
i) ≤ A − µn |
|
i = A − µnB. |
||||||||||||||||
y |
|
y |
y |
|||||||||||||||||||||
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
=1 |
|
|
|
|
|
|
|
||
|
|
|
|
|
X |
|
|
|
|
|
|
|
|
|
Xi |
|
|
|
|
|
|
|
x
min F (x, y) |
≤ max[ |
A |
− |
µ |
B, |
min max[A |
− |
µ y |
, 0] = min F (x(n), y) |
|||
y |
Y |
|
n |
|
0] = y |
Y |
n n |
y |
Y |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
è x(n) − максиминная стратегия нападения. б) Покажем, что
|
|
|
n |
1 |
|
−1 |
|
= y Y x X |
− |
k=1 |
|
||
|
µk |
|
||||
|
|
|
X |
|
|
|
v |
min max F (x, y) = max[A |
|
B |
|
|
, 0], |
à |
n |
|
− |
|
|
µk |
, i = 1, ..., n, |
||
|
y0 : yi0 = B µi k=1 |
|||
|
X |
1 |
|
1 |
−минимаксная стратегия обороны. Сначала докажем равенство
max F (x, y) = max F (x(i), y) |
y |
|
Y, |
(7.1) |
|||
|
X |
1 |
≤ ≤ |
|
|
|
|
x |
i n |
|
|
ãäå x(i) = (0, ..., A , 0, ..., 0) − стратегия нападения, состоящая в нанесе-
|{z}
i
нии концентрированного удара по i-му пункту.
69
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
n
Представим стратегию x â âèäå x = P xAi x(i). По определению выпук-
лой функции |
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F x, y |
n |
xi |
F x(i), y |
|
max F (x(i), y). |
||||||||
Xi |
|
) ≤ |
|||||||||||
|
( |
A |
( |
1 |
i n |
|
|||||||
|
) ≤ |
|
|
||||||||||
|
|
|
=1 |
|
|
|
|
|
|
|
≤ ≤ |
|
|
Следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
max F (x, y) |
≤ |
max F (x(i), y) |
max F (x, y) |
||||||||||
|
X |
|
1 |
≤ |
≤ |
n |
|
|
|
X |
|||
x |
|
|
|
i |
|
|
|
≤ x |
è(7.1) доказано. Далее имеем
v = min max F (x, y) = min max F (x(i), y) =
y Y x X y Y 1≤i≤n
min max max[A |
− |
µ y |
, 0] = min max[A |
− |
min µ y |
, 0] = |
|||||||||
= y |
Y 1 |
i |
≤ |
n |
i i |
y |
Y |
1 |
i |
≤ |
n |
i i |
|
||
|
|
≤ |
|
|
|
|
|
|
|
≤ |
|
|
|
= max[ |
A |
− |
B max min µ y |
/B, 0] = [замена переменных |
||||||||||||
|
y |
Y 1 |
i n |
i i |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
≤ ≤ |
|
|
n |
|
|
|
|
|
|
|
|
|
|
= max[ |
|
|
|
|
|
P |
i |
i |
|
|
|
||
p = y/B P = {p = (p1, ..., pn) | i=1 pi = 1, |
|
pi ≥ 0, i = 1, ..., n}] = |
||||||||||||||
|
|
|
|
|
A |
− |
B max min µ p , 0] = |
|
|
|||||||
|
|
|
|
|
|
|
|
P 1 |
≤ ≤ |
n |
|
|
|
|
||
|
|
|
|
|
|
|
p |
|
i |
|
n |
−1 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
, 0]. |
||
=[ см. пример 4.4] = max[A − B k=1 µ1k |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P |
|
|
Ïðè ýòîì
n |
µk |
− |
, i = 1, ..., n. |
yi0 = Bpi0 = B µi k=1 |
|||
X |
1 |
|
1 |
Когда в игре Если B ≥ A
существует решение в чистых стратегиях?
n
P 1 , òî v = 0 ≥ v ≥ 0 и, следовательно, v = v = 0.
k=1
µk
Для нападения любая стратегия оптимальна. В этом случае оборона так может распределить свои силы, чтобы не позволить нападению, исполь-
зующему концентрированный удар, прорваться на каком-либо пункте.
n
Åñëè B < A |
kP |
1 |
, то функция F (x, y) седловой точки не имеет. Дей- |
|||||||
µk |
||||||||||
ствительно, |
|
|
|
|
|
|
|
|||
|
=1 |
|
|
|
|
|
|
|
|
|
|
|
|
n |
µk |
− |
|
> A − B µn − |
= A − µnB. |
||
v = A − B k=1 |
1 |
|||||||||
|
|
|
X |
1 |
|
1 |
|
1 |
70