Васии А.А., Морозов B.B. Введение в теорию игр / Vasin_-_Vvedenie_v_teoriu_igr
.PDF3. Смешанные расширения антагонистических игр
1)Игра повторяется много раз. В этом случае за большое число повторений игры средний выигрыш первого игрока, использующего оптимальную смешанную стратегию, будет близок к значению игры или будет превышать его.
2)Смешанная стратегия реализуется в виде "физической смеси"чистых стратегий. Что это означает, поясним на примерах.
Пример 3.2. Игра против природы. Фермер (игрок 1 ) имеет участок земли, который можно засеять тремя сельскохозяйственными культурами. Год может быть нормальным, засушливым и дождливым (это три
стратегии игрока 2 − природы). Пусть H = (hij)3×3 − матрица урожайности, а bi − цена за единицу продукции i-го вида. Тогда A = (bihij)3×3 − матрица игры, где выигрыш фермера − стоимость произведенной продукции. Пусть p0 = (1/2, 1/4, 1/4) − оптимальная смешанная стратегия
первого игрока. Реализовать ее можно, засеяв половину участка первой культурой, а оставшиеся две четверти − второй и третьей культурами.
Пример 3.3. Некоторая страна (игрок 1) использует три типа истребителей для борьбы с самолетами противника (игрока 2). Если истребитель
òèïà i первого игрока встречается с самолетом типа j второго игрока,
то он побеждает противника с вероятностью aij. Смешанная стратегия p0 = (1/2, 1/4, 1/4) первого игрока может быть реализована в виде парка
истребителей с пропорциями типов 2:1:1.
3) Смешанные стратегии можно применять и при однократном повторении игры, когда игрок действует в условиях риска. При этом необходимо выигрыши заменить на их "полезности", учитывающие отношение игрока к риску.
Пример 3.4. Пусть игрок вынужден один раз сыграть в игру с матри-
öåé A = |
10 |
0 |
. Выигрышам 10 и 0 припишем полезности 1 и 0. Опре- |
0 |
5 |
делим полезность выигрыша 5. Пусть в некоторой лотерее выигрыш 10 ожидается с вероятностью 0 < a < 1. Первому игроку предлагается вы-
брать такое значение a, при котором игрок согласен купить лотерейный билет по цене 5. Выбранное значение a и будет полезностью выигрыша 5. Если a = 1/2, то отношение игрока к риску нейтральное, если a > 1/2, то игрок осторожен, а если a < 1/2, то игрок азартен.
Элементы теории полезности см. в конце данного параграфа.
Займемся смешанным расширением непрерывной игры . Ограни-
21
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
чимся игрой на прямоугольнике X × Y = [a, b] × [c, d]. При заданных стратегиях ϕ è ψ − функциях распределения на отрезках X è Y − ожидаемый выигрыш F (ϕ, ψ) первого игрока равен
bd
Z Z
F (ϕ, ψ) = F (x, y)dϕ(x)dψ(y).
ac
Здесь двойной интеграл от непрерывной функции F (x, y) существует. Более того, по теореме Фубини он равен повторному
b |
d |
ZZ
|
F (ϕ, ψ) = F (x, ψ)dϕ(x) = |
|
F (ϕ, y)dψ(y), |
|
|
|
||||||
|
|
|
a |
c |
|
|
|
|
|
|||
ãäå |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
d |
|
|
|
|
|
|
b |
|
|
|
F (x, ψ) = Zc |
F (x, y)dψ(y), F (ϕ, y) = Za |
F (x, y)dϕ(x). |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
− |
|
непре- |
Итак, построено cмешанное расширение = |
{ϕ}, {ψ}, F (ϕ, ψ) |
|
||||||||||
рывной игры на прямоугольнике. Наша ближайшая цель |
|
доказать |
||||||||||
|
|
|
|
|
|
|
|
|
||||
существование решения игры . |
|
|
|
|
|
|
Нам потребуется известный результат.
Теорема 3.2. Множество смешанных стратегий {ϕ} на отрезке [a, b]
является слабым компактом. Это означает, что из любой последовательности смешанных стратегий {ϕk} можно выделить подпоследователь-
ность {ϕkl }, слабо сходящуюся к некоторой стратегии ϕ0, т.е. такую, что для любой непрерывной на отрезке [a, b] функции h(x) выполнено
b b
ZZ
lim h(x)dϕkl (x) = h(x)dϕ0(x).
l→∞
a |
a |
Лемма 3.1. В непрерывной игре на прямоугольнике существуют
максиминная и минимаксная смешанные стратегии игроков. Доказательство. Рассмотрим выражения
v = sup inf F (ϕ, ψ), |
|
= |
inf sup F (ϕ, ψ) |
v |
|||
ϕ {ϕ} ψ {ψ} |
ψ {ψ} ϕ {ϕ} |
22
3. Смешанные расширения антагонистических игр
èдокажем, что внешние sup è inf в них достигаются. По определению
верхней грани v найдется такая последовательность смешанных стратегий {ϕk}, ÷òî
|
|
ψ |
inf |
|
F |
( |
ϕk, ψ |
) ≥ |
v |
− |
ε |
, ε |
k → |
|
, |
|
||||
|
|
{ |
ψ |
} |
|
|
|
k |
|
0+ |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
èëè |
XZ |
F (x, ψ)dϕk(x) ≥ v − εk |
ψ {ψ}, |
k = 1, 2, .... |
(3.1) |
|||||||||||||||
|
|
k |
} |
подпоследовательность |
{ϕ |
kl |
}, |
слабо сходящуюся к |
||||||||||||
Выделим из {ϕ |
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
||||||
смешанной стратегии ϕ |
. Заметим, что при фиксированной стратегии ψ |
функция F (x, ψ) непрерывна по x. Переходя в (3.1) к пределу по под- {kl}, получим неравенство
ψ |
inf |
F |
( |
ϕ0 |
, ψ |
) ≥ |
v |
ψ |
inf |
F (ϕ0, ψ) = v |
||
{ |
ψ |
} |
|
|
|
{ |
ψ |
} |
||||
|
|
|
|
|
|
|
|
|
è ϕ0 − максиминная смешанная стратегия первого игрока. Аналогично доказывается существование минимаксной смешанной стратегии.
Лемма 3.2. Рассмотрим две антагонистические игры
|
|
= X, Y, F (x, y) , = X, Y, F 0 |
(x, y) , |
|
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
F (x, y) |
è |
F |
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
|
Y |
|
|
|
ε > 0 |
||||||||
в которых функции |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ограничены на |
|
× |
|
è ïðè |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
выполнено условие |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|F (x, y) − F 0(x, y)| ≤ ε (x, y) X × Y. |
|
|
|
|
|
|
|
||||||||||||||||||||||||||
Тогда |v − v0| ≤ ε, |
|
| |
|
− |
|
0| ≤ ε. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
v |
v |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
Доказательство. Для всякого x X справедливы неравенства |
|
|
||||||||||||||||||||||||||||||||||
inf F (x, y) |
|
|
|
inf F 0(x, y) |
|
|
inf (F (x, y) |
− |
F |
0(x, y)) |
≥ − |
ε. |
|
|
|
|||||||||||||||||||||
y |
|
Y |
|
|
− y |
|
Y |
|
|
|
|
≥ y |
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Можно получить аналогичные неравенства, меняя местами функции |
||||||||||||||||||||||||||||||||||||
F (x, y) è F 0(x, y). В результате находим, что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
inf F (x, y) |
|
inf F 0 |
( |
x, y |
)| ≤ |
ε |
|
x |
|
X. |
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
| y |
|
Y |
|
|
|
|
− y |
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Далее, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
sup inf F (x, y) |
|
|
sup inf F 0(x, y) |
|
|
sup( inf F (x, y) |
|
inf F 0(x, y)) |
≤ |
ε. |
||||||||||||||||||||||||||
x X y Y |
|
|
− x X y Y |
|
|
|
|
|
≤ x X y Y |
|
|
|
|
− y Y |
|
|
|
|
|
23
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
Как и выше, находим, что |v − v0| ≤ ε. Аналогично доказывается неравенство |v − v0| ≤ ε.
Теорема 3.3 (Основная теорема непрерывных игр). Всякая непрерывная игра на прямоугольнике имеет решение в смешанных
стратегиях.
Доказательство. По теореìе 2.1 достаточно доказать равенство ве-
личин v = max inf |
F (ϕ, ψ) è v = min sup F (ϕ, ψ). |
ϕ {ϕ} ψ {ψ} |
ψ {ψ} ϕ {ϕ} |
Заметим, что достижимость здесь внешних максимумов и минимумов вытекает из леммы 3.1. Возьмем произвольное ε > 0. Из непрерыв-
ности функции F (x, y) следует существование такого разбиения отрезка X = [a, b] на непересекающиеся промежутки (отрезок и полуинтервалы) Xi, i = 1, ..., m и такого разбиения отрезка Y = [c, d] на аналогичные промежутки Y j, j = 1, ..., n, ÷òî
|F (x, y) − F (x0, y0)| ≤ ε (x, y), (x0, y0) Xi × Y j, i, j. |
(3.2) |
Для любых i, j возьмем точки xi Xi, yj Y j и определим ступенча- тую функцию
F1(x, y) = F (xi, yj) (x, y) Xi × Y j, i = 1, ..., m, j = 1, ..., n.
Тогда из (3.2) следует, что
|F (x, y) − F1(x, y)| ≤ ε (x, y) X × Y. |
(3.3) |
Итак, функция F1(x, y) аппроксимирует функцию F (x, y) с точностью до ε > 0. Непрерывная игра фактически приближена игрой с матрицей
A = (aij)m×n = (F (xi, yj))m×n.
Всякой смешанной стратегии ϕ поставим в соответствие вектор
p = (p1, ..., pm) : pi = Zi |
dϕ(x), i = 1, ..., m, |
X |
|
ãäå pi − вероятность попадания реализации смешанной стратегии в множество Xi (мера множества Xi ). Очевидно, что p является смешанной
стратегией первого игрока в матричной игре, т.е. p P. Построенное отображение P : {ϕ} → P является отображением íà P. Действительно, для любой стратегии p P функция распределения ϕ со скачками
24
3. Смешанные расширения антагонистических игр
pi в точках xi является прообразом p при отображении P. Аналогично определяется отображение Q : {ψ} → Q, ãäå Q − множество смешанных
стратегий второго игрока матричной игры. Далее, для любых стратегий ϕ, ψ и соответствующих стратегий p = P(ϕ), q = Q(ψ) справедлива
формула
F1(ϕ, ψ) =
b |
d |
m n |
|
= Z Z |
|
||
F1(x, y)dϕ(x)dψ(y) = i=1 j=1 piF (xi, yj)qj = A(p, q). |
(3.4) |
||
a |
c |
X X |
|
Кроме того, используя (3.3), получим
bd
Z Z
|F (ϕ, ψ) − F1(ϕ, ψ)| = | (F (x, y) − F1(x, y))dϕ(x)dψ(y)| ≤
|
|
a c |
|
|
b |
d |
b |
d |
|
≤ Za |
Zc |
|F (x, y) − F1(x, y)|dϕ(x)dψ(y) ≤ Za |
Zc |
εdϕ(x)dψ(y) = ε. |
Последнее неравенство означает, что для функций F (ϕ, ψ), F1(ϕ, ψ) выполнены условия леммы 3.2. Из нее вытекают неравенства
| |
max |
ψ |
inf |
F ϕ, ψ |
) |
− |
max |
min F |
1 |
ϕ, ψ |
)| ≤ |
ε, |
(3.5) |
||||||||||||||||
ϕ |
{ |
ϕ |
} |
{ |
ψ |
( |
|
ϕ |
{ |
ϕ |
} |
ψ |
{ |
ψ |
} |
( |
|
|
|
|
|||||||||
|
|
|
|
|
} |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
| |
min |
sup F (ϕ, ψ) |
− |
min |
max F |
1 |
(ϕ, ψ) |
| ≤ |
ε. |
(3.6) |
|||||||||||||||||||
ψ {ψ} ϕ {ϕ} |
|
|
ψ {ψ} ϕ {ϕ} |
|
|
|
|
|
|
||||||||||||||||||||
Из (3.4) и основной теоремы матричных игр следует, что |
|
||||||||||||||||||||||||||||
|
|
max min F1(ϕ, ψ) = max min A(p, q) = |
|
|
|||||||||||||||||||||||||
|
|
ϕ {ϕ} ψ {ψ} |
|
|
|
|
|
|
p P q Q |
|
|
|
|
|
|
|
|
||||||||||||
|
|
= min max A(p, q) = min max F1(ϕ, ψ). |
|
|
|||||||||||||||||||||||||
|
|
|
|
q Q p P |
|
|
|
|
|
ψ {ψ} ϕ {ϕ} |
|
|
|
|
|
|
|
|
|||||||||||
Отсюда и из неравенств (3.5),(3.6) следует |
|
|v − |
|
| ≤ 2ε. В силу произ- |
|||||||||||||||||||||||||
|
v |
||||||||||||||||||||||||||||
вольности ε > 0 получаем v = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
v. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Элементы теории полезности
Правомерность использования математического ожидания выигрыша в смешанном расширении игры вызывает сомнения. Когда игроки
25
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
применяют заданные смешанные стратегии, то выигрыш каждого является случайной величиной с заданным законом распределения. В теории полезности такую величину называют лотереей. Формально она задает-
ся набором параметров (A1, ..., Ak; x1, ..., xk), где выигрыш Al возникает
k
P
с вероятностью xl, l = 1, ..., k, è xl = 1.
l=1
Упражнение 3.2. Указать параметры лотереи, которая соответствует паре смешанных стратегий (p, q) в матричной игре.
Оценка исхода любой игры по математическому ожиданию предполагает, что лотереи (0; 1), ($5000, $ − 5000; 1/2, 1/2) è
(−1ðóá.,10000 ðóá.;10000/10001,1/10001) эквиваленты для индивидуума.
Можно предположить, что для многих читателей это не так. Далеко не все могут себе позволить сыграть во вторую лотерею, даже если несколько увеличить размер выигрыша. В то же время значительная часть населения участвует в лотереях, подобных третьей, даже при отрицательном среднем выигрыше: многие готовы рискнуть маленькой суммой в расче- те на счастливый случай. Вообще, отношение людей к риску достаточно сложно и не до конца исследовано. Его изучением занимается теория полезности (в экономике функции выигрыша обычно называют функциями полезности).
Один из важнейших результатов этой теории состоит в следующем. Предположим, что у индивидуума есть отношение предпочтения на мно-
жестве всевозможных лотерей, т.е. для любых двух лотерей L1, L2 îí ìî- жет указать, какое из соотношений ( причем только одно) выполняется: L1 L2 (L1 предпочтительней L2), L2 L1 èëè L1 L2 (лотереи эквива-
лентны). Пусть эти соотношения удовлетворяют следующим (довольно естественным) аксиомам:
I. Åñëè L1 L2 è L2 L3, òî L1 L3.
II. Åñëè L1 L2 è L2 L3, òî L1 L3.
III. Åñëè L1 L2 è L2 L3, òî L1 L3.
IV. Åñëè L1 L2 è L2 L3, òî L1 L3.
V. Лотереи, которым соответствует одинаковое распределение вероятностей, являются эквивалентными.
Пусть L1, L2 − две лотереи, 0 ≤ r ≤ 1. Обозначим через
rL1 + (1 − r)L2 лотерею, в которой c вероятностью r разыгрывается лотерея L1, а с вероятностью 1 − r − лотерея L2.
26
3. Смешанные расширения антагонистических игр
Из аксиомы V вытекает, что для любых лотерей L1, L2, L3 и вероят- ностей r, s справедливы соотношения
rL1 + (1 − r)L2 (1 − r)L2 + rL1,
rL1 + (1 − r)(L2 + (1 − s)L3) rL1 + (1 − r)L2 + (1 − r)(1 − s)L3.
V I. Åñëè L1 L2 (L1 L2), то для любой лотереи L3 и любой веро- ятности r > 0 выполнено соотношение
rL1 + (1 − r)L3 rL2 + (1 − r)L3 (rL1 + (1 − r)L3 rL2 + (1 − r)L3).
V II. Åñëè L1 L2 L3, то найдется такая вероятность r, ÷òî rL1 + (1 − r)L3 L2.
Аксиома V II похожа на теорему о промежуточном значении для
непрерывной функции на отрезке и означает, что отношение предпо- чтения непрерывно в некотором смысле. Пусть, наконец, справедлива аксиома
V III. Åñëè Al > Ah, òî (Al; 1) (Ah; 1).
Лемма 3.3. Пусть на множестве лотерей предпочтение индивидуума удовлетворяет аксиомам I − V III è L1 L2. Тогда для любых вероятностей β < α выполнено соотношение αL1 + (1 − α)L2 βL1 + (1 − β)L2.
Доказательство. По аксиоме V I ïðè L3 = L2 получаем
αL1 + (1 − α)L2 L2. Представим β â âèäå β = γα, ãäå γ [0, 1). Тогда по аксиомам V I è V
αL1 + (1 − α)L2 γ(αL1 + (1 − α)L2) + (1 − γ)L2
γαL1 + [γ(1 − α) + 1 − γ]L2 βL1 + (1 − β)L2.
Теорема 3.4. При выполнении указанных аксиом I −V III существует функция полезности u(L), определенная на множестве лотерей вида (A1, ..., Ak; x1, ..., xk) и такая, что выполнены следующие свойства:
1) |
Для любых лотерей L1, L2 |
u(L1) > u(L2) L1 L2. |
|
3) |
Функция u(A; 1) монотонно возрастает по A. |
k |
|
lP |
|||
2) |
Для любой лотереи L = (A1 |
, ..., Ak; x1, ..., xk) u(L) = |
xlu(Al). |
|
|
|
=1 |
Более того, эта функция единственна с точностью до линейного преобразования: если другая функция v(L) удовлетворяет тем же свойствам
1)−3), то существуют такие константы c > 0 è b, что для любой лотереи
L v(L) = cu(L) + b.
Утверждение теоремы означает, что для каждого индивидуума (при выполнении аксиом I − V III) существует монотонное преобразование
27
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
функции выигрыша, которое позволяет оценивать любую лотерею, исходя из математического ожидания выигрыша. В частности, если в мат-
ричной игре взять преобразованную функцию выигрыша u(aij), òî ñëó-
чайный исход при использовании смешанных стратегий p è q можно
m n
оценивать по математическому ожиданию P P piu(aij)qj. Отметим, что
i=1 j=1
функция полезности u(L) − своя для каждого индивидуума, поэтому иг-
ра с преобразованными матрицами выигрышей (u1(aij)) è (u2(aij)) вполне может оказаться неантагонистической.
Упражнение 3.3. Докажите теорему 3.4.
Указание. Без потери общности можно считать, что A1 A2 ... Ak. Положим u(A1) = r1 = 1, u(Ak) = rk = 0, а величины u(Al) = rl, l = 2, ..., k − 1 определим из соотношений rl(A1) + (1 − rl)Al Al, 0 < rl < 1, используя аксиому V II. С помощью леммы 3.3 покажите, что функция
k
P u(L) = u(A1, ..., Ak; x1, ..., xk) = xlrl
l=1
удовлетворяет всем утверждениям теоремы.
4. Свойства решений в смешанных стратегиях
В данном параграфе рассматриваются свойства решений в смешанных стратегиях матричных игр и непрерывных игр на прямоугольнике. Эти свойства в частных случаях позволяют находить оптимальные смешанные стратегии.
Теорема 4.1. Для того чтобы тройка (ϕ0, ψ0, v) была решением в смешанных стратегиях непрерывной игры , необходимо и достаточно, чтобы было выполнено условие
F (x, ψ0) ≤ v ≤ F (ϕ0, y) x X, y Y. ( )
Доказательство. Необходимость. Пусть (ϕ0, ψ0, v) − решение непрерывной игры в смешанных стратегиях. Тогда v = F (ϕ0, ψ0) и по определению седловой точки
F (ϕ, ψ0) ≤ F (ϕ0, ψ0) = v ≤ F (ϕ0, ψ) ϕ {ϕ}, ψ {ψ}.
Возьмем в последних неравенствах вместо ϕ è ψ чистые стратегии x è y. В результате получим условие ( ).
28
4. Свойства решений в смешанных стратегиях
Достаточность. Пусть для тройки (ϕ0, ψ0, v) выполнено условие ( ).
Проинтегрируем первое неравенство этого условия по любой стратегии ϕ, а второе − по любой стратегии ψ и получим
F (ϕ, ψ0) ≤ v ≤ F (ϕ0, ψ) ϕ {ϕ}, ψ {ψ}.
Подставляя, в частности, ϕ = ϕ0 è ψ = ψ0, находим, что F (ϕ0, ψ0) = v è ïàðà (ϕ0, ψ0) − седловая точка функции F (ϕ, ψ) íà {ϕ} × {ψ}.
Отметим, что теорема 4.1 справедлива для произвольных смешанных расширений антагонистических игр.
Сформулируем аналогичную теорему для матричных игр.
Теорема 4.1 0. Для того чтобы тройка (p0, q0, v) была решением в смешанных стратегиях игры с матрицей A, необходимо и достаточно, чтобы было выполнено условие
A(i, q0) ≤ v ≤ A(p0, j), i = 1, ...m, j = 1, ..., m. |
( ) |
Упражнение 4.1. Докажите теорему 4.1 0.
Отметим, что проверка выполнения условия ( ) теоремы 4.1 0 сводит- ся к подсчету скалярных произведений вектора p0 на столбцы, а также вектора q0 на строки матрицы A и сравнению их с числом v.
Пример 4.1. Пусть матрица игры − циклическая:
A = |
cn |
c1 ... |
cn−1 |
. |
|
|
|
|||||
|
|
c1 |
c2 ... |
|
cn |
|
|
|
|
|||
|
c |
2 |
... c |
n |
|
c |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
... ... ... ... |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
||
Покажем, что p0 = q0 = (1/n, ..., 1/n), |
|
|
|
n |
|
|
|
|||||
v = k=1 ck/n − решение игры |
||||||||||||
в смешанных стратегиях. Действительно, |
|
|
P |
( |
|
) здесь выполнено, |
||||||
|
|
|
|
|
|
|
условие |
|
|
|||
|
|
|
|
|
|
|
|
|
|
поскольку все неравенства в нем выполнены как равенства. В качестве конкретного примера рассмотрим игру "мешок, камень, ножницы"с мат-
рицей
M K H
|
|
|
|
1 |
−1 |
|
|
|
= |
M |
0 |
|
|
||
A |
H |
−1 |
−1 |
0 |
. |
||
|
K |
1 |
0 |
1 |
|
29
ГЛАВА I. АНТАГОНИСТИЧЕСКИЕ ИГРЫ
Можно дать следующую интерпретацию этой игры. Двое выбирают один из трех предметов: мешок, камень или ножницы. Каждый предмет против самого себя никакого выигрыша не дает, поэтому на диагонали стоят 0. Ножницы тупятся о камень, поэтому они проигрывают камню 1,
àтот в свою очередь выигрывает у ножниц 1. Камень можно поместить в мешок, поэтому мешок выигрывает у камня 1, а камень проигрывает мешку 1. Ножницы режут мешок, поэтому они выигрывают у мешка 1,
àмешок проигрывает ножницам 1.
Упражнение 4.2. Пусть B − матрица, полученная прибавлением константы c ко всем элементам матрицы A. Показать, что значения соответствующих матричных игр связаны соотношением v(B) = v(A) + c, а оптимальные смешанные стратегии игроков совпадают.
Пример 4.2. Продавец выставляет на продажу три предмета, не представляющие для него особой ценности (старые телевизоры и т.п.). Он готов их продать даже за незначительную цену. Имеются два покупателя
(игрока), располагающие одинаковыми суммами денег A. Игрок становится обладателем предмета, если предлагает за него сумму, б o´льшую,
чем партнер. Цель первого игрока состоит в покупке двух каких-либо предметов из трех. Цель второго игрока − воспрепятствовать этому.
3
Пусть x = (x1, x2, x3) X = {x | P xi = A, x1, x2, x3 ≥ 0} −
i=1
стратегия первого игрока, состоящая в предложении суммы xi çà i-ûé
предмет. Аналогичную стратегию y = (y1, y2, y3) Y = X использует второй игрок.
Будем писать x y, если какие-либо две компоненты вектора x больше соответствующих компонент вектора y. Определим функцию выигры-
ша первого игрока
(
1, x y,
F (x, y) =
0, в противном случае.
Заметим, что
x X y Y : ¬(x y) v = 0;
y Y x X : x y v = 1.
Отсюда следует, что игра не имеет решения в чистых стратегиях. Найдем ее решение в смешанных стратегиях.
Множество стратегий X (совпадающее с Y ) изобразим на плоскости в виде равностороннего треугольника высоты A. Точка y имеет барицентрические координаты y1, y2, y3, определяющие ее расстояния от
30