2. Принцип максимина (минимакса)
Как было отмечено, каждый игрок стремится обеспечить себе максимально возможный выигрыш при любых действиях противника. Поэтому рассмотрим следующий вопрос: как должны вести игроки в матричной игре, чтобы получить больший выигрыш, т. е. в чем состоит оптимальность в матричной игре?
Пусть игрок Ι выбрал стратегию i0 А, тогда игрок ΙΙ выберет такую стратегию j В, которая максимизирует его выигрыш и тем самым минимизирует выигрыш его противника. Стратегия игрока Ι, обеспечивающая ему наибольший выигрыш из всех возможных, независимо от действий противника будет состоять в выборе такого i0. А, для которого минимальный выигрыш будет наибольшим, т. е.
min H (i0, j) = max min H (i, j).
j B i A j B
Величину
max min H (i, j). (3)
i A j B
принято обозначать через v (Г) (или просто v) и называть нижним значением (нижней ценой) игры, а соответствующую этому значению стратегию i0 игрока Ι – максиминной стратегией. Если игрок Ι придерживается данной стратегией, то его выигрыш будет не меньше максиминного значения, т. е.
H
(i0,
j)
≥ v
(Г),
j
B.
(4)
Аналогично стратегия j0, определяемая равенством
max H (i,
j) = min max H (i, j) =
(Г),
i A j B i A
называется минимаксной стратегией игрока ΙΙ, соответствующее значение (Г) (или просто ) – верхним значением (верхней ценой) игры.
Если игрок ΙΙ придерживается данной стратегии, то его проигрыш будет не больше минимаксного значения, т. е.
Н (i, j0) ≤ (Г), i А (5)
Полагая, что в неравенстве (4) j = j0 , а в выражении (5) i = i0, получим:
max min H (i, j) ≤ H (i0, j0) ≤ min max H (i, j). (6)
i A j B j B i A
Принцип, которого придерживается игрок Ι, называется принципом максимина, так как его гарантированный выигрыш равен величине (3).Игрок ΙΙ также придерживается этого принципа, так как
max min [-H (i, j)] = -min max H (i, j).
i A j B j B i A
Из неравенства (6) следует, что во всякой матричной игре v ≤ . При этом возможны два следующих случая:
v < ; v = . (7)
В первом случае игрок Ι может обеспечить себе выигрыш
max min H (i, j), игрок ΙΙ в состоянии ему не дать больше,
i A j B
чем min max H (i, j). Вопрос о разделе между игроками разности
j B i A
– v (а в рассматриваемом случае она положительна) остается, таким образом, открытым. Это влечет за собой неопределенность в действиях игроков. Поясним сказанное.
П р и м е р 1
Н1
=
.
Нахождение v и матрицы Н может быть проведено по следующей схеме:
H
=
j
H
3
1
=
.
j
min max hij = 4
j i
v = 3, = 4, v < ; 2-я строка – максиминная стратегия; 1-й столбец – минимаксная стратегия. Применение максиминной и минимаксной стратегий приводит к выигрышу игрока Ι, равному v (разность - v = 4 – 3 = 1 достается игроку ΙΙ, но можно привести пример, когда эта разность достается игроку Ι). Однако игрок Ι в игре Н1, отклоняясь от максиминной и выбирая первую стратегию, может выиграть 4 > 3 (при условии, что игрок ΙΙ придерживается минимаксной стратегии). Но игрок ΙΙ, разгадав намерения игрока Ι, может выбрать свою четвертую стратегию и тем самым наказать его (даст ему 2 < 3). Игрок Ι в свою очередь может изменить решение и выбрать такую стратегию, при которой будет наказан игрок ΙΙ, и т. д. И это будет происходить во всех играх, в которых < v.
Итак, при v < максиминная и минимаксная стратегии не являются оптимальными.
Рассмотрим теперь второй случай. Равенство (7) означает, что величина, которую гарантирует игрок Ι, совпадает с величиной, больше которой игрок ΙΙ не позволит ему получить. Поэтому игрокам необходимо выбрать максиминную и минимаксную стратегии соответственно.
П р и м е р 2
Н
2
min max hij = 2
j i
v = 2, = 2, v = ; 2-я строка - максиминная стратегия; 2-й столбец – минимаксная стратегия. В этом случае любое отклонение каждого из игроков от этих стратегий (игрока Ι – от максиминной, игрока ΙΙ- от минимаксной) не может оказаться выгодным.
О п р е д е л е н и е 3. В случае v = максиминная и минимаксная стратегии называются оптимальными стратегиями игроков, а общее значение v и (в дальнейшем мы его будем обозначать через v) – значением или ценой игры.
Оптимальные стратегии будем обозначать через i*, j*. Нужно установить связь между принципом максимина и седловой точкой функции Н (i, j). Вспомним определение седловой точки.
О п р е д е л е н и е 4. Точка (a, b) называется седловой точкой функции Н, если
H (a`, b) ≤ H (a, b) ≤ H (a, b`), a` A, b` B.
Это неравенство выражает следующее свойство функции Н в точке (a, b): при любом изменении значения переменной а значение функции Н может уменьшиться, а при изменении значения переменной b – увеличиться. Термин «седловая точка» вводится по аналогии с термином «поверхность седла», которая искривляется вверх в одном направлении и вниз – в другом.
Теорема 1. Для того чтобы в матричной игре (2) существовали седловые точки, необходимо и достаточно, чтобы
max min H (i, j) = min max H (i, j). (8)
i A j B j B i A
Замечание 1. Из доказательства теоремы 1 видно, что i0 и j0 – соответственно максиминная и минимаксная стратегии игроков Ι и ΙΙ и наоборот.
Замечание 2. При доказательстве теоремы 1 было установлено, что в качестве Седловой точки могут быть взяты любые i и j, на которых достигаются внешние экстремумы в минимаксах
max min H (i, j), min max H (i, j).
i A j B j B i A
Поэтому если (i1, j1) и (i2, j2) – седловые точки функции H (i, j), то, по-видимому, точки (i1, j2) и (i2, j1) также будут Седловыми для этой функции. И это действительно так.
Теорема 2. Пусть (i1, j1) и (i2, j2) – две седловые точки матричной игры (2). Тогда: а) (i1, j2) и (i2, j1) являются Седловыми точками;
b) H (i1, j1) = Н (i2, j2) = Н (i1, j2) = Н (i2, j1). (11)
Свойство
а называют обычно свойством прямоугольности
(все седловые точки составляют
прямоугольное множество (рис.1)), а
свойство b
означает, что игроки j
и
меют
постоянные выигрыши во j2
(i1,
j2)
(i2, j2)
в
сех
Седловых точках. Эти два
с войства называют свойствами j1 (i1,j1) (i2, j2)
в
заимозаменяемости
и эквива-
лентности. 0 i1 i2 i
Решением матричной игры
называется процесс нахождения Рис. 1
ее значения и оптимальны
стратегий игроков или, как это следует из теоремы 1, ее седловых точек. Нахождение седловых точек в матичной игре проводится по
той же схеме, что и нахождение минимаксов.
П р и м е р 3
H
2
min max hij = 2
j i
Седловой точкой является пара (i* = 2, j* = 2), v = v (Г) = (Г) = 2. Заметим, что хотя в ситуациях (1, 1) и (3, 4) выигрыш также равен 2, они не являются седловыми точками (этот выигрыш не является минимальным в строке и максимальным в столбце).
П р и м е р 4
H
2
2
2
2
min max hij = 2
i j
Седловыми
точками являются пары (i
= 1, j
= 1), (i
= 1, j2=
2), (i
= 2, j
= 1), (i
= 2, j2=
2); Н (i
,
j
)
= Н (i
,
j
)
= Н (i
,
j
) = Н (i
, j
)
= v = 2.
П р и м е р 5
Н
5
=
min max hij = 2
j i
(Г) = 2, v (Г) = 1. Так как v (Г) ≠ (Г), рассматриваемая игра не имеет седловых точек.
Таким образом, существование седловых точек является скорее исключением, чем общим правилом. Поэтому не совсем ясно, что понимать под решением игры в данном случае.
