Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Матричные_игры(дляСтудентов).doc
Скачиваний:
10
Добавлен:
18.09.2019
Размер:
744.45 Кб
Скачать

2. Принцип максимина (минимакса)

Как было отмечено, каждый игрок стремится обеспечить себе максимально возможный выигрыш при любых действиях противника. Поэтому рассмотрим следующий вопрос: как должны вести игроки в матричной игре, чтобы получить больший выигрыш, т. е. в чем состоит оптимальность в матричной игре?

Пусть игрок Ι выбрал стратегию i0 А, тогда игрок ΙΙ выберет такую стратегию j В, которая максимизирует его выигрыш и тем самым минимизирует выигрыш его противника. Стратегия игрока Ι, обеспечивающая ему наибольший выигрыш из всех возможных, независимо от действий противника будет состоять в выборе такого i0. А, для которого минимальный выигрыш будет наибольшим, т. е.

min H (i0, j) = max min H (i, j).

j B i A j B

Величину

max min H (i, j). (3)

i A j B

принято обозначать через v (Г) (или просто v) и называть нижним значением (нижней ценой) игры, а соответствующую этому значению стратегию i0 игрока Ι – максиминной стратегией. Если игрок Ι придерживается данной стратегией, то его выигрыш будет не меньше максиминного значения, т. е.

H (i0, j) ≥ v (Г), j B. (4)

Аналогично стратегия j0, определяемая равенством

max H (i, j) = min max H (i, j) = (Г),

i A j B i A

называется минимаксной стратегией игрока ΙΙ, соответствующее значение (Г) (или просто ) – верхним значением (верхней ценой) игры.

Если игрок ΙΙ придерживается данной стратегии, то его проигрыш будет не больше минимаксного значения, т. е.

Н (i, j0) ≤ (Г), i А (5)

Полагая, что в неравенстве (4) j = j0 , а в выражении (5) i = i0, получим:

max min H (i, j) ≤ H (i0, j0) ≤ min max H (i, j). (6)

i A j B j B i A

Принцип, которого придерживается игрок Ι, называется принципом максимина, так как его гарантированный выигрыш равен величине (3).Игрок ΙΙ также придерживается этого принципа, так как

max min [-H (i, j)] = -min max H (i, j).

i A j B j B i A

Из неравенства (6) следует, что во всякой матричной игре v ≤ . При этом возможны два следующих случая:

v < ; v = . (7)

В первом случае игрок Ι может обеспечить себе выигрыш

max min H (i, j), игрок ΙΙ в состоянии ему не дать больше,

i A j B

чем min max H (i, j). Вопрос о разделе между игроками разности

j B i A

v (а в рассматриваемом случае она положительна) остается, таким образом, открытым. Это влечет за собой неопределенность в действиях игроков. Поясним сказанное.

П р и м е р 1

Н1 = .

Нахождение v и матрицы Н может быть проведено по следующей схеме:

H =

j

H

3

1 = .

j

min max hij = 4

j i

v = 3, = 4, v < ; 2-я строка – максиминная стратегия; 1-й столбец – минимаксная стратегия. Применение максиминной и минимаксной стратегий приводит к выигрышу игрока Ι, равному v (разность - v = 4 – 3 = 1 достается игроку ΙΙ, но можно привести пример, когда эта разность достается игроку Ι). Однако игрок Ι в игре Н1, отклоняясь от максиминной и выбирая первую стратегию, может выиграть 4 > 3 (при условии, что игрок ΙΙ придерживается минимаксной стратегии). Но игрок ΙΙ, разгадав намерения игрока Ι, может выбрать свою четвертую стратегию и тем самым наказать его (даст ему 2 < 3). Игрок Ι в свою очередь может изменить решение и выбрать такую стратегию, при которой будет наказан игрок ΙΙ, и т. д. И это будет происходить во всех играх, в которых < v.

Итак, при v < максиминная и минимаксная стратегии не являются оптимальными.

Рассмотрим теперь второй случай. Равенство (7) означает, что величина, которую гарантирует игрок Ι, совпадает с величиной, больше которой игрок ΙΙ не позволит ему получить. Поэтому игрокам необходимо выбрать максиминную и минимаксную стратегии соответственно.

П р и м е р 2

Н

2

2 =

min max hij = 2

j i

v = 2, = 2, v = ; 2-я строка - максиминная стратегия; 2-й столбец – минимаксная стратегия. В этом случае любое отклонение каждого из игроков от этих стратегий (игрока Ι – от максиминной, игрока ΙΙ- от минимаксной) не может оказаться выгодным.

О п р е д е л е н и е 3. В случае v = максиминная и минимаксная стратегии называются оптимальными стратегиями игроков, а общее значение v и (в дальнейшем мы его будем обозначать через v) – значением или ценой игры.

Оптимальные стратегии будем обозначать через i*, j*. Нужно установить связь между принципом максимина и седловой точкой функции Н (i, j). Вспомним определение седловой точки.

О п р е д е л е н и е 4. Точка (a, b) называется седловой точкой функции Н, если

H (a`, b) ≤ H (a, b) ≤ H (a, b`), a` A, b` B.

Это неравенство выражает следующее свойство функции Н в точке (a, b): при любом изменении значения переменной а значение функции Н может уменьшиться, а при изменении значения переменной b – увеличиться. Термин «седловая точка» вводится по аналогии с термином «поверхность седла», которая искривляется вверх в одном направлении и вниз – в другом.

Теорема 1. Для того чтобы в матричной игре (2) существовали седловые точки, необходимо и достаточно, чтобы

max min H (i, j) = min max H (i, j). (8)

i A j B j B i A

Замечание 1. Из доказательства теоремы 1 видно, что i0 и j0 – соответственно максиминная и минимаксная стратегии игроков Ι и ΙΙ и наоборот.

Замечание 2. При доказательстве теоремы 1 было установлено, что в качестве Седловой точки могут быть взяты любые i и j, на которых достигаются внешние экстремумы в минимаксах

max min H (i, j), min max H (i, j).

i A j B j B i A

Поэтому если (i1, j1) и (i2, j2) – седловые точки функции H (i, j), то, по-видимому, точки (i1, j2) и (i2, j1) также будут Седловыми для этой функции. И это действительно так.

Теорема 2. Пусть (i1, j1) и (i2, j2) – две седловые точки матричной игры (2). Тогда: а) (i1, j2) и (i2, j1) являются Седловыми точками;

b) H (i1, j1) = Н (i2, j2) = Н (i1, j2) = Н (i2, j1). (11)

Свойство а называют обычно свойством прямоугольности (все седловые точки составляют прямоугольное множество (рис.1)), а свойство b означает, что игроки j

и меют постоянные выигрыши во j2 (i1, j2) (i2, j2)

в сех Седловых точках. Эти два

с войства называют свойствами j1 (i1,j1) (i2, j2)

в заимозаменяемости и эквива-

лентности. 0 i1 i2 i

Решением матричной игры

называется процесс нахождения Рис. 1

ее значения и оптимальны

стратегий игроков или, как это следует из теоремы 1, ее седловых точек. Нахождение седловых точек в матичной игре проводится по

той же схеме, что и нахождение минимаксов.

П р и м е р 3

H

2

3 =

min max hij = 2

j i

Седловой точкой является пара (i* = 2, j* = 2), v = v (Г) = (Г) = 2. Заметим, что хотя в ситуациях (1, 1) и (3, 4) выигрыш также равен 2, они не являются седловыми точками (этот выигрыш не является минимальным в строке и максимальным в столбце).

П р и м е р 4

H

2

2

2

2

4 =

min max hij = 2

i j

Седловыми точками являются пары (i = 1, j = 1), (i = 1, j2= 2), (i = 2, j = 1), (i = 2, j2= 2); Н (i , j ) = Н (i , j ) = Н (i , j ) = Н (i , j ) = v = 2.

П р и м е р 5

Н 5 =

min max hij = 2

j i

(Г) = 2, v (Г) = 1. Так как v (Г) ≠ (Г), рассматриваемая игра не имеет седловых точек.

Таким образом, существование седловых точек является скорее исключением, чем общим правилом. Поэтому не совсем ясно, что понимать под решением игры в данном случае.