Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2629

.pdf
Скачиваний:
3
Добавлен:
15.11.2022
Размер:
73.01 Mб
Скачать

фликт в игровой форме, т.е. указать стратегии (возможные действия) и уточнить, к какому результату приведёт игра, если каждый игрок выберет определённую стратегию.

Таким образом, игра – это конфликт с чётко сформулированными условиями.

Часто результат игры даже при определённых стратегиях предсказать невозможно, так как всё зависит от случая. Тогда говорят о среднем результате, т.е. о результате, приходящемся в среднем на одну партию, если будет сыграно достаточно большое число партий. Следовательно, даже если случайно «везёт», в среднем выигрывает тот, кто ведёт себя разумно.

Часто результат выражается числом, даже если это просто выигрыш (1), либо проигрыш (0). Мы будем полагать, что выигрыш (проигрыш) каждого игрока выражается числом.

Таким образом, основная задача теории игр формулируется так: как должен вести себя (какую стратегию применять) разумный игрок в конфликте с разумным противником (противниками), чтобы обеспечить себе в среднем наибольший возможный выигрыш?

Парные игры

Если в конфликте участвуют две стороны, то игра называется парной, если несколько – множественной. Мы ограничимся парными играми.

Игры с нулевой суммой

Игра называется «с нулевой суммой», если одна сторона выигрывает то, что проигрывает другая. Иногда называют «антагонистическая игра». Это не всегда соблюдается. Например, один выигрывает одну сумму, а другой в этой же ситуации проигрывает другую. Однако во многих случаях парные игры с нулевой суммой не слишком искажают суть явлений.

91

Конечные игры

Конечные игры – каждый игрок располагает конечным числом стратегий. В этом, помимо всего прочего, выражается своего рода дискретность игры.

Платёжная матрица

Платёжная матрица или матрица (таблица) игры с нулевой суммой (табл. 5.1).

 

 

 

 

 

 

Таблица 5 . 1

 

 

Платёжная матрица

 

 

 

 

 

 

 

 

 

 

 

 

 

 

С1

 

С2

 

С3

 

 

С4

К1

k11

 

k12

 

k13

 

 

k14

К2

k21

 

k22

 

k23

 

 

k24

К3

k31

 

k32

 

k33

 

 

k34

Здесь К «красный» игрок, С – «синий». У красного три стратегии, у синего – четыре, kij – выигрыш (проигрыш) красного, т.е. проигрыш (выигрыш) синего.

Если игра представлена в виде такой таблицы (матрицы), то говорят, что игра приведена к нормальной форме. На практике: как записать шахматы в нормальной форме?!

Игра «Три пальца»

Два игрока К и С одновременно, и не сговариваясь, показывают один, два или три пальца.

Если всего показанных пальцев (у К и С) будет чётное число, то выигрывает К – он получает столько очков, сколько показанных пальцев. Если всего показанных пальцев (у К и С) будет нечётное число, то выигрывает С.

Запишем игру в нормальной форме (табл. 5.2).

Получить наибольшую выгоду в наихудших условиях! Определим максимум столбцов и минимум строк (табл. 5.3).

92

 

 

 

 

Таблица 5 . 2

 

Платёжная матрица игры «Три пальца»

 

 

 

 

 

 

 

С1

С2

С3

К1

 

2

-3

4

К2

 

-3

4

-5

К3

 

4

-5

6

Таблица 5 . 3

Максимум столбцов и минимум строк для платёжной матрица игры «Три пальца»

 

С1

С2

С3

Минимум

 

 

 

 

строк

К1

2

-3

4

-3

 

-3

4

-5

 

К2

-5

 

4

-5

6

 

К3

-5

Максимум столбцов

4

4

6

 

Нижняя цена игры – максимин α – максимальный элемент среди минимумов строк.

Верхняя цена игры – минимакс β – минимальный элемент среди максимумов столбцов.

Это принцип минимакса, и он является в теории игр основным, т.е. вести себя так, чтобы получить наибольшую выгоду в наихудших условиях. Значит, К целесообразно показывать один палец, а С – либо один, либо два.

Найденные нами стратегии обладают нехорошим свойством – они неустойчивы.

Пусть К показывает один палец (К1), а С – тоже один (С1). К всегда выигрывает 2 очка. Тогда С переходит на С2 и будет выигрывать 3 очка. Тогда К, не будь дурак, переходит на К2. А С в ответ – на С3 и так далее…Равновесии нарушается.

Седловая точка. Чистая цена игры

Рассмотрим другой пример (табл. 5.4).

Здесь α = 5 и β = 5. Особый случай! Пара стратегий К2, С3 устойчива и представляет собой решение игры. Никому не вы-

93

годно отступать от своих стратегий. Это связано с тем, что в матрице есть элемент, являющийся одновременно и минимаксом, и максимином. Такой элемент называется седловой точкой. Сама седловая точка – цена игры.

Таблица 5 . 4 Платёжная матрица некоторой игры с седловой точкой

 

С1

С2

С3

С4

min

К1

10

1

2

1

1

К2

6

8

5

6

5

К3

2

4

4

8

2

max

10

8

5

8

 

Если матрица игры имеет седловую точку (седловые точки), то игра имеет решение в так называемых чистых стратегиях. Это пара стратегий, пересекающихся в седловой точке.

А если α не равно β? Решение есть и в этом случае, только оно лежит в области смешанных стратегий, т.е. путём чередования стратегий с какими-то вероятностями.

Систематическое применение этих стратегий, называемых оптимальными, обеспечивает каждой стороне максимально возможный для неё выигрыш, определяемый ценой игры. Если же одна из сторон откажется от своей оптимальной стратегии (в то время как другая продолжает придерживаться своей), то это ни в коем случае не может быть выгодно: выигрыш либо будет неизменным, либо уменьшится.

Таким образом, каждая конечная игра имеет решение (возможно в области смешанных стратегий). Это утверждает основная теорема теории игр.

5.2. Игра «красные» и «синие» [37]

«Красные», используя стратегии К1, К2, К3 стремятся взломать систему безопасности объекта, «синие», используя стратегии С1,С2,С3,С4, обороняются. Выигрыш – процент случаев, когда красным удаетсявзломать систему безопасностиобъекта(рис. 5.1).

94

 

С1

С2

С3

С4

min

К1

0%

100%

50%

100%

0%

 

100%

0%

100%

50%

 

К2

0%

 

100%

100%

50%

50%

 

К3

50%

max

100%

100%

100%

100%

 

Рис. 5.1. Платёжная матрица игры «Осада и оборона объекта» в процентах

Таким образом, нижняя чистая цена игры α = 50 %, верхняя чистая цена игры β = 100 %. Тогда цена игры при смешанных стратегиях α ν β.

Будем указывать не проценты, а числовое значение выиг-

рыша – 1, либо 0,5 (рис. 5.2).

 

С1

С2

С3

С4

min

 

0

1

0,5

1

 

К1

0

К2

1

0

1

0,5

0

К3

1

1

0,5

0,5

0,5

max

1

1

1

1

 

Рис. 5.2. Платёжная матрица игры «Осада и оборона объекта»

Получаем систему линейных уравнений:

0 ξ1 1 ξ2 1 ξ3 v; 1 ξ1 0 ξ2 1 ξ3 v; 0,5 ξ1 1 ξ2 0,5 ξ3 v; 1 ξ1 0,5 ξ2 0,5 ξ3 v; ξi 0;

ξ1 ξ2 ξ3 1.

0 ξv1 1 ξv2 1 vv3 1; 1 ξv1 0 ξv2 1 ξv3 1; 0,5 ξv1 1 ξv2 0,5 ξv3 1;

95

Обозначим

к равенствам: Тогда:

1 ξv1 0,5 ξv2 0,5 ξv3 1;

ξ1 ξ2 ξ3 1 . v v

ξvi pi и введём переменную z для перехода

0 p1 1 p2 1 p3 z1 1; 1 p1 0 p2 1 p3 z2 1; 0,5 p1 1 p2 0,5 p3 z3 1; 1 p1 0,5 p 2 0,5 p3 z4 1; p1 p2 p3 min.

Поскольку стремимся максимизировать выигрыш v, p1 p2 p3 1v .

Получили задачу линейного программирования. При полезных стратегиях синих получаем zi = 0. Тогда из первого уравнения

p2 1 p3.

Из второго

p1 1 p3.

Из третьего находим:

12 (1 p3 ) 1 (1 p3 ) 12 p3 1.

Отсюда

p3 12 p1 p2 .

96

Тогда

ν

 

1

 

 

2 .

p

p

 

p

 

2

 

3

 

1

 

3

 

 

А по этому:

ξ1 v p1 23 12 13.

ξ2 v p2 23 12 13.

ξ3 v p3 23 12 13.

Таким образом, оптимальная смешанная стратегия красных имеет вид:

 

 

 

 

 

 

 

 

 

К

1

К

2

К

3

 

 

 

 

 

 

 

1

1

1

 

 

3

3

3

 

Это значит, что красные должны одинаково часто применять каждую из своих стратегий.

Составим теперь систему уравнений для неизвестных значений оптимальной стратегии синих:

0 η1 1 η2 0,5 η3 1 η4 23 v; 1 η1 0 η2 1 η3 0,5 η4 23 ;

1 η1 1 η2 0,5 η3 0,5 η4 23 ;

η1 η2 η3 η4 1.

97

Решение имеет вид:

 

 

 

 

 

 

 

 

 

 

С С

 

С

3

С

 

 

 

1

 

2

 

 

4

 

 

1

1

1

1

 

 

6

6

3

3

 

Следовательно, синие в одной трети случаев посылают все три отряда на одну дорогу (любую), а в остальных – две на одну, а один – на другую.

Однако все эти рассуждения ориентированы на многократное проведение «экспериментов» – сражений. Реальный бой реализуется один раз, и кто выиграет, определяется не теорией игр, а военным искусством…На то оно и искусство!

Решаем в СКМ «Маткад» (рис. 5.3).

Рис. 5.3. Решение игры – оптимальные стратегии «красных»

Поскольку

ξ1 ξ2 ξ3

 

1

, то

1

0,5 0,5 0,5 , т.е.

 

v

 

v

 

v

 

ν 23 .

98

Соответственно,

ξ1 ξ2 ξ3 13.

Это и есть оптимальная стратегия «красных» – они одинаково часто должны применять каждую из трёх своих стратегий. Мы хотим максимизировать выигрыш ν, т.е. минимизировать:

ξ1 ξ2 ξ3 v

или

p1 p2 p3 min,

где

p1 ξv1 ; p2 ξv2 ; p4 ξv3 .

Стратегия «синих» (рис. 5.4).

Рис. 5.4. Стратегия «синих»

Это и есть оптимальная стратегия «синих».

99

Пример 2. Игра с отрицательными числами в платёжной матрице

Пусть задана игра следующей матрицей [19] (рис. 3.5).

 

y1

y2

y3

x1

2

-3

4

x2

-3

4

-5

x3

4

-5

6

Рис. 5.5. Матрица игры

Как видим, в игре отсутствует седловая точка и ни одна стратегия не доминирует над другими. Можно показать, что к каждому элементу матрицы можно прибавить одно и то же число. Сделаем это, чтобы не иметь дела с отрицательными элементами. Получим матрицу (рис. 5.6).

 

y1

y2

y3

x1

7

2

9

x2

2

9

0

x3

9

0

11

Рис. 5.6. Преобразованная матрица игры

Получим решение игры в СКМ «Маткад» (рис. 5.7).

Рис. 5.7. Решение игры (рис. 5.6) – первая стратегия

100

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]