Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Конспект по ММТС.doc
Скачиваний:
5
Добавлен:
01.03.2025
Размер:
3.59 Mб
Скачать

3.11. Состязательные задачи

Состязательные задачи (игры) могут быть:

по вариантности стратегий - с чистой (применяется одна из возможных стратегий) или смешанной (если применяется несколько стратегий);

по числу применяемых стратегий – на конечные и бесконечные;

по количественному результату – с нулевой или ненулевой суммой;

по характеру взаимоотношений игроков – некооперативные (антагонистические) и кооперативные (коалиционные);

по числу сторон – двух или многих игроков;

по характеру протекания – непрерывные и дискретные;

по количеству информации у сторон – с полной, с вероятностной или с отсутствием, в т.ч. игры с природой, когда партнера заменяет среда, безразличная к действиям игрока.

Простейшей и наиболее разработанной является теория "матричных" игр двух сторон с нулевой суммой.

Исходные данные задаются в виде матрицы выигрышей cij (таблица 3.33).

Таблица 3.33 – Пример матрицы выигрышей

Стратегии

стороны Аi

Стратегии стороны Вj

Наименьший

выигрыш

В1

В2

В3

В4

А1

11

15

13

10

10

А2

12

14

11

16

11

А3

9

11

12

15

9

Наибольший

проигрыш

12

15

13

16

В этом примере сторона А имеет три возможные стратегии А1, А2, А3, а В – четыре (В1, В2, В3, В4). Сторона А не знает, как поступит сторона В, однако действуя наиболее целесообразно, она должна выбирать стратегию А2, которая гарантирует ей наибольший (11) из трех наименьших выигрышей (10,11,9).

Принято называть, что сторона руководствуется принципом максиминного выигрыша:

.

Определяемая таким образом величина (а) называется нижней ценой игры, максиминным выигрышем или максимином. Для приведенного примера а=11.

Если рассуждать аналогично, то сторона В должна выбирать стратегию В1, которая гарантирует ей наименьший (12) из четырех возможных наибольших проигрышей, т.е. она руководствуется принципом максиминного проигрыша:

.

Величина (b) называется верхней ценой игры, или минимаксом. Для приведенного примера b=12.

Справедливо, что b≥a.

Такая стратегия игроков называется принципом минимакса или принципом осторожности.

Если а = в, то такая точка называется седловой.

Рациональные правила поведения сторон:

1. Если известна стратегия стороны В, то сторона А должна выбрать Ai, которая дает максимальный выигрыш.

2. Если стратегия В неизвестна, то сторона А должна воспользоваться своей максиминной стратегией.

3. Если стратегия В неизвестна, но состязательная игра имеет седловую точку, то наиболее выгодно для стороны А не отклоняться от оптимальной точки, соответствующей седловой.

Если матрица игры не имеет седловой точки, то оказывается, что для определения успеха необходимо выбирать стратегии А и В с определенными вероятностями (частотами) при многократной игре. Такие стратегии называются смешанными.

Решение игровых задач в смешанных стратегиях осуществляется по итеративным алгоритмам Брауна или Неймана или сводится к задаче линейного программирования.

В основе алгоритма Брауна (фиктивной игры) лежит предположение, что игра играется много раз, а игроки выбирают свои стратегии, руководствуясь опытом ранее сыгранных партий.

Если считать, что выполнено k итераций и в результате получены оценки смешанных стратегий Ac = (A1, A2, ..., Ak) игрока А и Bc = (B1, B2, ..., Bk) игрока В, то на очередной итерации игроком А выбирается такая чистая стратегия, которая обеспечит ему максимум в предположении, что игрок В применит смешанную стратегию Bc. Аналогично В применяет чистую стратегию, которая дает минимум выигрыша А, если последним будет использована смешанная стратегия Ac.

Для парной игры с нулевой суммой обозначим вероятность применения стратегии Ai через pi, а Bj через qj (Ai – стратегия стороны А, Bj – стратегия стороны В).

Сумма вероятностей всех стратегий для каждой из сторон равна 1:

Тогда ; .

Средний выигрыш стороны А

,

где m и n – соответственно число различных стратегий сторон А и В.

Для поиска оптимума необходимо взять частные производные и приравнять их к нулю

;

.

Решение системы дает оптимальные значения вероятностей piопт и qjопт , которые должны быть больше нуля и меньше единицы.

Решение может быть получено реализацией итерационного процесса путем многократного имитационного моделирования игры. Например, следующей стратегией стороны А для приведенного примера является стратегия А1, дающую максимум при стратегии противоположной стороны В1, а сторона В применит стратегию В3, которая дает минимум выигрыша стороной А при ее предыдущей стратегии А2. При следующей итерации сторона А должна применить стратегию А1, дающую максимум выигрыша (14+14=28) при предыдущих стратегиях (В1,В3) противоположной стороны, а стороне В необходимо применить стратегию В3, которая дает минимум выигрыша стороной А при ее предыдущих стратегиях А2 и А1(11+14=25). Аналогично итерационный процесс моделирования проводят до равенства значений цен игры сторон с заданной точностью. Пример игры для пяти итераций приведен в таблице 3.34. Для рассматриваемого примера на 5-й итерации средняя цена игры стороны А равна 11.4 ( 57/5) и стороны В – 11.8 (59/5).

Таблица 3.34 – Пример моделирования игры двух сторон по алгоритму Брауна

Номер

итерации

Выбранная стратегия

Накопленные результаты стороны А

при стратегиях стороны В

Накопленные результаты стороны В

при стратегиях стороны А

Сторона А

Сторона В

1

2

3

4

1

2

3

1

А2

В1

12

14

11

16

11

12

9

2

А2

В3

24

28

22

32

24

23

21

3

А1

В3

35

43

35

42

37

34

33

4

А1

В1

46

58

48

52

48

46

42

5

А1

В1

57

73

61

62

59

58

51

Для решения задачи на основе итерационного алгоритма Брауна может быть использована его компьютерная реализация. Пример учебной программы приведен в приложении 11.