Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции мисис-15.doc
Скачиваний:
60
Добавлен:
23.03.2016
Размер:
1.42 Mб
Скачать

§ 11. Итерационный метод (Брауна – Робинсона).

Во многих случаях решение матричных игр представляет сложный и громоздкий процесс. Кроме того, часто в практических задачах нет необходимости находить точное решение игры. Достаточно найти приближенное решение.

Рассматриваемый приближенный метод отличается достаточной простотой. Суть его в том, что матричная игра имитируется (фиктивно разыгрывается несколько раз, в несколько туров), при этом накапливаются статистические данные об игре. По ним и вырабатываются рекомендации (математическая статистика! ) об оптимальных стратегиях игроков.

Продемонстрируем работу метода на примере [15]:

Игра задана платежной матрицей (таблицей):

Выбирает

А

Стр. В

Выбирает В

Стр. А

Средний

выигр.

тура

i

B1

B2

B3

j

A1

A2

v*

v*

v

1

2

3

2

1

1

1

3

2

2

1

4

3

3

3

1,5

2

1,75

3

1

7

4

2

4

1

2

1,5

4

2

8

6

3

5

1,5

2

1,75

5

2

9

9

3

6

1,6

2

1,8

6

2

12

10

1

9

1,67

1,83

1,75

7

2

15

12

7

12

1,57

1,71

1,64

8

1

14

15

3

13

1,625

1,75

1,69

9

2

15

18

3

14

1,67

1,78

1,72

10

2

21

17

1

17

17

1,6

1,7

1,65

1 тур:

Пусть игрок А выбирает 2-ю стратегию (max min)- в наихудшем случае он выиграет 1, а не 0). У игрока В три стратегии. Какую он выберет? Конечно 1-ю (он хочет проиграть поменьше!). Выделим соответствующий проигрыш синим цветом (или подчеркнем). Итак, игрок В выбрал 1-ю стратегию. Отметим это в 6-м столбце чертой сверху.

Как же ответит А? Конечно 1-й стратегией – отметим чертой снизу. Выделим в клетках накопленные выигрыши (проигрыши).

v* - накопленный проигрыш игрока В/ число ходов

v* - накопленный выигрыш игрока А/ число ходов

v - средний выигрыш

2 тур:

Итак, игрок А выбрал 1-ю стратегию. У игрока В накопленные проигрыши 4, 3, 3. Минимизируя свой проигрыш игрок В выберет 2-ю или 3-ю стратегию. Пусть ему приглянулась стратегия 3. Игрок А ответит либо 1, либо 2 стратегией. Его накопленные выигрыши либо 4, либо 3. Он ответит 1 стратегией, и т.д.

Вывод: после 10 туров v = 1,65. Игрок А воспользовался 1-й стратегией 3 раза (находим частоту) - p1 = 3/10= 0,30, 2- й стратегией 7 раз - р2 = 7/10= 0,70.

Аналогично для игрока В: q1 = 1/4, q2=0, q3 =2/3.

Как видно, всего после десяти итераций можно уже судить об основных тенденциях игры. Оценка точности решения игры рассматривается в [ 4].

§ 12. Игры с природой (статистические решения)

В рассмотренных выше матричных играх каждый игрок действовал вполне разумно, т.е. выбирал оптимальную для себя стратегию. В этом смысле действия игроков были в каком то смысле предсказуемы.

Рассмотрим теперь ситуацию, когда осознанно действует только один игрок (пусть А), вторым игроком является природа, принимающая неопределенным образом то или иное состояние безразлично к результату игры. Такая неопределенность может порождаться рынком ценных бумаг, покупательским спросом, курсом валюты, уровнем инфляции, политикой правительства, ситуацией на бирже, погодными условиями и т.п. Игры с подобной неопределенностью называют играми с природой. Таким образом, в игре с природой один из игроков оказывается нейтральным, не стремящимся извлечь для себя максимальной выгоды.

Как же в таких ситуациях действовать игроку А?

Формально подобная игра также задается платежной матрицей, в которой указываются выигрыши игрока А в зависимости от хода природы, т.е. фактора неопределенности.

Пример.

Оптовая база собирается закупить товар для последующей реализации. По оценкам специалистов, спрос в будущем может составить 2, 3, 4 тыс. единиц. Доход от реализации ед. товара составит 10 у.е. Если товар не продастся, то убытки составят 4 у.е. Другая ситуация- неудовлетворенный спрос (дефицит)- убытки составят 1 у.е.

Составим платежную матрицу (таблицу):

неопределенность

решение

2

3

4

2

20

19

18

3

16

30

29

4

12

26

40

Существует несколько критериев принятия решений игроком А.