Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТПР - мой вариант.docx
Скачиваний:
56
Добавлен:
16.09.2019
Размер:
1.99 Mб
Скачать

47. Метод Брауна-Робинсон.

Один из самых простых численных методов решения игр – метод итераций (метод Брауна-Робинсон). Идея его в следующем. Разыгрывается «мысленный эксперимент», в котором стороны А и В поочередно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Начинается он с того, что один из игроков (скажем, А) выбирает произвольно одну из своих стратегий Аi. Противник (В) отвечает ему той из своих стратегий Bj, которая хуже всего для А, т. е. обращает его выигрыш при стратегии Аi в минимум. Дальше снова очередь А — он отвечает В той своей стратегией Ak, которая дает максимальный выигрыш при стратегии Bj противника. Дальше — снова очередь противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии Ак, а для смешанной стратегии, в которой до сих пор примененные стратегии Аi, Аk встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих пор стратегии входят пропорционально частотам их применения. Вместо того чтобы вычислять каждый раз средний выигрыш, можно пользоваться просто «накопленным» за предыдущие ходы выигрышем и выбирать ту свою стратегию, при которой этот накопленный выигрыш максимален (минимален). Доказано, что такой метод сходится: при увеличении числа «партий» средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий – к их вероятностям в оптимальных смешанных стратегиях игроком. Продемонстрируем его на примере.

Задана матрица решений:

B1

B2

B3

A1

7

2

9

A2

2

9

0

A3

9

0

11

Начнем с произвольно выбранной стратегии игрока А, – например, со стратегии А3. В таблице приведены первые 15 шагов итерационного процесса по методу Брауна-Робинсона.

В первом столбце дан номер партии (пары выборов) k, во втором – номер i выбранной в данной партии стратегии игрока А. в последующих трех столбцах – «накопленный выигрыш» за первые k партий при трех стратегиях, которые применяли игроки в предыдущих партиях и при стратегиях В1, В2, В3 игрока В в данной партии (получается прибавлением элементов соответствующей строки к тому, что было строкой выше). Из этих накопленных выигрышей в таблице подчеркнут минимальный (если их несколько, подчеркиваются все). Подчеркнутое число определяет ответный выбор игрока В в данной партии – он выбирает ту стратегию, которая соответствует подчеркнутому числу (если их несколько, берется любая). Таким образом определяется номер j оптимальной (в данной партии) стратегии В (ставится в следующем столбце). В последующих трех столбцах дается накопленный выигрыш за к партий соответственно при стратегиях А1, А2, А3 игрока А (получается прибавлением элементов столбца Вj к тому, что было строкой выше). Из этих значений в таблице «надчеркнуто» максимальное; оно определяет выбор стратегии игрока А в следующей партии (строкой ниже). В последних трех столбцах таблицы 2 даны: – нижняя оценка цены игры, равная минимальному накопленному выигрышу, деленному на число партий k; – верхняя оценка цены игры, равная максимальному накопленному выигрышу, деленному на к; v* – среднее арифметическое между ними (оно служит лучшей, чем нижняя и верхняя, приближенной оценкой цены игры).

Как видно, величина v* незначительно колеблется около цены игры v =5. Подсчитаем по таблице 2 частоты р1, р2, p3, q1, q2, q3 стратегий игроков. Получим: р1 = 4/15, р2 = 7/15, p3 = 4/15, q1 = 2/15, q2 = 8/15, q3 = 5/15. К сожалению, сходимость метода Брауна – Робинсона, как показывает опыт, очень медленная. Очень важным преимуществом итерационного метода решения игр является то, что его трудоемкость сравнительно медленно возрастает с увеличением размерности игры, тогда как трудоемкость метода линейного программирования растет при увеличении размерности задачи гораздо быстрее.