47. Метод Брауна-Робинсон.

Один из самых простых численных методов решения игр – метод итераций (метод Брауна-Робинсон). Идея его в следующем. Разыгрывается «мысленный эксперимент», в котором стороны А и В поочередно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Начинается он с того, что один из игроков (скажем, А) выбирает произвольно одну из своих стратегий А_i. Противник (В) отвечает ему той из своих стратегий B_j, которая хуже всего для А, т. е. обращает его выигрыш при стратегии А_i в минимум. Дальше снова очередь А — он отвечает В той своей стратегией A_k, которая дает максимальный выигрыш при стратегии Bj противника. Дальше — снова очередь противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии А_к, а для смешанной стратегии, в которой до сих пор примененные стратегии А_i, А_k встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих пор стратегии входят пропорционально частотам их применения. Вместо того чтобы вычислять каждый раз средний выигрыш, можно пользоваться просто «накопленным» за предыдущие ходы выигрышем и выбирать ту свою стратегию, при которой этот накопленный выигрыш максимален (минимален). Доказано, что такой метод сходится: при увеличении числа «партий» средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий – к их вероятностям в оптимальных смешанных стратегиях игроком. Продемонстрируем его на примере.

Задана матрица решений:

	B₁	B₂	B₃
A₁	7	2	9
A₂	2	9	0
A₃	9	0	11

Начнем с произвольно выбранной стратегии игрока А, – например, со стратегии А₃. В таблице приведены первые 15 шагов итерационного процесса по методу Брауна-Робинсона.

В первом столбце дан номер партии (пары выборов) k, во втором – номер i выбранной в данной партии стратегии игрока А. в последующих трех столбцах – «накопленный выигрыш» за первые k партий при трех стратегиях, которые применяли игроки в предыдущих партиях и при стратегиях В₁, В₂, В₃ игрока В в данной партии (получается прибавлением элементов соответствующей строки к тому, что было строкой выше). Из этих накопленных выигрышей в таблице подчеркнут минимальный (если их несколько, подчеркиваются все). Подчеркнутое число определяет ответный выбор игрока В в данной партии – он выбирает ту стратегию, которая соответствует подчеркнутому числу (если их несколько, берется любая). Таким образом определяется номер j оптимальной (в данной партии) стратегии В (ставится в следующем столбце). В последующих трех столбцах дается накопленный выигрыш за к партий соответственно при стратегиях А₁, А₂, А₃ игрока А (получается прибавлением элементов столбца В_j к тому, что было строкой выше). Из этих значений в таблице «надчеркнуто» максимальное; оно определяет выбор стратегии игрока А в следующей партии (строкой ниже). В последних трех столбцах таблицы 2 даны: – нижняя оценка цены игры, равная минимальному накопленному выигрышу, деленному на число партий k; – верхняя оценка цены игры, равная максимальному накопленному выигрышу, деленному на к; v* – среднее арифметическое между ними (оно служит лучшей, чем нижняя и верхняя, приближенной оценкой цены игры).

Как видно, величина v* незначительно колеблется около цены игры v =5. Подсчитаем по таблице 2 частоты р₁, р₂, p₃, q₁, q₂, q₃ стратегий игроков. Получим: р₁ = 4/15, р₂ = 7/15, p₃ = 4/15, q₁ = 2/15, q₂ = 8/15, q₃ = 5/15. К сожалению, сходимость метода Брауна – Робинсона, как показывает опыт, очень медленная. Очень важным преимуществом итерационного метода решения игр является то, что его трудоемкость сравнительно медленно возрастает с увеличением размерности игры, тогда как трудоемкость метода линейного программирования растет при увеличении размерности задачи гораздо быстрее.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 1718 / 2118 19 20 21 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
17.08.20191.28 Mб26ТК, Еферова А.Р., Кердяшева О.В..doc
#
01.07.20251.46 Mб0ТМ.docx
#
01.07.2025102.45 Кб0топография.docx
#
12.04.201577.31 Кб58Торгово-товаровед.doc
#
01.05.2025402.94 Кб1ТП мет.бак 2913.doc
#
16.09.20191.99 Mб64ТПР - мой вариант.docx
#
01.07.20256.56 Mб0транспорт и хранение(1).doc
#
12.04.2015830.98 Кб56транспортнная задача1.doc
#
12.04.201565.54 Кб50Тренинг продаж эффективного сервиса.doc
#
10.11.2019936.89 Кб37Тренинги!!!.rtf
#
12.04.20159.46 Mб37ТРЁХМЕРНОЕ МОДЕЛИРОВАНИЕ.doc