
- •25. Процесс принятия решений: этапы, участники, основные задачи принятия решений.
- •26. Бинарные отношения. Операции над отношениями. Свойства бинарных отношений.
- •27. Бинарные отношения. Виды бинарных отношений. R-оптимальность.
- •28. Функции выбора. Логические формы функций выбора.
- •29. Функции выбора. Нормальные функции выбора.
- •30. Критериальное пространство. Бинарные отношения в критериальном пространстве.
- •31. Методы многокритериальной оптимизации. Метод линейной свертки
- •32. Методы многокритериальной оптимизации. Метод идеальной точки.
- •33. Методы многокритериальной оптимизации. Выбор с учетом числа доминирующих критериев.
- •34. Метод многокритериальной оптимизации. Метод анализа иерархий
- •35. Основная задача линейного программирования. Методы решений.
- •36. Двойственные задачи линейного программирования.
- •37. Транспортная задача.
- •38. Задача о назначении.
- •39. Динамическое программирование. Задача о замене оборудования.
- •40. Динамическое программирование. Мультипликативная задача.
- •41. Принятие решений в условиях полной неопределенности, в условиях риска
- •42. Принятие решений в условиях конфликта (Элементы теории игр). Основные понятия.
- •43. Задачи теории игр. Классификация игр.
- •44. Матричные игры. Решение матричной игры в чистых стратегиях. Смешанные стратегии.
- •45. Матричные игры. Сведение матричной игры к задаче линейного программирования.
- •46. Графоаналитические методы решения матричных игр.
- •47. Метод Брауна-Робинсон.
- •48. Методы экспертных оценок. Множества оценок экспертов.
- •49. Методы экспертных оценок. Типы шкал для измерения критериев.
- •Шкалы качественных признаков
- •Шкалы количественных признаков.
- •50. Методы обработки экспертной информации.
47. Метод Брауна-Робинсон.
Один из самых простых численных методов решения игр – метод итераций (метод Брауна-Робинсон). Идея его в следующем. Разыгрывается «мысленный эксперимент», в котором стороны А и В поочередно применяют друг против друга свои стратегии, стремясь выиграть побольше (проиграть поменьше). Эксперимент состоит из ряда «партий» игры. Начинается он с того, что один из игроков (скажем, А) выбирает произвольно одну из своих стратегий Аi. Противник (В) отвечает ему той из своих стратегий Bj, которая хуже всего для А, т. е. обращает его выигрыш при стратегии Аi в минимум. Дальше снова очередь А — он отвечает В той своей стратегией Ak, которая дает максимальный выигрыш при стратегии Bj противника. Дальше — снова очередь противника. Он отвечает нам той своей стратегией, которая является наихудшей не для последней, примененной нами, стратегии Ак, а для смешанной стратегии, в которой до сих пор примененные стратегии Аi, Аk встречаются с равными вероятностями. И так далее: на каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оптимальной для него относительно смешанной стратегии другого, в которую все примененные до сих пор стратегии входят пропорционально частотам их применения. Вместо того чтобы вычислять каждый раз средний выигрыш, можно пользоваться просто «накопленным» за предыдущие ходы выигрышем и выбирать ту свою стратегию, при которой этот накопленный выигрыш максимален (минимален). Доказано, что такой метод сходится: при увеличении числа «партий» средний выигрыш на одну партию будет стремиться к цене игры, а частоты применения стратегий – к их вероятностям в оптимальных смешанных стратегиях игроком. Продемонстрируем его на примере.
Задана матрица решений:
|
B1 |
B2 |
B3 |
A1 |
7 |
2 |
9 |
A2 |
2 |
9 |
0 |
A3 |
9 |
0 |
11 |
Начнем с произвольно выбранной стратегии игрока А, – например, со стратегии А3. В таблице приведены первые 15 шагов итерационного процесса по методу Брауна-Робинсона.
В первом столбце дан номер партии (пары выборов) k, во втором – номер i выбранной в данной партии стратегии игрока А. в последующих трех столбцах – «накопленный выигрыш» за первые k партий при трех стратегиях, которые применяли игроки в предыдущих партиях и при стратегиях В1, В2, В3 игрока В в данной партии (получается прибавлением элементов соответствующей строки к тому, что было строкой выше). Из этих накопленных выигрышей в таблице подчеркнут минимальный (если их несколько, подчеркиваются все). Подчеркнутое число определяет ответный выбор игрока В в данной партии – он выбирает ту стратегию, которая соответствует подчеркнутому числу (если их несколько, берется любая). Таким образом определяется номер j оптимальной (в данной партии) стратегии В (ставится в следующем столбце). В последующих трех столбцах дается накопленный выигрыш за к партий соответственно при стратегиях А1, А2, А3 игрока А (получается прибавлением элементов столбца Вj к тому, что было строкой выше). Из этих значений в таблице «надчеркнуто» максимальное; оно определяет выбор стратегии игрока А в следующей партии (строкой ниже). В последних трех столбцах таблицы 2 даны: – нижняя оценка цены игры, равная минимальному накопленному выигрышу, деленному на число партий k; – верхняя оценка цены игры, равная максимальному накопленному выигрышу, деленному на к; v* – среднее арифметическое между ними (оно служит лучшей, чем нижняя и верхняя, приближенной оценкой цены игры).
Как видно, величина v* незначительно колеблется около цены игры v =5. Подсчитаем по таблице 2 частоты р1, р2, p3, q1, q2, q3 стратегий игроков. Получим: р1 = 4/15, р2 = 7/15, p3 = 4/15, q1 = 2/15, q2 = 8/15, q3 = 5/15. К сожалению, сходимость метода Брауна – Робинсона, как показывает опыт, очень медленная. Очень важным преимуществом итерационного метода решения игр является то, что его трудоемкость сравнительно медленно возрастает с увеличением размерности игры, тогда как трудоемкость метода линейного программирования растет при увеличении размерности задачи гораздо быстрее.