- •Оглавление
- •Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •Оценка операции по нескольким показателям эффективности
- •Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •Геометрическая интерпретация озлп.
- •Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6. Симплекс-метод решения задачи лп
- •7. Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения основной задачи линейного программирования на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного в конечное состояние в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn
- •19. Решение игр mx2
- •20. Решение игр mxn.
15. Решение игры в смешанных стратегиях.
Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.
Рассмотрим игру (модель конфликтной ситуации), в которой участвует два игрока A и B, имеющие прямо противоположные интересы.
Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока.
При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m возможных стратегий A1, A2…Am, а у игрока B – n возможных стратегий B1, B2…Bn. Пусть также известны величины aij – выигрыши игрока A при использовании Ai с его стороны и Bi со стороны противника.
Тогда игра, называемая игрой m×n, может быть представлена таблицей, называемой платежной матрицей или просто матрицей игры.
По матрице игры определяются нижняя α и верхняя β цены игры.
Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Известно, что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α = β.
В случае α ≠ β для получения наибольшего выигрыша игроку выгодно применять не одну (чистую) стратегию, а чередовать случайным образом несколько стратегий.
Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются смешанными и задаются соответствующими вероятностными векторами.
Пусть SA - смешанная стратегия игрока A, а SB - смешанная стратегия игрока B. Тогда SA =(p1, p2… pm), SB =(q1, q2… qn), где pi - вероятность применения игроком A стратегии Ai, qi - вероятность применения игроком B стратегии Bi, причем
Чистая стратегия – частный случай смешанной.
Если допустить применение смешанных стратегий, то для каждой конечной игры можно найти хотя бы одно решение, т.е. пару устойчивых оптимальных стратегий игроков (SA*, SB*), обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступить от своей.
Выигрыш, соответствующий решению, называется ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α ≤ γ ≤ β.
α – нижняя цена игры
γ – выигрыш
β – верхняя цена игры
Рассмотрим игру 2×2.
Ее матрица имеет вид:
Если в матрице 2×2 седловой точки нет и α ≠ β, то необходимо искать решение в смешанных стратегиях.
Пара оптимальных смешанных стратегий SA = (p1, p2), SB = (q1, q2), и цена игры в этом случае определяются по формулам:
Игра 2×2 и ее решение имеют простую геометрическую интерпретацию.
Пусть точки A1 и A2 соответствуют применению одноименных стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии SA *= (p1, p2).
Рисунок 1 – геометрическая интерпретация задачи 2×2
Ординаты прямой B1B1, проведенной так, как показано на рис.1, соответствуют выигрышу игрока A при применении им любой стратегии (чистой или смешанной) при условии, что B применяет B1. Прямая B2B2 также отражает выигрыш игрока A в случае, когда B применяет B2. Жирной линией отмечена нижняя граница выигрыша B1NB2 – минимальный выигрыш игрока A при любой его смешанной стратегией. Очевидно, решение достигается в точке максимума нижней границы (на рис.1 в точке N). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях.
По рисунку легко находятся α, β, γ и проводится анализ игры.
Геометрическим способом также легко анализируются и решаются игры 2×n.
Они задаются матрицей игры:
Например, геометрическая интерпретация игры 2×4, в которой число наклонных линий получается равным 4, по числу стратегий игрока B. имеет вид:
Рисунок 2 – геометрическая интерпретация задачи 2×4
Нижняя граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.
Т.е. находим, самую нижнюю кривую и самая верхняя точка пересечения в этой кривой и есть решение игры.
Из рис. 2 видно, что нижняя граница выигрыша – прямая B1MNB2, ее максимум достигается в точке N, которая определяет оптимальную стратегию SA *= (p1, p2). Следует отметить, что стратегия B3 вообще может не рассматриваться как заведомо невыгодная игроку B, а значения p1 и p2 можно найти по формулам игры 2×2, учитывая, что в точке N активных стратегий игрока B только две B2 и B4.