- •1) Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •1) Детерминированный случай
- •2) Оптимизация решений в условиях неопределенности
- •2) Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •3) Оценка операции по нескольким показателям.
- •3) Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •4) Геометрическая интерпретация озлп.
- •Анализ положения l относительно одр.
- •Дадим геометрическую интерпретацию поиска оптимального решения.
- •Тогда (x1*, x2*, …, xn*) – оптимальное решение
- •Некоторые выводы
- •5) Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6) Симплекс-метод решения задачи лп.
- •7) Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения задачи лп на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn.
- •19. Решение игр mх2.
- •20. Решение игр mxn.
- •3.2. Элементы теории статистических решений
13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
Рассмотрим игру (модель конфликтной ситуации), в которой участвуют два игрока A и B, имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a, то игрок B при этом выигрывает −a, поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока. При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m возможных стратегий A1, A2, …, Am, а у игрока B – n возможных стратегий B1, B2, …, Bn. Пусть также известны величины aij – выигрыши игрока A при использовании Ai с его стороны и Bj со стороны противника. Тогда игра, называемая игрой m×n, может быть представлена таблицей, называемой платежной матрицей Bj или просто матрицей игры (табл. 1).
Таблица 1
|
Bj |
|||
Ai |
B1 |
B2 |
… |
Bn |
A1 |
… |
|||
A2 |
… |
|||
… |
… |
… |
… |
… |
Am |
… |
Приведение игры к матричной форме может само по себе составить трудную задачу, однако таким путем многоходовая игра фактически сводится к одноходовой – от игрока требуется сделать только один ход: выбрать подходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.
14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
По платежной матрице (см. предыдущий вопрос) игры определяется нижняя α и верхняя β цены игры. Допустим, что (выбираем минимальное число в строке, записываем их рядом и у нас получается столбец из минимальных значений), (выбираем максимальное число в столбце – строка из максимальных), тогда
(из выписанных сбоку в столбец минимальных значений ищем максимальное)
(из выписанных снизу в строку максимальных значений ищем минимальное)
Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α=β. Тогда у матрицы есть седловая точка (это месторасположение совпавшего числа (чистой стратегии) в матрице аля (2,3) – то есть вторая строка третий столбец). а величина 𝛄=α=β называется ценой игры. Стратегии Ai и Bj, при которых достигается выигрыш 𝛄, называются оптимальными чистыми стратегиями, а их совокупность – решением игры.
Возможно, еще подойдет первая часть решения задачи из пункта 3.2 (она будет в самом конце).