- •1. Методы решения злп
- •2. Двойственность в линейном программировании
- •3. Теоремы двойственности
- •4. Анализ решения злп
- •5. Задачи транспортного типа
- •6. Понятие прогноза и прогнозирования. Временные ряды (ряды динамики), их виды. Компоненты временного ряда
- •7. Простейшие методы прогнозирования
- •8. Прогнозирование на основе кривых роста
- •9. Использование возможностей табличного процессора excel при построении прогнозов
- •10. Принципиальная схема межотраслевого баланса
- •11. Применение балансовых моделей в задачах планирования производства
- •12. Применение балансовых моделей при ограничениях на внешние ресурсы
- •13. Понятие игры. Виды игр
- •14. Решение матричных игр в чистых стратегиях (принцип минимакса)
- •15. Понятие смешанной стратегии. Упрощение платежных матриц
- •16. Решение статистических игр
15. Понятие смешанной стратегии. Упрощение платежных матриц
Если платёжная матрица не имеет Седловой точки, то есть a<B, то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении 2 и более стратегий с определёнными частотами. Смешанной стратегией игрока называют вектор, каждая из компонент которого показывает относительную частоту, использования игроком соответствующей чистой стратегии. Обычно смешанную стратегию игрока A обозначают как P, а второго игрока B как вектор Q. Из определения следует, что сумма компонент вектора стратегии равна 1, а сами компоненты неотрицательны.
P=(p1, p2, …, pm), pi>0, i=1
Q=(q1, q2 …, qn), qj>0, j=1
Основная теорема теории игр утверждает, что каждая конечная игра имеет, по крайней мере, 1 решение и возможно оно находится в области смешанных стратегий. Применение игроками оптимальных смешанных стратегий P* и Q* позволяет получить выигрыш равный цене игры j и a<j<ß.
Для игр с платёжными матрицами большой размерности отыскания решения можно несколько упростить, если уменьшить их размерность путём вычёркивания дублирующих и заведомо невыгодных стратегий.
1)Если в матрице игры все элементы строки (столбца) равны соответствующим элементам другой строки (столбца), то соответствующие им стратегии называются дублирующими и одна из них может быть исключена.
2)Если в матрице игры все элементы некоторой строки, определяющей стратегию игрока A не больше (<) соответствующих элементов другой строки, то стратегия игрока A называется заведомо невыгодной и может быть исключена из рассмотрения.
3)Если в матрице игры все элементы некоторого столбца, определяющего стратегию игрока B, не меньше (>) соответствующих элементов другого столбца, то данная стратегия игрока B называется заведомо невыгодной и может быть исключена из платёжной матрицы.
16. Решение статистических игр
Особенности игр с природой:
-
В платёжной матрице нельзя отбрасывать те или иные состояния природы
-
Решение достаточно найти только для игрока A.
-
Смешанные стратегии приобретают смысл только при многократном повторении игры.
Игра с природой задаётся платёжной матрицей, в которой строки соответствуют стратегиям сознательного игрока, а столбцы – состояниям природы. Состояние природы обозначаются как Пj. Для игр с природой часто составляют матрицу рисков. Риск – разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии Ai в тех же условиях. Риск сознательного игрока A при применении им своей стратегии Ai в условиях Пj обозначается как rij. Величина rij рассчитывается по формуле:
rij=Bj-aij
rij>0
Определение наилучшей стратегии сознательного игрока A в игре с природой основано на применении некоторых критериев, которые делятся на 2 группы:
-
Критерии, основанные на известных вероятностях природы
-
Критерии, используемые в условиях полной неопределённости
К критериям первой группы отнесем:
-
Критерий Байеса
Если на основе данных статистических наблюдений известны вероятности состояний природы qj, то оптимальной стратегией игрока A считается та чистая стратегия Ai, которая соответствует максимальному среднему значению выигрыша. a=maxai = max (Ej=1j=naij * gj)
-
Критерий Лапласа
Если игроку A представляется в равной мере правдоподобными все состояния природы, то полагают, что q1=q2=…=qn=1/n. Оптимальной считают чистую стратегию Ai, которая обеспечивает максимальный средний выигрыш aj=maxa1=max(1/n*E j=1 n aij).
Рассмотрим критерии второй группы.
-
Критерий Вальда.
Оптимальной считается та стратегия игрока A, которая гарантирует в наихудших условиях максимальный выигрыш a=max*minaij. Критерий Вальда выражает позицию крайнего пессимизма.
-
Критерий Сэвиджа.
Выбирается та стратегия, которая в наихудших условиях даёт наименьший риск r=min*maxrij.
-
Критерий Гурвица.
Оптимальной считается чистая стратегия Ai
S=max(L*minaij) + (1-L)*maxa ij
Критерий Гурвица называют критерием пессимизма-оптимизма.