- •Оглавление
- •Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •Оценка операции по нескольким показателям эффективности
- •Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •Геометрическая интерпретация озлп.
- •Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6. Симплекс-метод решения задачи лп
- •7. Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения основной задачи линейного программирования на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного в конечное состояние в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn
- •19. Решение игр mx2
- •20. Решение игр mxn.
19. Решение игр mx2
В игре mx2 мы имеем две m стратегий (A1, A2, …, Аm), а наш противник 2 стратегии (B1, B2). В игре mx2 всегда имеется решение, содержащее не более двух активных стратегий у каждого из игроков, если эти активные стратегии игроков будут найдены, то игры mx2 превращаются в игры 2x2 (описано в вопросе 18).
Правила решения игр mx2:
-
строится графическое изображение игры;
-
выделяется верхняя граница выигрыша, и на ней находится точка оптимума с наибольшей ординатой;
-
определяется пара стратегий, пересекающихся в точке оптимума M. Эти стратегии являются активными стратегиями игрока B. Если в точке оптимума пересекаются более двух стратегий, то в качестве активных стратегий может быть выбрана любая пара из них;
-
решается полученная игра 2x2.
Пример:
Дана матрица стратегий
Решение:
|
B1 |
B2 |
αi |
A1 |
0,4 |
1,0 |
0,4 |
A2 |
0,5 |
0,5 |
0,5 |
A3 |
1,0 |
0,3 |
0,3 |
A4 |
0,8 |
0,3 |
0,3 |
βj |
1,0 |
1,0 |
|
α= 0,5, β= 1,0. Седловой точки нет.
1. Cтроим графическое изображение игры относительно игрока В.
Если А применяет А1, то при использовании игроком В стратегии В1 выигрыш игрока А равен 0,4, а выигрыш А при стратегии В2 равен 1,0, поэтому на перпендикулярах строим такие отрезки. Видно, что стратегия А4 заведомо невыгодная по сравнению со стратегией А3 (выигрыш меньше).
2. Выделяем верхнюю границу выигрыша А3NА1′; точка с наименьшей ординатой – N.
3. В этой точке пересекаются отрезки А1А1′ и А3А3′, соответствующие активным стратегиям А1 и А3. Стратегия А2 не является активной, поэтому из матрицы исключаем вторую и четвертую строки:
4. решаем игру:
13p3 = 6; p3 = 6/13; p1 = 7/13
q2 = 6/13.
Ответ: γ = 44/65; PA = (7/13; 0; 6/13; 0); QB = (7/13; 6/13).
(γ – стоимость игры)
Примечание: Игроку А не выгодно отклоняться от спектра своих активных стратегий.
20. Решение игр mxn.
Для игр m × n геометрическая интерпретация неприменима. Здесь применяются чисто расчетные методы. Можно показать, что решение любой конечной игры m × n может быть сведено к задаче линейного программирования.
Рассмотрим игру m × n. У игрока A имеется m стратегий: A1, A2, ..., Am; у игрока B есть n стратегий: B1, B2, ..., Bn. Такая игра задается матрицей игры m × n [aij]. Нужно найти две оптимальные смешанные стратегии S*A = (p1, p2, ..., pm) и S*B = (q1, q2, ..., qn), где p1, p2, ..., pm и q1, q2, ..., qn – вероятности применения соответствующих чистых стратегий A1, A2, ..., Am и B1, B2, ..., Bn и , .
Нахождение S*A. Положим, что цена игры γ положительна, γ ≥ 0. Это всегда можно сделать, добавив ко всем членам матрицы игры достаточно большое положительное число М. При этом решение игры не изменится, а найденную величину γ нужно будет в конце также увеличить на М.
Если мы применяем S*A, а противник – чистую стратегию B j, то наш средний выигрыш будет равен
Так как мы применяем S*A, то наш средний выигрыш не может быть меньше цены игры γ, т. е. a j ≥ γ, j = 1, 2, ..., n, поэтому
(1)
Строки вышеприведенной системы пишутся по столбцам матрицы игры.
Разделим все вышеприведенные неравенства на положительную величину γ и введем обозначения
Тогда система (1) превращается в следующую:
(2)
Так как p1 + p2 + ... + pm = 1, то
Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/ γ принимает минимальное значение.
Таким образом мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения переменных x1, x2, ..., xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию
Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию S*A игрока A.
Нахождение SB*. Оптимальная стратегия SB* находится аналогично. Разница заключается в том, что игрок B стремится не максимизировать, а минимизировать выигрыш, а значит максимизировать величину 1γ. Следовательно, вместо условий (2) должны соблюдаться условия
(3)
Требуется так выбрать неотрицательные значения переменных y1, y 2, ..., yn, чтобы они удовлетворяли условиям (3.14) и обращали в максимум линейную функцию
L = y1 + y 2 + ... + yn = 1γ
или, что то же самое, обращали в минимум линейную функцию L′ = −L:
L ′ = − y1 − y 2 − ... − yn = − 1γ.
Таким образом, любая конечная игра m × n сводится к паре задач линейного программирования.