
- •Оглавление
- •Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •Оценка операции по нескольким показателям эффективности
- •Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •Геометрическая интерпретация озлп.
- •Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6. Симплекс-метод решения задачи лп
- •7. Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения основной задачи линейного программирования на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного в конечное состояние в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn
- •19. Решение игр mx2
- •20. Решение игр mxn.
19. Решение игр mx2
В игре mx2 мы имеем две m стратегий (A1, A2, …, Аm), а наш противник 2 стратегии (B1, B2). В игре mx2 всегда имеется решение, содержащее не более двух активных стратегий у каждого из игроков, если эти активные стратегии игроков будут найдены, то игры mx2 превращаются в игры 2x2 (описано в вопросе 18).
Правила решения игр mx2:
-
строится графическое изображение игры;
-
выделяется верхняя граница выигрыша, и на ней находится точка оптимума с наибольшей ординатой;
-
определяется пара стратегий, пересекающихся в точке оптимума M. Эти стратегии являются активными стратегиями игрока B. Если в точке оптимума пересекаются более двух стратегий, то в качестве активных стратегий может быть выбрана любая пара из них;
-
решается полученная игра 2x2.
Пример:
Дана матрица стратегий
Решение:
|
B1 |
B2 |
αi |
A1 |
0,4 |
1,0 |
0,4 |
A2 |
0,5 |
0,5 |
0,5 |
A3 |
1,0 |
0,3 |
0,3 |
A4 |
0,8 |
0,3 |
0,3 |
βj |
1,0 |
1,0 |
|
α= 0,5, β= 1,0. Седловой точки нет.
1. Cтроим графическое изображение игры относительно игрока В.
Если А применяет А1, то при использовании игроком В стратегии В1 выигрыш игрока А равен 0,4, а выигрыш А при стратегии В2 равен 1,0, поэтому на перпендикулярах строим такие отрезки. Видно, что стратегия А4 заведомо невыгодная по сравнению со стратегией А3 (выигрыш меньше).
2. Выделяем верхнюю границу выигрыша А3NА1′; точка с наименьшей ординатой – N.
3.
В этой точке пересекаются отрезки А1А1′
и А3А3′, соответствующие активным
стратегиям А1 и А3. Стратегия А2 не является
активной, поэтому из матрицы исключаем
вторую и четвертую строки:
4. решаем игру:
13p3 = 6; p3 = 6/13; p1 = 7/13
q2 = 6/13.
Ответ: γ = 44/65; PA = (7/13; 0; 6/13; 0); QB = (7/13; 6/13).
(γ – стоимость игры)
Примечание: Игроку А не выгодно отклоняться от спектра своих активных стратегий.
20. Решение игр mxn.
Для игр m × n геометрическая интерпретация неприменима. Здесь применяются чисто расчетные методы. Можно показать, что решение любой конечной игры m × n может быть сведено к задаче линейного программирования.
Рассмотрим
игру m
× n.
У игрока A
имеется m
стратегий: A1,
A2,
..., Am;
у игрока B
есть n
стратегий: B1,
B2,
..., Bn.
Такая игра задается матрицей игры m
× n
[aij].
Нужно найти две оптимальные смешанные
стратегии S*A
= (p1,
p2,
..., pm)
и S*B
= (q1,
q2,
..., qn),
где p1,
p2,
..., pm
и q1,
q2,
..., qn
– вероятности применения соответствующих
чистых стратегий A1,
A2,
..., Am
и B1,
B2,
..., Bn
и
,
.
Нахождение S*A. Положим, что цена игры γ положительна, γ ≥ 0. Это всегда можно сделать, добавив ко всем членам матрицы игры достаточно большое положительное число М. При этом решение игры не изменится, а найденную величину γ нужно будет в конце также увеличить на М.
Если мы применяем S*A, а противник – чистую стратегию B j, то наш средний выигрыш будет равен
Так как мы применяем S*A, то наш средний выигрыш не может быть меньше цены игры γ, т. е. a j ≥ γ, j = 1, 2, ..., n, поэтому
(1)
Строки вышеприведенной системы пишутся по столбцам матрицы игры.
Разделим все вышеприведенные неравенства на положительную величину γ и введем обозначения
Тогда система (1) превращается в следующую:
(2)
Так как p1 + p2 + ... + pm = 1, то
Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/ γ принимает минимальное значение.
Таким образом мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения переменных x1, x2, ..., xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию
Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию S*A игрока A.
Нахождение
SB*.
Оптимальная
стратегия
SB*
находится
аналогично.
Разница
заключается в том, что игрок B
стремится не максимизировать, а
минимизировать выигрыш, а значит
максимизировать величину 1γ.
Следовательно,
вместо условий (2)
должны соблюдаться условия
(3)
Требуется так выбрать неотрицательные значения переменных y1, y 2, ..., yn, чтобы они удовлетворяли условиям (3.14) и обращали в максимум линейную функцию
L
=
y1
+
y
2
+
...
+
yn
=
1γ
или, что то же самое, обращали в минимум линейную функцию L′ = −L:
L
′
=
−
y1
−
y
2
−
...
−
yn
=
−
1γ.
Таким образом, любая конечная игра m × n сводится к паре задач линейного программирования.