- •1) Методы принятия оптимальных решений. Математические модели операции: детерминированный случай, оптимизация решений в условиях неопределенности.
- •1) Детерминированный случай
- •2) Оптимизация решений в условиях неопределенности
- •2) Методы принятия оптимальных решений. Оценка операции по нескольким показателям.
- •3) Оценка операции по нескольким показателям.
- •3) Основная задача линейного программирования (озлп). Допустимые решения и оптимальное решение задачи лп.
- •4) Геометрическая интерпретация озлп.
- •Анализ положения l относительно одр.
- •Дадим геометрическую интерпретацию поиска оптимального решения.
- •Тогда (x1*, x2*, …, xn*) – оптимальное решение
- •Некоторые выводы
- •5) Задача лп с ограничениями-неравенствами. Переход от нее к основной задаче.
- •6) Симплекс-метод решения задачи лп.
- •7) Табличный алгоритм замены переменных.
- •8. Отыскание опорного решения задачи лп на основе табличного алгоритма замены переменных.
- •9. Отыскание оптимального решения задачи лп на основе табличного алгоритма замены переменных.
- •10. Метод динамического программирования (дп). Алгоритм решения задач управления состоянием организма в биотехнических системах. Основное рекуррентное уравнение дп.
- •11. Управление переходом организма из исходного в конечное состояние методом дп: использование ориентированного графа.
- •12. Управление переходом организма из исходного состояния в конечное в условиях неопределенности.
- •13. Игровые методы обоснования решений. Основные понятия теории игр. Платежная матрица.
- •14. Нижняя и верхняя цена игры. Принцип минимакса. Решение игры в чистых стратегиях.
- •15. Решение игры в смешанных стратегиях.
- •16. Игры 2х2 и их решение.
- •17. Геометрическая интерпретация решений игры 2х2.
- •18. Решение игр 2хn.
- •19. Решение игр mх2.
- •20. Решение игр mxn.
- •3.2. Элементы теории статистических решений
19. Решение игр mх2.
Все тоже самое пишем, как для 2xn. Но заменяем следующее
Решение игры mx2 осуществляется аналогично. Но в этом случае строится графическое изображение игры для игрока В и выделяется не нижняя, а верхняя граница выигрыша, и на ней находится точка оптимума с наименьшей ординатой (минимакс).
ОЧЕНЬ ПРИКОЛЬНАЯ ФИГНЯ МОЖНО ЗАФИГАЧИТЬ В КОНЕЦ КАК ИТОГ
ДЛЯ NX2
-
строится графическое изображение игры;
-
выделяется нижняя граница выигрыша и находится наибольшая ордината нижней границы, которая равна цене игры γ;
-
определяется пара стратегий, пересекающихся в точке оптимума M. Эти стратегии являются активными стратегиями игрока B. Если в точке оптимума пересекаются более двух стратегий, то в качестве активных стратегий может быть выбрана любая пара из них;
-
решается полученная игра 2x2.
Решение игры mx2 осуществляется аналогично. Вместо пункта 2 применяется:
2. Выделяется верхняя граница выигрыша, и на ней находится точка оптимума с наименьшей ординатой.
КАК У НЕЕ В МЕТОДЕ, НО ДЛЯ НАШЕГО СЛУЧАЯ
Игры mx2 можно легко решить с помощью геометрического способа. Они задаются матрицей игры (табл.1), а на рис.1 показана геометрическая интерпретация этой игры для случая m=4.
Таблица 1
Ai |
Bj |
|
B1 |
B2 |
|
A1 |
a11 |
a12 |
A2 |
a21 |
a22 |
……… |
||
Am |
am1 |
am2 |
Рисунок 1
Геометрическое построение осуществляется так же, как и для игры 2х2, только число наклонных линий получается равным m, по числу стратегий для игрока A. Нижняя граница игры может быть сложной ломанной линией, максимум которой определяет решение игры.
Из рис.1 нижняя граница выигрыша А2NMА1, ее минимум достигается в точке N, которая определяет оптимальную стратегию . Стратегия A3 вообще может не рассматриваться как заведомая невыгодная игроку A, а значения q1 и q2 можно найти по формулам игры 2х2, учитывая, что в точке N активных стратегий игрока А только две, А2 и А4.
20. Решение игр mxn.
Нельзя применять геометрическую интерпретацию.
Применяются чисто расчетные методы.
Решение любой игры mxn может быть сведено к задаче линейного программирования.
Допустим у игрока А имеется m стратегий (A1, A2, …, Am), у игрока B есть n стратегий: B1, B2, B3. Игра задается матрицей mxn . Мы ищем две оптимальные смешанные стратегии и , где p1, p2, …, pm и q1, q2, …, qn – вероятности применения соответствующих стратегий A1, A2, …, Am и B1, B2, …, Bn и .
Для нахождения полагаем, что цена игры 𝛄 положительна (𝛄 ≥ 0). Если есть отрицательные члены, то мы добавляем к ним достаточно большое положительное число М (также можно умножить). На решение игры это не влияет, но в конце важно не забыть провести обратные действия с ценой игры (если прибавили вычесть, если умножили разделить) – нее написано прибавить, но потом в примере (который на стр.87) вычитают, так что делаем выводы. а вообще можно написать так: Тогда цена игры увеличится на М, а вероятности останутся теми же.
Когда мы применяем , а противник – чистую стратегию Bj, то наш средний выигрыш будет равен
Так как мф применяем , то наш средний выигрыш не может быть меньше цены игры 𝛄, т.е. aj>𝛄, j = 1, 2, …, n, поэтому
………………
(1)
СТРОКИ ВЫШЕПЕРЕЧИСЛЕННОЙ СИСТЕМЫ ПИШЕТСЯ ПО СТОЛБЦАМ МАТРИЦЫ ИГРЫ
Разделим все получившиеся на положительную величину 𝛄 и введем обозначения
x1 = p1/𝛄, x2 = p2/𝛄, …, xm = pm/𝛄.
Тогда система (1) превращается в следующую
………………
(2)
Так как р1+р2+…+pm=1, то
x1+x2+…+xm=1/𝛄.
Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/𝛄 принимает минимальное значение.
Мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения x1, x2, …, xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию
L = x1+x2+…+xm
Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию игрока А.
Нахождение . Оптимальная стратегия находится аналогично. Разница заключается в том, что игрок В стремится не максимизировать, а минимизировать выигрыш, а значить максимизировать величину 1/𝛄. Следовательно, вместо условий (2) должны соблюдаться условия
………………
(3)
где yj = qj/ 𝛄, j = 1, 2, …, n.
Требуется так выбрать неотрицательные значения переменных y1, y2, …, yn, чтобы они удовлетворяли условиям (3) и обращали в максимум линейную функцию
L = y1 + y2 + … + yn = 1/𝛄
или, что то же самое, обращали в минимум линейную функцию
L =y1 y2 … yn = 1/𝛄
Таким образом, любая конечная игра nxm сводится к задачам линейного программирования.
Возможно, сюда еще надо будет вписать первую часть (теорию) из пункта 3.2., который идет дальше