
- •Проблема размерности в динамическом программировании.
- •Задача управления запасами.
- •Типы моделей управления запасами.
- •Детерминированные модели управления запасами.
- •1.Детерминированная обобщённая модель определения оптимального размера партии продукции при допущении дефицита.
- •Д инамические модели управления запасами.
- •Модель управления запасами при вероятностном стационарном спросе и мгновенных поставках.
- •Элементы теории игр.
- •Парная игра с нулевой суммой. Платежная матрица.
- •Решение игры среди чистых стратегий. Рассмотрим игру с платёжной матрицей:
- •Решение и геометрическая интерпретация игры (2x2).
- •Решение игры (2хn) и (mx2).
Решение и геометрическая интерпретация игры (2x2).
Если игра (2х2) имеет
седловую точку, то ее решение очевидно.
Пусть игра без седловой точки с платежной
матрицей (aij)2x2.
Требуется найти оптимальные смешанные
стратегии игроков
и
и цену игры .
В игре (2х2) без седловой точки обе
стратегии игроков являются активными.
Поэтому в соответствии с теоремой об
активных стратегиях, если игрок А будет
применять свою оптимальную смешанную
стратегию, то независимо от действия
игрока В, выигрыш его будет равен цене
игры .
Пусть игрок А
использует стратегию
,
а игрок В – стратегию В1.
Тогда выигрыш игрока А определяется из
уравнения
.
Если же игрок В будет применять стратегию В2, то выигрыш игрока А не изменится и будет определяться равенством
.
Принимая во внимание
условие
,
можно записать систему уравнений с
тремя неизвестными величинами:
,
, (1)
.
Решив эту систему
уравнений, находим оптимальную смешанную
стратегию
игрока А, т.е.
и
.
Аналогично
определяется оптимальная стратегия
игрока В из системы уравнений:
,
,
(2)
.
В результате
решения системы уравнений (2) находятся
вероятности
и
,
т.е. оптимальная стратегия
.
Игра (2х2) допускает простую геометрическую интерпретацию. Для этого в системе координат хОу на оси абсцисс откладывается отрезок А1,А2, равный единице, и через концы этого отрезка проводятся перпендикулярные к оси абсцисс прямые, на которых откладываются выигрыши игрока А (рис.1).
Л
евый
перпендикуляр, совпадающий с осью
ординат, соответствует стратегии А1,
для которой Р1=1,
Р2=0,
а правый равен стратегии А2,
для которой Р1=0,
Р2=1.
При применении игроком В стратегии В1
выигрыш будет а11,
если игрок А использует стратегию А1,
и будет а21,
если он применяет стратегию А2.
Отложив отрезки, равные а11
и а21
на соответствующих перпендикулярах
получим две точки: В1
соответствующий стратегии А1
и В1
соответствующий стратегии А2.
Ордината любой точки отрезка В1В2
равна величине выигрыша игрока А при
применении им стратегии А1
и А2
с вероятностями Р1
и Р2.
Если игрок В применяет стратегию В2, то выигрыш игрока А равен а12 при использовании стратегии А1, и а22 – стратегии А2. Ординаты точек, лежащие на отрезке В2В2, равны среднему выигрышу игрока А, если он применяет стратегии А1 и А2 с вероятностями Р1 и Р2, а противник -–стратегию В2.
Для нахождения оптимальной стратегии построим нижнюю границу выигрыша игрока А, т.е. ломаную В2NB1, отмеченную на рис.1 линией. Очевидно, что на этой ломанной лежат минимальные выигрыши игрока А при использовании им любой смешанной стратегии.
Оптимальное решение
игры определяет точка N,
в которой выигрыш игрока А принимает
наибольшее значение (проигрыш игрока
В наименьшее значение) равный цене игры
.
Проекция этой точки на ось абсцисс
соответствует оптимальной стратегии
,
при этом расстояния от точки
до концов единичного отрезка на оси
абсцисс равны вероятностям
и
.
Оптимальная
стратегия
игрока В находится аналогично. Для этого
необходимо поменять местами игроков А
и В. (см. рис.2)
Н
а
рис.1 и 2 решение игры определялось точкой
пересечения стратегий, однако это
справедливо не всегда. Так, например на
рис.3 показан случай, когда нижняя граница
выигрыша игрока А совпадает с отрезком
В2В2,
т.е. стратегия В1
для игрока В заведомо не выгодная. Здесь
,
игра имеет седловую точку.
На рис.4 показан
случай, в котором
,
.
Игра имеет седловую точку.