
- •По курсу
- •Для студентов специальности 080801
- •Таганрог 2007
- •1. Линейное программирование (лп)
- •1.1. Формы представления задач лп
- •1.2. Графический метод решения задачи лп
- •1.3. Симплекс-метод решения задачи лп
- •1.4. Двойственные задачи лп
- •1.5. Транспортная задача
- •2. Некоторые принципы принятия решений в задачах исследования операций
- •2.1. Задачи принятия решений. Определение
- •Полезности
- •2.2. Однокритериальные задачи принятия решений
- •2.3. Многокритериальные задачи принятия решений
- •3. Игровые методы принятия решений
- •3.1. Игры в матричной форме. Решение матричных антагонистических игр в чистых стратегиях
- •3.2. Решение матричных антагонистических игр в смешанных стратегиях
- •3.3. Игры в позиционной форме
- •3.4. Неантагонистические игры (некооперативный вариант)
- •4. Модели управления запасами
- •4.1. Детерминированные статические модели
- •4.2. Детерминированные динамические модели
- •Библиографический список
- •Содержание
- •1.1. Формы представления задач лп……………..………….……..3
- •Математические методы и модели исследования операций
3.2. Решение матричных антагонистических игр в смешанных стратегиях
В случае антагонистических игр без седловой точки используют смешанные стратегии.
Смешанная стратегия 1-го игрока
где xi
– вероятность использования стратегии
αi,
Смешанная стратегия 2-го игрока
где yj
– вероятность использования стратегии
βj,
Для данной смешанной стратегии активными называют те чистые стратегии, которые входят в эту смешанную стратегию с ненулевыми вероятностями.
Если в игре с платежной матрицей A 1-й игрок использует смешанную стратегию X, а 2-й – чистую стратегию βj, то математическое ожидание выигрыша 1-го игрока будет равно
Если 1-й игрок использует чистую стратегию αi, а 2-й – смешанную стратегию Y, то математическое ожидание проигрыша 2-го игрока будет равно
Если оба игрока используют смешанные стратегии X и Y, то математическое ожидание выигрыша 1-го игрока, равное математическому ожиданию проигрыша 2-го игрока, будет равно
Как и для игр с седловой точкой при выборе наилучшей смешанной стратегии используются принципы осторожности и уравновешенности.
Принцип осторожности приводит к понятию защитной смешанной стратегии. Для выбора защитной смешанной стратегии 1-й игрок использует критерий максимина, а 2-й игрок – критерий минимакса.
Смешанная стратегия
X0=
,
максимизирующая средний гарантированный
выигрыш 1-го игрока, т.е. выбранная в
соответствии с максиминным критерием
называется защитной смешанной стратегией 1-го игрока.
Смешанная стратегия
Y0=
,
минимизирующая средний гарантированный
проигрыш 2-го игрока, т.е. выбранная в
соответствии с минимаксным критерием
называется защитной смешанной стратегией 2-го игрока.
Достигаемый при использовании защитной стратегии X0 максимум гарантированного выигрыша 1-го игрока
называется нижней ценой игры (в классе смешанных стратегий).
Достигаемый при использовании защитной стратегии Y0 минимум гарантированного проигрыша 2-го игрока
называется верхней ценой игры (в классе смешанных стратегий).
Защитные смешанные стратегии существуют всегда. Их можно искать различными способами. Для игр размером 2×n или m×2 пригоден графический метод.
Пусть задана игра с платежной матрицей размера 2×n
Алгоритм определения защитных смешанных стратегий графическим методом заключается в следующем:
1. На концах единичного отрезка восстанавливают два перпендикуляра (левый перпендикуляр соответствует стратегии α2, правый перпендикуляр – стратегии α1).
2. Для стратегии
на левом перпендикуляре откладывают
величину a2j,
на правом перпендикуляре – величину
a1j,
полученные точки соединяют отрезком
прямой. В результате получают n
прямых, представляющих собой графики
зависимостей
3. Находят нижнюю
границу множества n
прямых (обычно ее выделяют на графике
штриховкой), т.е.
.
4. Находят точку
единичного отрезка, при которой нижняя
граница достигает максимума, т.е.
.
Эта точка соответствует искомой смешанной
стратегии X0,
высота максимума дает при этом значение
нижней цены игры u.
5. Определяют две
чистых стратегии 2-го игрока βl
и βk,
являющиеся его активными
стратегиями (это стратегии, для которых
пересечение графиков зависимостей
и
определяет точку максимума нижней
границы). Таким образом, игра 2×n
сводится к игре 2×2.
6. От матрицы A размера 2×n переходят к матрице A′ размера 2×2 следующего вида:
где
.
7. На концах
единичного отрезка восстанавливают
два перпендикуляра (левый перпендикуляр
соответствует стратегии
,
правый перпендикуляр – стратегии
).
8. Строят графики
зависимостей
и
.
9. Находят верхнюю
границу этих прямых (ее также выделяют
на графике штриховкой), т.е.
.
10. Находят точку
единичного отрезка, при которой верхняя
граница достигает минимума, т.е.
.
Эта точка соответствует искомой смешанной
стратегии Y0,
высота минимума дает при этом значение
верхней цены игры v.
По аналогичной методике может быть решена игра m×2: определяется защитная смешанная стратегия 2-го игрока, находятся активные стратегии 1-го игрока, игра m×2 сводится к игре 2×2, определяется защитная смешанная стратегия 1-го игрока.
Графический метод
в общем случае позволяет найти лишь
приближенное значение
,
i
= 1,2;
,
j
= 1,2, которые затем надо уточнить
аналитически.
Аналитический метод определения защитных смешанных стратегий применим для игр размера 2×2. Для платежной матрицы A такой игры
максимум минимального
(гарантированного) выигрыша для 1-го
игрока достигается при выполнении
.
К этому соотношению добавляется еще
условие нормировки
.
Таким образом, защитная смешанная
стратегия X0
является решением системы уравнений
При этом
.
Аналогично, для 2-го игрока защитная смешанная стратегия Y0 является решением системы уравнений
При этом
Для определения защитных смешанных стратегий в случае игр размерности m×n, где m >2, n >2, применяют метод, основанный на сведении игры к задаче ЛП.
Предварительно (в случае необходимости) платежная матрица A должна быть преобразована к виду, чтобы все ее элементы были положительны. Этого можно добиться, прибавляя ко всем элементам матрицы одно и то же положительное число K, т.е.
При этом цена игры увеличится на K, т.е.
а пара защитных смешанных стратегий не изменится.
Для 1-го игрока составляют задачу ЛП вида
(3.2)
где
Для 2-го игрока составляют задачу ЛП вида
(3.3)
где
Задачи (3.2) и (3.3)
образуют двойственную пару задач ЛП.
Симплекс-методом проще решать задачу
(3.3) для 2-го игрока. По итоговой
симплекс-таблице задачи (3.3) находят
оптимальное решение W0
для 2-го игрока (в столбце свободных
членов) и оптимальное решение T0
для 1-го игрока (в целевой строке).
Оптимальное значение целевой функции
L0
определяет цену игры
Затем определяют защитную пару
смешанных
стратегий и цену u=v
исходной
игры
Алгоритм определения защитных смешанных стратегий методом ЛП заключается в следующем:
1. Платежную матрицу A (в случае необходимости) преобразовывают к виду, содержащему только положительные элементы.
2. Составляют задачу (3.2) для 1-го игрока и задачу (3.3) для 2-го игрока.
3. Решают симплекс-методом задачу (3.3).
4. По итоговой симплекс-таблице находят оптимальное решение W0 задачи (3.3), оптимальное решение T0 задачи (3.2) и
5. Определяют
защитные смешанные стратегии
и цену исходной игры u=v.
Пара смешанных
стратегий
называется
уравновешенной,
если для любых X
и Y
выполняется
Решением антагонистической игры в смешанных стратегиях называется уравновешенная пара стратегий.
Поскольку в классе
смешанных стратегий защитная пара
стратегий всегда
является уравновешенной, то решением
антагонистической игры в смешанных
стратегиях является уравновешенная
пара
защитных стратегий.
В связи с вышеизложенным к алгоритму решения антагонистической игры, приведенному в параграфе 3.1, следует добавить п. 4.
4. Находят цену игры в смешанных стратегиях u=v и защитную пару смешанных стратегий, являющуюся решением игры в смешанных стратегиях.
Задачи
3.4. Каждый из двух игроков одновременно выбирает одно из чисел: 1 или 2. Если 1-й игрок выбрал 1 и числа совпали, он проигрывает 2 рубля; не совпали – игра завершается вничью. Если 1-й игрок выбрал 2 и числа совпали, он проигрывает 1 рубль; не совпали – он выигрывает 2 рубля. Составить игру в матричной форме и найти ее решение а) графическим методом, б) аналитическим методом.
3.5 У каждого из двух игроков по две монеты: 1 рубль и 2 рубля. Оба одновременно выкладывают по одной из них на стол. Если достоинство монет совпало, то выложенные деньги забирает 1-й игрок; если не совпало – 2-й игрок.
Составить игру в матричной форме и найти ее решение а) графическим методом, б) аналитическим методом, в) методом ЛП.
3.6. В игре на совпадение сторон монеты два игрока одновременно выбирают герб или цифру. Пусть результаты совпали: если 1-й игрок выбрал герб, то он выигрывает 2 рубля; если цифру, то он выигрывает 1 рубль. Пусть результаты не совпали: если 2-й игрок выбрал герб, то он выигрывает 1 рубль; если цифру, то он выигрывает 3 рубля.
Составить игру в матричной форме и найти ее решение а) графическим методом, б) аналитическим методом.