
- •Лекции по дисциплине
- •Основные этапы операционного исследования
- •Глава 1. Задачи линейного программирования
- •Возможные случаи допустимого множества решений задачи линейного программирования
- •Возможные случаи оптимальных решений (планов) задачи линейного программирования.
- •Графоаналитический способ решения задач линейного программирования
- •Симплекс-метод
- •Алгоритм симплекс-метода
- •1.5. Метод искусственного базиса (м-метод)
- •Алгоритм м-метода:
- •1.6. Элементы теории двойственности
- •Основная теорема двойственности
- •Вторая теорема двойственности
- •Глава 2. Элементы матричных игр
- •2.1. Формальное представление игр. Понятие матричной игры
- •2.2. Принцип миинимакса решения матричных игр.
- •2.3. Смешанные стратегии. Основные свойства решений в смешанных стратегиях.
- •2.4. Методы решения матричных игр.
- •Упрощение игр с помощью отбрасывания доминируемых стратегий.
- •3. Графический метод решения игр 2хn и mх2.
- •Метод сведения матричной игры к задаче линейного программирования.
- •4.5. Итерационный метод Брауна – Робинсон.
- •2.5. Игры с природой.
- •Список рекомендуемой литературы.
3. Графический метод решения игр 2хn и mх2.
Рассмотрим подробно случай 2хn- игр. Пусть игрок А имеет в своем распоряжении две чистых стратегии, а игрок В – n чистых стратегий. Матрица выигрышей игрока А имеет вид:
.
Смешанная стратегия игрока А задается вектором SА=(р1, р2), где р1+р2=1, р10, р20. Положим р1=р, тогда р2=1р, где р[0, 1]. Поэтому SА=(р, 1р), т. е. смешанная стратегия игрока А однозначно определяется екоторым числом р[0, 1].
Если игрок В применит свою чистую стратегию Вj (j=1,…,n), то средний выигрыш игрока А в одной партии при использовании стратегии SA=(p,1p) определяется выражением H(SA,Bj)=a1jp+a2j(1p)=zj(p) при всех j=1,…,n..
Функции zj(p) – линейные функции на отрезке р[0,1]. Изобразим их графики на рисунке.
Каждой чистой стратегии Вj игрока В соответствует своя прямая Н=zj(p). Игрок В стремится к уменьшению своего проигрыша. Следовательно, при фиксированной стратегии SA=(p,1p) его противника игрок В выбирает ту стратегию Вj, для которой график функции Н=zj(p) при данном р расположен ниже других.
Таким образом, наименьшим выигрышам игрока А при неблагоприятных для него действиях игрока В соответствует нижняя огибающая всех прямых Н=zj(p) на рисунке.
С другой стороны, целью игрока А является достижение наибольшего гарантированного выигрыша при любых действиях партнера. Значит, он будет выбирать ту стратегию SA*=(p*,1p*), которая определяется точкой р*, соответствующей максимуму нижней огибающей. Именно эта стратегия и является оптимальной для игрока А, а само значение максимума огибающей определяет цену игры.
Теперь найдем оптимальную смешанную стратегию игрока В. В зависимости от формы нижней огибающей, может представиться два случая. Рассмотрим каждый из них.
Случай 1. Нижняя огибающая имеет ровно одну максимальную точку (р*, Н*). При этом заметим, что если в исходной матрице отсутствуют доминируемые стратегии, то точка максимума р* является внутренней точкой отрезка [0, 1].
Итак, пусть р*(0, 1). Тогда в пиковой точке нижней огибающей пересекается не менее двух прямых, из которых одна имеет положительный наклон, а другая – отрицательный.
Выделим любую пару таких прямых, например, z=zk(p) и z=zl(p), которым соответствуют чистые стратегии Вk и Вl. Нетрудно показать, что для минимизации собственного проигрыша игроку В достаточно использовать только эти стратегии, а от применения других чистых стратегий воздержаться. Тем самым получим вспомогательную игру с платежной матрицей:
(матрица
получается
изН
вычеркиванием всех столбцов, кроме k-го
и l-го).
Оптимальная стратегия SB=(q1,
q2)
игрока В и цена игры
в получившейся игре 2х2 могут быть
найдены с помощью формул (2.7). Тогда
оптимальной стратегией игрока В в
первоначальной задаче является стратегияSB*,
в которой k-й
и l-й
компоненты равны соответственно q1
и q2,
а остальные компоненты равны нулю. Цена
вспомогательной игры совпадает с ценойvS
исходной игры. Аналогично могут быть
рассмотрены и другие пары прямых,
проходящих через пиковую точку и имеющих
разнознаковые наклоны.
Замечание. В рассмотренном случае игрок В с точки зрения принципа минимакса может обладать несколькими оптимальными стратегиями. Однако, исследуя ситуацию и с других позиций, среди множества оптимальных стратегий игрока В можно выделить наиболее приемлемую. В данном случае, по-видимому, следует предпочесть ту стратегию игрока В, которая соответствует паре прямых с наибольшими отрицательным и положительным наклонами, т. е. прямыми, имеющими с нижней огибающей общие отрезки.
Случай 2. Нижняя огибающая содержит горизонтальный участок, соответствующий отрезку [p1*,p2*] на оси абсцисс.
Тогда
любая стратегия видаSA*=(p,
1p),
где р[p1*,p2*],
является оптимальной для игрока А.
Игрок В обладает единственной чистой
стратегией, которой соответствует
прямая, содержащая данный горизонтальный
участок.
Пример 2.6. Решим игру с платежной матрицей:
Сначала упростим матрицу с помощью отбрасывания доминируемых стратегий. Стратегия В6 доминирует над стратегиями В4, В5 и В7. Следовательно, вычеркиваем 4-й, 5-й и 7-й столбцы. Стратегия В2 доминирует над стратегией В3. Поэтому 3-й столбец матрицы также можно отбросить.
Оставшаяся матрица
доминируемых
стратегий не имеет.
Решим
игру, заданную матрицей
,
используя графический метод.
Смешанная
стратегия А имеет вид SA=(p,
1p).
Составим функции средних выигрышей
игрока А при условии, что игрок В
выбирает свои чистые стратегии
,
,
игре с матрицей
:
Н1=0p+13(1p)=1313p, Н2=5p+4(1p)=4+p, Н3=10p+1(1p)=1+9p.
Построим графики этих функций на отрезке р[0, 1].
Выделяем
нижнюю огибающую этих графиков.
Находим самую высокую точку этой
огибающей. Эта точка – результат
пересечения прямых Н=1313р
и Н=4+р.
Найдем ее координаты аналитически.
Для этого решим уравнение 1313р=4+р.
Получим 14р=9,
откуда р*=9/140.642,
1р*=5/140.358.
Следовательно, оптимальная смешанная
стратегия игрока А имеет вид
SA*=(9/14,5/14).
Подставляя значение р*=9/14 в любую из функций Н=1313р или Н=4+р, находим цену игры vS = 13139/14 = 65/14 4.642.
Нахождение
оптимальной стратегии игрока В
соответствует случаю 1. Рассмотрим
игру 2х2 с матрицей
,
столбцы которой соответствуют прямым,
образующим пик нижней огибающей. Найдем
компоненты оптимальной стратегии
,
воспользовавшись формулами (2.7):
q1=(45)/(4+0135)=1/140.074, q2=11/14=13/140.926.
Цена
игры
=(04+135)/(4+0135)=65/144.642
совпадает с ранее найденной ценой
vS.
Учитывая вычеркнутые стратегии игрока
В, окончательно запишем оптимальные
стратегии игроков для исходной игры
SA*=(9/14,5/14),
SB*=(1/14,13/14,0,0,0,0,0);
цена игры vS=65/14.
Решение игры mх2 производится аналогично. Перечислим лишь основные этапы решения. Пусть исходная игра задается матрицей
.
Будем искать смешанную стратегию игрока В в виде SВ=(q, 1q)
Для каждой стратегии Аi игрока А находим средние выигрыши
H(Ai,SB)=ai1q+ai2(1q) (i=1,2,…,m).
Строим графики этих выигрышей на координатной плоскости.
Выделяем верхнюю огибающую построенных графиков, соответствующую наименее благоприятным для игрока В ситуациям.
Отмечаем точку минимума этой огибающей q*, которая определяет оптимальную стратегию игрока В; при этом сам минимум задает цену игры v.
В матрице Н оставляем две строки, соответствующие прямым, которые принимали участия в образовании минимума нижней огибающей.
Для полученной игры 2х2 находим оптимальную стратегию игрока А, применяя формулы (2.7).
Записываем оптимальную стратегию игрока А, учитывая вычеркнутые строки.