
- •7. Элементы теории статистических решений.
- •8. Критерий, основанный на известных вероятностях условий. Критерии Вальда, Сэвиджа, Гурвица.
- •Максиминный критерий Вальда.
- •Критерий минимаксного риска Сэвиджа.
- •Критерий пессимизма-оптимизма Гурвица.
- •9. Планирование эксперимента в условиях неопределенности.
Оптимальной стратегией игрока А является чистая стратегия А2, хотя это и не соответствует точке пересечения стратегий. Здесь стратегия А2 игрока А явно (при любой стратегии противника) выгоднее стратегии А1.
I II
B2
B1
B2
a12 B1
a11 = n a22
a21
0 1 x
SA*=A1 p1
Рис.6.4.
На Рис.6.4 изображен случай, когда заведомо невыгодная стратегия имеется у противника (игрока В).
I II
B2
B1
N
K
L
B2
n b
B1 a
0 1 x
p2 SA* p1
Рис.6.5.
На Рис.6.5 геометрическая интерпретация дает возможность наглядно изобразить также нижнюю цену a и верхнюю b. На том же графике можно дать и геометрическую интерпретацию оптимальных стратегий противника В. Действительно, можно убедиться, что доля q1 стратегии В1 в оптимальной смешанной стратегии SB*=(q1, q2) равна отношению длины отрезка КВ2 к сумме длин отрезков КВ2+КВ1 на оси I: q1=КВ2/(КВ2+КВ1), или, что то же, q1=LB2/(LB2+LB1) на оси II.
Оптимальную стратегию SB*=(q1, q2) можно найти и непосредственно, поменяв местами игроков А и В, и вместо максимальной нижней границы выигрыша рассматривать минимум верхней границы:
I II
A2
A1
N
A1
a22 n a12
a11 A2
a22
0 1 x
q2 SB* q1
Рис.6.6.
Геометрическая интерпретация решения игры “поиск”:
I II
B1
B2 N
B1
n B2
0 1 x
p2 SA* p1
Рис.6.7.
5. Игры 2´n и m´2.
Мы убедились, что любая игра 2´2 может быть решена элементарными приемами. Совершенно аналогично может быть решена любая игра 2´n, где у нас (А) имеется две стратегии, а у противника (В) - произвольное количество n.
Итак, пусть имеется матрица игры 2´n. Зададим геометрическую интерпретацию - n стратегий противника изобразятся n прямыми:
I II
B2
B3
B1
N B3
M
K
B2
B4
0
1 x
B1 p2 SA* p1
Рис.6.8.
Нижняя граница выигрыша - ломаная В1MNB2. Точка с максимальной ординатой на ней - N. Эта ордината - цена игры n, а абсцисса точки N будет равна вероятности р2 стратегии А2 в оптимальной смешанной стратегии игрока А:
SA*=(p1,p2).
Зная, какие стратегии пересекаются в точке N, можно указать активные стратегии противника: в данном случае оптимальная смешанная стратегия
SB*=(0,q2,0,q4)
состоит из смеси двух активных стратегий В2 и В4. Стратегия В3 является заведомо невыгодной, а стратегия В1 - невыгодна при оптимальной стратегии SA*. Вероятности q2 и q4 относятся как длины отрезков КВ4 и КВ2.
Если А будет пользоваться своей оптимальной стратегией SA*, то выигрыш не изменится, какой бы из своих активных стратегий ни пользовался В; однако он изменится, если В перейдет к стратегии В1 или В3.
У любой конечной игры m´n существует решение, в котором число активных стратегий каждой стороны не превосходит наименьшего из чисел m и n.
Из этого, в частности следует, что у игры 2´n всегда имеется решение, в котором с каждой стороны участвует не более двух активных стратегий. Когда эти стратегии найдены, игра 2´n превращается в игру 2´2, решение которой выше получено.
Практическое решение игры 2´n сводится к построению геометрической интерпретации (Рис.6.8) и нахождению пары стратегий, пересекающихся в точке (N), соответствующей решению игры (если пересекаются больше двух стратегий, то берется любая пара). Эти стратегии и представляют собой активные стратегии игрока В.
Очевидно, что игра m´2 может быть решена точно так же, с той лишь разницей, что строится не нижняя, а верхняя граница выигрыша, и на ней ищется не максимум, а минимум.
6. Решение игры m´n.
В общем случае, при m>2, n>2, решение игры m´n может быть сведено к уже известной задаче линейного программирования.
Рассмотрим игру m´n игрока А (стратегии А1,А2,..,Аm) и игрока В (стратегии В1,В2,...,Вn). Задана матрица игры (аij) (без седловой точки).
Требуется найти решение игры, то есть две оптимальные смешанные стратегии игроков А и В
SA*=(p1, p2,...,pm), SB*=(q1,q2,...,qn),
где
pi,
qj
- вероятности применения чистых стратегий
(
,
).
Найдем сначала оптимальную стратегию SA*. Эта стратегия должна обеспечить нам выигрыш, не меньше n, при любом поведение противника, и выигрыш, равный n, при его оптимальном поведении (то есть при стратегии SB*).
Цена игры n нам пока неизвестна. Не нарушая общности, можно предположить ее равной некоторому положительному числу n>0. Для этого достаточно, чтобы все элементы матрицы (аij) были неотрицательными, а этого можно добиться, прибавляя ко всем элементам матрицы (аij) одну и ту же достаточно большую положительную величину М. При этом цена игры увеличится на М, а решение не изменится.
Предположим, что мы применяем свою оптимальную стратегию SA*, а противник (В) - свою чистую стратегию Вj. Тогда наш средний выигрыш будет:
aj=p1 a1 j +p2 a2j+...+pm am j (j=1,...,n).
Наша оптимальная стратегия SA* обладает тем свойством, что при любом поведении противника обеспечивает нам выигрыш, не меньше n. Значит, любое из чисел aj не может быть меньше n. Получаем условие:
(6.9)
Разделим неравенства (6.9) на n>0 и введем обозначения:
(6.10)
Тогда условия (6.9) запишутся в виде:
"
i xi³0.
(6.11)
Поскольку , то из (6.10) следует:
.
(6.12)
Мы хотим сделать свой гарантированный выигрыш максимально возможным; при этом правая часть (6.12) принимает минимальное значение. Таким образом, задача решения игры свелась к следующей математической задаче:
Определить неотрицательные значения переменных х1, х2,..., хm так, чтобы они удовлетворяли линейным ограничениям (6.11) и при этом их линейная функция
L=x1+x2+...+xm (6.13)
обращалась в минимум.
Это - типичная задача линейного программирования; решая ее, мы можем найти оптимальные стратегии SA* игрока А.
Теперь найдем оптимальную стратегию SB* игрока В. Все аналогично решению игры для игрока А, разница в том, что игрок В стремится не максимизировать, а минимизировать выигрыш, а значит, максимизировать величину 1/n. Вместо условий (6.11) должны выполняться условия:
"j
yj³0,
(6.14)
yj=qj/n, j=1,...,n.
Требуется найти такие значения yj, чтобы они удовлетворяли условиям (6.14) и обращали в максимум линейную функцию
L=y1+y2+...+yn=1/n (6.15)
(либо L’=-L=-y1-...-yn=-1/n ® min).
Таким образом, решение любой конечной игры m´n сведено к паре задач линейного программирования.
Из особенностей задачи линейного программирования, к которой сводится решение любой конечной игры, вытекает
Основная теорема существования решения конечных игр:
Допустимое решение ЗЛП, соответствующей конечной игре m´n, всегда существует.
Доказательство:
Решение ЗЛП не существует, если
1) допустимая область пуста;
2) целевая функция не ограничена снизу (для канонического вида).
Проверим, как обстоит дело с ЗЛП, соответствующей конечной игре.
1)
Сделаем элементы матрицы (аij)
строго положительными (прибавим большое
число М) и найдем наименьший элемент:
.
Положим х1=1/m , х2=х3=...=хm=0 (цена игры n=m). Эта система значений переменных х1, х2,...,хm представляет собой допустимое решение ЗЛП - все они неотрицательны и удовлетворяют условиям (6.11).
2) Убедимся, что линейная функция (6.13) не может быть неограниченной снизу. Действительно, все хi неотрицательны, коэффициенты при них в (6.13) – положительны (+1), значит, функция L в формуле (6.13) тоже неотрицательна, значит, она ограничена снизу нулем, и решение ЗЛП (а, соответственно, и игры m´n) существует.
Пример. Найти решение игры “ три пальца”.
Матрица игры имеет вид:
|
В1 |
В2 |
В3 |
А1 |
2 |
-3 |
4 |
А2 |
-3 |
4 |
-5 |
А3 |
4 |
-5 |
6 |
Прибавляя ко всем элементам матрицы число М=5, сделаем их неотрицательными:
-
В1’
В2’
В3’
А1’
7
2
9
А2’
2
9
0
А3’
9
0
11
При этом цена игры увеличится на 5, а решение не изменится. Обозначим новую цену игры n’=n+5.
Найдем оптимальную смешанную стратегию игрока А SA*=(p1, p2, p3).
L=x1+x2+x3®min
Для игрока В оптимальная смешанная стратегия SB*=(q1, q2, q3) находится из задачи:
"j yi³0,
L=y1+y2+y3 ® max.
Решая сформулированную ЗЛП симплексным методом, получим оптимальную стратегию SA*=(1/4, 1/2, 1/4). Значение целевой функции Lmin=1/5. Далее находим цену игры:
n’=1/ Lmin=5 Þ n=n’-5=0.
Так как матрица (aij) – симметричная, то оптимальная стратегия игрока В будет такой же, как и у А:
SВ*=(1/4, 1/2, 1/4).
В данном примере все три стратегии каждого игрока активны. Такая игра, в которой все стратегии игроков активны, называется полностью усредненной.
Если игра является полностью усредненной, т.е. все стратегии обеих сторон являются активными, неравенства (6.11) обращаются в равенства. Решив получившуюся систему уравнений, имеем положительные значения x1, x2,…,xm. Отсюда цена игры:
,
а вероятности p1, p2,…, pm в оптимальной стратегии SA*:
pi=xin, i=1,…,m.
Предположение о полной усредненности игры обычно делается в случае игры с квадратной матрицей (т.е. m=n). Такое решение существует по утверждению:
Для любой игры m´n существует решение, в котором с обеих сторон участвует число стратегий, равное min(m, n).
7. Элементы теории статистических решений.
В задачах теории игр, рассматривая операции, проводимые в условиях неопределенности, мы связывали эту неопределенность с неизвестным для нас поведением противника, который являлся ‘‘разумным и злонамеренным’’ и предпринимает только те действия, которые для нас наименее выгодны.
Однако, при исследовании операций приходится встречаться не только с таким видом неопределенности. Очень часто такая неопределенность связана не с сознательным противодействием противника, а с нашей недостаточной осведомленностью об условиях проведения операции. Например, могут быть заранее не известны: погода в некотором районе, покупательский спрос на определенную продукцию, объем перевозок, которые придется выполнить железной дороге, и так далее.
Все эти условия объективной действительности в теории решений принято называть ‘‘природой’’. Соответствующие ситуации часто называются ‘‘играми с природой’’. ‘‘Природа’’ в теории статистических решений рассматривается как некая незаинтересованная сторона, ‘‘поведение’’ которой не известно, но, во всяком случае, не содержит элемента сознательного противодействия нашим планам.
Рассмотрим такую ситуацию. Пусть у нас (сторона А) имеется m возможных стратегий А1, А2, …, Аm; относительно объективных условий можно сделать n предположений П1, П2,…, Пn — это ‘‘стратегии природы’’. Наш выигрыш при каждой паре стратегий Аi, Пj задан, как и раньше, матрицей игры (аij):
-
П1
П2
. . .
Пn
A1
a11
a12
. . .
a1n
A2
a21
a22
. . .
a2n
. . .
. . .
. . .
. . .
. . .
Am
am1
am2
. . .
amn
Требуется выбрать такую стратегию игрока А (чистую или смешанную), которая является предпочтительнее (более выгодна).
В игре с природой, казалось бы, нам легче получить больший выигрыш, чем в игре с противодействующим противником; однако обоснованное решение, которое даст хороший выигрыш, здесь принять труднее. Действительно, ведь рассуждения о ‘‘наихудшем’’ для нас поведении противника снимает неопределенность в выборе. Если такого предположения нет, то неопределенность сказывается гораздо более сильно.
Как и в игре двух противников, матрицу игры с природой необходимо попытаться упростить. Однако надо учесть, что избавляться мы можем только от своих невыгодных стратегий, так как ‘‘природа’’ не выбирает свою стратегию ‘‘наихудшим’’ для нас образом.
Например, в следующей таблице можно отбросить стратегии А1, А2, заведомо невыгодные по сравнению с А4, и стратегию А5 – по сравнению с А3, в результате чего матрица сведется к матрице 2´5.
-
П1 П2 П3 П4 П5
A1
A2
A3
А4
А5
5 3 4 2 1
5 3 2 1 1
1 2 5 4 3
7 6 7 3 1
1 2 3 4 3
Þ
-
П1 П2 П3 П4 П5
A3
А4
1 2 5 4 3
7 6 7 3 1
В дальнейшем будем предполагать, что анализ матрицы и отбрасывание заведомо не выгодных и дублирующих стратегий уже произведены.
В процессе принятия решения мы, конечно же, должны исходить из матрицы выигрышей (аij). Однако, иногда картина ситуации которую дает матрица выигрышей, содержит своего рода ‘‘искажения’’.
Например, выигрыш при стртегии Аi и состоянии природы Пj больше, чем при стратегии Аk и состоянии Пl :
aij>akl.
Но первый выигрыш может быть больше второго не за счет того, что мы выбрали более удачную стратегию, а за счет того, что состояние природы Пj “выгоднее” для нас, чем состояние Пl. Например, для какой – нибудь экономической операции (и не только экономической) состояние “отсутствие стихийных бедствий” вообще более благоприятно, чем состояние “наводнение”, “землетрясение” и тому подобное.
Поэтому желательно ввести такие показатели, которые не просто задавали бы выигрыш в каждой ситуации, но и описывали бы “удачность” или “неудачность” применения данной стратегии в данной ситуции, с учетом того, насколько вообще эта ситуация благоприятна для нас.
С этой целью в теории решений вводится понятие “риска”.
Риском игрока при пользовании стратегией Аi в условиях Пj называется разность между выигрышем, который он получил бы, если бы знал Пj, и выигрышем, который он подучит в тех же условиях, применяя стратегию Ai.
Обозначим rij риск игрока при его стратегии Аi в условиях Пj. Выразим риск rij через элементы матрицы выигрышей (аij). Очевидно, если бы игрок знал заранее состояния природы (условия) Пj, он выбрал бы ту стратегию, которой соответствует максимальный выигрыш в данном столбце — bj. Тогда, согласно определению риска:
rij=bj-aij, (6.16)
где
Из этого определения следует, что rij³0.
При вычислении риска величина bj является уровнем благоприятности данного состояния для нас.
Матрица рисков (rij) дает зачастую более наглядную картину неопределенности ситуации, чем матрица выигрышей (аij).
Пример. Планируется операция в заранее не ясных условиях, например, касающихся рыночной конъюнктуры. Относительно этих условий можно сделать предположения П1, П2, П3, П4. Выгодность операций (ожидаемая прибыль) при наших стратегиях (Ai) для различных условий (Пj) задана матрицей выигрышей (aij).
|
П1 П2 П3 П4 |
A1 A2 A3 |
1 4 5 9 3 8 4 3 4 6 6 2 |
Построить матрицу рисков (rij).
Решение: b1=4, b2=8, b3=6, b4=9.
Матрица рисков:
-
П1 П2 П3 П4
A1
A2
A3
3 4 1 0
1 0 2 6
0 2 0 7
Сравним стратегии А2 в условиях П1 и в условиях П4:
а21=а24=3.
В матрице же рисков соответствующие значения:
r21=1 , r24=6.
Если при состоянии природы П1 и при выборе стратегии А2 наш выигрыш всего на единицу меньше максимально возможного, и этот выбор очень хорош, то при состоянии П4 и той же стратегии А2 наши потери в выигрыше составят уже шесть единиц, и выбор стратегии А2 очень плох.