
- •1 Теоретическая часть
- •Решение детерминированных задач приятия решений
- •Решение задач принятия решений в условиях риска
- •Решение задач принятия решений в условиях неопределенности
- •1.4 Решение задач принятия решений в условиях конфликта
- •Практическая часть
- •Вычисляем матрицу рисков по формуле.
- •2.2 Определение оптимальной стратегии игроков матричной игры
- •Задачи на процентные ставки
Практическая часть
Выбор оптимального решения
Предположим, что ЛПР (Лицо, Принимающее Решения) обдумывает четыре возможных решения. Но ситуация на рынке неопределенна, она может быть одной из четырех.
С помощью экспертов ЛПР составляет матрицу последствий или доходов Q
Элемент этой матрицы q[i,j] показывает доход, полученный ЛПР, если им принято i-е решение, а ситуация оказалась j-я. В этой схеме полной неопределенности могут быть высказаны лишь некоторые соображения о том, какое решение принять. Сначала построим матрицу рисков. Строится эта матрица так: в каждом столбце матрицы доходов находим максимальный элемент d[j] , после чего элементы r[i,j]=d[j]-q[i,j] и образуют матрицу рисков. Смысл рисков таков: если бы ЛПР знал что в реальности имеет место j-я ситуация, то он выбрал бы решение с наибольшим доходом, но он не знает, поэтому, принимая i-е решение он рискует недобрать d[j]-q[i,j] - что и есть риск.
Рисунок 1 – Матрица доходов
Вычисляем матрицу рисков по формуле.
¦2 5 6 4¦
¦0 3 4 2¦
¦2 2 2 2¦
¦0 0 0 0¦
Правило Вальда называют правилом крайнего пессимизма: ЛПР уверен, что какое бы решение он ни принял, ситуация сложится для него самая плохая, так что, принимая i-е решение, он получит минимальный доход q[i]=min{q[i,j]:j=1..2}.
Но теперь уже из чисел q[i] ЛПР выбирает максимальное и принимает соответствующее решение.
По правилу Сэвиджа находят в каждой строке матрицы рисков максимальный элемент r[i] и затем из чисел r[i] находят минимальное и принимают соответствующее решение. Так принимает решение ЛПР, не любящий рисковать.
По правилу Гурвица для каждой строки матрицы доходов находят величину z[i]=a*max{q[i,j]:j=1..2}+(1-a)*min{q[i,j]:j=1..2}, потом находят из чисел z[i] наибольшее и принимают соответствующее решение. Число a каждый ЛПР выбирает индивидуально - оно отражает его отношение к доходу и риску, при приближении a к 0 правило Гурвица приближается к правилу Вальда, при приближении a к 1 - к правилу розового оптимизма. В данной задаче самым оптимальным решением является четвертое.
2.2 Определение оптимальной стратегии игроков матричной игры
Рассмотрим игру двух лиц, интересы которых противоположны. Такие игры называют антагонистическими играми двух лиц. В этом случае выигрыш одного игрока равен проигрышу второго, и можно описать только одного из игроков. Предполагается, что каждый игрок может выбрать только одно из конечного множества своих действий. Выбор действия называют выбором стратегии игрока. Если каждый из игроков выбрал свою стратегию, то эту пару стратегий называют ситуацией игры. Следует заметить, каждый игрок знает, какую стратегию выбрал его противник, т.е. имеет полную информацию о результате выбора противника. Чистой стратегией игрока I является выбор одной из n строк матрицы выигрышей А, а чистой стратегией игрока II является выбор одного из столбцов этой же матрицы.
A) Проверяем, имеет ли платежная матрица седловую точку.
Если да, то выписываем решение игры в чистых стратегиях. Считаем, что игрок I выбирает свою стратегию так, чтобы получить максимальный свой выигрыш, а игрок II выбирает свою стратегию так, чтобы минимизировать выигрыш игрока I(рисунок 1).
Рисунок 2 – Проверка седловой точки
Находим гарантированный выигрыш, определяемый нижней ценой игры a = max(ai) = 1, которая указывает на максимальную чистую стратегию A1. Верхняя цена игры b = min(bj) = 2. Что свидетельствует об отсутствии седловой точки, так как a ≠ b, тогда цена игры находится в пределах 1 ≤ y ≤ 2. Находим решение игры в смешанных стратегиях. Объясняется это тем, что игроки не могут объявить противнику свои чистые стратегии: им следует скрывать свои действия. Игру можно решить, если позволить игрокам выбирать свои стратегии случайным образом (смешивать чистые стратегии).
Б) Проверяем платежную матрицу на доминирующие строки и доминирующие столбцы.
Иногда на основании простого рассмотрения матрицы игры можно сказать, что некоторые чистые стратегии могут войти в оптимальную смешанную стратегию лишь с нулевой вероятностью. Говорят, что i-я стратегия 1-го игрока доминирует его k-ю стратегию, если aij ≥ akj для всех j Э N и хотя бы для одного j aij > akj. В этом случае говорят также, что i-я стратегия (или строка) – доминирующая, k-я – доминируемая. Говорят, что j-я стратегия 2-го игрока доминирует его l-ю стратегию, если для всех j Э M aij ≤ ail и хотя бы для одного i aij < ail. В этом случае j-ю стратегию (столбец) называют доминирующей, l-ю – доминируемой. Стратегия A1 доминирует над стратегией A4 (все элементы строки 1 больше или равны значениям 4-ой строки), следовательно исключаем 4-ую строку матрицы. Вероятность p4 = 0. Стратегия A2 доминирует над стратегией A3 (все элементы строки 2 больше или равны значениям 3-ой строки), следовательно исключаем 3-ую строку матрицы. Вероятность p3 = 0.
Рисунок 3 – Проверка платёжной матрицы
С позиции проигрышей игрока В стратегия B1 доминирует над стратегией B3 (все элементы столбца 1 больше элементов столбца 3), следовательно исключаем 1-й столбец матрицы. Вероятность q1 = 0. С позиции проигрышей игрока В стратегия B4 доминирует над стратегией B3 (все элементы столбца 4 больше элементов столбца 3), следовательно исключаем 4-й столбец матрицы. Вероятность q4 = 0.
Рисунок 4 - Проверка платёжной матрицы
Мы свели игру 4 x 4 к игре 2 x 2.
Так как игроки выбирают свои чистые стратегии случайным образом, то выигрыш игрока I будет случайной величиной. В этом случае игрок I должен выбрать свои смешанные стратегии так, чтобы получить максимальный средний выигрыш. Аналогично, игрок II должен выбрать свои смешанные стратегии так, чтобы минимизировать математическое ожидание игрока I.
В) Находим решение игры в смешанных стратегиях.
Решим задачу геометрическим методом, который включает в себя следующие этапы: 1. В декартовой системе координат по оси абсцисс откладывается отрезок, длина которого равна 1. Левый конец отрезка (точка х = 0) соответствует стратегии A1, правый - стратегии A2 (x = 1). Промежуточные точки х соответствуют вероятностям некоторых смешанных стратегий S1 = (p1,p2). 2. На левой оси ординат откладываются выигрыши стратегии A1. На линии, параллельной оси ординат, из точки 1 откладываются выигрыши стратегии A2. Решение игры (2 x n) проводим с позиции игрока A, придерживающегося максиминной стратегии. Доминирующихся и дублирующих стратегий ни у одного из игроков нет. Максиминной оптимальной стратегии игрока A соответствует точка N, лежащая на пересечении прямых B1B1 и B2B2, для которых можно записать следующую систему уравнений: y = 1 + (3/2 - 1)p2 y = 2 + (1 - 2)p2 Откуда p1 = 2/3 p2 = 1/3 Цена игры, y = 5/3 Теперь можно найти минимаксную стратегию игрока B, записав соответствующую систему уравнений q1+2q2 = y 3/2q1+q2 = y q1+q2 = 1 или q1+2q2 = 5/3 3/2q1+q2 = 5/3 q1+q2 = 1 Решая эту систему, находим: q1 = 1/3. q2 = 2/3.
Ответ: Цена игры: y = 5/3, векторы стратегии игроков: Q(1/3, 2/3), P(2/3, 1/3) 4. Проверим правильность решения игры с помощью критерия оптимальности стратегии. ∑aijqj ≤ v ∑aijpi ≥ v M(P1;Q) = (1•1/3) + (2•2/3) = 1.667 = v M(P2;Q) = (3/2•1/3) + (1•2/3) = 1.667 = v M(P;Q1) = (1•2/3) + (3/2•1/3) = 1.667 = v M(P;Q2) = (2•2/3) + (1•1/3) = 1.667 = v Все неравенства выполняются как равенства или строгие неравенства, следовательно, решение игры найдено верно. Поскольку из исходной матрицы были удалены строки и столбцы, то найденные векторы вероятности можно записать в виде: P(2/3,1/3,0,0) Q(0,1/3,2/3,0)
Рисунок 5 – Решение в Excel 2007