4539
.pdfРешение игры = |
1 |
; |
S*B = ( y1* ,… y*n ) = ( q1* ,… q*n ). |
|
|
||||
g(Y*) |
||||
|
|
|
Пример. Найти оптимальные смешанные стратегии игры, заданной
следующей платежной матрицей: |
|
|||||
|
|
В1 |
В2 |
В3 |
|
нижняя цена игры = 4, |
|
А1 |
1 |
10 |
3 |
|
верхняя цена игры = 5, |
|
А2 |
8 |
4 |
5 |
|
т.е. – седловой точки нет. |
Сведем данную задачу к задаче линейного программирования. Найдем оптимальную стратегию игрока А – (S*A ):
f(x) = X1 + X2 min. X1 + 8X2 1,
10X1 + 4X2 1,
3X1 + 5X2 1,
X1 , X2 0.
f (x) 0,21; |
X1 0,026; |
X2 0,184, |
отсюда
= |
1 |
= 4,76; |
P1 = 4,76 0,026 = 0,124; |
P2 = 4,76 0,184 = 0,876. |
0,21 |
Найдем оптимальную стратегию игрока В – (S*B ):
g(y) = y1 + y2 + y3 max.
y1 + 10y2 + 3y3 1,
8y1 + 4y2 + 5y3 1, y1 , y2 , y3 0.
g y 0,21; |
y1 0; |
y2 0,0526; |
y3 0,158, |
отсюда |
|
|
|
q1 = 0; |
q2 = 4,76 0,0526 = 0,25; |
q3 = 4,76 0,158 = 0,75. |
Таким образом, применяя свою первую чистую стратегию с вероятно-
стью 0,124 и вторую – с вероятностью 0,876, игрок А выигрывает величину
4,76. Игрок В, применяя свою вторую чистую стратегию с вероятностью 0,25
и третью – с вероятностью 0,75, проигрывает величину 4,76, иначе он проиг-
рывает больше.
Игра два на два (2 х 2)
Рассмотрим игру, в которой у игроков А и В по две стратегии. Платежная матрица имеет вид
|
В1 |
В2 |
|
А1 |
a11 |
a12 |
(8) |
20
А2 a21 a22
Рассмотрим случай, когда игра не имеет седловой точки.
Теорема 4. Пусть S*A и S*B – оптимальные смешанные стратегии игры с
платежной матрицей (1) и ценой игры , тогда для любого i, при котором вы- |
|||||||
полняется строгое неравенство |
верхняя |
граница игры - |
сколько |
||||
|
|
самое меньшее |
проиграть |
||||
|
|
|
|
|
A1 |
||
|
|
|
|
|
игрок В. |
|
|
А2 |
|
|
|
|
|
|
|
|
М |
|
|
|
q1 - вероятность выбора |
||
|
|
|
|
||||
|
|
|
|
стратегии B1. |
|
||
|
|
|
|
|
|
|
|
А1 |
|
|
|
а1 |
q2 - вероятность выбора |
||
а2 |
|
|
|
|
|
стратегии B2. |
|
|
|
|
|
|
|
||
|
а1 |
|
|
|
|
||
|
|
|
|
A2 |
|
|
|
В1 |
|
|
а2 |
|
|
||
0 |
|
|
|
|
B2 |
|
|
|
q2 |
S* |
q1 |
|
1 |
|
|
|
|
B |
|
|
|
|
|
n
а ij qj < ,
j 1
имеет место равенство pi = 0. А если pi > 0, то
n
а ij qj = .
j 1
Аналогично, если для некоторых j
m
аij pi > ,
i 1
то для этих j qj = 0. А если qj > 0, то
m
аij pi = .
i 1
Определим оптимальную смешанную стратегию S*A игрока А,
этого решим систему трех уравнений с тремя неизвестными
а11 p1 + а21 p2 = , а12 p1 + а22 p2 = ,
p1 + p2 = 1.
Решив следующую систему, найдем оптимальную стратегию S*B
а для
игро-
ка В:
а11 q1 + а12 q2 = , а21 q1 + а22 q2 = ,
q1 + q2 = 1.
Рассмотрим первую систему. Вычитая из первого равенства второе, по-
лучая
(а11 - а12) p1 + (а21 - а22) p2 = 0.
21
Подставим P2 = 1 - P1, тогда
(а11 - а12) p1 + (а21 - а22) (1- p1 ) = 0,
отсюда оптимальная смешанная стратегия для игрока А – А*( p1, p2)
P1 = (а22 - а21)/( а11 - а12 + а22 - а21),
P2 = 1- P1 = (а11 - а12)/( а11 - а12 + а22 - а21).
цена игры
= ( а11 а22 - а21 а12)/ ( а11 - а12 + а22 - а21).
Рассуждая аналогично, для определения оптимальной стратегии игрока В получая
q1 = (а22 - а12)/( а11 - а12 + а22 - а21),
q2 = (а11 - а21)/( а11 - а12 + а22 - а21).
Задание по лабораторной работе Найти решение игровых ситуаций графически, аналитически и пред-
ставить игру в виде задачи линейного программирования.
Допустим в матричной игре два игрока имеют возможность выбора из нескольких вариантов решений. Аi (i 1 m) – стратегии игрока А,
Вj ( j 1 n) – стратегии игрока В. Значения выигрышей представлены в мат-
рицах по вариантам.
6 10 |
6 7 |
|
3 11 |
11 10 |
|
16 3 |
|
||||||||||||||
|
7 9 |
|
|
4 12 |
|
|
7 |
3 |
|
|
2 4 |
|
|
|
|
7 |
18 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
8 2 |
|
|
8 1 |
|
|
4 |
4 |
|
|
3 5 |
|
|
|
|
8 |
|
2 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
1 12 |
|
|
5 2 |
|
|
8 |
5 |
|
|
8 12 |
|
|
|
6 |
|
7 |
|
||||
3 11 |
21 7 |
|
7 |
8 |
1 10 |
|
|
16 3 |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
17 5 |
|
|
|
4 12 |
|
|
3 |
3 |
|
|
2 14 |
|
|
|
2 |
|
8 |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4 2 |
|
|
8 11 |
|
1 |
4 |
|
|
8 5 |
|
|
|
7 |
|
3 |
|
|
|||
1 7 |
|
|
6 2 |
|
8 |
7 |
|
|
8 12 |
|
|
|
6 |
|
4 |
|
|
Практическое занятие 5
Вероятностные модели теории принятия решений. Рисковые ситуации
Цель работы: Изучение методов принятия решения на основе вероятност-
ных моделей. Рисковые ситуации.
22
В рамках исследуемой проблемной ситуации анализируемый субъект экономики как правило подвержен воздействию внешних факторов. При этом точные значения этих факторов (т.е. конкретное состояние внешней среды) заранее неизвестны. В этом случае лицо принимающее решение должно выявить возможные состояния внешней среды и оценить эффектив-
ность каждого из своих возможных решений в различных условиях. После чего необходимо выбрать предпочтительное решение. Если при этом извест-
ны вероятности состояний внешней среды, то такие условия называют усло-
виями риска, а если неизвестны – то неопределенности.
Этапы принятия решений в условиях риска или неопределенности:
1)Формирование цели принятия решения;
2)Построение экономико-математической модели задачи принятия решения (происходит так же, как и в случае определенности внешних факто-
ров);
3)Формирование множества альтернативных решений;
4)Выявление неопределенных внешних факторов, влияющих на дос-
тижение цели, формирование возможных состояний внешней среды;
5) Расчет эффективности вариантов решения при различных состояни-
ях внешней среды, формирование матрицы ценности альтернатив;
6)Оценка вероятности состояний внешней среды (если возможно);
7)Выбор предпочтительного варианта решения.
Матрица ценности альтернатив имеет вид: Таблица 1.
Номер альтернативного решения |
Номер состояния внешней среды |
|
|||
|
1 |
… |
j |
… |
m |
1 |
u11 |
… |
u1 j |
… |
u1m |
|
|||||
|
|
|
|
|
|
i |
ui1 |
… |
uij |
… |
u |
|
|||||
|
|
|
|
|
im |
|
|
|
|
|
|
n |
un1 |
… |
unj |
… |
unm |
|
23
В этой матрице величина uij обозначает ценность i-го решения при
реализации j-го состояния внешней среды.
Для каждой альтернативы можно найти ее пессимистичную и оптимистичную оценки (соответственно наименьшее uimin и наибольшее значения
uimax в соответствующей строке матрицы).
Выбор решения в условиях неопределенности Для этого существует ряд критериев: максиминный критерий Вальда,
максимаксный критерий («оптимистический»), критерий Гурвица, критерий Лапласа.
Критерий Вальда соответствует пессимистической оценке: выбирается та альтернатива, для которой пессимистическая оценка наибольшая, т.е. мак-
В |
|
|
|
||
|
||
симум из минимумов, лучшая из худших. u max |
||
|
i |
min j
u |
|
|
max u |
min |
. |
|
|
||||
|
|
||||
|
ij |
|
|
i |
|
|
|
|
i |
|
|
Максимаксный критерий: выбирается альтернатива с наибольшей оп-
тимистической оценкой (лучшая из лучших).
Критерий Гурвица (взвешенный критерий): альтернативы оцениваются
согласно выражению |
~ |
min |
max |
., где 0 1 – коэффициент |
ui (1 |
)ui |
ui |
оптимизма. Значение =0 соответствует пессимистичной оценке (т.е. крите-
рию Вальда), =1 соответствует оптимистичной оценке (т.е. максимаксному критерию). Промежуточные значения соответствуют взвешенному, т.е.
пессимистично-оптимистичному, взвешенному подходу. Задав фиксирован-
ное значение коэффициента оптимизма, выбирают альтернативу с наиболь-
шей оценкой.
Критерий Лапласа: альтернативы оцениваются с учетом всего диапа-
зона ценностей (а не только худшего и/или лучшего значений): ui m1
Выбирается альтернатива с наибольшей оценкой.
Вычисления проводить использовав табличный процессор Excel.
Числовой пример:
m
uij . j 1
24
Матрица ценностей представлена в табл. 2. Там же приведены значения критериев. Лучшие по каждому из критериев решения показаны жирным шрифтом:
Таблица 2.
Номер альтерна- |
Состояние внешней среды |
Критерий |
|
|
||
тивного решения |
1.Конкурен- |
2.Конкурен- |
Критерий |
Максимакс- |
Критерий |
Критерий |
|
ция на преж- |
ция усилилась |
Вальда |
ный |
Гурвица |
Лапласа |
|
нем уровне |
|
|
|
( 0.4) |
|
|
|
|
|
|
|
|
1.Продолжать |
125 |
90 |
90 |
125 |
104 |
112,5 |
работу в обыч- |
|
|
|
|
|
|
ном режиме |
|
|
|
|
|
|
2.Усилить рек- |
120 |
95 |
95 |
120 |
105 |
112,5 |
ламную деятель- |
|
|
|
|
|
|
ность |
|
|
|
|
|
|
Методика принятия решения в условиях риска.
Если каким-либо образом (например, экспертным методом) оценены вероятности состояний внешней среды ( p j ), то для оценки альтернативных
решений используются критерии Байеса-Лапласа или Ходжеса-Лемана:
Критерий Байеса-Лапласа: |
|
|
|
|
p |
|
u |
|
, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
u |
i |
j |
ij |
|
|||||||||
|
|
|
|
|
j |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
~ |
|
|
|
|
min |
|
|
|
|
|
0 1 – |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
ui , где |
||||||||
Критерий Ходжеса-Лемана: ui (1 |
)ui |
|
коэффициент доверия к вероятности (т.е. к экспертам).
Варианты индивидуальных заданий Вариант 1. Предприятие имеет три альтернативных варианта своей ры-
ночной стратегии. Оценка его прибыли в зависимости от состояния внешней среды приведена в табл. 3.
А) Принятие решения в условиях неопределенности.
Необходимо найти оптимальные стратегии при пессимистической оценке (по критерию Вальда), оценке Лапласа, взвешенной оценке (по крите-
рию Гурвица). Значение коэффициента оптимизма выбрать самостоятельно.
Результаты выбора решения отразить в таблице, аналогично табл. 2. Сделать выводы о применимости критериев.
Б) Принятие решения в условиях риска.
25
Пусть получены экспертные оценки вероятностей состояний внешней среды p1=0.5, p2=0.35, p3=0.15. Оценить альтернативные решения по крите-
рию Байеса-Лапласа. Результаты вычисления ценности альтернативных ре-
шений занести в ту же таблицу. Выбрать наилучшее решение. Сравнить ре-
зультат выбора с полученными ранее результатами выбора решения в усло-
виях неопределенности.
Таблица 3.
Возможные |
аль- |
Возможные состояния внешней среды |
|
||
тернативные решения |
1.Конкуренция |
на |
2.Конкуренция немного |
3. Конкуренция |
|
|
|
прежнем уровне |
|
усилилась |
резко усилилась |
1. Продолжать работу в |
100 |
|
80 |
50 |
|
обычном режиме |
|
|
|
|
|
2.Активизировать |
рек- |
90 |
|
90 |
70 |
ламную деятельность |
|
|
|
|
|
3.Активизировать |
рек- |
60 |
|
70 |
80 |
ламу и снизить цены |
|
|
|
|
|
Варианты 2-14.
Постановка задачи такая же, как и для варианта 1. Численные значения
матрицы ценности альтернатив (т.е. оценок прибыли предприятия) приведе-
ны в табл. 4.
Таблица 4.
№ варианта |
Матрица ценности |
№ варианта |
Матрица ценности |
№ варианта |
Матрица |
||||
|
|
|
|
|
|
|
ценности |
||
1 |
100 80 50 |
6 |
100 80 50 |
11 |
100 70 50 |
||||
|
90 |
90 70 |
|
90 100 70 |
|
90 |
90 60 |
||
|
60 |
70 80 |
|
60 |
90 80 |
|
50 |
60 70 |
|
2 |
100 70 60 |
7 |
100 80 50 |
12 |
100 70 50 |
||||
|
80 |
90 70 |
|
80 |
90 70 |
|
80 |
90 60 |
|
|
60 |
70 80 |
|
60 |
90 80 |
|
60 |
70 80 |
|
3 |
100 80 40 |
8 |
100 80 40 |
13 |
100 80 50 |
||||
|
70 |
90 60 |
|
70 |
90 50 |
|
70 |
90 60 |
|
|
60 |
70 80 |
|
50 |
70 80 |
|
60 |
70 70 |
|
4 |
100 80 20 |
9 |
100 80 50 |
14 |
100 80 50 |
||||
|
80 |
90 40 |
|
80 |
90 70 |
|
70 |
90 70 |
|
|
30 |
40 80 |
|
40 |
70 80 |
|
40 |
60 70 |
|
5 |
100 80 50 |
10 |
100 80 30 |
15 |
100 80 40 |
||||
|
80 |
95 70 |
|
90 |
90 40 |
|
80 |
90 70 |
|
|
60 |
70 80 |
|
50 |
60 70 |
|
50 |
70 |
100 |
|
|
|
|
|
|
|
|
|
|
Ранжирование критериев
26
Пусть все критерии можно ранжировать (строго упорядочить) по важно-
сти так, что при последовательном рассмотрении критериев вначале исполь-
зуется первый (наиболее важный с точки зрения ЛПР) критерий, затем вто-
рой и т.д. Это позволяет на множестве допустимых решений задать лексико-
графическое отношение предпочтения.
Определение 5. Допустимое решение x лексикографически предпоч-
тительнее допустимого решения x ,если выполняется одно из условий:
1) f1(x )>f1(x ), |
(4) |
|
|
|
2) i m f (x j) f (x j ) для j=1,…,i и fi+1(x )=fi+1(x ) |
||
Если fi(x )=fi(x ) для |
всех i=1,…,m, то допустимые решения x ,x лекси- |
|
кографически эквивалентны. |
|
|
Определение. |
Допустимое решение x лексикографически опти- |
мальное, если не существует допустимого решения x , для которого выпол-
няется условие (4). |
|
|
|
|
|
|
|
|
|
|
Найти лексикографически |
оптимальное решение многокритериаль- |
|||||||||
ной задачи можно, решив следующую последовательность задач: |
|
|||||||||
1) найти |
max f (x) f * |
в области x X; |
|
|||||||
|
1 |
|
|
1 |
|
|
|
|
|
|
2) найти |
max f |
2 |
(x) f * |
в области, задаваемой условиями |
|
|||||
|
|
|
|
2 |
|
|
|
|
|
|
|
x X; |
f (x) f *; |
(5) |
|||||||
|
|
|
|
|
1 |
|
1 |
|
|
|
………………………………………………………………. |
|
|||||||||
m) найти |
max f |
m |
(x) f * |
в области, задаваемой условиями |
||||||
|
|
|
|
|
m |
|
|
|
|
|
|
x X; f |
(x) f * , i |
|
|
|
|||||
|
1, m 1; |
|
||||||||
|
|
|
|
i |
|
|
i |
|
||
Итак, искомым лексикографически оптимальным является |
всякое ре- |
шение последней ( m-ой ) задачи. Полученное при этом лексикографически оптимальное решение является одной из эффективных точек, однако выбор
27
порядка ранжирования существенно влияет на то, какая из эффективных то-
чек будет найдена.
Так как область допустимых решений очередной задачи представляет собой множество оптимальных решений предшествующих задач, то она бы-
стро сужается до одной точки, лишая свободы выбора при максимизации по-
следующих критериев. Попытка избавиться от этого недостатка предпринята в методе последовательных уступок.
Метод последовательных уступок (компромиссов)
Здесь так же, как и в предыдущем походе, вначале производится каче-
ственный анализ относительной важности критериев. На основании такого анализа критерии нумеруются в порядке убывания важности.
Ищем максимальное значение f1* первого критерия f f1(x) на всем множестве допустимых решений. Затем назначаем величину «допусти-
мого» снижения (уступки) 1 критерия f1(x) и определяем наибольшее
значение f * второго критерия f f |
2 |
(x) при условии, что значение пер- |
|||||
2 |
|
|
|
|
|
|
|
вого критерия должно быть не меньше, |
чем f * - |
. Затем назначаем вели- |
|||||
|
|
|
1 |
1 |
|
|
|
чину «допустимого» снижения (уступки) 2 критерия f2 (x) и опре- |
|
||||||
деляем наибольшее значение f * |
третьего критерия f f |
3 |
(x) при усло- |
||||
3 |
|
|
|
|
|
|
|
вии, что значение второго критерия должно быть не меньше, |
чем f * - |
и |
|||||
|
|
|
|
|
|
2 |
2 |
т. д. Таким образом, оптимальным решением многокритериальной задачи считается всякое решение последней из задач последовательности:
1)найти max f1(x) f1* в области x X ;
2)найти max f2 (x) f2* в области, задаваемой условиями
x X ; f |
(x) f * ; |
(6) |
|
1 |
1 |
1 |
|
m) найти max fm (x) fm* в области, задаваемой условиями
|
(x) f * |
|
|
|
|
x X; f |
i |
, i |
1, m 1; |
||
i |
i |
|
|
|
28
Очевидно, что если все i =0, то метод уступок находит только лекси-
кографически оптимальные решения, которые доставляют первому по важ-
ности критерию наибольшее на Х значение. В другом крайнем случае, когда величины уступок очень велики, решения , получаемые по этому методу,
доставляют последнему по важности критерию наибольшее на Х значение.
Поэтому величины уступок можно рассматривать как своеобразную меру отклонения приоритета частных критериев от жесткого лексикографическо-
го.
Метод последовательных уступок не всегда приводит к получению
только эффективных точек, но среди этих точек всегда существует хотя бы одна эффективная. Это следует из следующих утверждений [2].
Утверждение. Если X Rn - множество замкнутое и ограниченное, а
функции fi(x) непрерывны, то решением m-й задачи из (6) является, по крайней мере, одна эффективная точка.
Утверждение. Если x - единственная (с точностью до эквивалент-
ности) точка, являющаяся решением m-й задачи из (6), то она эффективна.
Примеры решения многокритериальной задачи методом после-
довательных уступок
Пример. Решить методом последовательных уступок многокритериаль-
ную задачу из примера.
f1(x)=7x1 +2x3-x4+x5 max , f2(x)=x1-5x2-4x3+x4 max
при ограничениях
-x1 +x2 |
+x3 |
=2 ; |
3x1 -x2 |
+x4 |
=3 ; |
5x1+2x2 +x3+x4 +x5=11;
xi 0 для i=1,2,...,5.
29