Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

4539

.pdf
Скачиваний:
2
Добавлен:
08.01.2021
Размер:
1.13 Mб
Скачать

Решение игры =

1

;

S*B = ( y1* ,… y*n ) = ( q1* ,… q*n ).

 

g(Y*)

 

 

 

Пример. Найти оптимальные смешанные стратегии игры, заданной

следующей платежной матрицей:

 

 

 

В1

В2

В3

 

нижняя цена игры = 4,

 

А1

1

10

3

 

верхняя цена игры = 5,

 

А2

8

4

5

 

т.е. – седловой точки нет.

Сведем данную задачу к задаче линейного программирования. Найдем оптимальную стратегию игрока А – (S*A ):

f(x) = X1 + X2 min. X1 + 8X2 1,

10X1 + 4X2 1,

3X1 + 5X2 1,

X1 , X2 0.

f (x) 0,21;

X1 0,026;

X2 0,184,

отсюда

=

1

= 4,76;

P1 = 4,76 0,026 = 0,124;

P2 = 4,76 0,184 = 0,876.

0,21

Найдем оптимальную стратегию игрока В – (S*B ):

g(y) = y1 + y2 + y3 max.

y1 + 10y2 + 3y3 1,

8y1 + 4y2 + 5y3 1, y1 , y2 , y3 0.

g y 0,21;

y1 0;

y2 0,0526;

y3 0,158,

отсюда

 

 

 

q1 = 0;

q2 = 4,76 0,0526 = 0,25;

q3 = 4,76 0,158 = 0,75.

Таким образом, применяя свою первую чистую стратегию с вероятно-

стью 0,124 и вторую – с вероятностью 0,876, игрок А выигрывает величину

4,76. Игрок В, применяя свою вторую чистую стратегию с вероятностью 0,25

и третью – с вероятностью 0,75, проигрывает величину 4,76, иначе он проиг-

рывает больше.

Игра два на два (2 х 2)

Рассмотрим игру, в которой у игроков А и В по две стратегии. Платежная матрица имеет вид

 

В1

В2

 

А1

a11

a12

(8)

20

А2 a21 a22

Рассмотрим случай, когда игра не имеет седловой точки.

Теорема 4. Пусть S*A и S*B – оптимальные смешанные стратегии игры с

платежной матрицей (1) и ценой игры , тогда для любого i, при котором вы-

полняется строгое неравенство

верхняя

граница игры -

сколько

 

 

самое меньшее

проиграть

 

 

 

 

 

A1

 

 

 

 

 

игрок В.

 

А2

 

 

 

 

 

 

 

М

 

 

 

q1 - вероятность выбора

 

 

 

 

 

 

 

 

стратегии B1.

 

 

 

 

 

 

 

 

А1

 

 

 

а1

q2 - вероятность выбора

а2

 

 

 

 

 

стратегии B2.

 

 

 

 

 

 

 

 

а1

 

 

 

 

 

 

 

 

A2

 

 

В1

 

 

а2

 

 

0

 

 

 

 

B2

 

 

 

q2

S*

q1

 

1

 

 

 

 

B

 

 

 

 

 

n

а ij qj < ,

j 1

имеет место равенство pi = 0. А если pi > 0, то

n

а ij qj = .

j 1

Аналогично, если для некоторых j

m

аij pi > ,

i 1

то для этих j qj = 0. А если qj > 0, то

m

аij pi = .

i 1

Определим оптимальную смешанную стратегию S*A игрока А,

этого решим систему трех уравнений с тремя неизвестными

а11 p1 + а21 p2 = , а12 p1 + а22 p2 = ,

p1 + p2 = 1.

Решив следующую систему, найдем оптимальную стратегию S*B

а для

игро-

ка В:

а11 q1 + а12 q2 = , а21 q1 + а22 q2 = ,

q1 + q2 = 1.

Рассмотрим первую систему. Вычитая из первого равенства второе, по-

лучая

11 - а12) p1 + (а21 - а22) p2 = 0.

21

Подставим P2 = 1 - P1, тогда

11 - а12) p1 + (а21 - а22) (1- p1 ) = 0,

отсюда оптимальная смешанная стратегия для игрока А – А*( p1, p2)

P1 = (а22 - а21)/( а11 - а12 + а22 - а21),

P2 = 1- P1 = (а11 - а12)/( а11 - а12 + а22 - а21).

цена игры

= ( а11 а22 - а21 а12)/ ( а11 - а12 + а22 - а21).

Рассуждая аналогично, для определения оптимальной стратегии игрока В получая

q1 = (а22 - а12)/( а11 - а12 + а22 - а21),

q2 = (а11 - а21)/( а11 - а12 + а22 - а21).

Задание по лабораторной работе Найти решение игровых ситуаций графически, аналитически и пред-

ставить игру в виде задачи линейного программирования.

Допустим в матричной игре два игрока имеют возможность выбора из нескольких вариантов решений. Аi (i 1 m) – стратегии игрока А,

Вj ( j 1 n) – стратегии игрока В. Значения выигрышей представлены в мат-

рицах по вариантам.

6 10

6 7

 

3 11

11 10

 

16 3

 

 

7 9

 

 

4 12

 

 

7

3

 

 

2 4

 

 

 

 

7

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

8 2

 

 

8 1

 

 

4

4

 

 

3 5

 

 

 

 

8

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 12

 

 

5 2

 

 

8

5

 

 

8 12

 

 

 

6

 

7

 

3 11

21 7

 

7

8

1 10

 

 

16 3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

17 5

 

 

 

4 12

 

 

3

3

 

 

2 14

 

 

 

2

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4 2

 

 

8 11

 

1

4

 

 

8 5

 

 

 

7

 

3

 

 

1 7

 

 

6 2

 

8

7

 

 

8 12

 

 

 

6

 

4

 

 

Практическое занятие 5

Вероятностные модели теории принятия решений. Рисковые ситуации

Цель работы: Изучение методов принятия решения на основе вероятност-

ных моделей. Рисковые ситуации.

22

В рамках исследуемой проблемной ситуации анализируемый субъект экономики как правило подвержен воздействию внешних факторов. При этом точные значения этих факторов (т.е. конкретное состояние внешней среды) заранее неизвестны. В этом случае лицо принимающее решение должно выявить возможные состояния внешней среды и оценить эффектив-

ность каждого из своих возможных решений в различных условиях. После чего необходимо выбрать предпочтительное решение. Если при этом извест-

ны вероятности состояний внешней среды, то такие условия называют усло-

виями риска, а если неизвестны – то неопределенности.

Этапы принятия решений в условиях риска или неопределенности:

1)Формирование цели принятия решения;

2)Построение экономико-математической модели задачи принятия решения (происходит так же, как и в случае определенности внешних факто-

ров);

3)Формирование множества альтернативных решений;

4)Выявление неопределенных внешних факторов, влияющих на дос-

тижение цели, формирование возможных состояний внешней среды;

5) Расчет эффективности вариантов решения при различных состояни-

ях внешней среды, формирование матрицы ценности альтернатив;

6)Оценка вероятности состояний внешней среды (если возможно);

7)Выбор предпочтительного варианта решения.

Матрица ценности альтернатив имеет вид: Таблица 1.

Номер альтернативного решения

Номер состояния внешней среды

 

 

1

j

m

1

u11

u1 j

u1m

 

 

 

 

 

 

 

i

ui1

uij

u

 

 

 

 

 

 

im

 

 

 

 

 

 

n

un1

unj

unm

 

23

В этой матрице величина uij обозначает ценность i-го решения при

реализации j-го состояния внешней среды.

Для каждой альтернативы можно найти ее пессимистичную и оптимистичную оценки (соответственно наименьшее uimin и наибольшее значения

uimax в соответствующей строке матрицы).

Выбор решения в условиях неопределенности Для этого существует ряд критериев: максиминный критерий Вальда,

максимаксный критерий («оптимистический»), критерий Гурвица, критерий Лапласа.

Критерий Вальда соответствует пессимистической оценке: выбирается та альтернатива, для которой пессимистическая оценка наибольшая, т.е. мак-

В

 

 

 

симум из минимумов, лучшая из худших. u max

 

i

min j

u

 

 

max u

min

.

 

 

 

 

 

ij

 

 

i

 

 

 

 

i

 

 

Максимаксный критерий: выбирается альтернатива с наибольшей оп-

тимистической оценкой (лучшая из лучших).

Критерий Гурвица (взвешенный критерий): альтернативы оцениваются

согласно выражению

~

min

max

., где 0 1 – коэффициент

ui (1

)ui

ui

оптимизма. Значение =0 соответствует пессимистичной оценке (т.е. крите-

рию Вальда), =1 соответствует оптимистичной оценке (т.е. максимаксному критерию). Промежуточные значения соответствуют взвешенному, т.е.

пессимистично-оптимистичному, взвешенному подходу. Задав фиксирован-

ное значение коэффициента оптимизма, выбирают альтернативу с наиболь-

шей оценкой.

Критерий Лапласа: альтернативы оцениваются с учетом всего диапа-

зона ценностей (а не только худшего и/или лучшего значений): ui m1

Выбирается альтернатива с наибольшей оценкой.

Вычисления проводить использовав табличный процессор Excel.

Числовой пример:

m

uij . j 1

24

Матрица ценностей представлена в табл. 2. Там же приведены значения критериев. Лучшие по каждому из критериев решения показаны жирным шрифтом:

Таблица 2.

Номер альтерна-

Состояние внешней среды

Критерий

 

 

тивного решения

1.Конкурен-

2.Конкурен-

Критерий

Максимакс-

Критерий

Критерий

 

ция на преж-

ция усилилась

Вальда

ный

Гурвица

Лапласа

 

нем уровне

 

 

 

( 0.4)

 

 

 

 

 

 

 

 

1.Продолжать

125

90

90

125

104

112,5

работу в обыч-

 

 

 

 

 

 

ном режиме

 

 

 

 

 

 

2.Усилить рек-

120

95

95

120

105

112,5

ламную деятель-

 

 

 

 

 

 

ность

 

 

 

 

 

 

Методика принятия решения в условиях риска.

Если каким-либо образом (например, экспертным методом) оценены вероятности состояний внешней среды ( p j ), то для оценки альтернативных

решений используются критерии Байеса-Лапласа или Ходжеса-Лемана:

Критерий Байеса-Лапласа:

 

 

 

 

p

 

u

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

u

i

j

ij

 

 

 

 

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

~

 

 

 

 

min

 

 

 

 

 

0 1 –

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ui , где

Критерий Ходжеса-Лемана: ui (1

)ui

 

коэффициент доверия к вероятности (т.е. к экспертам).

Варианты индивидуальных заданий Вариант 1. Предприятие имеет три альтернативных варианта своей ры-

ночной стратегии. Оценка его прибыли в зависимости от состояния внешней среды приведена в табл. 3.

А) Принятие решения в условиях неопределенности.

Необходимо найти оптимальные стратегии при пессимистической оценке (по критерию Вальда), оценке Лапласа, взвешенной оценке (по крите-

рию Гурвица). Значение коэффициента оптимизма выбрать самостоятельно.

Результаты выбора решения отразить в таблице, аналогично табл. 2. Сделать выводы о применимости критериев.

Б) Принятие решения в условиях риска.

25

Пусть получены экспертные оценки вероятностей состояний внешней среды p1=0.5, p2=0.35, p3=0.15. Оценить альтернативные решения по крите-

рию Байеса-Лапласа. Результаты вычисления ценности альтернативных ре-

шений занести в ту же таблицу. Выбрать наилучшее решение. Сравнить ре-

зультат выбора с полученными ранее результатами выбора решения в усло-

виях неопределенности.

Таблица 3.

Возможные

аль-

Возможные состояния внешней среды

 

тернативные решения

1.Конкуренция

на

2.Конкуренция немного

3. Конкуренция

 

 

прежнем уровне

 

усилилась

резко усилилась

1. Продолжать работу в

100

 

80

50

обычном режиме

 

 

 

 

 

2.Активизировать

рек-

90

 

90

70

ламную деятельность

 

 

 

 

3.Активизировать

рек-

60

 

70

80

ламу и снизить цены

 

 

 

 

 

Варианты 2-14.

Постановка задачи такая же, как и для варианта 1. Численные значения

матрицы ценности альтернатив (т.е. оценок прибыли предприятия) приведе-

ны в табл. 4.

Таблица 4.

№ варианта

Матрица ценности

№ варианта

Матрица ценности

№ варианта

Матрица

 

 

 

 

 

 

 

ценности

1

100 80 50

6

100 80 50

11

100 70 50

 

90

90 70

 

90 100 70

 

90

90 60

 

60

70 80

 

60

90 80

 

50

60 70

2

100 70 60

7

100 80 50

12

100 70 50

 

80

90 70

 

80

90 70

 

80

90 60

 

60

70 80

 

60

90 80

 

60

70 80

3

100 80 40

8

100 80 40

13

100 80 50

 

70

90 60

 

70

90 50

 

70

90 60

 

60

70 80

 

50

70 80

 

60

70 70

4

100 80 20

9

100 80 50

14

100 80 50

 

80

90 40

 

80

90 70

 

70

90 70

 

30

40 80

 

40

70 80

 

40

60 70

5

100 80 50

10

100 80 30

15

100 80 40

 

80

95 70

 

90

90 40

 

80

90 70

 

60

70 80

 

50

60 70

 

50

70

100

 

 

 

 

 

 

 

 

 

 

Ранжирование критериев

26

Пусть все критерии можно ранжировать (строго упорядочить) по важно-

сти так, что при последовательном рассмотрении критериев вначале исполь-

зуется первый (наиболее важный с точки зрения ЛПР) критерий, затем вто-

рой и т.д. Это позволяет на множестве допустимых решений задать лексико-

графическое отношение предпочтения.

Определение 5. Допустимое решение x лексикографически предпоч-

тительнее допустимого решения x ,если выполняется одно из условий:

1) f1(x )>f1(x ),

(4)

 

 

 

2) i m f (x j) f (x j ) для j=1,…,i и fi+1(x )=fi+1(x )

Если fi(x )=fi(x ) для

всех i=1,…,m, то допустимые решения x ,x лекси-

кографически эквивалентны.

 

Определение.

Допустимое решение x лексикографически опти-

мальное, если не существует допустимого решения x , для которого выпол-

няется условие (4).

 

 

 

 

 

 

 

 

 

Найти лексикографически

оптимальное решение многокритериаль-

ной задачи можно, решив следующую последовательность задач:

 

1) найти

max f (x) f *

в области x X;

 

 

1

 

 

1

 

 

 

 

 

2) найти

max f

2

(x) f *

в области, задаваемой условиями

 

 

 

 

 

2

 

 

 

 

 

 

x X;

f (x) f *;

(5)

 

 

 

 

 

1

 

1

 

 

 

……………………………………………………………….

 

m) найти

max f

m

(x) f *

в области, задаваемой условиями

 

 

 

 

 

m

 

 

 

 

 

x X; f

(x) f * , i

 

 

 

 

1, m 1;

 

 

 

 

 

i

 

 

i

 

Итак, искомым лексикографически оптимальным является

всякое ре-

шение последней ( m-ой ) задачи. Полученное при этом лексикографически оптимальное решение является одной из эффективных точек, однако выбор

27

порядка ранжирования существенно влияет на то, какая из эффективных то-

чек будет найдена.

Так как область допустимых решений очередной задачи представляет собой множество оптимальных решений предшествующих задач, то она бы-

стро сужается до одной точки, лишая свободы выбора при максимизации по-

следующих критериев. Попытка избавиться от этого недостатка предпринята в методе последовательных уступок.

Метод последовательных уступок (компромиссов)

Здесь так же, как и в предыдущем походе, вначале производится каче-

ственный анализ относительной важности критериев. На основании такого анализа критерии нумеруются в порядке убывания важности.

Ищем максимальное значение f1* первого критерия f f1(x) на всем множестве допустимых решений. Затем назначаем величину «допусти-

мого» снижения (уступки) 1 критерия f1(x) и определяем наибольшее

значение f * второго критерия f f

2

(x) при условии, что значение пер-

2

 

 

 

 

 

 

вого критерия должно быть не меньше,

чем f * -

. Затем назначаем вели-

 

 

 

1

1

 

 

 

чину «допустимого» снижения (уступки) 2 критерия f2 (x) и опре-

 

деляем наибольшее значение f *

третьего критерия f f

3

(x) при усло-

3

 

 

 

 

 

 

вии, что значение второго критерия должно быть не меньше,

чем f * -

и

 

 

 

 

 

 

2

2

т. д. Таким образом, оптимальным решением многокритериальной задачи считается всякое решение последней из задач последовательности:

1)найти max f1(x) f1* в области x X ;

2)найти max f2 (x) f2* в области, задаваемой условиями

x X ; f

(x) f * ;

(6)

1

1

1

 

m) найти max fm (x) fm* в области, задаваемой условиями

 

(x) f *

 

 

 

 

x X; f

i

, i

1, m 1;

i

i

 

 

 

28

Очевидно, что если все i =0, то метод уступок находит только лекси-

кографически оптимальные решения, которые доставляют первому по важ-

ности критерию наибольшее на Х значение. В другом крайнем случае, когда величины уступок очень велики, решения , получаемые по этому методу,

доставляют последнему по важности критерию наибольшее на Х значение.

Поэтому величины уступок можно рассматривать как своеобразную меру отклонения приоритета частных критериев от жесткого лексикографическо-

го.

Метод последовательных уступок не всегда приводит к получению

только эффективных точек, но среди этих точек всегда существует хотя бы одна эффективная. Это следует из следующих утверждений [2].

Утверждение. Если X Rn - множество замкнутое и ограниченное, а

функции fi(x) непрерывны, то решением m-й задачи из (6) является, по крайней мере, одна эффективная точка.

Утверждение. Если x - единственная (с точностью до эквивалент-

ности) точка, являющаяся решением m-й задачи из (6), то она эффективна.

Примеры решения многокритериальной задачи методом после-

довательных уступок

Пример. Решить методом последовательных уступок многокритериаль-

ную задачу из примера.

f1(x)=7x1 +2x3-x4+x5 max , f2(x)=x1-5x2-4x3+x4 max

при ограничениях

-x1 +x2

+x3

=2 ;

3x1 -x2

+x4

=3 ;

5x1+2x2 +x3+x4 +x5=11;

xi 0 для i=1,2,...,5.

29

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]