Добавил:

ivanov666 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Воронежская государственная лесотехническая академия

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

4539

.pdf

Скачиваний:

Добавлен:

08.01.2021

Размер:

1.13 Mб

Скачать

☆

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

Решение игры =	1	;	SB = ( y1 ,… yn ) = ( q1 ,… q*n ).

	g(Y*)

Пример. Найти оптимальные смешанные стратегии игры, заданной

следующей платежной матрицей:
		В1	В2	В3	нижняя цена игры = 4,
	А1	1	10	3	верхняя цена игры = 5,
	А2	8	4	5	т.е. – седловой точки нет.

Сведем данную задачу к задаче линейного программирования. Найдем оптимальную стратегию игрока А – (S*A ):

f(x) = X1 + X2 min. X1 + 8X2 1,

10X1 + 4X2 1,

3X1 + 5X2 1,

X1 , X2 0.

f (x) 0,21;

X1 0,026;

X2 0,184,

отсюда

=	1	= 4,76;	P1 = 4,76 0,026 = 0,124;	P2 = 4,76 0,184 = 0,876.
	0,21

Найдем оптимальную стратегию игрока В – (S*B ):

g(y) = y1 + y2 + y3 max.

y1 + 10y2 + 3y3 1,

8y1 + 4y2 + 5y3 1, y1 , y2 , y3 0.

g y 0,21;	y1 0;	y2 0,0526;	y3 0,158,
отсюда
q1 = 0;	q2 = 4,76 0,0526 = 0,25;		q3 = 4,76 0,158 = 0,75.

Таким образом, применяя свою первую чистую стратегию с вероятно-

стью 0,124 и вторую – с вероятностью 0,876, игрок А выигрывает величину

4,76. Игрок В, применяя свою вторую чистую стратегию с вероятностью 0,25

и третью – с вероятностью 0,75, проигрывает величину 4,76, иначе он проиг-

рывает больше.

Игра два на два (2 х 2)

Рассмотрим игру, в которой у игроков А и В по две стратегии. Платежная матрица имеет вид

	В1	В2
А1	a11	a12	(8)

А2 a21 a22

Рассмотрим случай, когда игра не имеет седловой точки.

Теорема 4. Пусть S*A и S*B – оптимальные смешанные стратегии игры с

платежной матрицей (1) и ценой игры , тогда для любого i, при котором вы-
полняется строгое неравенство				верхняя		граница игры -	сколько
полняется строгое неравенство						самое меньшее	проиграть
					A1	самое меньшее	проиграть
					A1	игрок В.
А2						игрок В.
А2		М				q1 - вероятность выбора
						q1 - вероятность выбора
						стратегии B1.
						стратегии B1.
А1					а1	q2 - вероятность выбора
а2						стратегии B2.
а2
	а1
	а1				A2
В1				а2	A2
0					B2
	q2	S*	q1		1
		B

а ij qj < ,

j 1

имеет место равенство pi = 0. А если pi > 0, то

а ij qj = .

j 1

Аналогично, если для некоторых j

аij pi > ,

i 1

то для этих j qj = 0. А если qj > 0, то

аij pi = .

i 1

Определим оптимальную смешанную стратегию S*A игрока А,

этого решим систему трех уравнений с тремя неизвестными

а11 p1 + а21 p2 = , а12 p1 + а22 p2 = ,

p1 + p2 = 1.

Решив следующую систему, найдем оптимальную стратегию S*B

а для

игро-

ка В:

а11 q1 + а12 q2 = , а21 q1 + а22 q2 = ,

q1 + q2 = 1.

Рассмотрим первую систему. Вычитая из первого равенства второе, по-

лучая

(а11 - а12) p1 + (а21 - а22) p2 = 0.

Подставим P2 = 1 - P1, тогда

(а11 - а12) p1 + (а21 - а22) (1- p1 ) = 0,

отсюда оптимальная смешанная стратегия для игрока А – А*( p1, p2)

P1 = (а22 - а21)/( а11 - а12 + а22 - а21),

P2 = 1- P1 = (а11 - а12)/( а11 - а12 + а22 - а21).

цена игры

= ( а11 а22 - а21 а12)/ ( а11 - а12 + а22 - а21).

Рассуждая аналогично, для определения оптимальной стратегии игрока В получая

q1 = (а22 - а12)/( а11 - а12 + а22 - а21),

q2 = (а11 - а21)/( а11 - а12 + а22 - а21).

Задание по лабораторной работе Найти решение игровых ситуаций графически, аналитически и пред-

ставить игру в виде задачи линейного программирования.

Допустим в матричной игре два игрока имеют возможность выбора из нескольких вариантов решений. Аi (i 1 m) – стратегии игрока А,

Вj ( j 1 n) – стратегии игрока В. Значения выигрышей представлены в мат-

рицах по вариантам.

6 10		6 7			3 11			11 10				16 3
	7 9			4 12		7	3			2 4			7	18
	7 9			4 12		7	3			2 4			7	18
	8 2			8 1		4	4			3 5			8		2
	8 2			8 1		4	4			3 5			8		2
1 12				5 2		8	5			8 12			6		7
3 11		21 7			7		8	1 10			16 3

17 5				4 12		3	3		2 14			2		8

	4 2		8 11		1		4		8 5			7		3
1 7			6 2		8		7		8 12			6		4

Практическое занятие 5

Вероятностные модели теории принятия решений. Рисковые ситуации

Цель работы: Изучение методов принятия решения на основе вероятност-

ных моделей. Рисковые ситуации.

В рамках исследуемой проблемной ситуации анализируемый субъект экономики как правило подвержен воздействию внешних факторов. При этом точные значения этих факторов (т.е. конкретное состояние внешней среды) заранее неизвестны. В этом случае лицо принимающее решение должно выявить возможные состояния внешней среды и оценить эффектив-

ность каждого из своих возможных решений в различных условиях. После чего необходимо выбрать предпочтительное решение. Если при этом извест-

ны вероятности состояний внешней среды, то такие условия называют усло-

виями риска, а если неизвестны – то неопределенности.

Этапы принятия решений в условиях риска или неопределенности:

1)Формирование цели принятия решения;

2)Построение экономико-математической модели задачи принятия решения (происходит так же, как и в случае определенности внешних факто-

ров);

3)Формирование множества альтернативных решений;

4)Выявление неопределенных внешних факторов, влияющих на дос-

тижение цели, формирование возможных состояний внешней среды;

5) Расчет эффективности вариантов решения при различных состояни-

ях внешней среды, формирование матрицы ценности альтернатив;

6)Оценка вероятности состояний внешней среды (если возможно);

7)Выбор предпочтительного варианта решения.

Матрица ценности альтернатив имеет вид: Таблица 1.

Номер альтернативного решения	Номер состояния внешней среды
	1	…	j	…	m
1	u11	…	u1 j	…	u1m


i	ui1	…	uij	…	u

					im

n	un1	…	unj	…	unm

В этой матрице величина uij обозначает ценность i-го решения при

реализации j-го состояния внешней среды.

Для каждой альтернативы можно найти ее пессимистичную и оптимистичную оценки (соответственно наименьшее uimin и наибольшее значения

uimax в соответствующей строке матрицы).

Выбор решения в условиях неопределенности Для этого существует ряд критериев: максиминный критерий Вальда,

максимаксный критерий («оптимистический»), критерий Гурвица, критерий Лапласа.

Критерий Вальда соответствует пессимистической оценке: выбирается та альтернатива, для которой пессимистическая оценка наибольшая, т.е. мак-

	В
	В

	симум из минимумов, лучшая из худших. u max
		i

min j

u		max u	min	.
			min

	ij		i
		i

Максимаксный критерий: выбирается альтернатива с наибольшей оп-

тимистической оценкой (лучшая из лучших).

Критерий Гурвица (взвешенный критерий): альтернативы оцениваются

согласно выражению	~	min	max	., где 0 1 – коэффициент
согласно выражению	ui (1	)ui	ui	., где 0 1 – коэффициент

оптимизма. Значение =0 соответствует пессимистичной оценке (т.е. крите-

рию Вальда), =1 соответствует оптимистичной оценке (т.е. максимаксному критерию). Промежуточные значения соответствуют взвешенному, т.е.

пессимистично-оптимистичному, взвешенному подходу. Задав фиксирован-

ное значение коэффициента оптимизма, выбирают альтернативу с наиболь-

шей оценкой.

Критерий Лапласа: альтернативы оцениваются с учетом всего диапа-

зона ценностей (а не только худшего и/или лучшего значений): ui m1

Выбирается альтернатива с наибольшей оценкой.

Вычисления проводить использовав табличный процессор Excel.

Числовой пример:

uij . j 1

Матрица ценностей представлена в табл. 2. Там же приведены значения критериев. Лучшие по каждому из критериев решения показаны жирным шрифтом:

Таблица 2.

Номер альтерна-	Состояние внешней среды		Критерий
тивного решения	1.Конкурен-	2.Конкурен-	Критерий	Максимакс-	Критерий	Критерий
	ция на преж-	ция усилилась	Вальда	ный	Гурвица	Лапласа
	нем уровне				( 0.4)

1.Продолжать	125	90	90	125	104	112,5
работу в обыч-
ном режиме
2.Усилить рек-	120	95	95	120	105	112,5
ламную деятель-
ность

Методика принятия решения в условиях риска.

Если каким-либо образом (например, экспертным методом) оценены вероятности состояний внешней среды ( p j ), то для оценки альтернативных

решений используются критерии Байеса-Лапласа или Ходжеса-Лемана:

Критерий Байеса-Лапласа:

min

0 1 –

ui , где

Критерий Ходжеса-Лемана: ui (1

)ui

коэффициент доверия к вероятности (т.е. к экспертам).

Варианты индивидуальных заданий Вариант 1. Предприятие имеет три альтернативных варианта своей ры-

ночной стратегии. Оценка его прибыли в зависимости от состояния внешней среды приведена в табл. 3.

А) Принятие решения в условиях неопределенности.

Необходимо найти оптимальные стратегии при пессимистической оценке (по критерию Вальда), оценке Лапласа, взвешенной оценке (по крите-

рию Гурвица). Значение коэффициента оптимизма выбрать самостоятельно.

Результаты выбора решения отразить в таблице, аналогично табл. 2. Сделать выводы о применимости критериев.

Б) Принятие решения в условиях риска.

Пусть получены экспертные оценки вероятностей состояний внешней среды p1=0.5, p2=0.35, p3=0.15. Оценить альтернативные решения по крите-

рию Байеса-Лапласа. Результаты вычисления ценности альтернативных ре-

шений занести в ту же таблицу. Выбрать наилучшее решение. Сравнить ре-

зультат выбора с полученными ранее результатами выбора решения в усло-

виях неопределенности.

Таблица 3.

Возможные	аль-	Возможные состояния внешней среды
тернативные решения		1.Конкуренция	на	2.Конкуренция немного	3. Конкуренция
		прежнем уровне		усилилась	резко усилилась
1. Продолжать работу в		100		80	50
обычном режиме
2.Активизировать	рек-	90		90	70
ламную деятельность
3.Активизировать	рек-	60		70	80
ламу и снизить цены

Варианты 2-14.

Постановка задачи такая же, как и для варианта 1. Численные значения

матрицы ценности альтернатив (т.е. оценок прибыли предприятия) приведе-

ны в табл. 4.

Таблица 4.

№ варианта	Матрица ценности		№ варианта	Матрица ценности		№ варианта	Матрица
							ценности
1	100 80 50		6	100 80 50		11	100 70 50
	90	90 70		90 100 70			90	90 60
	60	70 80		60	90 80		50	60 70
2	100 70 60		7	100 80 50		12	100 70 50
	80	90 70		80	90 70		80	90 60
	60	70 80		60	90 80		60	70 80
3	100 80 40		8	100 80 40		13	100 80 50
	70	90 60		70	90 50		70	90 60
	60	70 80		50	70 80		60	70 70
4	100 80 20		9	100 80 50		14	100 80 50
	80	90 40		80	90 70		70	90 70
	30	40 80		40	70 80		40	60 70
5	100 80 50		10	100 80 30		15	100 80 40
	80	95 70		90	90 40		80	90 70
	60	70 80		50	60 70		50	70	100

Ранжирование критериев

Пусть все критерии можно ранжировать (строго упорядочить) по важно-

сти так, что при последовательном рассмотрении критериев вначале исполь-

зуется первый (наиболее важный с точки зрения ЛПР) критерий, затем вто-

рой и т.д. Это позволяет на множестве допустимых решений задать лексико-

графическое отношение предпочтения.

Определение 5. Допустимое решение x лексикографически предпоч-

тительнее допустимого решения x ,если выполняется одно из условий:

1) f1(x )>f1(x ),

(4)


2) i m f (x j) f (x j ) для j=1,…,i и fi+1(x )=fi+1(x )
Если fi(x )=fi(x ) для	всех i=1,…,m, то допустимые решения x ,x лекси-
кографически эквивалентны.
Определение.	Допустимое решение x лексикографически опти-

мальное, если не существует допустимого решения x , для которого выпол-

няется условие (4).
Найти лексикографически							оптимальное решение многокритериаль-
ной задачи можно, решив следующую последовательность задач:
1) найти	max f (x) f *					в области x X;
	1				1
2) найти	max f	2	(x) f *			в области, задаваемой условиями
		2			2
	x X;				f (x) f *;				(5)
					1		1
……………………………………………………………….
m) найти	max f		m	(x) f *			в области, задаваемой условиями
			m			m
	x X; f				(x) f * , i
	x X; f				(x) f * , i			1, m 1;
				i			i
Итак, искомым лексикографически оптимальным является									всякое ре-

шение последней ( m-ой ) задачи. Полученное при этом лексикографически оптимальное решение является одной из эффективных точек, однако выбор

порядка ранжирования существенно влияет на то, какая из эффективных то-

чек будет найдена.

Так как область допустимых решений очередной задачи представляет собой множество оптимальных решений предшествующих задач, то она бы-

стро сужается до одной точки, лишая свободы выбора при максимизации по-

следующих критериев. Попытка избавиться от этого недостатка предпринята в методе последовательных уступок.

Метод последовательных уступок (компромиссов)

Здесь так же, как и в предыдущем походе, вначале производится каче-

ственный анализ относительной важности критериев. На основании такого анализа критерии нумеруются в порядке убывания важности.

Ищем максимальное значение f1* первого критерия f f1(x) на всем множестве допустимых решений. Затем назначаем величину «допусти-

мого» снижения (уступки) 1 критерия f1(x) и определяем наибольшее

значение f * второго критерия f f		2	(x) при условии, что значение пер-
2		2
вого критерия должно быть не меньше,			чем f * -	. Затем назначаем вели-
			1	1
чину «допустимого» снижения (уступки) 2 критерия f2 (x) и опре-
деляем наибольшее значение f *	третьего критерия f f				3	(x) при усло-
3					3
вии, что значение второго критерия должно быть не меньше,						чем f * -	и
						2	2

т. д. Таким образом, оптимальным решением многокритериальной задачи считается всякое решение последней из задач последовательности:

1)найти max f1(x) f1* в области x X ;

2)найти max f2 (x) f2* в области, задаваемой условиями

x X ; f	(x) f * ;		(6)
1	1	1

m) найти max fm (x) fm* в области, задаваемой условиями

	(x) f *
x X; f	(x) f *	i	, i	1, m 1;
i	i	i

Очевидно, что если все i =0, то метод уступок находит только лекси-

кографически оптимальные решения, которые доставляют первому по важ-

ности критерию наибольшее на Х значение. В другом крайнем случае, когда величины уступок очень велики, решения , получаемые по этому методу,

доставляют последнему по важности критерию наибольшее на Х значение.

Поэтому величины уступок можно рассматривать как своеобразную меру отклонения приоритета частных критериев от жесткого лексикографическо-

го.

Метод последовательных уступок не всегда приводит к получению

только эффективных точек, но среди этих точек всегда существует хотя бы одна эффективная. Это следует из следующих утверждений [2].

Утверждение. Если X Rn - множество замкнутое и ограниченное, а

функции fi(x) непрерывны, то решением m-й задачи из (6) является, по крайней мере, одна эффективная точка.

Утверждение. Если x - единственная (с точностью до эквивалент-

ности) точка, являющаяся решением m-й задачи из (6), то она эффективна.

Примеры решения многокритериальной задачи методом после-

довательных уступок

Пример. Решить методом последовательных уступок многокритериаль-

ную задачу из примера.

f1(x)=7x1 +2x3-x4+x5 max , f2(x)=x1-5x2-4x3+x4 max

при ограничениях

-x1 +x2	+x3	=2 ;
3x1 -x2	+x4	=3 ;

5x1+2x2 +x3+x4 +x5=11;

xi 0 для i=1,2,...,5.

<<< < Предыдущая 1 23 / 53 4 5 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.01.20211.12 Mб14533.pdf
#
08.01.20211.12 Mб34534.pdf
#
08.01.20211.13 Mб34536.pdf
#
08.01.20211.13 Mб14537.pdf
#
08.01.20211.13 Mб834538.pdf
#
08.01.20211.13 Mб24539.pdf
#
08.01.2021199.83 Кб1454.pdf
#
08.01.20211.13 Mб14540.pdf
#
08.01.20211.13 Mб24541.pdf
#
08.01.20211.13 Mб14542.pdf
#
08.01.20211.14 Mб34543.pdf