Добавил:

fench Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Национальный исследовательский ядерный университет (МИФИ)

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Елтаренко Исследование операцыи 2007

.pdf

Скачиваний:

Добавлен:

16.08.2013

Размер:

2.72 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1612 13 14 15 16 > Следующая >>>

Sa . Таким образом, для любой смешанной стратегии Sb можно определить приемлемую стратегию Sa .

Можно условно графически представить зависимость приемлемой стратегии Sa как функцию от Sb , представленной на рис. 2.5.

Смешанная стратегия Sb игрока B является приемлемой, если при любой другой смешанной стратегии Sb и фиксированной сме-

шанной стратегии Sa выполняется:
b Sa , Sb	b Sa , Sb .
Sb	Sb

Sa		Sa
Рис. 2.5. Множество приемлемых		Рис. 2.6. Множество приемлемых
стратегий для участника А		стратегий для участника B
Зависимость приемлемой стратегии Sb		от Sa также можно услов-
но представить в виде функции Gb	(рис. 2.6).
Пересечение двух множеств Fa	и Gb	дает решение биматричной
игры (рис. 2.7):

110

S*b

S*a Sa

Рис. 2.7. Определение оптимальных смешанных стратегий

Проиллюстрируем принцип решения биматричных игр на задаче размерности 2 2.

2.4.2.Решение биматричных игр 2 2

Вкачестве исходных данных заданы две матрицы:

S1b

S2b

a11

a12

S1a ,

a21

a22

S2a

S1b

S2b

b11

b12

S1a .

b21

b22

S2a

Смешанные стратегии

для

, P

, для

B :

, P

Выигрыш участника A равен:

111

a S

, S

a P P

11 1a 1b

12 1a 2b

21 2a 1b

22 2a 2b

С учетом

и P

a S

, S

a P P

a P

1 P

11 1a 1b

12 1a

После упрощения получим:

a S

, S

P P

a a

Так как в нашем случае смешанная стратегия

определяется

одной вероятностью

а S

, то условие приемлемой страте-

гии для Sa запишется в виде:

a P

, P

a P

, P

Чистая стратегия

будет приемлемой (лучшей), когда

или когда

0 .

Из данного неравенства можем сделать вывод, что чистая страте-

гия S

– приемлемая, если P

a22

a12

a11

a22

a12

a21

при знаменателе C

a11

a22

a12

a21

0 .

Если же C

0 ,

то тогда P

a22

a12

– прием-

a11

a22

a12

a21

лемая при P

P* .

Напротив, стратегия S

приемлема при

0, т.е. при условии,

что

112

0 .

Таким

образом,

при

стратегия

S2a

приемлема,

если

a22

a12

, а при C

– если P

a11

a22

a12

a21

На рис. 2.8 приведены зависимости при C

0 и C

0 .

P1b

C>0

P1b

C<0

P*1b

P1a

1 P1a

Рис. 2.8. Множество приемлемых стратегий для участника А

Для построения Gb

S1a , S1b

запишем выражение для выигрыша

участника B :

b S

, S b P P

b P P

;

11 1a 1b

12 1a 2b

21 2a 1b

22 2a 2b

; P

;

b S

, S

P P

b b b b

b b

P b b

b .

1b 1a

22 12

1a 12

Чистая стратегия

– приемлемая P

1 , если

или P

b22

b21

b11

b22

b12

b21

при условии, что знаменатель

b11

b22

b12

b21

Если D

0, то чистая стратегия S1b

приемлема при

113

		P		b22	b21		P* .
		1a	b11	b22	b12	b21		1a
			b11	b22	b12	b21
	На рис.	2.9 приведены зависимости				G P		, P	при D	0	и
						b	1a	1b
D	0.
	P1b	D<0			P1b	D>0
	1				1
		Gb
								Gb
	0	P*1a			0			P*1a
		P*1a	1 P1a					P*1a	1 P1a
		Рис. 2.9. Множество приемлемых стратегий для участника B
	Решением биматричной игры будет пересечение Fa								и Gb .
	Возможны четыре варианта пересечения Fa						и Gb		(в зависимости
от знаков C и D).
	Первый вариант
	P
	1b						C 0, D 0 .
							C 0, D 0 .			Реше-
	1					ние		единственное			–
		Gb		Fa		P* , P* .
	P*					1a		1b
	P*
	1b
					P
					1a
	0	P*		1
		1a
				114

Второй вариант
P
1b					C 0, D 0 .
					C 0, D 0 .			Ре-
1			(1,1)		шением будет P* ,			P* ,
		Gb					1a	1b
		Gb			точки		пересечения
P*			F		точки		пересечения
P*			F		(1,1) и (0,0) – неустой-
1b			a		(1,1) и (0,0) – неустой-
1b			a
чи-					вы.
			P
			1a
0	P*		1
	1a
Третий вариант
				C	0, D	0. Решением бу-
P1b			дет P*		, P* . Точки (1, 0) и (0,
				1a	1b
1			1)	дают неустойчивые реше-
1			ния.
	Gb		ния.
	Gb
P1*b
			Fa
			P1a
0	P1*a		1
Четвертый вариант
			C	0, D	0 . Решение единст-
P1b			венное – P* ,			P* .
					1a	1b
1
	Gb
P1*b
		Fa
			P1a
0	P1*a	1	115

Пример решения биматричной игры. Для каждого участника за-

дана матрица выигрышей:

					a		3	1		,		b			6		0		.
					a		3	1		,		b			6		0		.
					ij		1	6				ij			1		3
							1	6							1		3
Находим оптимальные смешанные стратегии:
	*				a22		a12						6	1				7
	P																			, C 0;
	P																			, C 0;
	1b			a11	a22		a12			a21	3 6 1 1 9
				a11	a22		a12			a21	3 6 1 1 9
	*				b22		b21				3		1	2
	P																,		D		0.
	P																,		D		0.
	1a			b11	b22		b12		b21		6		3	1 5
				b11	b22		b12		b21		6		3	1 5
Рассчитываем выигрыши участников игры:
a	a(S* , S* ) a P* P*									a P* P*				a P*				P*			a P*	P*	;
a			a b			11 1a 1b				12 1a 2b						21 2a 1b					22 2a 2b
			a	3 2		7	1 2		2		1 3		7	6 3			2				103 ;
			a		5	9	5		9		5		9	5			9				45
					5	9	5		9		5		9	5			9				45
		b		6 2		7	3 2		2		1 3		7	3 3				2			123.
		b			5	9		5	9		5		9	5				9			45
					5	9		5	9		5		9	5				9			45

Отметим, что принцип нахождения оптимальной смешанной стратегии для игрока А – минимизация выигрыша противника, и для участника В – тоже минимизация выигрыша противника. Этот принцип

распространим для решения игр размерности n m.

2.4.3. Решение биматричных игр n m
Даны две матрицы выигрышей			и	bij		размерности n m.
Даны две матрицы выигрышей		aij	и	bij		размерности n m.
Необходимо найти оптимальные смешанные стратегии:
S*	{P*} и		S*	{P*			}.
a	ia		b			jb
Оптимальную смешанную стратегию {P*} находим из условия
					ia
минимизации выигрыша противника			min		b	,	а {P* }	– из условия
					b		jb
минимизации выигрыша противника min				a .

116

Для нахождения {P*} ставим задачу линейного программирова-
	ia
ния:
			n
		max xi		,
			i 1
	n
при ограничениях	bij xi	1 ( j	1, 2,...,m), xi			0.
i	1
На основе найденных		x* вычисляем		{P*} (см. п. 2.3, решение
		i		ia
матричных игр n m).
Для нахождения	{P* }	ставим задачу линейного программирова-
	jb
			m
ния:		max	y j
			j 1
	m
при ограничениях:	aij yj	1 (i	1, 2, ...,n) ,		yj	0.
j 1
На основе найденных		y* вычисляем		{P*	}	(см. п. 2.3. решение
		j		jb

матричных игр n m).

Выигрыши участников определяются с использованием их матриц выигрышей:

n	m			n	m
a	a PP	,	b		b PP .
a	ij ia jb		b		ij ia jb
i 1	j 1			i 1	j 1

Следует сказать, что матричные (антагонистические) игры являются частным случаем биматричных игр, поэтому для их решения можно использовать принцип решения биматричных игр.

Следует также отметить, что принцип решения биматричных игр может использоваться для решения игр с тремя и более участниками. Чтобы это продемонстрировать, рассмотрим решение диадических игр с тремя участниками.

117

2.5. Диадические игры

Игры, в которых каждому участнику предоставляется только две чистые стратегии, называются диадическими. Участник A: S1a, S2a ,

участник B : S1b, S2b , участник C : S1c, S2c .

В диадических играх смешанная стратегия участника A описыва-

ется вероятностью	P	, так как	P	1 P	. Поэтому решить диади-
	1a		2b	1a
ческую игру – значит найти оптимальные P*						, P*	, P* .
				1a		1b	1c

Продемонстрируем метод решения диадических игр на примере из [2]. Имеются предприятия: A, B и C , осуществляющие сброс воды в один водоем. Каждый из них имеет две чистые стратегии:

S1a , S1b , S1c – используют очистные сооружения; S2a , S2b , S2c – не используют очистные сооружения.

Водоем такой, что если два или более предприятий сбрасывают неочищенную воду, то вода загрязняется выше нормы, и все предприятия платят штраф (-3). Использование очистных средств обходится предприятию в (-1).

Для каждого из участников должны быть заданы матрицы полез-

ности: aijk , bijk , cijk .

Удобно представить эти матрицы графически на кубе (рис. 2.10). Углы куба – возможные исходы (в скобках указаны расходы трех

предприятий при соответствующем исходе aijk ,bijk , cijk ).

Зафиксируем стратегии участников B и C
	S	P , P	S	P	, P	.
	b	1b 2b	c	1c	2c
Приемлемая смешанная стратегия Sa				– это лучшая стратегия для
участника A при фиксированных Sb , Sc .
Fa Sb , Sc	– зависимость приемлемой стратегии Sa						от Sb , Sc ,
Gb Sa , Sc	– зависимость приемлемой стратегии Sb						от Sa , Sc ,

118

Hc Sa , Sb	– зависимость приемлемой стратегии Sc от Sa , Sb .
		P2c
	1	(-1,-1,0)	(-3,-4,-3)
(-4,-3,-3)		(-3,-3,-3)
	(-1,-1,-1)		(0,-1,-1)
			1	P2a
1
P2b	(-1,0,-1)	(-3,-3,-4)

Рис. 2.10. Графическое представление матриц полезностей для участников

Найдем оптимальные стратегии для всех участников на пересечении этих функций. Построим эти функции для нашего примера. Так как у нас в примере игра симметричная, то достаточно построить од-

ну зависимость Fa Sb , Sc .
При первой чистой стратегии P				1 выигрыш будет:
			1a
a P P a P P			a P P a P P			,
111 1b 1c	112 1b	2c		121 2b 1c	122 2b 2c
а при второй чистой стратегии		P2a		1 :
a P P a P P			a P P a P P			.
211 1b 1c	212 1b	2c		221 2b 1c	222 2b 2c

Чтобы первая стратегия была приемлемой, она должна быть лучше второй, поэтому первый выигрыш должен быть не хуже второго.

Сгруппируем слагаемые:

a	a P P a	a P P a	a P P
111	211 1b 1c 112	212 1b 2c 121	221 2b 1c

a122 a222 P2b P2c 0.

119

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 1112 / 1612 13 14 15 16 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
16.08.20132.59 Mб41Елисеев Автоматизация проектирования в программном комплексе 2010.pdf
#
16.08.20132.97 Mб46Елманов Исследование топологии поверхности методом сканируюсчей 2008.pdf
#
16.08.2013616.13 Кб36Елманов Моделирование процессов вакуумной плавки металлов 2008.pdf
#
16.08.20131.25 Mб49Елманов Теплоемкост металлов и сплавов 2007.pdf
#
16.08.20131.15 Mб69Елманов Теплопроводност металлов и сплавов 2007.pdf
#
16.08.20132.72 Mб95Елтаренко Исследование операцыи 2007.pdf
#
16.08.20133.97 Mб131Емелянов Лекции по основам електрослабой 2007.pdf
#
16.08.201311.16 Mб107Емелянов Фундаменталные симметрии 2008.pdf
#
16.08.2013507.34 Кб13Енглиш-Руссиан дицтионары оф енглиш фор манагерес 2009.pdf
#
16.08.20138.42 Mб234Ермолаев Технологические процессы в машиностроении 2011.pdf
#
16.08.20131.2 Mб71Жабрев Лабораторный практикум Получение и 2007.pdf