Добавил:

Ravochking Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кузбасский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf

Скачиваний:

Добавлен:

01.01.2020

Размер:

667.17 Кб

Скачать

☆

<<< < Предыдущая 1 2 34 / 154 5 6 7 8 9 10 11 12 13 14 15 > Следующая >>>

2.МАТРИЧНЫЕ ИГРЫ

2.1.Примеры матричных игр

Для того, чтобы составить экономико-математическую модель конфликтной ситуации в виде матричной игры, необходимо построить матрицу выигрышей. Это весьма нетривиальная задача, особенно для игр большой размерности. В общем виде матрица игры (платежная матрица) строится следующим образом:

1) перечисляем все возможные чистые стратегииAi и Bj

игроков;

2)формализуем правила, по которым развивается конфликт

ввиде функции выигрышей f (i, j ) = aij .

Рассмотрим несколько примеров построения платежных матриц.

№ 2.1. Поставка товаров. На каждой из двух баз ассортиментный минимум составляет один и тот же набор изn видов товаров. Каждая база должна поставить в свой магазин только один из этих видов товара. Магазины, обозначим их через A и B, конкурируют между собой. Один и тот же вид товара в обоих магазинах продается по одной и той же цене. Однако товар, поставляемый в магазинB, более высокого качества. Если магазин A

завезет с базы товар i-го вида ( i =1, n ), а магазин B-товар j-го ви-

да ( i =1, n ), отличной от товараi-го вида ( i ¹ j ), то товар i-го вида будет пользоваться спросом и магазин A получит прибыль ci у.е. Если же в магазины A и B завезены товары одинакового вида ( i = j ), то товар i-го вида в магазине A не будет пользо-

ваться спросом, так как такой же товар, но более высокого качества продается в магазинеB, по такой же цене. Поэтому магазин B понесет убытки по транспортировке, хранению и, возможно, порче товара i-го вида в размере d j у.е.

Требуется составить платежную матрицу игры при n = 3 .

Решение. Формализуем данную конфликтную ситуацию. Пусть в качестве первого игрока выступает магазин A, а в качестве 2-го — магазин B. Игрок A с целью достижения прибыли имеет возможность выбрать одну изn следующих стратегий Ai —

завезти со своей базы товар i-го вида.									Игрок B	также	обладает
n стратегиями Bj						— завезти ее со своей базы j-й товар. Пусть
игроки	выбрали					стратегии{Ai, Bj } .			Тогда можно		составить
следующую функцию выигрышей игрока A:
		ìc ,если i ¹ j,
f (i,	j )=	íïdi	j	,если i = j, ,
		ï	j
		î
а платежная матрица (матрица игры), например,										при n = 3 будет
выглядеть следующим образом:
æ -d1			c1			c1		ö
A = ç	c	-d			2	c		÷ .
ç	2				2	2		÷
ç	c		c			-d	3	÷
è	3			3			3	ø

№ 2.2. Антагонистическая конкуренция. Фирма A производит некоторый сезонный товар, имеющий спрос в течениеT единиц времени, и который она может поставить на рынок в один из моментов времени i =1, 2, .., T . Для конкурентной борьбы с фирмой A дочерняя фирма B концерна D, не заботясь о собственных доходах, производит аналогичный товар, который поступает на рынок в один из моментов времени j =1, 2, .., T . Пусть технология

выпуска товара такова, что чем дольше он находится в производстве, тем выше его качество, а реализуется только товар более высокого качества (так как цена на товары разного качества одна и та же). Доход от продажи товара в единицу времени равен c у.е.

Требуется построить функцию выигрышей фирмыA, где под выигрышем понимается доход фирмы A. При этом единственным законным средством фирмы B в конкурентной борьбе является

выбор момента поставки товара на рынок, так как понижение цены на поставляемый товар запрещено определенными соглашениями.

Решение. Формализуем данную конфликтную ситуацию. В качестве игроков выступают фирмыA и B, которые преследуют прямо противоположные интересы: фирма A стремится максимизировать свой доход, а фирма B — минимизировать его. Для

достижения	своей	цели фирмаA обладает T стратегиями:
A1 , A2 , K, AT ,	где Ai ,	( i =	1,T	) — стратегия, состоящая в том,

что фирма A поставляет товар на рынок в момент времени i . Фирма B обладает аналогичными стратегиямиBj , j =1,T . Рас-

смотрим три возможных варианта результатов сравнения моментов поставки товаров фирмами A и B.

1. Если i < j , то в течение ( j - i ) ед. времени фирма A не будет иметь конкурента и ее доход составит величинуc ( j - i ) у.е. В момент времени t = j на рынке появляется товар фирмы

B, который имеет более высокое качество, так как он поступает на рынок позже. Поэтому, начиная с момента времениj, фирма A теряет рынок и дохода в дальнейшем не получает.

2. Если i = j , то обе фирмы поставляют свой товар на рынок одновременно, поэтому фирма A (так же как и фирма B ) в оставшиеся (n - i +1) ед. времени получит ровно половину дохода

вразмере c (n - i +1)/ 2 у.е.

3.Если i > j , то товар фирмы A более качественный, поэто-

му в течение оставшихся (n - i +1) ед. времени фирма A получит доход в размере c (n - i +1) у.е.

Таким образом, функция выигрышей игрокаA может быть записана в виде:

	(		)	ìc	( j - i ),при i < j,
f		i, j		í	(	n +1	- i	)	/2, при i = j,
			=	ïc
				îïc	(n +1		- i),при i > j.

Если предположить, например, что T = 4 , то можно составить следующую платежную матрицу игры:

æ 2c		c	2c	3c	ö
ç	3c	1,5c c		2c	÷
A = ç					÷ .
ç 2c		2c	c	c	÷
ç	c	c	c		÷
è				0,5c ø

2.2. Равновесная ситуация

Как уже отмечалось выше, одной из основных задач теории игр является выработка принципов оптимальности, то есть правил, которые позволяют установить, какое поведение игроков следует считать разумным(целесообразным) с точки зрения самих игроков.

Поскольку все возможные действия игроков в матричной игре описываются множеством стратегий Ai и Bj , то задача заклю-

чается в выборе такой стратегии, которая способствует достижению поставленной цели — максимизации выигрыша для игрока A или минимизации проигрыша для игрока B.

Рассмотрим методику поиска решения на следующем примере матричной игры, повторяемой многократно:

№ 2.3. Найти решение матричной игры 3 ´3 :

	æ -2		2	-1ö
A =	ç	2	1	1	÷
	ç				÷ .
	ç	3	-3	1	÷
	è				ø

Решение. Попробуем определить оптимальные стратегии игроков. Начнем со стратегии первого игрока, который стремится максимизировать свой выигрыш, учитывая то, что второй игрок будет пытаться свести выигрыш первого игрока к минимуму. Если первый игрок выберет стратегию A1 , то второй ответит стра-

тегией B1 , при которой выигрыш первого равен наименьшему

значению -2. На стратегию A2 будет ответом B2 или B3 с минимальным выигрышем 1, а на стратегию A3 – B2 с минимальным

выигрышем -3.

Запишем эти минимальные выигрыши в правый столбец:

				Т а б л и ц а 2 . 1

	B1	B2	B3

A1	-2	2	-1	-2

	2	1	1
A2	2	1	1		1


A3	3	-3	1	-3

Естественно, что первый игрок выбирает стратегию A2 , при которой его минимальный выигрыш максимален:

max min =1 .

Таким образом, если первый игрок выберет стратегиюA2 ,

ему гарантирован выигрыш не меньший, чем 1, при любом поведении второго игрока.

Рассмотрим теперь поведение второго игрока. Если он выберет стратегию B1 , то первый может ответить стратегией A3 , при которой он получит максимальный выигрыш 3, на B2 ответит A1 ,

и на B3 – A2 или A3 .

Запишем эти максимальные выигрыши в нижней строке.

					Та блица 2 . 2

	B1	B2		B3

A1	-2	2	-1		-2

	2	1	1
A2	2	1	1			1


A3	3	-3	1		-3

	3	2
	3	2		1

Естественно, что второй игрок выбирает стратегиюB3 , при которой максимальный выигрыш первого игрока минимален:

min max =1 .

То есть, если второй игрок будет придерживаться стратегии B3 , то при любом поведении первого игрока он не проиграет больше, чем 1.

В этом примере числа max min и min max совпали:

max min = min max =1 .

Это означает, что стратегии A2 и B3 являются оптимальными стратегиями игроков в том смысле, что при многократном повторении игры отказ от выбранной стратегии любым из игроков уменьшает его шансы на выигрыш(увеличивает его шансы на проигрыш).

И в самом деле. Если первый игрок будет придерживаться, например, стратегии A1 , то не стоит думать, что второй этого не заметит. Конечно же, заметит и тут же ответит стратегией B1

и выигрыш первого игрока уменьшится.

Таким образом, мы получили так называемуюравновесную ситуацию {A2 , B3 } .

Рассмотрим теперь произвольную матричную игру:

æ a	a	...	a	ö
ç 11	12		1n	÷
A = ç a21	a22	...	a2n ÷		,	(2.1)
ç ...	...	...	...	÷
ç	am2	...		÷
è am1	am2	...	amn ø

и опишем общий алгоритм, с помощью которого можно определить, есть ли в этой игре ситуация равновесия. При этом мы предполагаем, что оба игрока действуют разумно, то есть стремятся к получению максимального выигрыша, считая, что соперник действует наилучшим для себя образом.

Рассмотрим действия первого игрока:

1. В каждой строке матрицыA находится минимальный элемент:

ai	= min ai , j ,i =1, m ,
	j =1,n

и полученные числаai запишем в виде добавочного правого столбца к матрице A:

æ a11		a12	...	a1n		a1		ö
ç a		a	...	a		a		÷
ç	21	22			2n		2	÷ .
ç ... ...			... ...			K		÷
ç		a	...	a		a		÷
ç a	m1	a	...	a		a		÷
è	m1	m 2		mn			m ø

То есть, выбирая некоторую стратегию Ai , первый игрок рассчитывает выиграть не меньше ai при любых действиях второго игрока.

2. Среди чисел a1 ,a2 ,K,am выбирается наибольшее число:

a = maxai	= max min aij .	(2.2)
i	i j

То есть, выбрав описанную стратегию (2.2), первый игрок гарантирует себе выигрыш не меньшийa . Число a называют

нижней ценой игры.

Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, первый игрок должен остановиться на той стратегии, при которой число ai будет максимальным.

Принцип построения стратегии игрока, основанный на формуле (2.2), называется принципом максимина, а выбранная стратегия A* — максиминной стратегией первого игрока.

Рассмотрим теперь поведение второго игрока.

1. В каждом столбце матрицы A находится максимальный элемент:

b = max a , j =1, n ,

jij

i =1,m

иполученные числа запишем в виде нижней добавочной строки:

æ	a12	K a1n	a		ö
ç a11	a12	K a1n		1	÷
ç a21	a22	K a2n a2 ÷

ç	K	K K K K ÷ .					(2.3)
ç		am 2				÷
ç am1		am 2		K amn am ÷
ç						÷
ç		b		K b		÷
ç b		b	2	K b	n	÷
è	1		2		n	ø

То есть, выбрав некоторую стратегию Bj , второй игрок рас-

считывает на то, что в результате любых действий первого игрока он проиграет не больше b j .

Среди чисел b1 , b2 ,..., bn выбирается наименьшее число

b = min b j = min max aij .			(2.4)
j	j	i
То есть,	выбрав	стратегию (2.4), второй	игрок гарантирует
себе проигрыш, не превышающий b . Число b			называется верхней

ценой игры.

Таким образом, действуя наиболее осторожно и рассчитывая на наиболее разумное поведение соперника, второй игрок должен остановиться на стратегии, при которой b j будет минимальным.

Принцип построения стратегии второго игрока, основанный на правиле (2.4), называется принципом минимакса, а выбранная стратегия B* называется минимаксной стратегией второго игрока.

Отметим, что нижняя и верхняя цены игры всегда связаны

соотношением:
a £ b .	(2.5)

Если a = b , то ситуация {A* , B*} называется равновесной,

ини один из игроков не заинтересован в том, чтобы ее нарушить.

Вслучае, если a = b , то их общее значение называют ценой

игры n :

n =a	b	max=min aij		min max aij .		(2.6)
		i	j	j	i
В этом случае цена игры n					совпадет	с соответствующим
элементом	a*	матрицы A, который называется точкой равнове-
	ij

сия или седловой точкой матрицы A. Или седловой точкой является элемент матрицы A, максимальный в своем столбце и минимальный в своей строке.

Стратегии A* и B* , соответствующие седловой точке, называются оптимальными, а совокупность пары оптимальных реше-

ний {A* , B*} и цены игрыn называется решением матричной

игры с седловой точкой.

Если a < b , то речь пойдет уже об игре без седловой точки. В этом случае предложенный выбор стратегий к равновесной ситуации не приводит, и при многократном повторении игры у игроков могут возникнуть мотивы к нарушению рекомендаций, приведенных выше.

№ 2.4. Найти нижнюю и верхнюю цены игры для следующей матричной игры:

æ3		5	8	6	11ö
A = ç	8	4	12	7	9	÷ .
è						ø

Решение. Определим максиминную стратегию первого игрока, выбрав наименьшие значения выигрышей в каждой строке:

a1 = 3,=a2= 4,= a maxai 4 Þ A2 .

<<< < Предыдущая 1 2 34 / 154 5 6 7 8 9 10 11 12 13 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.08.20192.37 Mб1RuthlessManagementOfPeople.pdf
#
22.08.20192.15 Mб3RuthlessManagementOfPeopleAndProfits.pdf
#
29.10.20193.88 Mб6ruthven_malise_fundamentalism_a_very_short_introduction.pdf
#
18.06.20201.65 Mб23rybina_ea_i_dr_angliiskii_iazyk_dlia_magistrov_i_aspirantov.pdf
#
22.08.201962.98 Кб23rybuf.doc
#
01.01.2020667.17 Кб34sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
#
29.10.20192.83 Mб33Saidov_Sravnitelnoe_pravovedenie.pdf
#
19.11.20192.41 Mб55sarkisov_o_r_lyubarskiy_e_l_ekologicheskoe_pravo.pdf
#
27.10.2020880.12 Кб4sarpova_ov_filosofiia_istoricheskogo_poznaniia_v_trudakh_shk.pdf
#
29.10.20192.12 Mб7Sartr_Zhan-Pol_Bytie_i_nichto_Opyt_fenomenologicheskoy_ontologii_-_royallib_ru.doc
#
19.04.20202.04 Mб18savin_l_v_setetsentrichnaya_i_setevaya_voyna_vvedenie_v_kont.pdf