Добавил:

Ravochking Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Кузбасский государственный технический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf

Скачиваний:

Добавлен:

01.01.2020

Размер:

667.17 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1513 14 15 > Следующая >>>

риском одновременно. В этом случае можно порекомендовать использование особой меры риска — коэффициента вариации:

CV (Ai )= CV=i si ×100 % . ai

Этот коэффициент отражает риск, который приходится на единицу выигрыша (доходности), и дает базу для сравнения стратегий игрока, когда и их средний выигрыш и их средний риск неодинаковы.

В условиях № 4.4. можно получить:

CV1 = s1 ×100 % =15,60 % , a1

CV2 = 51,51% ,

CV3 = 66,81% , CV4 = 66,56% .

Следовательно, по критерию минимизации коэффициента вариации, предпочтения игрока можно проранжировать как:

A1 f A2 f A4 f A3 ,

то есть наиболее предпочтительной является стратегия A1 .

Заметим также, что когда речь идет о среднем выигрыше, то речь идет о возможности многократного повторения игры(акта принятия решений). И условность рассмотренных выше критериев состоит в том, что требуемого количества повторений чаще всего может и не быть.

4.4. О планировании эксперимента в играх с природой

Рассмотрим теперь вопрос о том, в каких случаях следует проводить эксперименты с целью получения дополнительной статистической информации о состояниях природы для принятия более эффективных решений в условиях риска.

101

Рассмотрим сначала так называемый«идеальный» эксперимент, в результате проведения которого игрок получает точную информацию о том, какое состояние природы будет иметь место в данной ситуации. В качестве критерия принятия решений рассмотрим критерий Байеса.

Без проведения эксперимента в качестве оптимальной стратегии по критерию Байеса относительно выигрышей выбиралась стратегия Ai0 с максимальным показателем эффективности (4.21):

ai	= max ai	=a .	(4.27)
0	i=1,m
Если в результате проведенного эксперимента выяснилось,
например, что		природа	будет находиться в состоянииQj , то

в качестве оптимальной надо выбирать стратегию, при которой достигается наибольший выигрыш:

b j = max aij , i=1,m

где b j , j =1, n — показатель благоприятности состояния приро-

ды Qj . То есть надо выбирать такую стратегию, чтобы наиболь-

ший элемент b j j-го столбца матрицы A находился в строке, со-

ответствующей этой стратегии. Однако такое решение мы можем принять только после проведения эксперимента. А нам нужно решить заранее вопрос о целесообразности проведения эксперимента, про который известно только, что он является идеальным, и не известно, в каком именно состоянииQj будет находиться

природа Q, то есть нам не известен размер будущего выигрыша игрока A.

Таким образом, разумно рассмотреть взвешенное среднее выигрышей b j с весовыми коэффициентами p j , то есть выиг-

рыш в случае идеального эксперимента можно определить как:

n
b = å p j b j .	(4.28)

j =1

102

Тогда средний выигрыш игрока A с применением идеального

эксперимента вырастет на величинуb -a . Таким образом, проведение эксперимента имеет смысл, если стоимость c такого эксперимента удовлетворяет условию:

с < b -a .	(4.29)
№ 4.7. Определите стоимость	идеального эксперимента в
условиях № 4.4.

Решение. Вычислим показатели благоприятности состояний природы:

b1 = 80, b2 = 85, b3 = 40.

Тогда

b = 80 × 0, 2 + 85 ×0,3 + 40 ×0,5= 61,5.

Следовательно, так как a = 42,5 , то стоимость эксперимента

сбудет меньше, чем

с < b -a =19 ед.

То есть, если стоимость эксперимента с ³19 ед., то эксперимент проводить невыгодно.

Можно решить эту задачу и в терминах рисков, а именно:

					n
с <	r	min=	ri	min=å p j rij .		(4.30)
		i		i	j =1
					j =1

При этом получаются те же самые результаты, что и по усло-

вию (4.29).

Теперь рассмотрим вопрос о проведении эксперимента, не являющегося идеальным, то есть позволяющего лишьуточнить

103

вероятности состояний природы. В общем случае можно предположить, что такой эксперимент Z приводит к появлению одно-

го из несовместных событий Zn ,n =1, k (исходов эксперимента),

вероятности	которых зависят	от того	состояния		природыQ	,
					j
при котором он проводился.
Предположим, что эти условные вероятности P(Zv					Qj ) собы-
Предположим, что эти условные вероятности P(Zv					Qj ) собы-
тий Z = Zv ,	при условии, что	природа	находится	в состоянии

Q = Qj , известны. Тогда по формулам Байеса можно пересчитать вероятности состояний природы, как

P (Q

Z ) =

P(Q)× P (Z

Q )

(4.31)

или

P (Z )

P (Q = Qj

Z= Zv =)

P (Q = Qj )× P (Z =Zv

Q =Qj )

P (Z = Zv )

P (Q = Qj

)= p j

где

— априорные вероятности состояний приро-

ды;

(

Q = Q

v )

— апостериорные

вероятности со-

Z =

стояний природы, при условии, что результатом эксперимента

будет Z = Zv ; P (Z = Zv )					— вероятности исхода Zv					эксперимента,
вычисляемые по формуле полной вероятности:
			n		Qj )× P (Z =Zv				Q =Qj ).
	P (Z = Zv )		=åP (Q=							(4.32)
	P (Z = Zv )		=åP (Q=							(4.32)
Пусть			j =1
Пусть
		n
		iv = å p jv	× aij , i =			, v =		— показатель эффективности
	a	iv = å p jv	× aij , i =	1, m		, v =	1, k	— показатель эффективности

j =1

104

стратегии Ai по критерию Байеса с апостериорными вероятно-

стями состояний природы Qj ÎQ ;

b v = max aiv			— максимальный средний выигрыш при исходе
i=1,m
эксперимента Zv Î Z ;
k
b% = åP=(Z			Zv )×	b	v	— среднее взвешенное максимальных
v=1
выигрышей		v	с весовыми коэффициентами, равными полным
	b
вероятностям P (Z = Zv )						событий Zv Î Z , вычисляемым по фор-

мулам (4.32).

Тогда средний выигрыш игрокаA с применением неидеаль-

ного эксперимента вырастет на величину b% -a . Таким образом, проведение эксперимента имеет смысл, если стоимость такого эксперимента с% удовлетворяет условию, аналогичному (4.29):

	%	-a .	(4.33)
с < b
%

Можно решить эту задачу и в терминах рисков. При этом результат (4.33) не изменится.

4.8. Определите стоимость проведения эксперимента в условиях № 4.4, если матрица условных вероятностей исходов эксперимента имеет вид:

P (Z	Q)	Z1	Z2	Z3
P (Z	Q)	Z1	Z2	Z3

Q1		0,6	0,25	0,15

Q2		0,3	0,55	0,15

Q3		0,1	0,25	0,65

Решение. Вычисление апостериорных вероятностей состояний природы представим в виде расчетной таблицы:

105

Т а б л и ц а 4 . 1

W	P (W)		P (Z		W)		P (Z		W)P (W )			P (W		Z )
			P (Z		W)		P (Z		W)P (W )			P (W		Z )

		Z1	Z2			Z3	Z1		Z2	Z3	Z1		Z2		Z3

W1	0,2	0,6	0,25			0,15	0,12	0,05		0,03	0,462		0,147		0,075
W2	0,3	0,3	0,55			0,15	0,09	0,165		0,045	0,346		0,485		0,113

Q3	0,5	0,1	0,25			0,65	0,05	0,125		0,325	0,192		0,368		0,812

		åP (Z		W)× P (W )			0,26	0,34		0,40
		åP (Z		W)× P (W )			0,26	0,34		0,40
		W

Пусть исходом эксперимента будет Z = Z1 , с апостериорными вероятностями состояний природы 0,462, 0,346 и 0,192 соответственно. Вычислим показатели эффективности стратегий игрока:

a11 = 0,462 × 25 + 0,346 ×35 + 0,192 × 40 = 31,34 ; a21 = 0,462 ×70 + 0,346 × 20 + 0,192 ×30 = 45,02 ; a31 = 0,462 ×35 + 0,346 ×85 + 0,192 × 20 = 49, 42 ; a41 = 0,462 ×80 + 0,346 ×10 + 0,192 ×35 = 47,14 ,

Тогда максимальный средний выигрыш при исходе эксперимента Z = Z1 будет равен:

b1	= max ai1 = 49, 42 ед.
	i =1,4

Пусть исходом эксперимента будет Z = Z2 , с апостериорными вероятностями состояний природы 0,147, 0,485 и 0,368 соответственно. Вычислим показатели эффективности стратегий игрока:

a12 = 0,147 × 25			+ 0, 485	×35	+ 0,368	× 40 = 35,37	;
	22	= 0,147 ×70 + 0,485		× 20 + 0,368 ×30 = 31,03			;
a
	32	= 0,147 ×35	+ 0,485	×85	+ 0,368	×20 53,73=	;
a
	42	= 0,147 ×80	+ 0, 485	×10 + 0,368		×35 = 29,49 .
a

106

Тогда максимальный средний выигрыш при исходе эксперимента Z = Z2 будет равен:

b 2	= max ai 2 = 53,73 ед.
	i =1,4

Пусть исходом эксперимента будет Z = Z3 , с апостериорными вероятностями состояний природы0,075, 0,113 и 0,812 соот-

ветственно. Вычислим показатели эффективности стратегий игрока:

a13 = 0,075 × 25 + 0,113 ×35 + 0,812 × 40 = 38,31 ;

a23 = 0,075 ×70 + 0,113 × 20 + 0,812 ×30 = 31,87 ;

a33 = 0,075 ×35 + 0,113×85 + 0,812 × 20 = 28,47 ;

a43 = 0,075 ×80 + 0,113×10 + 0,812 ×35 = 35,55 .

Тогда максимальный средний выигрыш при исходе эксперимента Z = Z3 будет равен:

b 3	= max ai 3 = 38,31 ед.
	i =1,4

Вычислим взвешенное среднее максимальных выигрышей b v с весовыми коэффициентами, равными полным вероятностям

P (Z = Zv ) событий Zv Î Z :

b% = åP (=Z Zv )× b v 0,=26 × 49, 42 + 0,34 ×53, 73 + 0, 40 ×38,31 =

v=1

=46,44 ед.

Следовательно, так как a = 42,5 , то стоимость эксперимента c будет меньше, чем

с < b% -a = 3,94 ед.

107

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1513 14 15 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
22.08.20192.37 Mб1RuthlessManagementOfPeople.pdf
#
22.08.20192.15 Mб3RuthlessManagementOfPeopleAndProfits.pdf
#
29.10.20193.88 Mб6ruthven_malise_fundamentalism_a_very_short_introduction.pdf
#
18.06.20201.65 Mб23rybina_ea_i_dr_angliiskii_iazyk_dlia_magistrov_i_aspirantov.pdf
#
22.08.201962.98 Кб23rybuf.doc
#
01.01.2020667.17 Кб34sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
#
29.10.20192.83 Mб33Saidov_Sravnitelnoe_pravovedenie.pdf
#
19.11.20192.41 Mб55sarkisov_o_r_lyubarskiy_e_l_ekologicheskoe_pravo.pdf
#
27.10.2020880.12 Кб4sarpova_ov_filosofiia_istoricheskogo_poznaniia_v_trudakh_shk.pdf
#
29.10.20192.12 Mб7Sartr_Zhan-Pol_Bytie_i_nichto_Opyt_fenomenologicheskoy_ontologii_-_royallib_ru.doc
#
19.04.20202.04 Mб18savin_l_v_setetsentrichnaya_i_setevaya_voyna_vvedenie_v_kont.pdf