Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
sadovin_h_c_sadovina_t_n_osnovy_teorii_igr.pdf
Скачиваний:
34
Добавлен:
01.01.2020
Размер:
667.17 Кб
Скачать

риском одновременно. В этом случае можно порекомендовать использование особой меры риска — коэффициента вариации:

CV (Ai )= CV=i si ×100 % . ai

Этот коэффициент отражает риск, который приходится на единицу выигрыша (доходности), и дает базу для сравнения стратегий игрока, когда и их средний выигрыш и их средний риск неодинаковы.

В условиях № 4.4. можно получить:

CV1 = s1 ×100 % =15,60 % , a1

CV2 = 51,51% ,

CV3 = 66,81% , CV4 = 66,56% .

Следовательно, по критерию минимизации коэффициента вариации, предпочтения игрока можно проранжировать как:

A1 f A2 f A4 f A3 ,

то есть наиболее предпочтительной является стратегия A1 .

Заметим также, что когда речь идет о среднем выигрыше, то речь идет о возможности многократного повторения игры(акта принятия решений). И условность рассмотренных выше критериев состоит в том, что требуемого количества повторений чаще всего может и не быть.

4.4. О планировании эксперимента в играх с природой

Рассмотрим теперь вопрос о том, в каких случаях следует проводить эксперименты с целью получения дополнительной статистической информации о состояниях природы для принятия более эффективных решений в условиях риска.

101

Рассмотрим сначала так называемый«идеальный» эксперимент, в результате проведения которого игрок получает точную информацию о том, какое состояние природы будет иметь место в данной ситуации. В качестве критерия принятия решений рассмотрим критерий Байеса.

Без проведения эксперимента в качестве оптимальной стратегии по критерию Байеса относительно выигрышей выбиралась стратегия Ai0 с максимальным показателем эффективности (4.21):

ai

= max ai

=a .

(4.27)

0

i=1,m

 

 

Если в результате проведенного эксперимента выяснилось,

например, что

природа

будет находиться в состоянииQj , то

в качестве оптимальной надо выбирать стратегию, при которой достигается наибольший выигрыш:

b j = max aij , i=1,m

где b j , j =1, n — показатель благоприятности состояния приро-

ды Qj . То есть надо выбирать такую стратегию, чтобы наиболь-

ший элемент b j j-го столбца матрицы A находился в строке, со-

ответствующей этой стратегии. Однако такое решение мы можем принять только после проведения эксперимента. А нам нужно решить заранее вопрос о целесообразности проведения эксперимента, про который известно только, что он является идеальным, и не известно, в каком именно состоянииQj будет находиться

природа Q, то есть нам не известен размер будущего выигрыша игрока A.

Таким образом, разумно рассмотреть взвешенное среднее выигрышей b j с весовыми коэффициентами p j , то есть выиг-

рыш в случае идеального эксперимента можно определить как:

n

 

b = å p j b j .

(4.28)

j =1

102

Тогда средний выигрыш игрока A с применением идеального

эксперимента вырастет на величинуb -a . Таким образом, проведение эксперимента имеет смысл, если стоимость c такого эксперимента удовлетворяет условию:

с < b -a .

(4.29)

№ 4.7. Определите стоимость

идеального эксперимента в

условиях № 4.4.

 

Решение. Вычислим показатели благоприятности состояний природы:

b1 = 80, b2 = 85, b3 = 40.

Тогда

b = 80 × 0, 2 + 85 ×0,3 + 40 ×0,5= 61,5.

Следовательно, так как a = 42,5 , то стоимость эксперимента

сбудет меньше, чем

с < b -a =19 ед.

То есть, если стоимость эксперимента с ³19 ед., то эксперимент проводить невыгодно.

Можно решить эту задачу и в терминах рисков, а именно:

 

 

 

 

 

n

 

с <

r

min=

ri

min=å p j rij .

(4.30)

 

 

i

i

j =1

 

 

 

 

 

 

 

При этом получаются те же самые результаты, что и по усло-

вию (4.29).

Теперь рассмотрим вопрос о проведении эксперимента, не являющегося идеальным, то есть позволяющего лишьуточнить

103

вероятности состояний природы. В общем случае можно предположить, что такой эксперимент Z приводит к появлению одно-

го из несовместных событий Zn ,n =1, k (исходов эксперимента),

вероятности

которых зависят

от того

состояния

 

природыQ

,

 

 

 

 

 

j

 

при котором он проводился.

 

 

 

 

 

Предположим, что эти условные вероятности P(Zv

 

Qj ) собы-

 

тий Z = Zv ,

при условии, что

природа

находится

в состоянии

Q = Qj , известны. Тогда по формулам Байеса можно пересчитать вероятности состояний природы, как

 

P (Q

 

Z ) =

P(Q)× P (Z

 

Q )

,

 

 

(4.31)

 

 

 

 

 

 

 

 

 

 

или

 

 

P (Z )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P (Q = Qj

 

Z= Zv =)

P (Q = Qj )× P (Z =Zv

 

Q =Qj )

 

 

 

 

 

 

 

 

 

P (Z = Zv )

 

,

 

P (Q = Qj

)= p j

 

 

 

 

 

 

 

где

— априорные вероятности состояний приро-

ды;

P

(

Q = Q

j

 

Z=

v )

p

jn

— апостериорные

вероятности со-

 

 

 

Z =

 

стояний природы, при условии, что результатом эксперимента

будет Z = Zv ; P (Z = Zv )

— вероятности исхода Zv

эксперимента,

вычисляемые по формуле полной вероятности:

 

 

 

 

n

Qj )× P (Z =Zv

 

Q =Qj ).

 

 

P (Z = Zv )

=åP (Q=

 

(4.32)

 

Пусть

j =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

iv = å p jv

× aij , i =

 

, v =

 

— показатель эффективности

 

a

1, m

1, k

j =1

104

стратегии Ai по критерию Байеса с апостериорными вероятно-

стями состояний природы Qj ÎQ ;

b v = max aiv

— максимальный средний выигрыш при исходе

i=1,m

 

 

 

 

эксперимента Zv Î Z ;

 

k

 

 

 

 

b% = åP=(Z

Zv )×

b

v

— среднее взвешенное максимальных

v=1

 

 

 

 

выигрышей

 

v

с весовыми коэффициентами, равными полным

b

вероятностям P (Z = Zv )

событий Zv Î Z , вычисляемым по фор-

мулам (4.32).

Тогда средний выигрыш игрокаA с применением неидеаль-

ного эксперимента вырастет на величину b% -a . Таким образом, проведение эксперимента имеет смысл, если стоимость такого эксперимента с% удовлетворяет условию, аналогичному (4.29):

 

%

-a .

(4.33)

с < b

%

 

 

 

Можно решить эту задачу и в терминах рисков. При этом результат (4.33) не изменится.

4.8. Определите стоимость проведения эксперимента в условиях № 4.4, если матрица условных вероятностей исходов эксперимента имеет вид:

P (Z

 

Q)

Z1

Z2

Z3

 

 

 

 

 

Q1

0,6

0,25

0,15

 

 

 

 

Q2

0,3

0,55

0,15

 

 

 

 

Q3

0,1

0,25

0,65

 

 

 

 

 

 

Решение. Вычисление апостериорных вероятностей состояний природы представим в виде расчетной таблицы:

105

Т а б л и ц а 4 . 1

W

P (W)

 

P (Z

 

W)

 

P (Z

 

W)P (W )

 

P (W

 

Z )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Z1

Z2

 

Z3

Z1

 

 

Z2

Z3

Z1

 

Z2

Z3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W1

0,2

0,6

0,25

 

 

 

0,15

0,12

0,05

0,03

0,462

0,147

0,075

W2

0,3

0,3

0,55

 

 

 

0,15

0,09

0,165

0,045

0,346

0,485

0,113

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Q3

0,5

0,1

0,25

 

 

 

0,65

0,05

0,125

0,325

0,192

0,368

0,812

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

åP (Z

 

W)× P (W )

0,26

0,34

0,40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пусть исходом эксперимента будет Z = Z1 , с апостериорными вероятностями состояний природы 0,462, 0,346 и 0,192 соответственно. Вычислим показатели эффективности стратегий игрока:

a11 = 0,462 × 25 + 0,346 ×35 + 0,192 × 40 = 31,34 ; a21 = 0,462 ×70 + 0,346 × 20 + 0,192 ×30 = 45,02 ; a31 = 0,462 ×35 + 0,346 ×85 + 0,192 × 20 = 49, 42 ; a41 = 0,462 ×80 + 0,346 ×10 + 0,192 ×35 = 47,14 ,

Тогда максимальный средний выигрыш при исходе эксперимента Z = Z1 будет равен:

b1

= max ai1 = 49, 42 ед.

 

i =1,4

Пусть исходом эксперимента будет Z = Z2 , с апостериорными вероятностями состояний природы 0,147, 0,485 и 0,368 соответственно. Вычислим показатели эффективности стратегий игрока:

a12 = 0,147 × 25

+ 0, 485

×35

+ 0,368

× 40 = 35,37

;

 

22

= 0,147 ×70 + 0,485

× 20 + 0,368 ×30 = 31,03

;

a

 

32

= 0,147 ×35

+ 0,485

×85

+ 0,368

×20 53,73=

;

a

 

42

= 0,147 ×80

+ 0, 485

×10 + 0,368

×35 = 29,49 .

a

106

Тогда максимальный средний выигрыш при исходе эксперимента Z = Z2 будет равен:

b 2

= max ai 2 = 53,73 ед.

 

i =1,4

Пусть исходом эксперимента будет Z = Z3 , с апостериорными вероятностями состояний природы0,075, 0,113 и 0,812 соот-

ветственно. Вычислим показатели эффективности стратегий игрока:

a13 = 0,075 × 25 + 0,113 ×35 + 0,812 × 40 = 38,31 ;

a23 = 0,075 ×70 + 0,113 × 20 + 0,812 ×30 = 31,87 ;

a33 = 0,075 ×35 + 0,113×85 + 0,812 × 20 = 28,47 ;

a43 = 0,075 ×80 + 0,113×10 + 0,812 ×35 = 35,55 .

Тогда максимальный средний выигрыш при исходе эксперимента Z = Z3 будет равен:

b 3

= max ai 3 = 38,31 ед.

 

i =1,4

Вычислим взвешенное среднее максимальных выигрышей b v с весовыми коэффициентами, равными полным вероятностям

P (Z = Zv ) событий Zv Î Z :

k

b% = åP (=Z Zv )× b v 0,=26 × 49, 42 + 0,34 ×53, 73 + 0, 40 ×38,31 =

v=1

=46,44 ед.

Следовательно, так как a = 42,5 , то стоимость эксперимента c будет меньше, чем

с < b% -a = 3,94 ед.

107