- •Введение
- •1.1. Задачи теории игр в экономике
- •1.2. Конфликты и теория игр
- •1.3. Основные понятия и классификация видов игр
- •2.1. Примеры матричных игр
- •2.2. Равновесная ситуация
- •2.3. Смешанные стратегии
- •2.4. Решение матричной игры 2×2
- •2.5. Матричные игры 2×n
- •2.7. Матричные игры m×n
- •2.7.1. Доминирование стратегий
- •2.7.2. Аффинное правило
- •2.7.3. Итерационный метод решения матричных игр
- •3.1. Основные понятия и ситуация равновесия
- •3.2. Биматричные игры 2×2
- •3.3. Поиск равновесных ситуаций
- •3.4. Кооперативные игры
- •4. Игры с природой
- •4.3. Принятие решений в условиях риска
- •Критерий Байеса относительно выигрышей
- •Критерий Байеса относительно рисков
- •Критерий Лапласа относительно выигрышей
- •Критерий Байеса относительных значений вероятностей состояний природы с учетом выигрышей
- •4.4. О планировании эксперимента в играх с природой
- •4.5. Выбор решений с помощью дерева решений
- •Литература
риском одновременно. В этом случае можно порекомендовать использование особой меры риска — коэффициента вариации:
CV (Ai )= CV=i si ×100 % . ai
Этот коэффициент отражает риск, который приходится на единицу выигрыша (доходности), и дает базу для сравнения стратегий игрока, когда и их средний выигрыш и их средний риск неодинаковы.
В условиях № 4.4. можно получить:
CV1 = s1 ×100 % =15,60 % , a1
CV2 = 51,51% ,
CV3 = 66,81% , CV4 = 66,56% .
Следовательно, по критерию минимизации коэффициента вариации, предпочтения игрока можно проранжировать как:
A1 f A2 f A4 f A3 ,
то есть наиболее предпочтительной является стратегия A1 .
Заметим также, что когда речь идет о среднем выигрыше, то речь идет о возможности многократного повторения игры(акта принятия решений). И условность рассмотренных выше критериев состоит в том, что требуемого количества повторений чаще всего может и не быть.
4.4. О планировании эксперимента в играх с природой
Рассмотрим теперь вопрос о том, в каких случаях следует проводить эксперименты с целью получения дополнительной статистической информации о состояниях природы для принятия более эффективных решений в условиях риска.
101
Рассмотрим сначала так называемый«идеальный» эксперимент, в результате проведения которого игрок получает точную информацию о том, какое состояние природы будет иметь место в данной ситуации. В качестве критерия принятия решений рассмотрим критерий Байеса.
Без проведения эксперимента в качестве оптимальной стратегии по критерию Байеса относительно выигрышей выбиралась стратегия Ai0 с максимальным показателем эффективности (4.21):
ai |
= max ai |
=a . |
(4.27) |
0 |
i=1,m |
|
|
Если в результате проведенного эксперимента выяснилось, |
|||
например, что |
природа |
будет находиться в состоянииQj , то |
в качестве оптимальной надо выбирать стратегию, при которой достигается наибольший выигрыш:
b j = max aij , i=1,m
где b j , j =1, n — показатель благоприятности состояния приро-
ды Qj . То есть надо выбирать такую стратегию, чтобы наиболь-
ший элемент b j j-го столбца матрицы A находился в строке, со-
ответствующей этой стратегии. Однако такое решение мы можем принять только после проведения эксперимента. А нам нужно решить заранее вопрос о целесообразности проведения эксперимента, про который известно только, что он является идеальным, и не известно, в каком именно состоянииQj будет находиться
природа Q, то есть нам не известен размер будущего выигрыша игрока A.
Таким образом, разумно рассмотреть взвешенное среднее выигрышей b j с весовыми коэффициентами p j , то есть выиг-
рыш в случае идеального эксперимента можно определить как:
n |
|
b = å p j b j . |
(4.28) |
j =1
102
Тогда средний выигрыш игрока A с применением идеального
эксперимента вырастет на величинуb -a . Таким образом, проведение эксперимента имеет смысл, если стоимость c такого эксперимента удовлетворяет условию:
с < b -a . |
(4.29) |
№ 4.7. Определите стоимость |
идеального эксперимента в |
условиях № 4.4. |
|
Решение. Вычислим показатели благоприятности состояний природы:
b1 = 80, b2 = 85, b3 = 40.
Тогда
b = 80 × 0, 2 + 85 ×0,3 + 40 ×0,5= 61,5.
Следовательно, так как a = 42,5 , то стоимость эксперимента
сбудет меньше, чем
с < b -a =19 ед.
То есть, если стоимость эксперимента с ³19 ед., то эксперимент проводить невыгодно.
Можно решить эту задачу и в терминах рисков, а именно:
|
|
|
|
|
n |
|
с < |
r |
min= |
ri |
min=å p j rij . |
(4.30) |
|
|
|
i |
i |
j =1 |
|
|
|
|
|
|
|
|
При этом получаются те же самые результаты, что и по усло-
вию (4.29).
Теперь рассмотрим вопрос о проведении эксперимента, не являющегося идеальным, то есть позволяющего лишьуточнить
103
вероятности состояний природы. В общем случае можно предположить, что такой эксперимент Z приводит к появлению одно-
го из несовместных событий Zn ,n =1, k (исходов эксперимента),
вероятности |
которых зависят |
от того |
состояния |
|
природыQ |
, |
|
|
|
|
|
j |
|
при котором он проводился. |
|
|
|
|
|
|
Предположим, что эти условные вероятности P(Zv |
|
Qj ) собы- |
||||
|
||||||
тий Z = Zv , |
при условии, что |
природа |
находится |
в состоянии |
Q = Qj , известны. Тогда по формулам Байеса можно пересчитать вероятности состояний природы, как
|
P (Q |
|
Z ) = |
P(Q)× P (Z |
|
Q ) |
, |
|
|
(4.31) |
||||||||
|
|
|
|
|
||||||||||||||
|
|
|||||||||||||||||
|
|
|
||||||||||||||||
или |
|
|
P (Z ) |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
P (Q = Qj |
|
Z= Zv =) |
P (Q = Qj )× P (Z =Zv |
|
Q =Qj ) |
||||||||||||
|
|
|
||||||||||||||||
|
|
|
|
|
|
P (Z = Zv ) |
|
, |
||||||||||
|
P (Q = Qj |
)= p j |
|
|
|
|
|
|
|
|||||||||
где |
— априорные вероятности состояний приро- |
|||||||||||||||||
ды; |
P |
( |
Q = Q |
j |
|
Z= |
v ) |
p |
jn |
— апостериорные |
вероятности со- |
|||||||
|
|
|
Z = |
|
стояний природы, при условии, что результатом эксперимента
будет Z = Zv ; P (Z = Zv ) |
— вероятности исхода Zv |
эксперимента, |
|||||||||
вычисляемые по формуле полной вероятности: |
|
||||||||||
|
|
|
n |
Qj )× P (Z =Zv |
|
Q =Qj ). |
|
||||
|
P (Z = Zv ) |
=åP (Q= |
|
(4.32) |
|||||||
|
|||||||||||
Пусть |
j =1 |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|||
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
iv = å p jv |
× aij , i = |
|
, v = |
|
— показатель эффективности |
||||
|
a |
1, m |
1, k |
j =1
104
стратегии Ai по критерию Байеса с апостериорными вероятно-
стями состояний природы Qj ÎQ ;
b v = max aiv |
— максимальный средний выигрыш при исходе |
|||||
i=1,m |
|
|
|
|
||
эксперимента Zv Î Z ; |
|
|||||
k |
|
|
|
|
||
b% = åP=(Z |
Zv )× |
b |
v |
— среднее взвешенное максимальных |
||
v=1 |
|
|
|
|
||
выигрышей |
|
v |
с весовыми коэффициентами, равными полным |
|||
b |
||||||
вероятностям P (Z = Zv ) |
событий Zv Î Z , вычисляемым по фор- |
мулам (4.32).
Тогда средний выигрыш игрокаA с применением неидеаль-
ного эксперимента вырастет на величину b% -a . Таким образом, проведение эксперимента имеет смысл, если стоимость такого эксперимента с% удовлетворяет условию, аналогичному (4.29):
|
% |
-a . |
(4.33) |
с < b |
|||
% |
|
|
|
Можно решить эту задачу и в терминах рисков. При этом результат (4.33) не изменится.
4.8. Определите стоимость проведения эксперимента в условиях № 4.4, если матрица условных вероятностей исходов эксперимента имеет вид:
P (Z |
|
Q) |
Z1 |
Z2 |
Z3 |
|
|||||
|
|
|
|
||
Q1 |
0,6 |
0,25 |
0,15 |
||
|
|
|
|
||
Q2 |
0,3 |
0,55 |
0,15 |
||
|
|
|
|
||
Q3 |
0,1 |
0,25 |
0,65 |
||
|
|
|
|
|
|
Решение. Вычисление апостериорных вероятностей состояний природы представим в виде расчетной таблицы:
105
Т а б л и ц а 4 . 1
W |
P (W) |
|
P (Z |
|
W) |
|
P (Z |
|
W)P (W ) |
|
P (W |
|
Z ) |
|||||||
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Z1 |
Z2 |
|
Z3 |
Z1 |
|
|
Z2 |
Z3 |
Z1 |
|
Z2 |
Z3 |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
W1 |
0,2 |
0,6 |
0,25 |
|
|
|
0,15 |
0,12 |
0,05 |
0,03 |
0,462 |
0,147 |
0,075 |
|||||||
W2 |
0,3 |
0,3 |
0,55 |
|
|
|
0,15 |
0,09 |
0,165 |
0,045 |
0,346 |
0,485 |
0,113 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Q3 |
0,5 |
0,1 |
0,25 |
|
|
|
0,65 |
0,05 |
0,125 |
0,325 |
0,192 |
0,368 |
0,812 |
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
åP (Z |
|
W)× P (W ) |
0,26 |
0,34 |
0,40 |
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
W |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пусть исходом эксперимента будет Z = Z1 , с апостериорными вероятностями состояний природы 0,462, 0,346 и 0,192 соответственно. Вычислим показатели эффективности стратегий игрока:
a11 = 0,462 × 25 + 0,346 ×35 + 0,192 × 40 = 31,34 ; a21 = 0,462 ×70 + 0,346 × 20 + 0,192 ×30 = 45,02 ; a31 = 0,462 ×35 + 0,346 ×85 + 0,192 × 20 = 49, 42 ; a41 = 0,462 ×80 + 0,346 ×10 + 0,192 ×35 = 47,14 ,
Тогда максимальный средний выигрыш при исходе эксперимента Z = Z1 будет равен:
b1 |
= max ai1 = 49, 42 ед. |
|
i =1,4 |
Пусть исходом эксперимента будет Z = Z2 , с апостериорными вероятностями состояний природы 0,147, 0,485 и 0,368 соответственно. Вычислим показатели эффективности стратегий игрока:
a12 = 0,147 × 25 |
+ 0, 485 |
×35 |
+ 0,368 |
× 40 = 35,37 |
; |
||
|
22 |
= 0,147 ×70 + 0,485 |
× 20 + 0,368 ×30 = 31,03 |
; |
|||
a |
|||||||
|
32 |
= 0,147 ×35 |
+ 0,485 |
×85 |
+ 0,368 |
×20 53,73= |
; |
a |
|||||||
|
42 |
= 0,147 ×80 |
+ 0, 485 |
×10 + 0,368 |
×35 = 29,49 . |
||
a |
106
Тогда максимальный средний выигрыш при исходе эксперимента Z = Z2 будет равен:
b 2 |
= max ai 2 = 53,73 ед. |
|
i =1,4 |
Пусть исходом эксперимента будет Z = Z3 , с апостериорными вероятностями состояний природы0,075, 0,113 и 0,812 соот-
ветственно. Вычислим показатели эффективности стратегий игрока:
a13 = 0,075 × 25 + 0,113 ×35 + 0,812 × 40 = 38,31 ;
a23 = 0,075 ×70 + 0,113 × 20 + 0,812 ×30 = 31,87 ;
a33 = 0,075 ×35 + 0,113×85 + 0,812 × 20 = 28,47 ;
a43 = 0,075 ×80 + 0,113×10 + 0,812 ×35 = 35,55 .
Тогда максимальный средний выигрыш при исходе эксперимента Z = Z3 будет равен:
b 3 |
= max ai 3 = 38,31 ед. |
|
i =1,4 |
Вычислим взвешенное среднее максимальных выигрышей b v с весовыми коэффициентами, равными полным вероятностям
P (Z = Zv ) событий Zv Î Z :
k
b% = åP (=Z Zv )× b v 0,=26 × 49, 42 + 0,34 ×53, 73 + 0, 40 ×38,31 =
v=1
=46,44 ед.
Следовательно, так как a = 42,5 , то стоимость эксперимента c будет меньше, чем
с < b% -a = 3,94 ед.
107