Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

TI_v_EMM_2014

.pdf
Скачиваний:
11
Добавлен:
27.05.2015
Размер:
3.52 Mб
Скачать

 

 

 

 

 

 

 

n

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 bn

bk

 

 

 

 

 

 

 

k 1

 

 

 

 

 

или, в силу (15) и (16):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bn

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставляя найденное значение λ1 в (19) и используя (15), будем иметь:

 

j

 

bn j 1

,

 

j 1,..., n .

(20)

b

 

 

 

 

 

 

 

 

 

 

 

Таким образом, выбирая в опасной ситуации коэффициенты λj , j =1,..., n, в соответствии с принципом невозрастания средних выигрышей, мы видим, что j-й коэффициент λj представляет собой отношение суммы bn-j+1 элементов bi,n-j+1, i =1,.... m, стоящих в (n-j+1)-м столбце матрицы B, к сумме b всех ее элементов, т.е. коэффициент λj есть доля суммы элементов (n-j+1)-го столбца в сумме всех элементов матрицы В.

В случае безопасной ситуации коэффициенты λj при возрастании выигрышей должны возрастать; поэтому их можно выбрать по «принципу неубывания средних выигрышей» прямо пропорционально средним выигрышам (15):

1 : 2 : ... : n b1 : b2 : ... : bn .

Аналогичным способом можно показать, что в данном случае коэффициенты λj выражаются через выигрыши следующим образом:

 

 

 

bj

,

j 1,..., n.

(21)

j

 

 

 

b

 

 

 

 

 

 

 

Распространим критерий Гурвица относительно выигрышей, а значит и его частные случаи — критерии Вальда и максимаксный критерий, на смешанные стратегии.

Пусть SA - множество всех смешанных (в том числе и чистых) стратегий игрока A и Р=(р1,…, pm) —

некоторая смешанная стратегия игрока А из множества

SA : P SA . Тогда выигрыш игрока

А при

применении им смешанной стратегии P=(p1,…,pm), соответствующий состоянию природы Пj, равен

 

m

 

 

H (P, n j ) pi aij ,

j 1,..., n,

(26)

i 1

 

 

где ai j, i=1,…, m; j=1,…, n, — элементы матрицы (1).

Показателем эффективности смешанной стратегии Р = (p1,..., pm) по критерию пессимизма-

оптимизма Гурвица относительно выигрышей с показателем оптимизма [0,1] назовем число

 

G(P; ) (1 )W (P) M (P),

(27)

где

 

 

W (P) min H (P, nj

) и M (P) max H (P, nj )

 

1 j n

1 j n

 

— соответственно минимальный и максимальный выигрыши игрока А при использовании им смешанной стратегии Р.

Так как каждой смешанной стратегии Р соответствуют единственные значения минимального и максимального выигрышей, то W( P ) и М (Р ), а, следовательно, и G(P; λ ), являются числовыми функциями векторного аргумента Р = (p1,..., pm) определенными на множестве SA.

Если, в частности, смешанная стратегия Р = (p1,..., pm) является чистой Аk, то pi = 0 при i ≠ к , и рk =1; следовательно, по формуле (26), H(P, Пj) = Н(Ак, Пj) = akj и показатель эффективности G(P; λ ) превращается в показатель эффективности Gk(λ ) чистой стратегии Аk , определяемый формулой (12) при i = k.

Оптимальной среди всех смешанных стратегий множества SA по критерию пессимизма-оптимизма

Гурвица

относительно выигрышей с показателем оптимизма [0,1] назовем стратегию

p0 ( p0

,..., p0 ) S

A

с максимальным показателем эффективности G(P; λ):

1

m

 

 

 

 

61

G(P0 ; ) max G(P, ) max[(1 )W (P) M (P))].

(28)

P SA

P SA

 

В связи с бесконечностью множества SA встает вопрос о существовании определяемой формулой (28) оптимальной стратегии Р0, т.е. о достижимости функцией G(P; λ) своей верхней грани на множестве SA. Ответ на этот вопрос положителен. Для доказательства этого сначала докажем непрерывность функций W(P) и М(Р) на множестве SA.

Функция H(P, Пj), задаваемая формулой (26), линейна и, следовательно, непрерывна по аргументу P на множестве SA, т.е. для любого ɛ>0 найдется δj>0, зависящее от ɛ, номера j и точки P, такое, что для любой точки U (u1,...,um ) SA , отстоящей от точки P на расстоянии, не большем чем δj : ρ(P,U) δj ,

справедливо неравенство

H (P, П j ) H (U, П j ) ,

которое можно переписать так :

 

 

 

 

Н (Р, Пj)

Н (U, Пj)

 

или так:

 

 

 

 

H(U, Пj) - H(P, Пj) H(U, Пj) + .

(29)

Под paccтоянием понимается обычное евклидово paccтояние в пространстве Rm, определяемое

формулой

 

 

 

 

 

 

 

 

 

P,U

 

m

 

 

( pi ui )2

 

 

 

i 1

 

Eсли точка U S A такова, что

 

 

 

 

P,U min j

(30)

 

 

1 j n

 

то неравенство P,U j ,будет выполняться для каждого j= 1,..., n, и, следовательно, для каждого j=

1,..., n, 6yдут выполняться неравенства (29).

 

 

 

 

Taк как

H U, n j , j 1,...,n,

W U min H U, n j

1 j n

 

 

 

 

то из левого неравенства (2.21.29) получим:

 

 

 

 

W U H (U , j ) H P, j

, j 1,..., n.

B частности последнее неравенство будет выполняться для того номера j, который доставляет

функции H P, j минимум, т.е.

 

 

 

 

W U min H P, n j W P

1 j n

Из этого неравенства и правого неравенства (29) будем иметь:

W U W P min H P,n j H P, j H U, j , j 1,...,n.

1 j n

В частности, справедливы неравенства

 

 

 

 

W U W P min H U, n j

W U

 

1 j n

 

 

 

 

которые можно переписать следующим образом :

 

 

 

 

 

W P W U

или

 

 

 

 

 

W P W U

 

 

 

(31)

 

 

62

 

 

 

 

ЧТО ДЛЯ ЛЮБОГО

Taким o6paзом, noказали, 0 найдѐтся 0 такое, что из неравенства (30) следует неравенство (31). Это означает, что функция W(P) нeпpepывна B каждой точке P множества SA, T.e. нeпpepывна нa мhoжестве SA.

Доказательство непрерывности на множестве SA функции M(P) проводиться аналогично, в силу непрерывности функции H(P, nj) пo apryментy P нa мнoжестве SA, для любого 0 найдѐтся 0 тaкoe,

ЧТО для любой точки U S A , удовлетворяющей нepaвeнствy (30), 6yдут выполняться нepaвeнствa (29) для каждого j = 1,..., n. Из пpaвoгo нepaвeнствa (29) получим:

H P, J H U, J max H U, n j M U

 

 

 

 

 

 

 

 

 

1 j n

 

 

 

 

 

 

 

Так как это неравенство верно для любого j = 1,..., n, TO, B частности, имеем

 

 

 

 

M

U

max H P, n j M

U

 

 

 

 

 

 

 

 

 

1 j n

 

 

 

 

 

 

 

 

 

 

 

Отсюда и из левого неравенства (2.21.29) получим :

 

 

 

 

 

 

 

H U, j H P, j

max H P,nj

M P M U

 

 

 

 

 

 

 

 

1 j n

 

 

 

 

 

 

 

 

 

 

Поскольку полученное неравенство

имеет

место для

каждого j =

1,...,

n, TO

справедливо

неравенство

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M U max H U, n j

M P M U

 

 

 

 

 

1 j n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

из котoporo вытекает неравенство

 

 

M P M U

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Этим доказана непрерывность функции M(P) нa множестве SA. Из Heпpepывности функций W(P) H

M(P) следует нeпpepывность функции G P,

кaк cyммы нeпpepывых функций

1 W P и M P .

Taк кaк мнoжество SA является симплексом, то оно замкнуто и ограничено. Следовательно, по

теореме Вейерштрасса, нeпpepывная функция G P,

достигает на множестве SA

 

своей верхней грани,

т.e. найдѐтся стратегия P 0 p 0 ,..., p 0 S

A

, удовлетворяющая равенству (28).

 

 

 

 

1

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

При 0 из формулы (27)

получаем показатель эффективности смешанной стратегии P no

критерию Вальда :

W P min H P, n j .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 j

n

 

 

 

 

 

 

 

 

 

 

Toгда, кaк следует из (28), onmuмальной cpeди вcex взвешанных cmpameгий множества SA no

критерию Вальда 6yдет cтратегия

P 0

p 0 ,...,

p 0

c максимальным показателем эффэктивности

 

 

 

 

 

1

 

m

 

 

 

 

 

 

 

W(P):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

W P0 maxW P max min H P, n

j

 

 

P S A

 

 

 

 

P S A 1 j n

 

 

 

 

 

 

 

 

 

 

 

 

 

При 1из формулы (27)

получаем показатель эффективности смешанной стратегии P no

максимальному кpuтepuю :

M P max H P, n j

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 j n

 

 

 

 

 

 

 

 

 

 

Cлeдовaтельно, из (28) получаем, что oптuмальной среди всех смешанных стратегий множества SA

по максимальному критерию является

 

стратегия

P 0 p 0 ,..., p 0 c максимальным

показателем

 

 

 

 

 

 

 

 

 

 

 

1

m

 

 

 

 

 

эффективности M(P):

 

 

 

 

 

 

 

P max max H P, n

 

.

M P0 max M

j

 

 

 

P S A

 

 

 

 

P S A 1 j n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Относительно максимального критерия справедлива следующая

Teopeмa 1. Стратегия Ai0 , оптимальная среди чистых стратегий по максимальному критерию, является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA .

63

Доказательство: Пусть P = (p1,..., pm) — произвольная смешанная стратегия игрока А. Тогда для еѐ показателя эффективности M(P) пo мaксимаксному критерию, в силу (2.21.26), нормировочного равенства

m

 

 

 

 

 

 

 

 

 

 

 

 

pi

1И paвeнствa

 

M i

max max aij , cпpaвeдливого пo условию теоремы, будем иметь :

i 1

 

 

 

 

0

 

1 i m 1 j n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M P max H P, n j

max

m

 

m

 

 

m

 

pi aij max

pi

max aij

max max aij pi

max max aij M i0

 

1 j n

 

 

 

1 j n

i 1

1 j n

i 1

1 i n

1 j n 1 i m

i 1

1 j n 1 i n

 

 

 

 

 

 

 

 

 

 

Taк кaк пpaвaя часть этого неравенства не зависит от P, то

 

 

 

 

 

 

 

 

 

 

max M P M i .

 

(32)

 

 

 

 

 

 

 

P S A

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C другой стороны, для чистой стратегии

Ai0

, координаты которой как смешанной стратегии

p 0 0

для всех i i

0

,

И

p0 1

, имеем :

 

 

 

 

 

i

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

M i0

т.e.

 

 

 

 

m

 

max H Ai

, n j M Ai

 

max M P .

max max aij

max ai j

max

pi0 aij

 

1 i n 1 j n

1 j n

0

1 j n

i 1

 

1 j n

0

 

0

P S A

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(2.21.33)

 

 

 

 

 

Из неравенств (2.21.33) H (2.21.32) получаем:

P M i

 

 

 

 

M i

max M

 

 

 

 

 

0

P S A

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

max M P M i

0

M Ai

.

 

 

 

 

 

P S A

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

Этo paвeнство означает, по определению, что чистая стратегия Ai0 является оптимальной по

максимальному критерию среди всех стратегий множества SA, что и требовалось доказать.

Teopeмa 1 говорит о том, что при применении максимального критерия, нет необходимости пользоваться смешанными стратегиями, а для отыскания оптимального решения достаточны лишь чистые стратегии.

Аналогичная теорема для критерия Вальда не верна, т.е. среди смешанных стратегий игрока А, не являющихся чистыми, может оказаться стратегия с более высокой эффективностью, чем эффективность любой чистой стратегии.

Paccмотpeнный o6o6щенный критерий Гурвица и его чистые случаи были сформулированы так, что они существенно учитывали выигрыши игрока A и потому являлись критериями «относительно выигрышей». Однако можно сформулировать аналогичные критерии относительно рисков.

В соответствии с определением риска составим матрицу рисков для матрицы выигрышей:

Ai, Пj

П1

П2

Пn

A1

r11

r

r1n

 

 

 

12

 

 

A2

r21

r22

r2n

 

 

Am

rm1

rm 2

rmn

 

 

(36)

Обобщѐнный критерий пессимизма-оптимизма Гурвица относительно рисков с коэффициентами

1 , 2 ,..., n .

64

В каждой строке матрицы (36) переставим риски в невозрастающем порядке и обозначим элементы полученной матрицы через d ij , a саму матрицу — через D:

D =

Di, j

1

2

n

D1

d11

d12

d12

D2

d21

d22

d2n

Dm

dm1

d m 2

d mn

Таким o6paзом,

 

 

 

 

 

 

di1 di 2

... din , i 1,..., m .

 

(37)

 

В силу этого, в первом столбце матрицы D стоят максимальные риски при каждой стратегии Ai:

di1

max rij , r 1,...,m ,

 

(.38)

 

 

 

1 j n

 

 

 

a в последнем n — м столбце — минимальные риски при каждой стратегии Ai:

 

d

 

min r ,i 1,...,m

.

(39)

 

 

in

 

1 j n ij

 

Отметим что если i—я строка матрицы выигрышей

(1)

содержит

максимальный выигрыш

aij j при состоянии природы Пj,

ТО d in 0 .

 

 

 

Пусть числа 1 , 2 ,..., n удовлетворяют условиям (4).

 

 

 

Показатели неэффективности стратегии Ai по обобщенному критерию Гурвица относительно

рисков с коэффициентами 1 , 2 ,..., n ,

назовѐм число

 

 

 

Ri 1 , 2 ,..., n

n

 

 

 

j dij ,i 1,..., m

,

(40)

 

 

 

j 1

 

 

 

 

 

 

 

учитывающее очевидно все риски при выборе стратегии Ai.

Обобщенным критерием пессимизма – оптимизма Гурвица относительно рисков с

коэффициентами

1 , 2 ,..., n назовѐм критерий, по которому оптимальной среди чистых стратегий

считается стратегия Ai0 c минимальным показателем неэффективности (40), т.e.

Ri 1 , 2

,..., n R 1 , 2 ,..., n min Ri 1 , 2 ,..., n . (41)

0

 

1 i m

0

 

 

Числа p

и 0

, определяемые равенствами (6), и для этого критерия называется показателями

пессимизма и оптимизма соответственно.

 

Коэффициенты 1 , 2 ,..., n выбираются лицом, принимающим решение, субъективно так, чтобы показатель пессимизма p был ближе к единице в опасной ситуации и ближе к нулю в опасной ситуации,

при этом, поскольку p 0 1 , показатель оптимизма 0 будет принимать значения противоположного смысла.

Впрочем, коэффициенты 1 , 2 ,..., n можно выбирать формализовано, аналогично тому, как это

делалось для обобщенного критерия Гурвица относительно выигрышей. А именно пусть

m

d j dij , j 1,..., n ,

i 1

- сумма рисков j-го столбца матрицы D;

65

 

 

 

1

m

 

 

d j

dij , j 1,..., n ,

 

 

 

 

 

 

 

 

m i 1

 

 

-среднее значение рисков j-го столбца матрицы D;

 

 

 

 

 

 

n

n

m

 

 

 

 

d d j

d ij

 

 

 

 

j 1

j 1

i 1

- сумма всех рисков матрицы D [или, что тоже, -матрицы (2.21.36)]. Из (2.21.37) имеем:

d1 d2 ... dn .

В опасной ситуации коэффициенты 1 , 2 ,..., n можно выбирать по принципу «не возрастания средних рисков», т.e.

1 : 2 : : n d1 : d 2 : : dn ,

откуда [CM. (21)]

j d j / d , j 1,..., n ,

Вслучае безопасной ситуации коэффициенты 1 , 2 ,..., n можно выбирать по принципу «не убывания средних рисков», т.e.

1 : 2 : : n dn : dn 1 : : d1 ,

откуда

 

j

d n j 1 / d , j 1,..., n .

Рассмотрим частные случаи обобщенного критерия пессимизма – оптимизма Гурвица относительно рисков с коэффициентами 1 , 2 ,..., n .

Если dij rij ,i 1,.., m, j 1,..., n , т.e.-матрица D совпадает с матрицей рисков, то, очевидно, что коэффициенты 1 , 2 ,..., n можно формально рассматривать в качестве вероятностей состояний природы:

q1 1 ,..., qn n и тогда показатель неэффективности стратегии Ai по обобщенному

критерию Гурвица относительно рисков, вычисляемый по формуле (40), превращается в показатель неэффективности стратегии Ai по критерию Байеса относительно рисков, определяемый формулой (10):

Ri 1 , 2 ,..., n ri ,i 1,...,m .

Поэтому из (11) И (41) следует, что обобщенный критерий Гурвица относительно рисков превращается в этом случае в критерий Байеса относительно рисков.

Если коэффициенты j , j =1,...,n , равны между собой : j = l/n, j =1,..., n , то их формально можно

интерпретировать как вероятности равновероятных состояний природы. В этом случае из формулы (40) получаем :

 

1

 

1

 

 

 

 

1

 

 

 

1

n

 

Ri 1 , 2 ,.., n

Ri

 

,

 

 

 

 

,..,

 

 

 

 

 

 

 

 

dij ,i 1,..., m .

(42)

 

 

n

 

 

 

 

n

 

n

 

 

 

 

 

n

 

 

 

j 1

 

Поскольку di1 ,..., din является перестановкой рисков ri1,…, rin - строки матрицы (36), то

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

d ij

 

 

rij

 

 

 

 

 

 

j 1

 

 

 

 

 

 

j 1

 

 

и тогда из (42):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

 

1

 

1

 

n

 

 

 

Ri

 

 

,

 

,..,

 

 

 

 

 

 

 

rij ,

 

 

 

 

n

 

 

 

n

 

 

 

 

 

n

 

 

 

n

 

 

 

j 1

 

т.e. показатель неэффективности стратегии Ai по обобщенному критерию Гурвица относительно рисков превращается в показатель неэффективности стратегии Ai по критерию Лапласа относительно рисков. таким образом, в этом случае обобщенный критерий Гурвица относительно рисков превращается, как это следует из (41), в критерий Лапласа относительно рисков.

Kpumepuu Cэвиджa (кpumepuu кpaйнего neccuмизмa).

66

Kpumepuu Cэвиджa представляет собой частный случай обобщенного критерия Гурвица относительно рисков с коэффициентами (7).

Из (40), (7) И (38) получаем показатель неэффективности стратегии Ai no Kpumepuю Cэвиджa :

 

Ri

1,0,...,0 di1

max rij ,i 1,...,m ,

(43)

 

 

 

1 j n

 

представляющий собой максимальный риск при выборе игроком A стратегии Ai.

Onmuмальной cpeдu чистых cmpameгuй no кpumepuю Cэвиджa

является в соответствии с

формулой (41) cmpameгия Ai0 c минимальным показателем неэффективности (43):

Ri

1,0,...,0 min Ri 1,0,...,0 min max rij .

(43)

 

0

1 i m

1 i m 1 j n

 

 

 

 

 

Таким образом, оптимальной среди чистых стратегий по критерию Cэвиджa считается та чистая стратегия, максимальный риск при выборе которой является минимальным среди максимальных рисков всех чистых стратегий. Поэтому оптимальная стратегия по критерию Cэвиджa гарантирует игроку A при любых состояниях природы риск, не больший, чем минимакс

min max rij .

1 i m 1 j n

Из (2.21.7) H (2.21.6) находим, что для критерия Cэвиджa показатель пессимизма p = 1,a

показатель оптимизма 0 =0. Поэтому критерия Cэвиджa является критерием крайнего пессимизма, он

предполагает наихудшие для игрока A coстояния природы, при которых риск каждой из чистых стратегий максимален.

Хотя и критерий Вальда, И критерий Cэвиджa являются критериями крайнего пессимизма, но они не эквивалентны. Для доказательства этого вернемся к примеру 2.23.2.

Muниминный кpumepuй (кpumepuu кpaйнего oоптимизма).

Muниминный кpumepuй является противоположным критерию Севиджа и представляет собой частный случай обобщенного критерия Гурвица относительно рисков, когда коэффициенты 1 , 2 ,..., n

выбираются в виде (9).

Подставив коэффициенты (9) в формулу (40) И, yучитывая (39), получим показатель неэффективности стратегии Ai, no минимальному критерию :

Ri 1 ,..., n 1 , n Ri 0,...,0,1 din min rij ,i 1,...,m .

(46)

 

 

1 j n

 

Тогда, по формуле (41), onmuмальной cpeдu чистых cmpameгuй no миниминному критерию

является стратегия Ai0

c минимальным показателем неэффективности (46) :

 

Ri 0

0,...,0,1 min Ri 0,...,0,1 min max rij .

 

 

1 i m

 

1 i m 1 j n

 

С одной стороны, в соответствии с (6), rij 0 , i =1,..., m, j=1,..., n , и потому

 

 

min min r

0

 

 

1 i m 1 j n ij

 

.

(48)

C другой стороны, среди рисков матрицы (36) имеются нулевые, поскольку для каждого элемента aij

матрицы выигрышей (1), paвного j , соответствующий риск rij= j - aij =0; поэтому

 

 

min min rij 0

 

(49)

 

 

1i m 1 j n

.

 

 

 

 

 

Неравенства (48) и (49) oозначают, что минимин

67

min max rij 0 .

1 i m 1 j n

Следовательно, по формуле (47), onmuмальнльной cpeдu чистых cmpameгuй no миниминному

критерию является стратегия Ai0 , хотя-бы один из рисков которой ri0 1 ,..., ri0n равен нулю, и потому

она гарантирует игроку A возможность нулевого риска.

Из (9) И (6) получаем, что для миниминного критерия показатели пессимизма и оптимизма равны соответственно p =0 и 0 =0. Таким образом, миниминный критерий является критерием крайнего

оптимизма; он ориентирует игрока A на самые благоприятные для него состояния природы, при которых риск выбора стратегии равен нулю.

Соотношение между максимаксным и миниминным критериями крайнего оптимизма раскрывается в следующем утверждении:

Теорема. Стратегия, оптимальная среди чистых стратегий по максимаксному критерию, является оптимальной о по миниминному критерию. Обратное не верно, т.е. существуют стратегии, оптимальные среди чистых стратегий по миниминному критерию, но не являющиеся оптимальными по максимаксному критерию.

Доказательство: Пусть стратегия Аio оптимальная стратегия по максимальному критерию. Это означает, что (хотя бы) один элемент i0-й строки матрицы выигрышей (1) является максимальным среди всех элементов этой матрицы. Предположим, что этот элемент стоит в j-м столбце и, следовательно, имеет обозначение ai0j, при этом ai0jj. Но тогда соответствующий риск ri0j= βj- ai0j=0 и потому стратегия Аio является оптимальной и по миниминному критерию.

Для доказательства второй части теоремы снова обратимся к примеру 2. Вторая строка матрицы выигрышей (34) в этом примере содержит максимальный элемент а22=7. Поэтому оптимальной среди стратегий А1 и А2 по максимаксному критерию является стратегия А2.

Каждая строка матрицы рисков (44) для матрицы (34) содержит нулевой элемент и потому каждая из стратегий А1 и А2 является оптимальной по миниминному критерию.

Таким образом, стратегия А1, являясь оптимальной по миниминному критерию, не является оптимальной по максимаксному критерию.

Критерий пессимизма-оптимизма Гурвица относительно рисков с показателем оптимизма λ [0,1].

Этот критерий занимает промежуточное положение между критерием Сэвиджа крайнего пессимизма и миниминным критерием крайнего оптимизма и является частным случаем обобщенного критерия Гурвица относительно рисков с коэффициентами (11).

В силу (11),(40),(38) и (39), показатель неэффективности стратегии Аi по рассматриваемому критерию определяется формулой

Ri(λ) = Ri(1-λ, 0…,0, λ)= λ1di1+ λn din=(1-λ)maxrij+ λminrij, i=1,…,m.(50)

И тогда в соответствии с равенством (41) оптимальной стратегией среди чистых стратегий игрока А по критерию пессимизма-оптимизма Гурвица относительно рисков с показателем оптимизма λ [0,1] будет стратегия Аio с минимальным показателем неэффективности (50):

Ri0(λ)=min Ri(λ)=min[=(1-λ)maxrij+ λminrij].

Подставляя коэффициенты (11) в формулы (6) получим показатели пессимизма и оптимизма для этого критерия, равные соответственно λp=1-λ и λ0=λ.

При λ=0 и λ=1 из критерия гурвица относительно рисков получается соответственно критерий Сэвиджа и миниминный критерий.

Выше мы доказали неэквивалентность критерия Вальда и Сэвиджа, а из теоремы 2 следует неэквивалентность максимаксного и миниминного критериев. Это означает, что критерии Гурвица относительно выигрышей и относительно рисков неэквивалентны при покателях оптимизма λ=0 и λ=1. В связи с этим возникает вопрос: может быть эти критерии эквивалентны при всех остальных показателях оптимизма λ (0,1)? Оказывается, что ответ на этот вопрос также отрицателен. Приведем соответствующийпример.

Показателем неэффективности смешанной стратегии P=(p1,…,pm) по критерию пессимизмаоптимизма Гурвица относительно рисков с показателем оптимизма λ [0,1] назовем число

R(P;λ)=(1-λ)maxr(P,nj)+λminr(P,nj), (54),

68

1 j n

где maxr(P,nj) и minr(P,nj) – соответственно максимальный и минимальный риски игрока А при использовании им смешанной стратегии P.

Поскольку каждой смешанной стратегии P SA соответствует единственное значение максимального и минимального рисков, то maxr(P,nj), minr(P,nj) и, следовательно, R(P;λ), являются числовыми функциями векторного аргумента P=(p1,…,pm), определенными на множестве SА.

Если смешанная стратегия P=(p1,…,pm) является чистой стратегией Ак, то pi=0 при ik, и pk=1;

следовательно, по формулам (53),(26), и (5), r(P,Пj)=r(Ак,Пj)=βj-akj=rkj и показатель неэффективности R(P;λ) превращается в показатель неэффективности Rk(λ) чистой стратегии Ак, определяемый формулой (50) при i=k.

Оптимальной среди всех смешанных стратегий множества SA по критерию пессимизма-оптимизма Гурвица относительно рисков с показателем оптимизма λ [0,1] назовем стратегию P0=(p10,…,pm0) SA с минимальным показателем неэффективности R(P;λ):

R(P0;λ)= minR(P;λ)=min(1-λ)maxr(P,nj)+λminr(P,nj)]. (55)

Здесь из-за бесконечности множества SA, так же как и в случае критерия Гурвица относительно выигрышей, возникает необходимость доказательства существования оптимальной стратегии P0, т.е. доказательство того, что функция R(P;λ) достигает на множестве SA своей нижней грани.

Непрерывность по аргументу P на множестве SA функции H(P,Пj), задаваемой формулой (26), влечет непрерывность на том же множестве SA функции r(P,Пj), определяемой по формуле (53). Поэтому для любого ε>0 найдется δi>0 такое, что для каждой стратегии U=(u1,…,um) ) SA, удовлетворяющей

m

неравенству ρ(P,U)≤δi, где ρ(P,U)= ( pi ui )2 , будет справедливо неравенство (r(P,nj)-r(U,nj))≤ε,

i 1

которое можно переписать так:

r(U,Пj)-ε≤ r(P,Пj)≤ r(U,Пj)+ε. (56)

Если стратегия U SA такова, что

ρ(P,U)≤δ= min δj,

1 j n

то неравенство ρ(P,U)≤δ будет выполняться для каждого j=1,…,n и, следовательно, для каждого j=1,…,n будут выполняться неравенства (56).

Из левого неравенства (56) получим:

min r(U,nj)-ε≤ min r(P,nj).

1 j n

1 j n

Из этого неравенства и правого неравенства (56) будем иметь неравенство

min r(U,nj)-ε≤ min r(P,nj)≤ r(P,nj)≤ r(U,nj)+ε,

1 j n

1 j n

Справедливое для любого j=1,…,n. В частности имеет место неравенство

min r(U,nj)-ε≤ min r(P,nj)≤ min r(U,nj)+ε,

1 j n

1 j n

1 j n

Которое можно переписать так:

| min r(P,nj)- min r(U,nj)|≤ε. (57)

1 j n

1 j n

Итак, мы показали, что для любого ε>0 существует δ>0 такое, что из неравенства ρ(P,U)≤δ следует

неравенство (57). Это означает, что функция min r(P,nj) непрерывна по аргументу P на множестве SA.

1 j n

Непрерывность функции max r(P,nj) доказывается аналогично. А именно, в силу непрерывности

1 j n

функции r(P,Пj) по аргументу P на множестве SA, для любого ε>0 найдется такое, что для любой стратегии U SA, удовлетворяющей неравенству ρ(P,U)≤δi, будут справедливы неравенства (56). Если же

стратегия U SA такова, что ρ(P,U)≤δ= min δj, то неравенства (56) выполняются для любого j=1,…,n. Из

1 j n

правого неравенства (56):

r(P, Ï j ) r(U , Ï j ) max r(U, nj ) ,

1 j n

откуда в частности

max r(P, nj ) max r(U , nj )

1 j n

и, следовательно, из левого неравенства (2.21.56):

r(U , Ï j ) r(P, Ï

j

) max r(P, nj

) max r(U , nj ) .

 

 

1 j n

1 j n

Отсюда, в частности получаем неравенство

69

max r(U , nj

) max r(P, nj

) max r(U , nj ) ,

1 j n

1 j n

1 j n

которое можно записать в виде:

 

 

max r(P, nj ) max r(U , nj )

,

 

 

 

1 j n

1 j n

 

 

 

Этим мы доказали непрерывность функции max r(P, ni ) на множестве SA.

 

 

 

 

 

1 j n

 

 

Непрерывность

функций

max r(P, ni ) и

min r(P, ni ) гарантирует

непрерывность функции

 

 

 

1 j n

1 j n

 

R(P; ) [см.(2.21.54)] как

суммы непрерывных

функций 1 max r(P, nj ) и min r(P, nj ) . А

 

 

 

 

 

1 j n

1 j n

потому функция

R(P; ) по теореме Вейерштрасса достигает не ограниченном замкнутом множестве SA

своей нижней границы, т.е. существует стратегия

P0 ( p10,..., p0m) SA , удовлетворяющая неравенству

(55).

 

 

 

 

 

 

При 0 из формулы (54) получаем показатель неэффективности смешанной стратегии P по

критерию Сэвиджа:

 

 

 

 

R(P;0) max r(P, nj ) .

 

 

 

1 j n

 

Тогда, как следует из (55), оптимальной среди всех смешанных стратегий множества SA по критерию

Сэвиджа будет

стратегия

P0 ( p10,..., p0m) с минимальным показателем неэффективности

R(P; 0) :

 

 

 

 

R(

P

0; 0) min R(P; 0) min max r(P, nj ) .

 

 

P SA

P SA 1 j n

При 1из формулы (54) получаем показатель неэффективности смешанной стратегии P по миниминному критерию:

R(P;1) min r(P, nj )

 

 

1 j n

 

и, следовательно, из (55) оптимальной среди всех смешанных стратегий множества SA по

миниминному критерию

является стратегия P0 ( p10,..., p0m) с минимальным показателем

неэффективности R(P;1) :

 

R(

P

0;1) min R(P;1) min min r(P, n j ) .

 

P SA

P SA 1 j n

Теорема 3 Стратегия Ai 0 , оптимальная среди чистых стратегий по миниминному критерию, является оптимальной по тому же критерию и среди всех смешанных стратегий множества SA.

Доказательство: Для показателя

неэффективности

стратегии Ai 0

как смешанной

по миниминному

критерию очевидно справедливо неравенство

 

 

 

 

R( Ai0 ;1) min R(P;1) .

(58)

 

 

 

 

P SA

 

 

 

 

 

Риск rij чистой стратегии Ai при состоянии природы

Ï j равен риску

r( Ai , Ï j ) стратегии

Ai , если ее

рассматривать как смешанную:

r( Ai , Ï j ) rij . Следовательно, в

силу формулы

(46)

показатели

неэффективности стратегии Ai как чистой и как смешанной по миниминному критерию совпадают:

R(A ;1) min r( A ; n

) min r

R (0,..., 0,1) . (59)

i

1 j n

i j

1 j n ij

i

Так как стратегия Ai 0 по условию теоремы оптимальна среди чистых стратегий по миниминному критерию, то по формуле (47)

Ri0 (0,..., 0,1) min min rij .

1 i m 1 j n

Но, как было показано ранее, min min r 0

. Поэтому

R

(0,..., 0,1) 0

1 i m 1 j n ij

 

i 0

 

Из этого равенства и равенства (59) при i=i0 получаем: R( Ai 0 ;1) 0 . (60)

Из определения (12) риска смешанной стратегии P при состоянии природы Пj вытекает, что

70

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]