Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

TI_v_EMM_2014

.pdf
Скачиваний:
8
Добавлен:
27.05.2015
Размер:
3.52 Mб
Скачать

Доказательство. Если Ak и Ar — дублирующие чистые стратегии игрока А, то из определения дублирующих стратегий следует, что k-я и r-я строки матрицы игры равны, а потому каждая из них (нестрого) доминируется другой. Следовательно, одну из них можно удалить.

Рассуждения для дублирующих стратегий игрока В аналогичны.

Решение матричных игр со смешанным расширением методами линейного программирования

Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.

Для матричной игры, платѐжная матрица которой показана на рис. 1.1, Vн Vв , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2 ,…, pm) и для игрока 2 (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.

Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:

Для первого игрока:

a11 p1

a21 p2

... am1 pm

V

 

a

p

a

22

p

2

... a

m2

p

m

V

 

12 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2n p2

... amn pm

V

a1n p1

p

p

 

... p

 

1

 

 

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

p

0 : p

2

0...p

m

0

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для второго игрока:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a11q1

a12 q2

... a1n qn V

a

 

q

a

22

q

2

... a

2n

q

n

V

 

21 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

am2 q2

... amn qn

V

am1q1

 

q

 

q

 

... q

 

 

1

 

 

 

 

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

0 : q2

 

0...qn

0

 

 

 

q1

 

 

 

 

Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.

a11 x1 a21 x2

... am1 xm

1

a

x

a

22

x

2

... a

m2

x

m

1

12 1

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2n x2

... amn xm

1

a1n x1

x

x

 

... x

 

1/ v

 

 

 

1

 

 

2

 

 

 

 

 

m

 

 

 

 

 

 

 

x

0 : x

2

0...x

m

0

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для игрока 1 получим следующую систему неравенств, из которой найдѐм значение 1/v: Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V

должно стремиться к минимуму.

Целевая функция задачи будет иметь следующий вид:

51

min Z = min 1/V = min (x1 + x2 + … + xm)

Для игрока 2 получим следующую систему неравенств, из которой найдѐм значение 1/v:

a11 y1

a12 y2

... a1n yn

1

a

 

y

a

22

y

2

... a

2n

y

n

 

1

 

21 1

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

am 2 y2 ... amn yn

1

am1 y1

y

 

y

 

... y

 

1/V

 

 

 

 

1

 

 

2

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

y

 

0 : y

2

0...y

n

0

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.

Целевая функция задачи будет иметь следующий вид:

max Z = max 1/V = max (y1 + y2 + … + yn)

Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платѐжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина V* = V + K.

Для решения задач линейного программирования используется симплекс-метод.

В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj .

Величина V* определяется по формуле: V* = 1/z

Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xiV*: для игрока 2: qi =

yiV*.

Для определения цены игры V из величины V* необходимо вычесть число K.

Тема 4. Лекция 11-13. Игры с природой. (Принятие решений в условиях неопределенности и риска. Теория статистических решений.)

Рассмотрим ситуацию, когда имеются: Игрок А, игрок П (природа). Поведение человека – выбор стратегии из заданного множества. Поведение природы – одно состояние из известного множества. Если множества конечны, то игра задается матрицей A - матрицей выигрыша игрока А при выбранной стратегии игрока А и заданном состоянии природы П. H (Ai, Пj) = aij

 

П1

… Пn

A1

 

 

 

aij

Am

 

 

Принципы оптимальности:

1)Доминирующие стратегии

2)Удаление доминируемых стратегий.

3)Осторожные стратегии (МГР).

4)Принцип благоприятствования стратегий.

Показателем благоприятствования игрока Пj к выигрышу игрока А называется βj = max aij Риском i-той стратегии игрока А в состоянии Пj называется rij = βj - aij.

А→Ra=║rij

52

 

3

8

10

 

 

 

4

0

0

 

 

 

 

 

 

 

 

 

 

 

 

A

5

5

5

,

R A

 

2

3

5

 

 

7

1

4

 

 

 

0

7

6

 

 

 

 

 

 

Как привести неопределенность к определенности?

1)Вероятности состояний природы.

2)Относительная вероятность состояний.

3)Экспертная информация о вероятности.

4)Неизвестная вероятность состояния природы (неопределенность).

Пусть заданы вероятности qi состояний природы Пi (i=1,…..n).

Критерий Байеса относительно выигрыша (К1).

Пусть задана игра ис природой

 

П1

… Пn

A1

 

 

 

aij

An

 

 

qi

q1

qn

Определение:

n

Показателем эффективности стратегии Аi называется величина ai q j aij

j 1

Стратегия игрока называется максимальной, если показатель эффективности ее максимален. Ai0

оптимальна (в соответствии с К1) => max āi = āi0.

 

 

Определение:

p1

 

Выигрыш игрока при использовании им смешанной стратегии P=

 

 

 

 

...

 

 

 

 

m

pm

Равен H(P, П j ) pi aij

 

 

i 1

Определение:

Показателем эффективности игрока А (в соответствии с К1) называется величина

 

 

n

 

 

 

H(P)

q j

H(P, П j ) q j pi aij

pi q j aij pi ai

 

 

j 1

j i

i j

Определение:

Стратегия P0 игрока А назыается оптимальной на множестве Sa (в соответствии с К1) если

max H(P) H(P0 )

P SA

Теорема.

Если стратегия Аio оптимальна на множестве чистых стратегий Sca (в соответствии с К1), то она оптимальна и на множестве смешанных стратегий Sa (в соответствии с К1).

Доказательство.

H(P) pi ai pi max ai ai0 pi ai0

i

Если верно, что P SA , то => H(P0 ) ai0

53

Т.к. Ai0 SCA SA . H(P0 ) ai0

Критерий Байеса относительно риска (К2). Определение:

Показателем неэффективности Аi (в соответствии с К2) есть величина

n

 

ri q j rij , ║rij║ = Ra.

 

j 1

 

Стратегия Аi0 игрока А называется оптимальной, если ri0

min ri

 

i

Определение:

Риском, при использовании игроком А стратегии P и при Пi называется:

r(P, Пj ) max H(V, Пj ) H(P, Пj )

V SA

Определение:

Показатель эффективности стратегии В игрока А (в соответствии с К2) называется величина:

n

r(P) q j r(P, П j )

j 1

Определение:

Смешанные стратегии P0 игрока А называется оптимальной (в соответствии с К2), если

min r(P) r(P0 )

P SA

Теорема.

Стратегия Аio игрока А, оптимальная (в соответствии с К2) на множестве ScА (множество рисков), будет оптимальной и на SА (множество смешанных стратегий).

Доказательство:

 

 

 

 

 

max H(V, П j ) max Ui aij

max Ui

max aij j

V

V

i

V

i

i

 

 

 

 

Докажем это неравенство в другую сторону.

Пусть j

ak j ,

Ak SCA SA

 

 

 

 

 

 

 

max H(V, Пj ) j

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

H(P, П j ) pi aij

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

r(P, П j ) max H(V, П j ) H(P, П j ) j pi aij

Pi ( j

aij ) pi rij

 

 

 

V SA

 

 

 

i

i

 

i

 

 

 

 

 

 

 

 

 

 

qj pi rij

pi qj rij pi

 

pi

min

 

 

ri0 pi

 

 

r(P)

 

ri

ri

ri0

 

 

j

i

i

j

i

i

 

 

 

 

 

 

Итак, min r(p) ri0

Теорема об эквивалентности К1 и К2.

Рассмотрим показатели эффективности стратегий относительно риска:

n

ri qj rij q j ( j aij ) qj j qj aij

j 1

j

j

j

ai

54

ri достигает своего минимума если ai достигает своего максимума.

Критерий Лапласса относительно выигрыша/риска. Все состояния природы считаются равновероятными.

Pj n1 , j = 1, ..., n

Далее, все формулировки аналогичны критериям Байеса.

Для лучшей обозримости сведем рассмотренные в этом параграфе критерии в таблице.

Таблица 1.

Критерии относительно выигрышей

№№

Критерий

 

Вероятности состояний природы

Показатель

эффективности

п/п

 

 

q1

,..., qn

 

 

 

 

стратегии

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai , i 1,..., m

1B

Критерий

Бейса

q1

,..., qn

 

 

 

 

 

 

 

n

 

 

относительно выигрышей

 

 

 

 

 

 

ai

 

q j aij

, i 1,..., m.

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

2B

Критерий

Лапласа

q

... q

 

1

 

 

 

n

 

 

относительно выигрышей

1

 

 

n

 

n

ai

 

aij , i 1,..., m.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

3B

Критерий

относительный

q1

: q2 ... : qn

1 : 2 ... : n .

 

 

 

n

 

 

значений вероятностей

 

 

n

 

 

1

ai

 

j aij

, i 1,..., m.

 

 

 

 

 

 

 

 

j 1

 

 

 

 

q j

j

k

, j 1,...,m.

 

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

 

По каждому из этих критериев оптимальной является стратегия Ai0 , показатель эффективности которой

a

 

 

 

 

 

 

 

 

= max a

 

 

, т.е.

a

i

. Очевидно, что каждый из этих критериев является по существу критерием

i0

 

i0

1 i m

 

Байеса относительно выигрышей и отличаются они друг от друга лишь способом добывания информации о вероятностях состояний природы.

По каждому из этих критериев является стратегия Ai0 показатель

 

r

 

r

 

 

 

неэффективности

который минимален, т.е.

= min r .

 

i

 

i

1 i m

i

 

0

 

0

 

 

Каждый из этих критериев является критерием Байеса относительно рисков и отличаются они друг от друга только способом получения информации о вероятностях состояний природы.

Таблица 2.

Критерии относительно рисков состояний природы с учетом рисков

№№

Критерий

 

Вероятности состояний природы

Показатель

эффективности

п/п

 

 

q1

,..., qn

 

 

 

 

стратегии

 

 

 

 

 

 

 

 

 

 

 

 

Ai , i 1,..., m

1P

Критерий

Бейса

q1

,..., qn

 

 

 

 

 

 

n

 

 

 

 

 

ri

q j rij

, i 1,..., m.

 

относительно рисков

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2P

Критерий

Лапласа

 

... q

 

1

 

 

n

 

q

 

 

 

rij , i 1,..., m.

n

ri

 

относительно рисков

1

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3P

Критерий

относительный

q1

: q2 ... : qn

1 : 2 ... : n .

 

 

n

 

ri

j rij

, i 1,..., m.

 

значений

вероятностей

 

 

n

 

 

1

 

состояний

природы с

 

 

 

 

j 1

 

 

учетом рисков

q j

j

k

, j 1,...,m.

 

 

 

 

 

 

 

 

k 1

 

 

 

 

 

 

55

Наконец, напомним, что критерии 1В, 2В, 3В эквивалентны соответственно критериям 1р,2р,3р. Заканчивая обсуждение способов принятия решения в условиях риска, мы видим, что информация о

вероятностях состояний природы может быть как объективной, так и субъективной. Оптимальные стратегии, определенные на основе субъективной оценки вероятностей состояний природы, в общем случае также оказываются субъективными. Степень субъективности оптимальных решений можно уменьшить, если вероятности состояний природы, назначенные одним экспертом, заменить на средние вероятностей, назначенных различными экспертами независимо друг от друга.

ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

В предыдущей лекции мы рассмотрели подходы к принятию решений в условиях риска, т.е. в условиях, когда мы существенно использовали вероятности состояний природы, добытые тем или иным путем.

Здесь мы обсудим некоторые критерии принятия оптимальных решений в условиях неопределенности, т.е. когда вероятности, с которыми природа может принимать то или иное состояние, неизвестны и отсутствует всякая возможность получения о них какой-либо статистической информации.

Пусть в игре с природой П игрок А обладает m возможными чистыми стратегиями А1...,Аm, а природа П может находится в одном из n состояний П1..., Пn. Пусть (20.1) является матрицей выигрышей игрока А.

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами

λ123,…λn .

Переставим выигрыши аi1i2,...,аin при каждой стратегии Ai, (т.е. элементы каждой строки матрицы), расположив их в неубывающем порядке, и обозначим элементы полученной матрицы через bij, а саму матрицу — через B:

 

 

Bi \ j

 

1

 

2

n

 

 

 

 

 

 

 

 

B =

 

B1

b11

 

b12

b1n

 

B2

b21

 

b21

b2n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Bm

bm1

 

bm2

bmn

Таким образом,

 

 

 

 

 

bi1 bi 2

... bin , i ,...m. (1)

 

 

 

Каждая строка Bi матрицы В является перестановкой выигрышей при стратегии Ai, (i = 1,..., m). Не исключена возможность, что для некоторых номеров i и j будет иметь место равенство bij = aij. В силу неравенств (1), в первом столбце матрицы В стоят минимальные выигрыши при каждой стратегии

bi1 min ij ,i 1,..., m,

(2)

1 j n

 

а в последнем n-м столбце — максимальные выигрыши при каждой стратегии

bin max ij ,i 1,...,m,

(3)

1 j n

 

Пусть числа λ123,…λn, удовлетворяют условиям

n

 

0 и 1

(4)

j 1

Показателем эффективности стратегии Аi по рассматриваемому критерию назовем число

n

 

Gi 1 , 2 ,...., n j bij , i 1,..., m.

(5)

j 1

56

λi,j=1,..., n,. В обозначении
можно было бы не указывать один из коэффициентов,

Из этого определения видно, что показатель эффективности стратегии Аi, учитывает все выигрыши при этой стратегии bi1,..., bin и зависит от чисел λi,j=1,..., n, удовлетворяющих условиям (4).

Выражение (5) является выпуклой комбинацией выигрышей ни строки матрицы В с коэффициентами

Gi 1, 2 ,...., n

например, λ1, поскольку он однозначно определяется остальными n-1 коэффициентами из нормировочного равенства (4).

 

 

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с

коэффициентами

1, 2 ,...., n

назовем критерий, по которому оптимальной среди чистых

стратегий считается стратегия

i

. с максимальным показателем эффективности (5), т.е.

 

 

 

 

 

 

 

 

0

 

 

Gi

1 , 2 ,...., n G 1 , 2 ,...., n maxGi 1 , 2 ,...., n

 

0

 

 

 

 

 

 

 

 

1 i m

 

 

 

 

 

 

 

 

 

 

Числа

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

2

 

 

 

 

 

 

p

j и 0

 

j

1 p

 

(6)

 

j 1

 

n

 

 

 

 

 

 

 

 

 

j

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

назовем показателями соответственно пессимизма и оптимизма. В обозначениях (6) индекс «р» — первая буква английского pessimism [, pesi'mizm], индекс «о» — первая буква английского optimism ['optimizm], a

n

 

— целая часть числа

n

, т.е. наибольшее целое число, непревосходящее числа n/2; очевидно, что

 

 

 

 

 

 

2

 

 

2

 

n2

 

т

, если n-число четное ( 2)

 

 

 

 

2

 

 

 

 

 

 

 

 

, если n-число нечетное ( 2)

 

т 1

 

2

 

 

 

 

 

Коэффициенты λ123,…λn выбираются из субъективных соображений следующим образом: чем опаснее ситуация, тем больше возникает желание в ней подстраховаться, тем больше, т.е. ближе к единице, должен быть коэффициент пессимизма λp (см. 6) и, следовательно, тем меньше, т.е. ближе к нулю, будет коэффициент оптимизма λo. В безопасной ситуации коэффициенты λ123,…λn выбираются так, чтобы показатель пессимизма λp был ближе к нулю, а показатель оптимизма λo— ближе к единице. Таким образом, показатели пессимизма λp и оптимизма λo в данном критерии выражают количественную меру соответственно пессимизма и оптимизма игрока A, выбирающего коэффициенты λ1,…λn.

Если показатель оптимизма λo > 1/2 и, следовательно показатель пессимизма λp< < 1/2, то критерий более «оптимистический», чем «пессимистический»; если, наоборот, показатель оптимизма λo < ½ и, следовательно показатель пессимизма λр > ½, то критерий более пессимистический чем оптимистический; если же показатели оптимизма и пессимизма равны: λoр=1/2, то критерий можно считать реалистическим.

Если bij=aij для всех i=1,...,n и j=1,...,n, т.е. если матрица В совпадает с матрицей А, то коэффициенты λ1,…λn, можно формально интерпретировать как вероятности состояний природы: q11...,qnn, и тогда показатель эффективности стратегии Ai, по обобщенному критерию Гурвица относительно выигрышей, определяемый формулой (5), превращается в показатель эффективности

стратегии Ai по критерию Байеса относительно выигрышей : Gi 1, 2 ,...., n ai ,i 1,...,m. .

57

Следовательно, в этом случае, обобщенный критерий Гурвица относительно выигрышей превращается в критерий Байеса относительно выигрышей.

Если коэффициенты j 1n , j 1,..., n , то их можно формально трактовать как вероятности равновероятных состояний природы и из (2.21.5) получим:

 

 

 

 

 

 

 

 

 

 

1

 

1

 

1

1

n

 

 

 

 

Gi 1, 2 ,...., n

Gi

 

,

 

 

,...,

 

 

 

bij .

 

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

n

 

 

 

n

j 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

n

Но поскольку bi1,...,bin есть перестановка элементов ai1,...,ain i-строки матрицы А, то bij

. aij . и,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j 1

j 1

следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

1

 

1

n

 

 

 

 

 

 

 

 

 

 

 

Gi

 

,

 

,...,

 

 

 

aij .

 

 

 

 

 

 

 

 

 

 

 

 

n

n

n

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

j 1

 

 

 

 

 

 

 

 

 

 

 

т.е. показатель эффективности стратегии Ai

по обобщенному критерию Гурвица относительно выигрышей

совпадает с показателем эффективности стратегии Ai - по критерию Лапласа относительно выигрышей. Значит, обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с равными коэффициентами λ1=…= λn=1/2, превращается в критерий Лапласа относительно выигрышей.

Критерий Вальда (критерий крайнего пессимизма).

Критерий Вальда есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами

λ1=1,λ2=0…= λn=0

(7)

которые, очевидно, удовлетворяют условиям (4).

Подставляя значения коэффициентов (7) в формулу (5) и учитывая (2), получим показатель эффективности стратегии Аi- по критерию Вальда:

Wi

Gi (1,0,...0) bi1

min aij ,i 1,...,m,

(8)

 

 

1 j n

 

представляющий собой минимальный выигрыш игрока А при применении им стратегии Ai. Оптимальной

среди чистых стратегий по критерию Вальда является, таким образом, стратегия

i

, имеющая

 

 

0

 

максимальный показатель эффективности (8):

 

 

Wi0 W maxWi

max min aij.

 

 

1 i m

1 i m 1 j n

 

 

Другими словами, оптимальной среди чистых стратегий по критерию Вальда считается та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий. Таким образом, оптимальная стратегия по критерию Вальда гарантирует при любых состояниях природы выигрыш, не меньший, чем максимин

W max min aij.

1 i m 1 j n

Из (7) и (6) получаем, что для критерия Вальда показатель пессимизма λр=1 а показатель оптимизма λо=0. Это говорит о том, что критерий Вальца является критерием крайнего пессимизма, ибо ориентирует игрока А на наихудшие для него состояния природы и, следовательно, на крайне осторожное, осмотрительное поведение при выборе стратегий. Хотя арабская пословица и гласит «Кто боится собственной тени, тому нет места под солнцем», тем не менее этот критерий уместен в тех случаях, когда игрок А не столько хочет выиграть, сколько не хочет проиграть. Принципом критерия Вальда часто пользуются в обиходе, что подтверждается такими поговорками, как «Семь раз отмерь—один раз отрежь», «Береженного бог бережет», «Лучше синица в руках, чем журавль в небе».

Максимаксный критерий (критерий крайнего оптимизма). Противоположностью критерию Вальда является так называемый максимаксный критерий, представляющий собой также частный случай обобщенного критерия Гурвица относительно выигрышей, когда коэффициенты λ12,…, λn выбираются следующим образом:

λ1=…=λn-1=0, λn=1

(9)

Коэффициенты (9) удовлетворяют условиям (4). Если эти коэффициенты подставить в (5) и учесть (3), то получим формулу для показателя эффективности стратегии Ai, по максимаксному критерию:

58

Mi Gi (1,0,...0) bin maxaij ,i 1,...,m, (10)

1 j n

Значит, в качестве показателя эффективности стратегии Ai по максимаксному критерию выбирается максимальный выигрыш при этой стратегии.

Тогда оптимальной среди чистых стратегий по максимаксному критерию является стратегия

i

с

 

 

 

0

 

максимальным показателем эффективности (10):

 

 

Mi

M max Mi

maxmaxaij.

 

 

0

1 i m

1 i m 1 j n

 

 

 

 

 

 

т.е. стратегия, максимальный выигрыш при которой максимален среди максимальных выигрышей всех чистых стратегий. По-другому можно сказать, что оптимальной будет та чистая стратегия, при которой (хотя-бы) один из выигрышей

является максимальным среди выигрышей всех чистых стратегии. Оптимальная по максимаксному критерию стратегия гарантирует игроку А возможность наибольшего выигрыша, равного максимаксу

M max max aij

1 i m 1 j n

Подставляя коэффициенты (9) в (6), найдем для максимаксного критерия показатель пессимизма λp=0 и показатель оптимизма λo=1. Таким образом, максимаксный критерий является критерием крайнего оптимизма, так как ориентирует лицо, принимающее решение, (игрока А) на наилучшие, благоприятнейшие для него состояния природы и, как следствие отсюда — на порой неоправданно легкомысленное, шапкозакидательское поведение при выборе стратегий. Вместе с тем, в некоторых случаях этим критерием пользуются осознанно, например, в ситуации, когда перед игроком А стоит дилемма: либо получить наибольший выигрыш, либо стать банкротом.

Критерий пессимизма-оптимизма Гурвица относительно выигрышей, с показателем оптимизма

[0,1]

Данный критерий является как бы промежуточным между критериями крайнего пессимизма и крайнего оптимизма и представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей

с коэффициентами

1 1 , 2 ... n 1 0, n

удовлетворяющими, очевидно, условиям (4).

Из (11), (5), (2) и (3) следует, что показателем эффективности стратегии А, по рассматриваемому критерию является величина

Gi ( ) Gi

(1 , 0,..., 0, ) 1bi1

nbin (1 ) min aij

max aij , i 1,..., m.

 

 

 

1 j n

 

1 j n

Оптимальной же стратегией по этому критерию считается стратегия Аi0

с максимальным показателем

эффективности (12):

 

 

 

 

 

G ( ) G( ) max G ( ) max (1 ) min a max a .

i0

1 i m i

 

1 j n

ij

 

1 i m

1 j n ij

Из (11) и (6) получаем, что показатели пессимизма и оптимизма в этом критерии равны соответственно λр=1-λ и λo=λ. При λ=0 мы из критерия Гурвица получаем критерий Вальда, а при λ=1 — максимаксный критерий. Чем ближе к нулю показатель оптимизма λ, тем ближе к единице показатель пессимизма 1-λ, и тем меньше оптимизма и больше пессимизма. И наоборот, чем ближе λ к единице, тем больше оптимизма и меньше пессимизма. Если показатель оптимизма 1 2 , то и показатель пессимизма 1 12 . В этом

случае показатель эффективности стратегии Аi, как следует из формулы (12), примет вид:

G (

1

)

1

min a

max a

 

,

 

 

i

 

 

 

 

ij

 

 

 

2 2 1 j n

1 j n ij

 

а так как множитель 1/2 в правей части этого равенства не зависит oт номера i, то в качестве показателя эффективности стратегии Аi по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма λ=1/2 можно рассмотреть правую часть равенства (13) без коэффициента 1/2:

G (

1

) min a

max a

 

i 2

1 j n

ij

1 j n

ij

 

 

 

 

59

(11)

(12)

(13)

Отметим, что критерий Вальда, максимаксный критерий и критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма (0,1) не учитывают всех выигрышей игрока А при

каждой его стратегии: критерий Вальда принимает во внимание только минимальные выигрыши при каждой стратегии, максимаксный критерий учитывает лишь максимальные выигрыши при каждой стратегии, а критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма

(0,1) опирается на минимальные и максимальные выигрыши. В отличие от этого обобщенный

критерий Гурвица учитывает все выигрыши при каждой стратегии игрока А, используя тем самым полную информацию об игре, поскольку вся имеющаяся информация об игре с природой в условиях неопределенности содержится в матрице выигрышей игрока A .

Перейдем к вопросу о формализации метода выбора коэффициентов λ1, λ2,..., λn в обобщенном критерии Гурвица относительно выигрышей.

Пусть

 

 

 

 

m

 

 

 

 

bj

bij ,

j 1,..., n,

 

 

 

 

i 1

 

 

— сумма выигрышей, стоящих в j-м столбце матрицы В;

 

 

 

 

 

 

 

 

m

 

 

 

 

 

bj

1

bij ,

j 1,..., n,

bj

1

 

m

m

 

 

 

 

 

 

i 1

 

— среднее значение выигрышей bij, стоящих в j-м столбце матрицы В;

 

 

 

 

n

n

m

 

 

 

b bj

bij

 

 

 

 

j 1

j 1

i 1

— сумма всех выигрышей матрицы В, или, что то же, сумма всех выигрышей матрицы А . Просуммировав неравенства (1) по индексу i от 1 до m, получим с учетом обозначений (14):

b1 b2 ... bn ,

откуда, в обозначениях (15):

 

 

b1 b2

... bn

(17)

В случае опасной ситуации выбор стратегии игроком А должен быть осторожным, «направленным» в сторону убывания выигрышей. Поэтому коэффициенты λj по мере убывания выигрышей должны возрастать. Учитывая (17), эти коэффициенты можно выбрать обратно пропорциональными средним выигрышам (15):

1 : 2 :

: n

 

 

 

 

 

 

 

bn : bn 1 : : b1 ....

(18)

Так как неравенства (17) можно переписать так:

bn bn 1 ... b2 b1 ,

то принцип (18) выбора коэффициентов λj , j =1,..., n, можно назвать «принципом невозрастания средних выигрышей».

Выразим коэффициенты λj , j =1,..., n, через выигрыши bij .

Из (18):

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bn

,

 

j 2,..., n .

 

 

 

 

 

 

 

 

 

 

 

 

 

j

b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n j 1

 

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bn

 

j 1

 

, j 2,..., n .

 

 

j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bn

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставляя эти выражения в нормировочное равенство (2.21.4), получим

 

1

 

1 bn j 1

1 bk ,

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

bn

 

 

j 1

 

 

 

bn k 1

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

60

(14)

(15)

(16)

(19)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]