![](/user_photo/2706_HbeT2.jpg)
TI_v_EMM_2014
.pdfДоказательство. Если Ak и Ar — дублирующие чистые стратегии игрока А, то из определения дублирующих стратегий следует, что k-я и r-я строки матрицы игры равны, а потому каждая из них (нестрого) доминируется другой. Следовательно, одну из них можно удалить.
Рассуждения для дублирующих стратегий игрока В аналогичны.
Решение матричных игр со смешанным расширением методами линейного программирования
Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.
Для матричной игры, платѐжная матрица которой показана на рис. 1.1, Vн Vв , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2 ,…, pm) и для игрока 2 (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.
Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:
Для первого игрока:
a11 p1 |
a21 p2 |
... am1 pm |
V |
|
||||||||||||||||||||
a |
p |
a |
22 |
p |
2 |
... a |
m2 |
p |
m |
V |
||||||||||||||
|
12 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a2n p2 |
... amn pm |
V |
|||||||||||||||||||
a1n p1 |
||||||||||||||||||||||||
p |
p |
|
... p |
|
1 |
|
|
|
|
|
|
|
||||||||||||
|
1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
p |
0 : p |
2 |
0...p |
m |
0 |
|
|
|
|
|
|
|||||||||||||
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Для второго игрока: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a11q1 |
a12 q2 |
... a1n qn V |
||||||||||||||||||||||
a |
|
q |
a |
22 |
q |
2 |
... a |
2n |
q |
n |
V |
|||||||||||||
|
21 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
am2 q2 |
... amn qn |
V |
||||||||||||||||||
am1q1 |
|
|||||||||||||||||||||||
q |
|
q |
|
... q |
|
|
1 |
|
|
|
|
|
|
|||||||||||
1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
0 : q2 |
|
0...qn |
0 |
|
|
|
||||||||||||||||
q1 |
|
|
|
|
Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.
a11 x1 a21 x2 |
... am1 xm |
1 |
||||||||||||||
a |
x |
a |
22 |
x |
2 |
... a |
m2 |
x |
m |
1 |
||||||
12 1 |
|
|
|
|
|
|
|
|
|
|
|
|||||
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
a2n x2 |
... amn xm |
1 |
||||||||||||
a1n x1 |
||||||||||||||||
x |
x |
|
... x |
|
1/ v |
|
|
|
||||||||
1 |
|
|
2 |
|
|
|
|
|
m |
|
|
|
|
|
|
|
x |
0 : x |
2 |
0...x |
m |
0 |
|
|
|
||||||||
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для игрока 1 получим следующую систему неравенств, из которой найдѐм значение 1/v: Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V
должно стремиться к минимуму.
Целевая функция задачи будет иметь следующий вид:
51
min Z = min 1/V = min (x1 + x2 + … + xm)
Для игрока 2 получим следующую систему неравенств, из которой найдѐм значение 1/v:
a11 y1 |
a12 y2 |
... a1n yn |
1 |
||||||||||||||||
a |
|
y |
a |
22 |
y |
2 |
... a |
2n |
y |
n |
|
1 |
|||||||
|
21 1 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||
... |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
am 2 y2 ... amn yn |
1 |
|||||||||||||||
am1 y1 |
|||||||||||||||||||
y |
|
y |
|
... y |
|
1/V |
|
|
|
|
|||||||||
1 |
|
|
2 |
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
y |
|
0 : y |
2 |
0...y |
n |
0 |
|
|
|
|
|||||||||
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.
Целевая функция задачи будет иметь следующий вид:
max Z = max 1/V = max (y1 + y2 + … + yn)
Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платѐжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина V* = V + K.
Для решения задач линейного программирования используется симплекс-метод.
В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj .
Величина V* определяется по формуле: V* = 1/z
Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xiV*: для игрока 2: qi =
yiV*.
Для определения цены игры V из величины V* необходимо вычесть число K.
Тема 4. Лекция 11-13. Игры с природой. (Принятие решений в условиях неопределенности и риска. Теория статистических решений.)
Рассмотрим ситуацию, когда имеются: Игрок А, игрок П (природа). Поведение человека – выбор стратегии из заданного множества. Поведение природы – одно состояние из известного множества. Если множества конечны, то игра задается матрицей A - матрицей выигрыша игрока А при выбранной стратегии игрока А и заданном состоянии природы П. H (Ai, Пj) = aij
|
П1 |
… Пn |
A1 |
|
|
… |
|
aij |
Am |
|
|
Принципы оптимальности:
1)Доминирующие стратегии
2)Удаление доминируемых стратегий.
3)Осторожные стратегии (МГР).
4)Принцип благоприятствования стратегий.
Показателем благоприятствования игрока Пj к выигрышу игрока А называется βj = max aij Риском i-той стратегии игрока А в состоянии Пj называется rij = βj - aij.
А→Ra=║rij║
52
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV53x1.jpg)
|
3 |
8 |
10 |
|
|
|
4 |
0 |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
A |
5 |
5 |
5 |
, |
R A |
|
2 |
3 |
5 |
|
|
7 |
1 |
4 |
|
|
|
0 |
7 |
6 |
|
|
|
|
|
|
Как привести неопределенность к определенности?
1)Вероятности состояний природы.
2)Относительная вероятность состояний.
3)Экспертная информация о вероятности.
4)Неизвестная вероятность состояния природы (неопределенность).
Пусть заданы вероятности qi состояний природы Пi (i=1,…..n).
Критерий Байеса относительно выигрыша (К1).
Пусть задана игра ис природой
|
П1 |
… Пn |
A1 |
|
|
… |
|
aij |
An |
|
|
qi |
q1 |
qn |
Определение:
n
Показателем эффективности стратегии Аi называется величина ai q j aij
j 1
Стратегия игрока называется максимальной, если показатель эффективности ее максимален. Ai0 –
оптимальна (в соответствии с К1) => max āi = āi0. |
|
|
Определение: |
p1 |
|
Выигрыш игрока при использовании им смешанной стратегии P= |
||
|
|
|
|
... |
|
|
|
|
m |
pm |
|
Равен H(P, П j ) pi aij |
|
|
i 1
Определение:
Показателем эффективности игрока А (в соответствии с К1) называется величина
|
|
n |
|
|
|
H(P) |
q j |
H(P, П j ) q j pi aij |
pi q j aij pi ai |
|
|
j 1 |
j i |
i j |
Определение:
Стратегия P0 игрока А назыается оптимальной на множестве Sa (в соответствии с К1) если
max H(P) H(P0 )
P SA
Теорема.
Если стратегия Аio оптимальна на множестве чистых стратегий Sca (в соответствии с К1), то она оптимальна и на множестве смешанных стратегий Sa (в соответствии с К1).
Доказательство.
H(P) pi ai pi max ai ai0 pi ai0
i
Если верно, что P SA , то => H(P0 ) ai0
53
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV54x1.jpg)
Т.к. Ai0 SCA SA . H(P0 ) ai0
Критерий Байеса относительно риска (К2). Определение:
Показателем неэффективности Аi (в соответствии с К2) есть величина
n |
|
ri q j rij , ║rij║ = Ra. |
|
j 1 |
|
Стратегия Аi0 игрока А называется оптимальной, если ri0 |
min ri |
|
i |
Определение:
Риском, при использовании игроком А стратегии P и при Пi называется:
r(P, Пj ) max H(V, Пj ) H(P, Пj )
V SA
Определение:
Показатель эффективности стратегии В игрока А (в соответствии с К2) называется величина:
n
r(P) q j r(P, П j )
j 1
Определение:
Смешанные стратегии P0 игрока А называется оптимальной (в соответствии с К2), если
min r(P) r(P0 )
P SA
Теорема.
Стратегия Аio игрока А, оптимальная (в соответствии с К2) на множестве ScА (множество рисков), будет оптимальной и на SА (множество смешанных стратегий).
Доказательство: |
|
|
|
|
|
max H(V, П j ) max Ui aij |
max Ui |
max aij j |
|||
V |
V |
i |
V |
i |
i |
|
|
|
|
Докажем это неравенство в другую сторону.
Пусть j |
ak j , |
Ak SCA SA |
|
|
|
|
|
|
|
||||||
max H(V, Пj ) j |
|
|
|
|
|
|
|
|
|
|
|
||||
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
||
H(P, П j ) pi aij |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
r(P, П j ) max H(V, П j ) H(P, П j ) j pi aij |
Pi ( j |
aij ) pi rij |
|||||||||||||
|
|
|
V SA |
|
|
|
i |
i |
|
i |
|||||
|
|
|
|
|
|
|
|
||||||||
|
|
qj pi rij |
pi qj rij pi |
|
pi |
min |
|
|
ri0 pi |
|
|
||||
r(P) |
|||||||||||||||
|
ri |
ri |
ri0 |
||||||||||||
|
|
j |
i |
i |
j |
i |
i |
||||||||
|
|
|
|
|
|
Итак, min r(p) ri0
≤
Теорема об эквивалентности К1 и К2.
Рассмотрим показатели эффективности стратегий относительно риска:
n
ri qj rij q j ( j aij ) qj j qj aij
j 1 |
j |
j |
j |
ai
54
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV55x1.jpg)
ri достигает своего минимума если ai достигает своего максимума.
Критерий Лапласса относительно выигрыша/риска. Все состояния природы считаются равновероятными.
Pj n1 , j = 1, ..., n
Далее, все формулировки аналогичны критериям Байеса.
Для лучшей обозримости сведем рассмотренные в этом параграфе критерии в таблице.
Таблица 1.
Критерии относительно выигрышей
№№ |
Критерий |
|
Вероятности состояний природы |
Показатель |
эффективности |
||||||||
п/п |
|
|
q1 |
,..., qn |
|
|
|
|
стратегии |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
Ai , i 1,..., m |
|
1B |
Критерий |
Бейса |
q1 |
,..., qn |
|
|
|
|
|
|
|
n |
|
|
относительно выигрышей |
|
|
|
|
|
|
ai |
|
q j aij |
, i 1,..., m. |
||
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
2B |
Критерий |
Лапласа |
q |
... q |
|
1 |
|
|
|
n |
|
||
|
относительно выигрышей |
1 |
|
|
n |
|
n |
ai |
|
aij , i 1,..., m. |
|||
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|||
3B |
Критерий |
относительный |
q1 |
: q2 ... : qn |
1 : 2 ... : n . |
|
|
|
n |
|
|||
|
значений вероятностей |
|
|
n |
|
|
1 |
ai |
|
j aij |
, i 1,..., m. |
||
|
|
|
|
|
|
|
|
j 1 |
|
||||
|
|
|
q j |
j |
k |
, j 1,...,m. |
|
|
|
|
|
||
|
|
|
|
k 1 |
|
|
|
|
|
|
|
По каждому из этих критериев оптимальной является стратегия Ai0 , показатель эффективности которой
a |
|
|
|
|
|
|
|
|
= max a |
|
|
||
, т.е. |
a |
i |
. Очевидно, что каждый из этих критериев является по существу критерием |
|||
i0 |
|
i0 |
1 i m |
|
Байеса относительно выигрышей и отличаются они друг от друга лишь способом добывания информации о вероятностях состояний природы.
По каждому из этих критериев является стратегия Ai0 показатель
|
r |
|
r |
|
|
|
неэффективности |
который минимален, т.е. |
= min r . |
||||
|
i |
|
i |
1 i m |
i |
|
|
0 |
|
0 |
|
|
Каждый из этих критериев является критерием Байеса относительно рисков и отличаются они друг от друга только способом получения информации о вероятностях состояний природы.
Таблица 2.
Критерии относительно рисков состояний природы с учетом рисков
№№ |
Критерий |
|
Вероятности состояний природы |
Показатель |
эффективности |
||||||||
п/п |
|
|
q1 |
,..., qn |
|
|
|
|
стратегии |
|
|||
|
|
|
|
|
|
|
|
|
|
|
Ai , i 1,..., m |
||
1P |
Критерий |
Бейса |
q1 |
,..., qn |
|
|
|
|
|
|
n |
|
|
|
|
|
|
ri |
q j rij |
, i 1,..., m. |
|||||||
|
относительно рисков |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2P |
Критерий |
Лапласа |
|
... q |
|
1 |
|
|
n |
|
|||
q |
|
|
|
rij , i 1,..., m. |
|||||||||
n |
ri |
||||||||||||
|
относительно рисков |
1 |
|
|
|
n |
|||||||
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3P |
Критерий |
относительный |
q1 |
: q2 ... : qn |
1 : 2 ... : n . |
|
|
n |
|
||||
ri |
j rij |
, i 1,..., m. |
|||||||||||
|
значений |
вероятностей |
|
|
n |
|
|
1 |
|||||
|
состояний |
природы с |
|
|
|
|
j 1 |
|
|||||
|
учетом рисков |
q j |
j |
k |
, j 1,...,m. |
|
|
|
|
||||
|
|
|
|
k 1 |
|
|
|
|
|
|
55
Наконец, напомним, что критерии 1В, 2В, 3В эквивалентны соответственно критериям 1р,2р,3р. Заканчивая обсуждение способов принятия решения в условиях риска, мы видим, что информация о
вероятностях состояний природы может быть как объективной, так и субъективной. Оптимальные стратегии, определенные на основе субъективной оценки вероятностей состояний природы, в общем случае также оказываются субъективными. Степень субъективности оптимальных решений можно уменьшить, если вероятности состояний природы, назначенные одним экспертом, заменить на средние вероятностей, назначенных различными экспертами независимо друг от друга.
ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
В предыдущей лекции мы рассмотрели подходы к принятию решений в условиях риска, т.е. в условиях, когда мы существенно использовали вероятности состояний природы, добытые тем или иным путем.
Здесь мы обсудим некоторые критерии принятия оптимальных решений в условиях неопределенности, т.е. когда вероятности, с которыми природа может принимать то или иное состояние, неизвестны и отсутствует всякая возможность получения о них какой-либо статистической информации.
Пусть в игре с природой П игрок А обладает m возможными чистыми стратегиями А1...,Аm, а природа П может находится в одном из n состояний П1..., Пn. Пусть (20.1) является матрицей выигрышей игрока А.
Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами
λ1,λ2,λ3,…λn .
Переставим выигрыши аi1,аi2,...,аin при каждой стратегии Ai, (т.е. элементы каждой строки матрицы), расположив их в неубывающем порядке, и обозначим элементы полученной матрицы через bij, а саму матрицу — через B:
|
|
Bi \ j |
|
1 |
|
2 |
… |
n |
|
|
|
|
|
|
|
|
|
B = |
|
B1 |
b11 |
|
b12 |
… |
b1n |
|
|
B2 |
b21 |
|
b21 |
… |
b2n |
||
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
… |
… |
|
… |
… |
… |
|
|
|
|
|
|
|
|
|
|
|
|
Bm |
bm1 |
|
bm2 |
… |
bmn |
|
Таким образом, |
|
|
|
|
|
|||
bi1 bi 2 |
... bin , i ,...m. (1) |
|
|
|
Каждая строка Bi матрицы В является перестановкой выигрышей при стратегии Ai, (i = 1,..., m). Не исключена возможность, что для некоторых номеров i и j будет иметь место равенство bij = aij. В силу неравенств (1), в первом столбце матрицы В стоят минимальные выигрыши при каждой стратегии
bi1 min ij ,i 1,..., m, |
(2) |
1 j n |
|
а в последнем n-м столбце — максимальные выигрыши при каждой стратегии
bin max ij ,i 1,...,m, |
(3) |
1 j n |
|
Пусть числа λ1,λ2,λ3,…λn, удовлетворяют условиям
n |
|
0 и 1 |
(4) |
j 1
Показателем эффективности стратегии Аi по рассматриваемому критерию назовем число
n |
|
Gi 1 , 2 ,...., n j bij , i 1,..., m. |
(5) |
j 1
56
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV57x1.jpg)
Из этого определения видно, что показатель эффективности стратегии Аi, учитывает все выигрыши при этой стратегии bi1,..., bin и зависит от чисел λi,j=1,..., n, удовлетворяющих условиям (4).
Выражение (5) является выпуклой комбинацией выигрышей ни строки матрицы В с коэффициентами
Gi 1, 2 ,...., n
например, λ1, поскольку он однозначно определяется остальными n-1 коэффициентами из нормировочного равенства (4).
|
|
Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с |
||||||||
коэффициентами |
1, 2 ,...., n |
назовем критерий, по которому оптимальной среди чистых |
||||||||
стратегий считается стратегия |
i |
. с максимальным показателем эффективности (5), т.е. |
||||||||
|
|
|
|
|
|
|
|
0 |
|
|
Gi |
1 , 2 ,...., n G 1 , 2 ,...., n maxGi 1 , 2 ,...., n |
|||||||||
|
0 |
|
|
|
|
|
|
|
|
1 i m |
|
|
|
|
|
|
|
|
|
|
|
Числа |
|
|
|
|
|
|
|
|
||
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|||
p |
j и 0 |
|
j |
1 p |
|
(6) |
||||
|
j 1 |
|
n |
|
|
|
|
|||
|
|
|
|
|
j |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
2 |
|
|
|
|
назовем показателями соответственно пессимизма и оптимизма. В обозначениях (6) индекс «р» — первая буква английского pessimism [, pesi'mizm], индекс «о» — первая буква английского optimism ['optimizm], a
n |
|
— целая часть числа |
n |
, т.е. наибольшее целое число, непревосходящее числа n/2; очевидно, что |
|
|
|
|
|
||
|
|
||||
2 |
|
|
2 |
|
n2
|
т |
, если n-число четное ( 2) |
||
|
|
|
|
|
2 |
|
|
||
|
|
|
||
|
|
|
, если n-число нечетное ( 2) |
|
|
т 1 |
|||
|
2 |
|
|
|
|
|
|
Коэффициенты λ1,λ2,λ3,…λn выбираются из субъективных соображений следующим образом: чем опаснее ситуация, тем больше возникает желание в ней подстраховаться, тем больше, т.е. ближе к единице, должен быть коэффициент пессимизма λp (см. 6) и, следовательно, тем меньше, т.е. ближе к нулю, будет коэффициент оптимизма λo. В безопасной ситуации коэффициенты λ1,λ2,λ3,…λn выбираются так, чтобы показатель пессимизма λp был ближе к нулю, а показатель оптимизма λo— ближе к единице. Таким образом, показатели пессимизма λp и оптимизма λo в данном критерии выражают количественную меру соответственно пессимизма и оптимизма игрока A, выбирающего коэффициенты λ1,…λn.
Если показатель оптимизма λo > 1/2 и, следовательно показатель пессимизма λp< < 1/2, то критерий более «оптимистический», чем «пессимистический»; если, наоборот, показатель оптимизма λo < ½ и, следовательно показатель пессимизма λр > ½, то критерий более пессимистический чем оптимистический; если же показатели оптимизма и пессимизма равны: λo=λр=1/2, то критерий можно считать реалистическим.
Если bij=aij для всех i=1,...,n и j=1,...,n, т.е. если матрица В совпадает с матрицей А, то коэффициенты λ1,…λn, можно формально интерпретировать как вероятности состояний природы: q1=λ1...,qn=λn, и тогда показатель эффективности стратегии Ai, по обобщенному критерию Гурвица относительно выигрышей, определяемый формулой (5), превращается в показатель эффективности
стратегии Ai по критерию Байеса относительно выигрышей : Gi 1, 2 ,...., n ai ,i 1,...,m. .
57
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV58x1.jpg)
Следовательно, в этом случае, обобщенный критерий Гурвица относительно выигрышей превращается в критерий Байеса относительно выигрышей.
Если коэффициенты j 1n , j 1,..., n , то их можно формально трактовать как вероятности равновероятных состояний природы и из (2.21.5) получим:
|
|
|
|
|
|
|
|
|
|
1 |
|
1 |
|
1 |
1 |
n |
|
||
|
|
|
Gi 1, 2 ,...., n |
Gi |
|
, |
|
|
,..., |
|
|
|
bij . |
|
|||||
|
|
|
|
|
n |
|
n |
|
|||||||||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
n |
j 1 |
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
n |
Но поскольку bi1,...,bin есть перестановка элементов ai1,...,ain i-строки матрицы А, то bij |
. aij . и, |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
j 1 |
j 1 |
следовательно, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
1 |
|
1 |
|
1 |
|
1 |
n |
|
|
|
|
|
|
|
|
|
|
|
Gi |
|
, |
|
,..., |
|
|
|
aij . |
|
|
|
|
|
|
|
|
|
|
|
|
n |
n |
n |
|
|
|
|
|
|
|
|
|
|
|
|||||
n |
|
|
|
j 1 |
|
|
|
|
|
|
|
|
|
|
|
||||
т.е. показатель эффективности стратегии Ai |
по обобщенному критерию Гурвица относительно выигрышей |
совпадает с показателем эффективности стратегии Ai - по критерию Лапласа относительно выигрышей. Значит, обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с равными коэффициентами λ1=…= λn=1/2, превращается в критерий Лапласа относительно выигрышей.
Критерий Вальда (критерий крайнего пессимизма).
Критерий Вальда есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами
λ1=1,λ2=0…= λn=0 |
(7) |
которые, очевидно, удовлетворяют условиям (4).
Подставляя значения коэффициентов (7) в формулу (5) и учитывая (2), получим показатель эффективности стратегии Аi- по критерию Вальда:
Wi |
Gi (1,0,...0) bi1 |
min aij ,i 1,...,m, |
(8) |
|
|
1 j n |
|
представляющий собой минимальный выигрыш игрока А при применении им стратегии Ai. Оптимальной
среди чистых стратегий по критерию Вальда является, таким образом, стратегия |
i |
, имеющая |
|
|
|
0 |
|
максимальный показатель эффективности (8): |
|
|
|
Wi0 W maxWi |
max min aij. |
|
|
1 i m |
1 i m 1 j n |
|
|
Другими словами, оптимальной среди чистых стратегий по критерию Вальда считается та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий. Таким образом, оптимальная стратегия по критерию Вальда гарантирует при любых состояниях природы выигрыш, не меньший, чем максимин
W max min aij.
1 i m 1 j n
Из (7) и (6) получаем, что для критерия Вальда показатель пессимизма λр=1 а показатель оптимизма λо=0. Это говорит о том, что критерий Вальца является критерием крайнего пессимизма, ибо ориентирует игрока А на наихудшие для него состояния природы и, следовательно, на крайне осторожное, осмотрительное поведение при выборе стратегий. Хотя арабская пословица и гласит «Кто боится собственной тени, тому нет места под солнцем», тем не менее этот критерий уместен в тех случаях, когда игрок А не столько хочет выиграть, сколько не хочет проиграть. Принципом критерия Вальда часто пользуются в обиходе, что подтверждается такими поговорками, как «Семь раз отмерь—один раз отрежь», «Береженного бог бережет», «Лучше синица в руках, чем журавль в небе».
Максимаксный критерий (критерий крайнего оптимизма). Противоположностью критерию Вальда является так называемый максимаксный критерий, представляющий собой также частный случай обобщенного критерия Гурвица относительно выигрышей, когда коэффициенты λ1,λ2,…, λn выбираются следующим образом:
λ1=…=λn-1=0, λn=1 |
(9) |
Коэффициенты (9) удовлетворяют условиям (4). Если эти коэффициенты подставить в (5) и учесть (3), то получим формулу для показателя эффективности стратегии Ai, по максимаксному критерию:
58
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV59x1.jpg)
Mi Gi (1,0,...0) bin maxaij ,i 1,...,m, (10)
1 j n
Значит, в качестве показателя эффективности стратегии Ai по максимаксному критерию выбирается максимальный выигрыш при этой стратегии.
Тогда оптимальной среди чистых стратегий по максимаксному критерию является стратегия |
i |
с |
||
|
|
|
0 |
|
максимальным показателем эффективности (10): |
|
|
||
Mi |
M max Mi |
maxmaxaij. |
|
|
0 |
1 i m |
1 i m 1 j n |
|
|
|
|
|
|
т.е. стратегия, максимальный выигрыш при которой максимален среди максимальных выигрышей всех чистых стратегий. По-другому можно сказать, что оптимальной будет та чистая стратегия, при которой (хотя-бы) один из выигрышей
является максимальным среди выигрышей всех чистых стратегии. Оптимальная по максимаксному критерию стратегия гарантирует игроку А возможность наибольшего выигрыша, равного максимаксу
M max max aij
1 i m 1 j n
Подставляя коэффициенты (9) в (6), найдем для максимаксного критерия показатель пессимизма λp=0 и показатель оптимизма λo=1. Таким образом, максимаксный критерий является критерием крайнего оптимизма, так как ориентирует лицо, принимающее решение, (игрока А) на наилучшие, благоприятнейшие для него состояния природы и, как следствие отсюда — на порой неоправданно легкомысленное, шапкозакидательское поведение при выборе стратегий. Вместе с тем, в некоторых случаях этим критерием пользуются осознанно, например, в ситуации, когда перед игроком А стоит дилемма: либо получить наибольший выигрыш, либо стать банкротом.
Критерий пессимизма-оптимизма Гурвица относительно выигрышей, с показателем оптимизма
[0,1]
Данный критерий является как бы промежуточным между критериями крайнего пессимизма и крайнего оптимизма и представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей
с коэффициентами
1 1 , 2 ... n 1 0, n
удовлетворяющими, очевидно, условиям (4).
Из (11), (5), (2) и (3) следует, что показателем эффективности стратегии А, по рассматриваемому критерию является величина
Gi ( ) Gi |
(1 , 0,..., 0, ) 1bi1 |
nbin (1 ) min aij |
max aij , i 1,..., m. |
||
|
|
|
1 j n |
|
1 j n |
Оптимальной же стратегией по этому критерию считается стратегия Аi0 |
с максимальным показателем |
||||
эффективности (12): |
|
|
|
|
|
G ( ) G( ) max G ( ) max (1 ) min a max a . |
|||||
i0 |
1 i m i |
|
1 j n |
ij |
|
1 i m |
1 j n ij |
Из (11) и (6) получаем, что показатели пессимизма и оптимизма в этом критерии равны соответственно λр=1-λ и λo=λ. При λ=0 мы из критерия Гурвица получаем критерий Вальда, а при λ=1 — максимаксный критерий. Чем ближе к нулю показатель оптимизма λ, тем ближе к единице показатель пессимизма 1-λ, и тем меньше оптимизма и больше пессимизма. И наоборот, чем ближе λ к единице, тем больше оптимизма и меньше пессимизма. Если показатель оптимизма 1 2 , то и показатель пессимизма 1 12 . В этом
случае показатель эффективности стратегии Аi, как следует из формулы (12), примет вид:
G ( |
1 |
) |
1 |
min a |
max a |
|
, |
|
|
|
|||||||
i |
|
|
|
|
ij |
|
|
|
2 2 1 j n |
1 j n ij |
|
а так как множитель 1/2 в правей части этого равенства не зависит oт номера i, то в качестве показателя эффективности стратегии Аi по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма λ=1/2 можно рассмотреть правую часть равенства (13) без коэффициента 1/2:
G ( |
1 |
) min a |
max a |
||
|
|||||
i 2 |
1 j n |
ij |
1 j n |
ij |
|
|
|
|
|
59
(11)
(12)
(13)
![](/html/2706/21/html_MJWOtWXVJu.2nac/htmlconvd-d92YkV60x1.jpg)
Отметим, что критерий Вальда, максимаксный критерий и критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма (0,1) не учитывают всех выигрышей игрока А при
каждой его стратегии: критерий Вальда принимает во внимание только минимальные выигрыши при каждой стратегии, максимаксный критерий учитывает лишь максимальные выигрыши при каждой стратегии, а критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма
(0,1) опирается на минимальные и максимальные выигрыши. В отличие от этого обобщенный
критерий Гурвица учитывает все выигрыши при каждой стратегии игрока А, используя тем самым полную информацию об игре, поскольку вся имеющаяся информация об игре с природой в условиях неопределенности содержится в матрице выигрышей игрока A .
Перейдем к вопросу о формализации метода выбора коэффициентов λ1, λ2,..., λn в обобщенном критерии Гурвица относительно выигрышей.
Пусть
|
|
|
|
m |
|
|
||
|
|
bj |
bij , |
j 1,..., n, |
||||
|
|
|
|
i 1 |
|
|
||
— сумма выигрышей, стоящих в j-м столбце матрицы В; |
|
|
||||||
|
|
|
|
|
|
m |
|
|
|
|
|
|
bj |
1 |
bij , |
j 1,..., n, |
|
bj |
1 |
|||||||
|
m |
m |
||||||
|
|
|
|
|
|
i 1 |
|
|
— среднее значение выигрышей bij, стоящих в j-м столбце матрицы В; |
||||||||
|
|
|
|
n |
n |
m |
||
|
|
|
b bj |
bij |
||||
|
|
|
|
j 1 |
j 1 |
i 1 |
— сумма всех выигрышей матрицы В, или, что то же, сумма всех выигрышей матрицы А . Просуммировав неравенства (1) по индексу i от 1 до m, получим с учетом обозначений (14):
b1 b2 ... bn ,
откуда, в обозначениях (15): |
|
|
b1 b2 |
... bn |
(17) |
В случае опасной ситуации выбор стратегии игроком А должен быть осторожным, «направленным» в сторону убывания выигрышей. Поэтому коэффициенты λj по мере убывания выигрышей должны возрастать. Учитывая (17), эти коэффициенты можно выбрать обратно пропорциональными средним выигрышам (15):
1 : 2 : |
: n |
|
|
|
|
|
|
|
bn : bn 1 : : b1 .... |
(18) |
Так как неравенства (17) можно переписать так:
bn bn 1 ... b2 b1 ,
то принцип (18) выбора коэффициентов λj , j =1,..., n, можно назвать «принципом невозрастания средних выигрышей».
Выразим коэффициенты λj , j =1,..., n, через выигрыши bij .
Из (18):
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
bn |
, |
|
j 2,..., n . |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
j |
b |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
n j 1 |
|
|
|
|
|
|
||||||
откуда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
bn |
|
j 1 |
|
, j 2,..., n . |
||||||||||
|
|
j |
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
bn |
|
|
1 |
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Подставляя эти выражения в нормировочное равенство (2.21.4), получим |
||||||||||||||||||||
|
1 |
|
1 bn j 1 |
1 bk , |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
n |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
bn |
|
|
j 1 |
|
|
|
bn k 1 |
||||||||
откуда |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
60
(14)
(15)
(16)
(19)