Добавил:
rn Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие Немирко Манило.pdf
Скачиваний:
106
Добавлен:
14.06.2020
Размер:
897.06 Кб
Скачать

найти по формулам игры 2 ×2 , учитывая, что в точке N активных стратегий игрока B только две, B2 и B4 .

3.2.Элементы теории статистических решений

Взадачах теории игр неопределенность выбора решения связана с неизвестным для нас поведением разумного и «враждебно» настроенного противника. Однако часто в задачах поиска наилучшего решения неопределенность связана просто с нашей неосведомленностью об условиях объективной действительности, которую в теории решений принято называть «природой». «Природа» здесь рассматривается как некоторая незаинтересованная сторона, поведение которой неизвестно, но не содержит элементов сознательного противодействия нашим планам. Такие задачи часто называются «играми с природой». Их нельзя решать методами антагонистических игр, так как со стороны «природы» противодействие отсутствует.

 

 

 

 

 

 

Таблица 3.4

 

Пусть у нас (сторона A), как и ра-

 

 

 

 

 

 

нее, имеется m возможных стратегий:

 

 

 

 

 

S j

 

 

A ,

A

, ,

A ; что касается «природы»,

Ai

 

 

 

 

 

 

 

 

1

2

 

 

m

 

 

 

 

 

 

 

 

 

 

 

то о ней можно сделать n предположе-

S1

S2

 

Sn

 

 

 

 

 

ний:

S , S

2

, , S

n

. Последние можно

 

 

 

 

 

 

 

 

 

A1

a11

a12

 

a1n

 

 

1

 

 

 

 

рассматривать как состояния или стра-

 

A2

a21

a22

 

a2n

тегии

«природы». Наш выигрыш

a

 

при каждой паре стратегий (Ai , S j )

ij

 

за-

A

a

m1

a

m2

 

a

mn

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

дается матрицей, приведенной

в

табл. 3.4. Требуется выбрать такую стратегию игрока

 

A (чистую или сме-

шанную), которая является наиболее выгодной для него.

 

 

С точки зрения лечебного процесса состояния S j могут рассматриваться как неизвестные состояния больного организма, а стратегии Ai – как возможные планы лечения (в простейшем случае – лечебные воздействия). В этом случае выигрыш aij – это эффективность лечения, например вероят-

ность выздоровления. В качестве оценки такой вероятность можно использовать соответствующую частость, либо субъективную вероятность, задаваемую экспертом.

71

Учитывая, что состояниями «природы» мы не управляем, кроме показателя aij можно ввести другие, отражающие «удачность» выбора данной стра-

тегии именно в данной ситуации. К таким показателям относится «риск». Риском rij игрока A при пользовании стратегией Ai в условиях S j называет-

ся разность между выигрышем, который он получил бы, если бы знал условия S j , и выигрышем, который он получит, не зная их и выбирая стратегию

Ai . Следовательно,

rij =βj aij .

При поиске оптимальной стратегии игрока A в зависимости от выбранного показателя aij или rij либо максимизируется выигрыш, либо минимизи-

руется риск.

В работе [8] предпринята попытка объединить показатели aij и rij в

один. Так как мы хотели бы иметь наибольший выигрыш и одновременно наименьший риск, то этот объединенный показатель fij , названный автором

«сочетанным показателем полезности», вычисляется в виде

fij = aij rij .

Чем больше fij , тем лучше, так как больше выигрыш и меньше риск, поэтому при оптимизации выбора Ai показатель fij нужно максимизировать.

Пусть, для примера, больной организм может находиться в одном из трех состояний: S1, S2, S3 , – а у врача есть три варианта лечения: A1, A2, A3. При-

менение лечения Ai

к больному в состоянии S j приводит к вероятности выздо-

ровления aij . Пусть значения aij задаются матрицей Ma

в виде табл.3.5.

 

 

 

Таблица 3.5

 

 

 

 

 

 

 

 

 

 

 

 

Ai

 

S j

 

 

 

 

 

 

S1

S2

 

S3

 

 

 

 

 

 

 

 

A1

0,95

0,90

 

0,85

 

α1

= 0,85;

 

 

 

 

 

 

 

 

 

 

A2

0,97

0,92

0,75

 

α2

α = 0,85

 

= 0,75;

 

 

 

 

 

 

 

 

 

A3

0,99

0,75

0,60

 

 

 

 

α3 = 0,60

 

β1 = 0,99 β2 = 0,92 β3 = 0,85

β = 0,85

72

Рассчитанные по этой матрице значения αi

 

приведены справа от соот-

ветствующих строк, а значения

βj

под

соответствующими столбцами.

Матрица рисков Mr получается из Ma

на основе соотношения

 

 

β1

β2

β3

 

 

 

 

M

r

= β

β

2

β

3

 

M

a

,

 

1

β

β

 

 

 

 

 

β

2

3

 

 

 

 

 

 

1

 

 

 

 

 

 

поэтому Mr имеет вид, представленный в табл. 3.6. Наконец, матрица M f сочетанного показателя полезности fij определяется разностью M f =

= Ma Mr

и имеет вид табл. 3.7. Для этой матрицы также рассчитаны ниж-

няя α и верхняя β цены игры.

 

 

 

 

 

 

 

 

 

 

Таблица 3.6

 

 

 

 

Таблица 3.7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai

 

 

S j

 

 

 

Ai

 

 

 

S j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S1

S2

S3

 

 

 

S1

 

S2

 

S3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

0,04

0,02

0

 

 

A

 

0,91

 

0,88

 

 

 

 

 

 

 

 

 

0,85

 

 

 

1

 

 

 

 

 

 

1

 

 

 

 

 

 

 

α1

= 0,85;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A2

 

0,02

0

0,10

 

 

A2

 

0,95

 

0,92

 

0,65

 

 

 

 

 

 

 

 

 

 

 

α2

= 0,65;

α = 0,85

 

 

0

0,17

0,25

 

 

 

 

 

 

 

 

 

 

 

= 0,35

 

A3

 

 

 

A

 

0,99

 

0,58

 

0,35

 

α

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β1 = 0,99 β2

= 0,92 β3

= 0,85

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β = 0,85

 

 

 

 

 

 

При нахождении минимаксных стратегий теории игр по полученным

матрицам выигрышей Ma

и

M f выполняются соотношения α =β = 0,85;

α =β = 0,85, что говорит о наличии устойчивых чистых стратегий, определяемых седловой точкой. Для обеих матриц эта точка оказалась одной и той же γ = γ* = 0,85. В табл. 3.5 и 3.7 она обведена и определяет пару оптимальных чистых стратегий (A1, S3 ). В общем случае решение находится в обл а-

сти смешанных стратегий.

Наиболее прост для решения случай, когда заранее известны априорные вероятности состояний: P1 = P (S1 ), P2 = P (S2 ), , Pn = P (Sn ), причем P1 + +P2 + + Pn =1. На практике чаще всего эти вероятности неизвестны. В ме-

73

Таблица 3.8

дицине оценки этих вероятностей в виде соответствующих частостей «добываются» с большим трудом и не всегда обладают требуемой достоверностью. В случае отсутствия экспериментальных данных один из выходов заключается в получении требуемых оценок с помощью опроса экспертов и применении метода экспертных оценок. Если вероятности P1, P2, , Pn известны, то

при использовании показателя aij решение игры находится на основе максимизации среднего значения ai , где

n

ai = Pjaij ,

j=1

сучетом вероятностей всех возможных условий, т. е. выбираем такую стра-

тегию Ai , для которой

 

 

 

 

 

ai

max .

(3.3)

Очевидно, что при использовании показателя rij

решение игры находит-

ся на основе минимизации среднего риска, т. е.

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

ri

min,

ri

 

= Pjrij ,

(3.4)

 

 

 

 

 

 

 

 

 

 

j=1

 

а для показателя fij на основе

 

 

 

 

 

 

 

 

 

 

 

n

 

 

fi

max,

fi

= Pj fij .

(3.5)

j=1

В теории доказывается [7], что та же стратегия, которая обращает в максимум средний выигрыш ai , обращает в минимум и средний риск ri . Там же

показано, что при использовании вероятностей состояний применение смешанных стратегий для A не дает ему дополнительных преимуществ, поэтому всегда можно обойтись одними чистыми стратегиями.

Пример 3.1. Рассмотрим больных с подозрением на острый аппендицит. В зави-

симости от формы аппендицита будем раз-

Ai

 

 

S j

личать два состояния больных: S1 – неде-

 

 

 

 

S1

 

S2

 

 

структивный аппендицит (простой), кото-

 

 

 

 

 

A1

 

 

 

 

99,9

 

99,8

 

рый не дает опасных для жизни осложнений

 

 

A2

100

 

99,3

 

и может пройти без оперативного вмеша-

 

 

Pj

0,75

 

0,25

 

 

 

 

74