Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Методичка

.pdf
Скачиваний:
70
Добавлен:
14.06.2020
Размер:
1.39 Mб
Скачать

41

q1

=

 

a22

a12

 

 

; q2

=1 q1 ;

 

 

 

a11

+ a22

a12

a21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

γ =

a22 a11 a12 a21

 

.

(3.2)

 

 

 

 

a

+ a

22

a a

21

 

 

 

 

 

11

 

12

 

 

Игра 2 ×2 и ее решение имеют простую геометрическую интерпретацию.

Отложим на некоторой числовой оси отрезок единичной длины A1 A2 (рис. 3.1).

Пусть точки A1 и A2 соответствуют применению одноименных стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии

SA* = (p1, p2 ). В этом случае ординаты прямой B1B1 , проведенной так, как показано на рис 3.1, соответствуют выигрышу игрока A при применении им любой стратегии

(чистой или смешанной) при условии, что B применяет B1 . Прямая B2 B2 также отражает выигрыш игрока A в случае, когда B применяет B2 . Жирной линией отмечена нижняя граница выигрыша B1NB2 – минимальный выигрыш игрока A при любой его смешанной стратегией. Очевидно, решение достигается в точке максимума нижней границы (на рис. 3.1 в точке N ). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях. По рисунку легко находятся α,β, γ и проводится анализ игры.

 

 

B2

 

 

B1

 

 

 

 

N

 

 

 

 

 

 

B2

 

a12

 

B1

 

 

 

 

γ

 

 

β a21

 

a11

a22

α

 

 

 

 

 

 

 

 

 

 

 

A1

p2

*

p1

A2

 

 

 

SA

 

 

Рис. 3.1

Геометрическим способом также легко анализируются и решаются игры 2 ×n . Они задаются матрицей игры, представленной в табл. 3.3, а на рис. 3.2 представлена геометрическая интерпретация этой игры для случая n = 4 . Геометрические построения осуществляются так же, как и для игры 2 ×2 , только число наклонных линий получается равным n, по числу стратегий игрока B. Нижняя

42

граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.

Таблица 3.3

Ai

B j

B

B

B

 

 

1

2

 

n

 

A1

a11

a12

a1n

 

A2

a21

a22

a2n

 

 

 

a13

 

B3

 

 

B3

a23

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

B1

a21

 

 

 

 

a12

 

B2

 

 

 

 

 

 

 

 

 

 

 

 

B4

a24

 

 

 

 

 

 

 

M

N

 

 

 

 

a14

 

B4

 

B2

a22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a11

 

B1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A1

 

p2

 

SA*

p1

A2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рис. 3.2

 

 

 

 

 

Из рис. 3.2 видно, что нижняя граница

выигрыша – прямая B1MNB2 ,

ее

максимум

 

достигается в точке

N , которая определяет

оптимальную стратегию

S* =

(p , p

2

). Следует отметить, что стратегия B

вообще может не рассматриваться

A

1

 

 

 

 

3

 

 

 

как заведомо невыгодная игроку

B , а значения

p1 и p2 можно найти по формулам

игры 2 ×2 , учитывая, что в точке N активных стратегий игрока B только две B2

и

B4 .

 

 

 

 

 

 

 

 

 

 

3.2Элементы теории статистических решений

Взадачах теории игр неопределенность выбора решения связана с неизвестным для нас поведением разумного и «враждебно» настроенного противника. Однако часто в задачах поиска наилучшего решения неопределенность связана просто с нашей неосведомленностью об условиях объективной действительности, которую в теории решений принято называть «природой».

43

«Природа» здесь рассматривается как некоторая незаинтересованная сторона, поведение которой неизвестно, но не содержит элементов сознательного противодействия нашим планам. Такие задачи часто называются «играми с природой». Их нельзя решать методами антагонистических игр, так как со стороны «природы» противодействие отсутствует.

Пусть у нас (сторона A ), как и ранее, имеется m возможных стратегий:

A1, A2 ,K, Am ; что касается «природы, то о ней можно сделать n предположений

S1, S2 ,K, Sn . Последние можно рассматривать как состояния или стратегии

«природы». Наш выигрыш aij при каждой паре стратегий (Ai , S j ) задается матрицей,

приведенной в табл. 3.4. Требуется выбрать такую стратегию игрока A (чистую или смешанную), которая является наиболее выгодной для него.

Таблица 3.4

Ai S j

S

S

2

S

n

 

1

 

 

 

A1

a11

a12

a1n

A2

a21

a22

a2n

Am

am1

am2

amn

 

С точки зрения лечебного процесса состояния S j могут рассматриваться как

неизвестные состояния больного организма, а стратегии Ai – как возможные планы

лечения (в простейшем случае – лечебные воздействия). В этом случае выигрыш aij

– это эффективность лечения, например, вероятность выздоровления. В качестве оценки такой вероятность можно использовать соответствующую частость, либо субъективную вероятность, задаваемую экспертом.

Учитывая, что состояниями «природы» мы не управляем, кроме показателя aij можно ввести другие, отражающие «удачность» выбора данной стратегии именно

в данной ситуации. К таким показателям относится «риск». Риском rij игрока A при

пользовании стратегией Ai в условиях S j называется разность между выигрышем,

который он получил бы, если бы знал условия S j , и выигрышем, который он

получит, не зная их и выбирая стратегию Ai . Следовательно,

rij = βj aij .

44

При поиске оптимальной стратегии игрока A в зависимости от выбранного показателя aij или rij либо максимизируется выигрыш, либо минимизируется риск.

В работе [8] предпринята попытка объединить показатели aij и rij в один. Так как мы хотели бы иметь наибольший выигрыш и одновременно наименьший риск,

то этот объединенный показатель fij , названный автором «сочетанным показателем полезности», вычисляется в виде

fij = aij rij .

Чем больше fij тем лучше, так как больше выигрыш и меньше риск, поэтому при оптимизации выбора Ai показатель fij нужно максимизировать.

Пусть, для примера, больной организм может находиться в одном из трех состояний S1, S2 , S3 , а у врача есть три варианта лечения: A1, A2 , A3 . Применение лечения Ai к больному в состоянии S j приводит к вероятности выздоровления aij .

Пусть значения aij задаются матрицей Ma

в виде табл. 3.5. Рассчитанные по этой

 

 

 

 

 

Таблица 3.5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai

S j

 

S1

S2

 

S3

 

 

 

 

 

 

A1

 

0,95

0,90

 

0,85

 

α1

= 0,85

 

 

 

A2

 

0,97

0,92

 

0,75

 

α2

= 0,75

 

 

 

 

 

 

α = 0,85

 

 

A3

 

0,99

0,75

 

0,60

 

α3

= 0,60

 

 

 

 

 

 

 

 

 

 

β1

=0,99

β2 =0,92

β3 =0,85

 

 

 

 

 

1444442444443

 

 

 

 

 

 

 

 

β=0,85

 

 

 

 

 

матрице значения αi приведены справа от соответствующих строк, а значения βj -

под соответствующими столбцами. Матрица рисков Mr получается из Ma на основе соотношения

β1

β2

β3

 

 

β2

 

M a ,

M r = β1

β3

 

β2

 

 

β1

β3

 

поэтому Mr имеет вид, представленный

в

табл. 3.6. Наконец, матрица M f

сочетанного

 

 

 

 

 

 

 

45

 

 

 

Таблица 3.6

 

 

 

 

 

 

Ai

S j

S1

S2

S3

 

 

A1

0,04

0,02

0

 

 

A2

0,02

0

0,10

 

 

A3

0

0,17

0,25

 

показателя полезности

fij определяется разностью

M f

= Ma Mr

и имеет вид

табл. 3.7. Для этой матрицы также рассчитаны нижняя α*

и верхняя β*

цены игры.

 

 

 

 

 

 

Таблица 3.7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai

S j

 

S1

 

S2

 

S3

 

α

*

= 0,85

 

 

 

 

A1

 

 

0,91

 

0,88

 

0,85

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

A2

 

 

0,95

 

0,92

0,65

 

α

*

= 0,65 α* = 0,85

 

 

 

 

 

 

 

 

2

 

 

 

 

 

A3

 

 

0,99

 

0,58

0,35

 

α

*

 

 

 

 

 

 

 

 

 

3

= 0,35

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β*

= 0,99 β*

= 0,92 β*

= 0,85

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

3

 

 

 

 

 

 

 

 

 

 

1444442444443

 

 

 

 

 

 

 

 

 

 

 

 

β*=0,85

 

 

 

 

 

 

 

 

 

 

При нахождении минимаксных стратегий теории игр по полученным

матрицам

выигрышей

Ma

и

M f

выполняются

соотношения

αc =β = 0,85;

α* = β* = 0,85 , что говорит о наличии устойчивых чистых стратегий, определяемых

седловой точкой. Для обеих

матриц

эта

точка

оказалась одной и той же

γ = γ* = 0,85 .

В табл. 3.5 и 3.7 она

обведена

кружком

и определяет пару

оптимальных

чистых стратегий

(A1, S3 ).

В

общем

случае

решение находится в

области смешанных стратегий.

Наиболее прост для решения случай, когда заранее известны априорные

вероятности

состояний:

P1 = P(S1 ),

P2 = P(S2 ), K, Pn = P(Sn );

причем

P1 + P2 +K+ Pn =1.

На практике чаще

всего эти

вероятности неизвестны. В

медицине

оценки

этих

вероятностей

в

виде

соответствующих

частостей

«добываются» с большим трудом и не всегда обладают требуемой достоверностью. В случае отсутствия экспериментальных данных один из выходов заключается в получении требуемых оценок с помощью опроса экспертов и применении метода экспертных оценок. Если вероятности P1, P2 ,K, Pn известны, то при использовании

46

показателя aij решение игры находится на основе максимизации среднего значения

ai , где

n

ai = Pj aij , j =1

с учетом вероятностей всех возможных условий, т.е. выбираем такую стратегию Ai ,

для которой

 

max .

(3.3)

ai

Очевидно, что при использовании показателя rij решение игры находится на основе минимизации среднего риска, т.е.

 

 

 

 

 

 

 

n

 

 

 

 

min,

 

 

= Pj rij ,

(3.4)

ri

ri

 

 

 

 

 

 

 

j=1

 

а для показателя fij на основе

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

fi

max,

 

fi

= Pj fij

(3.5)

j=1

В теории доказывается [7], что та же стратегия, которая обращает в максимум средний выигрыш ai , обращает в минимум и средний риск ri . Там же показано, что при использовании вероятностей состояний применение смешанных стратегий для A не дает ему дополнительных преимуществ, поэтому всегда можно обойтись одними чистыми стратегиями.

Пример 3.1. Рассмотрим больных с подозрением на острый аппендицит. В

зависимости от формы аппендицита будем различать два состояния больных: S1 -

недеструктивный аппендицит (простой), который не дает опасных для жизни осложнений и может пройти без оперативного вмешательства; S2 - деструктивный аппендицит, требующий срочной операции. У хирурга есть две стратегии: A1 -

оперировать, A2 - воздержаться от срочной операции (и наблюдать либо до исчезновения симптомов, либо до появления убедительной картины острого аппендицита). Пусть aij относительное число выздоровевших больных (в процентах)

из всех тех, находившихся в состоянии S j , к которым была применена стратегия Ai .

47

Тогда матрица Ma для этого случая, составленная по реальным данным [8] имеет вид табл. 3.8. Под каждым столбцом этой матрицы приведены значения априорных вероятностей: P1 = P(S1 )= 0,75; P2 = P(S2 )= 0,25 , взятые также из [8].

 

 

 

 

 

 

 

Таблица 3.8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ai

S j

 

S1

S2

 

 

 

 

 

 

 

 

 

A1

 

 

99,9

99,8

 

 

 

 

 

 

 

 

 

 

 

A2

 

 

100

99,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Pj

0,75

0,25

 

 

 

 

 

 

 

 

Если подходить к данной матрице с позиций теории игр и не учитывать

вероятности

P1 и

P2 , то

α = β = γ = 99,8 и мы имеем седловую

точку

99,8

(обведенную в таблице кружком), которая определяет минимаксные стратегии

A1 и

S2 . Учет априорных вероятностей позволяет рассчитать средние значения

выигрыша:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= 99,9 0,75 +99,8 0,25 = 99,87,

 

 

 

 

a1

 

 

 

 

 

=100 0,75 +99,3 0,25 = 99,82.

 

 

 

 

a2

 

 

Из этого расчета следует, что, так как

 

>

 

, то применяется стратегия

A1 . Во всех

a1

a2

случаях наилучшим признается проведение срочной операции. Этот пример убедительно показывает правильность поведения врача, предпочитающего срочное хирургическое вмешательство консервативному лечению при подозрении на аппендицит.

3.3 Критерии принятия решений в условиях неопределенности

Наличие вероятностей P1 , P2 ,K, Pn хотя бы в вероятностном смысле определяет поведение «природы», однако часто относительно этих вероятностей нельзя сделать никаких предположений. В этом случае для выбора оптимального решения существует несколько подходов, приведенных ниже.

К р и т е р и й Л а п л а с а .

Согласно этому критерии, называемому также

«принципом недостаточного основания»

Лапласа, все состояния S1, S2 ,K, Sn

считается равновероятными, т.е. P = P =K= P =

1

. В этом случае, используя далее

 

1

2

n

n

максимизацию

 

(или

 

) или минимизацию

 

 

согласно выражениям (3.3)-(3.5),

ai

fi

ri

48

которые, конечно, для этого случая упростятся, получим наилучшую чистую стратегию, удовлетворяющую данному критерию.

К р и т е р и й В а л ь д а . Это критерий, согласно которому игрок A выбирает свою минимаксную стратегию, соответствующую его гарантированному выигрышу, равному α. При этом выигрыш будет зависеть от состояний «природы», но не превысит максимина:

α = max minj aij .

i

Это очень осторожная стратегия, рассчитывающая на худший случай. (В играх с активным противником этот худший случай вырабатывается им в качестве противодействия). Критерий Вальда можно применять не только к матрице Ma , но и

к матрице M f . В последнем случае выигрыш игрока A не превышает α* , где

α* = maxi minj fij .

Вслучае, если α β для матрицы Ma , либо α* β* для матрицы M f , в этих

матрицах отсутствует седловая точка и игроку более выгодно применять смешанную стратегию. С точки зрения лечебного процесса это означает, что в качестве оптимального решения врачу предлагают применять различные планы лечения с соответствующими вероятностями, а не просто наилучший план. Учитывая, что данная «вычисленная» информация используется врачом в качестве совета, применение смешанных стратегий в данном случае следует считать целесообразным.

Матрица M f размерности 2 ×2 имеет вид табл. 3.9.

 

 

 

 

Таблица 3.9

 

Ai

S j

S1

S2

если эта матрица не имеет седловой точки, то

 

 

 

 

 

 

 

 

 

 

 

A1

f11

f12

оптимальная смешанная стратегия S *

= (p , p

2

)

 

 

A

f

 

f

 

 

 

 

 

 

 

 

A

1

 

 

 

21

22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

игрока A определяется соотношениями,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

аналогичными (3.1), (3.2). Потому в данном случае

 

 

 

 

 

 

p1 =

 

f22

f21

 

; p2 =

 

f11

f12

,

 

 

 

 

 

f11

+ f22

f12 f

21

 

f11 + f22

f12 f 21

 

 

 

 

 

откуда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p1

 

 

f22 f21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

;

 

 

 

 

 

 

(3.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p2

f11 f12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

49

γ =

f22 f11 f12

f21

 

 

 

.

(3.7)

f11 + f22 f12

f21

К р и т е р и й С э в и д ж а .

Этот критерий рекомендует

в условиях

неопределенности выбирать для игрока

A также минимаксную стратегию, но не по

матрицам выигрышей Ma или M f , а по матрице риска Mr . Оптимальной считается та стратегия, при которой величина риска принимает наименьшее значение в самой неблагоприятной ситуации (когда риск максимален). При этом риск для разных состояний «природы» не превышает значения R , где

R = mini max rij .

j

Критерий Сэвиджа так же, как и предыдущий критерий Вальда, допускает применение смешанной стратегии для игрока A в случае, когда матрица Mr не имеет седловой точки.

3.4Принятие решений при острых хирургический заболеваниях органов брюшной полости

Целесообразность применения теории игр для оптимизации принятия решения о проведении хирургических операций при “остром животе”, остром аппендиците, остром холецистите, закрытых травмах, онкологических заболеваниях и др. подробно раскрыта в интересной монографии [8]. Дальнейшее изложение основано на материале этой работы. Специфику применения игровых методов для принятия оптимальных решений в хирургии рассмотрим на примере клинической ситуации подозрения на “острый живот”, т.е. на острое хирургическое заболевание органов брюшной полости и на примере онкологических заболеваний.

При “остром животе” у хирурга есть только две стратегия: A1 - срочное оперативное вмешательство и A2 - отказ от срочной операции с последующим принятием нового решения. Состояния больного формулируются в соответствии с возможными управляющими воздействиями, т. е. стратегиями хирурга, следующим образом:

S1 - острое заболевание органов брюшной полости, при котором показана срочная операция;

50

S2 - острое за6олевание при котором может оказаться более выгодной отсроченная операция после подготовки;

S3 - острое заболевание органов брюшной полости или иной локализации,

симулирующее S1 или S2 , при котором оперативное вмешательство окажется напрасным;

S4 -острое заболевание, симулирующее S1 или S2 , при котором операция противопоказана (в дальнейшем это состояние имеет также обозначение S2* ).

Главными равноправными целями хирурга являются максимизация величины вероятности выживания больного и минимизации величины вероятности неоправданных потерь (минимизация риска).

Пусть cij - вероятность летального (смертельного) исхода при применений хирургом стратегии Ai к больному, находящемуся в состоянии S j . Тогда можно составить матрицу летальности Mc с элементами cij , которая имеет вид табл.3.10.

Анализ величин элементов этой матрицы показывает, что всегда выполняются соотношения: g > l, h > d, t < d, t < l, t < b, которые наглядно можно представить в виде схемы

g l

t b ,

h d

показывающий, что вероятность летального исхода срочной операции является минимальной в случае S3 . По матрице Mc построим матрицу выигрышей Ma ,

подразумевая под выигрышем aij вероятность выздоровления больного

(благоприятного исхода), находящегося в состоянии S j , к которому применяется стратегия Ai . Для построения Ma воспользуемся очевидным соотношением aij =1 cij . Тогда Ma будет иметь вид табл.3.11.

 

 

 

 

 

Таблица 3.10

Ai

S j

S1

S2

S3

 

S4

 

A1

l

h

t

 

b

 

A2

g

d

0

 

0