Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие Немирко Манило.pdf
Скачиваний:
94
Добавлен:
14.06.2020
Размер:
897.06 Кб
Скачать

3. ПРИМЕНЕНИЕ ТЕОРИИ ИГР ДЛЯ ОПТИМИЗАЦИИ КЛИНИЧЕСКИХ РЕШЕНИЙ В ХИРУРГИИ

3.1. Игры и методы их решения

Рассмотрим игру (модель конфликтной ситуации), в которой участвуют два игрока A и B , имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a , то игрок B при этом выигрывает a , поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока [6]. При конечном числе стратегий игра

будет конечной. Пусть у

игрока

A имеется m

возможных

стратегий

A1, A2, , Am ,

а у игрока B

n возможных стратегий B1, B2, , Bn . Пусть

также известны величины aij

– выигрыши игрока A при использовании Ai с

его стороны и

B j со стороны противника. Тогда игра, называемая игрой

 

 

 

 

 

m ×n , может быть представлена табли-

 

 

 

Таблица 3.1

цей, называемой платежной матрицей

Ai

 

 

Bj

 

или просто матрицей игры (табл. 3.1).

 

 

 

 

Приведение

игры к

матричной

B1

B2

Bn

 

форме может само по себе составить

A1

a11

a12

a1n

трудную задачу, однако таким путем

A2

a21

a22

a2n

многоходовая игра фактически сводит-

ся к одноходовой – от игрока требуется

Am

am1

am2

amn

сделать только один ход: выбрать под-

ходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.

По матрице игры определяются нижняя α и верхняя β цены игры. Пусть

αi = minαij , βj = maxαij , тогда

j

i

67

α = maxαi = max minαij ;

i

i

j

β = minβj = minmaxαij .

j

j

i

Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Известно [7], что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α =β. Тогда матрица игры имеет седловую точку, а величина γ = α =β называется ценой игры. Стратегии Ai и B j , при которых достигается выигрыш γ,

называются оптимальными чистыми стратегиями, а их совокупность – решением игры.

Более часто α β, и тогда для получения наибольшего выигрыша игроку выгодно не применять одну (чистую) стратегию, а чередовать случайным образом несколько стратегий. Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются смешанными и задаются соответ-

ствующими вероятностными векторами.

Пусть SA – смешанная стратегия

игрока

A, а

SB – смешанная

стратегия игрока

B . Тогда

SA = (p1,

p2, ,

pm ), SB = (q1, q2, , qn ), где pi – вероятность применения

игроком A стратегии Ai , q j – вероятность применения игроком B стратегии B j , причем

m

n

pi = q j =1.

i=1

j=1

Если допустить применение смешанных стратегий (чистая стратегия – частный случай смешанной), то для каждой конечной игры можно найти хотя бы одно решение, т. е. пару устойчивых оптимальных стратегий игроков

(S*A, SB* ), обладающих следующим свойством: если один из игроков при-

держивается своей оптимальной стратегии, то другому не может быть вы годно отступить от своей [6]. Выигрыш, соответствующий решению, называется, как и раньше, ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α γ β. Самая простая конечная игра – игра 2 ×2 . Ее матрица имеет вид табл. 3.2.

68

 

 

 

 

 

 

 

 

 

 

 

Таблица 3.2

 

Если для этой матрицы α =β,

то

 

 

 

 

 

 

 

 

 

 

 

игра

имеет

 

седловую

точку

и

ее

 

 

 

 

 

 

 

 

 

Bj

 

 

 

 

 

 

 

 

 

Ai

 

 

 

 

 

 

 

 

 

 

 

 

 

 

решение –

это пара

чистых страте-

 

 

 

 

 

B1

 

 

 

 

 

B2

 

 

 

 

 

гий,

пересекающихся

в

седловой

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

точке. Если же в матрице

2 ×2 сед-

 

A

 

 

 

 

a11

 

 

 

 

a12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ловой точки

нет

и

α β,

то необ-

 

A2

 

 

 

 

a21

 

 

 

 

a22

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ходимо искать решение в смешанных

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

стратегиях.

 

 

Пара

оптимальных

смешанных

стратегий:

S*

= (p , p

);

S*

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

1

2

= (q ,q ), – и цена игры в этом случае определяется по формулам [7]

 

 

B

1 2

 

 

 

 

a22 a21

 

 

 

 

 

 

 

 

 

 

 

 

 

a11 a12

 

 

 

 

 

p1

=

 

 

 

 

;

 

p2 =1p1 =

 

 

 

 

 

;

(3.1)

 

a

+ a

22

a

a

 

 

a

 

+ a

a

a

 

 

11

 

12

21

 

 

 

 

 

 

11

 

22

12

21

 

 

 

 

q1

=

 

a22 a12

 

 

 

;

 

q2 =1q1;

 

 

 

 

 

 

 

 

 

 

a + a a a

 

 

 

 

 

 

 

 

 

 

 

 

 

11

22

 

12

21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

γ =

 

a22a11 a12a21

 

 

 

 

 

 

 

(3.2)

 

 

 

 

 

 

 

 

 

 

a

 

 

+ a

22

a

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11

 

12

21

 

 

 

 

 

 

 

 

 

 

 

 

Игра 2 ×2

и ее решение имеют простую геометрическую интерпрета-

цию. Отложим на некоторой числовой оси отрезок единичной длины

A1A2

(рис. 3.1). Пусть точки

 

A1

и A2 соответствуют применению одноименных

стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии S*A = (p1, p2 ). В этом случае ординаты прямой B1B1 , про-

веденной так, как показано на рис 3.1, соответствуют выигрышу игрока A при применении им любой стратегии (чистой или смешанной) с условием, что B применяет B1. Прямая B2B2 также отражает выигрыш игрока A

в случае, когда B применяет B2 . Жирной линией отмечена нижняя граница выигрыша B1NB2 (минимальный выигрыш игрока A при любой его смешан-

ной стратегии). Очевидно, решение достигается в точке максимума нижней границы (N на рис. 3.1). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях. По рисунку легко находятся α, β, γ и проводится анализ игры.

Геометрическим способом также легко анализируются и решаются игры 2 ×n . Они задаются матрицей игры, представленной в табл. 3.3, а на рис. 3.2 представлена геометрическая интерпретация этой игры для случая n = 4 .

69

 

 

B2

 

 

B1

 

 

 

 

N

 

 

 

 

B2

a12

B1

 

 

γ

a22

 

β a21

 

 

 

 

 

α

a11

 

 

 

 

 

 

A2

 

A1

 

p2

SA p1

 

Рис. 3.1

Геометрические построения осуществляются так же, как и для игры 2 ×2 , только число наклонных линий получается равным n, по числу стратегий игрока B. Нижняя граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.

Таблица 3.3

Ai

 

 

Bj

 

B1

B2

 

Bn

 

 

A1

a11

a12

 

a1n

A2

a21

a22

 

a2n

a13

B3

 

B3

a23

 

 

 

 

 

B1

a21

a12

B2

 

 

 

 

 

B4

a24

 

M

N

a14

B4

 

B2

a22

 

 

 

 

 

 

B3

 

 

 

a11

 

 

 

 

A1

p2

S*A

p1

A2

 

 

Рис. 3.2

 

 

Из рис. 3.2 видно, что нижняя граница выигрыша – прямая B1MNB2 , ее максимум достигается в точке N , которая определяет оптимальную стратегию S*A = (p1, p2 ). Следует отметить, что стратегия B3 вообще может не рассматриваться как заведомо невыгодная игроку B , а значения p1 и p2 можно

70