- •ВВЕДЕНИЕ
- •1.1. Формулировка задачи линейного программирования
- •1.2. Распределение специализированных бригад скорой помощи по категориям больных
- •1.3. Некоторые другие задачи на распределение
- •1.4. Разработка комплексной лекарственной терапии
- •1.5. Выработка оптимального плана массового лечения
- •1.6. Определение линейных разделяющих функций
- •2.1. Метод динамического программирования
- •2.4. Выравнивание символьных последовательностей
- •3. ПРИМЕНЕНИЕ ТЕОРИИ ИГР ДЛЯ ОПТИМИЗАЦИИ КЛИНИЧЕСКИХ РЕШЕНИЙ В ХИРУРГИИ
- •3.1. Игры и методы их решения
- •3.2. Элементы теории статистических решений
- •3.3. Критерии принятия решений в условиях неопределенности
- •3.4. Принятие решений при острых хирургических заболеваниях органов брюшной полости
- •3.5. Минимизация риска хирургического вмешательства в онкологии
- •Список литературы
- •ПРИЛОЖЕНИЯ
3. ПРИМЕНЕНИЕ ТЕОРИИ ИГР ДЛЯ ОПТИМИЗАЦИИ КЛИНИЧЕСКИХ РЕШЕНИЙ В ХИРУРГИИ
3.1. Игры и методы их решения
Рассмотрим игру (модель конфликтной ситуации), в которой участвуют два игрока A и B , имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a , то игрок B при этом выигрывает −a , поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока [6]. При конечном числе стратегий игра
будет конечной. Пусть у |
игрока |
A имеется m |
возможных |
стратегий |
||||
A1, A2, , Am , |
а у игрока B |
– n возможных стратегий B1, B2, , Bn . Пусть |
||||||
также известны величины aij |
– выигрыши игрока A при использовании Ai с |
|||||||
его стороны и |
B j со стороны противника. Тогда игра, называемая игрой |
|||||||
|
|
|
|
|
m ×n , может быть представлена табли- |
|||
|
|
|
Таблица 3.1 |
цей, называемой платежной матрицей |
||||
Ai |
|
|
Bj |
|
или просто матрицей игры (табл. 3.1). |
|||
|
|
|
|
Приведение |
игры к |
матричной |
||
B1 |
B2 |
… |
Bn |
|||||
|
форме может само по себе составить |
|||||||
A1 |
a11 |
a12 |
… |
a1n |
трудную задачу, однако таким путем |
|||
A2 |
a21 |
a22 |
… |
a2n |
многоходовая игра фактически сводит- |
|||
… |
… |
… |
… |
… |
ся к одноходовой – от игрока требуется |
|||
Am |
am1 |
am2 |
… |
amn |
сделать только один ход: выбрать под- |
ходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.
По матрице игры определяются нижняя α и верхняя β цены игры. Пусть
αi = minαij , βj = maxαij , тогда |
|
j |
i |
67
α = maxαi = max minαij ; |
||
i |
i |
j |
β = minβj = minmaxαij . |
||
j |
j |
i |
Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Известно [7], что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α =β. Тогда матрица игры имеет седловую точку, а величина γ = α =β называется ценой игры. Стратегии Ai и B j , при которых достигается выигрыш γ,
называются оптимальными чистыми стратегиями, а их совокупность – решением игры.
Более часто α ≠β, и тогда для получения наибольшего выигрыша игроку выгодно не применять одну (чистую) стратегию, а чередовать случайным образом несколько стратегий. Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются смешанными и задаются соответ-
ствующими вероятностными векторами. |
Пусть SA – смешанная стратегия |
|||
игрока |
A, а |
SB – смешанная |
стратегия игрока |
B . Тогда |
SA = (p1, |
p2, , |
pm ), SB = (q1, q2, , qn ), где pi – вероятность применения |
игроком A стратегии Ai , q j – вероятность применения игроком B стратегии B j , причем
m |
n |
∑ pi = ∑ q j =1. |
|
i=1 |
j=1 |
Если допустить применение смешанных стратегий (чистая стратегия – частный случай смешанной), то для каждой конечной игры можно найти хотя бы одно решение, т. е. пару устойчивых оптимальных стратегий игроков
(S*A, SB* ), обладающих следующим свойством: если один из игроков при-
держивается своей оптимальной стратегии, то другому не может быть вы годно отступить от своей [6]. Выигрыш, соответствующий решению, называется, как и раньше, ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α ≤ γ ≤β. Самая простая конечная игра – игра 2 ×2 . Ее матрица имеет вид табл. 3.2.
68
|
|
|
|
|
|
|
|
|
|
|
Таблица 3.2 |
|
Если для этой матрицы α =β, |
то |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
игра |
имеет |
|
седловую |
точку |
и |
ее |
|||||||||||||
|
|
|
|
|
|
|
|
|
Bj |
|
|
|
|
|
|
|
|
|||||||||||||
|
Ai |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
решение – |
это пара |
чистых страте- |
||||||||||||
|
|
|
|
|
B1 |
|
|
|
|
|
B2 |
|
|
|
|
|
гий, |
пересекающихся |
в |
седловой |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
точке. Если же в матрице |
2 ×2 сед- |
|||||||||||||
|
A |
|
|
|
|
a11 |
|
|
|
|
a12 |
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ловой точки |
нет |
и |
α ≠β, |
то необ- |
||||||||
|
A2 |
|
|
|
|
a21 |
|
|
|
|
a22 |
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ходимо искать решение в смешанных |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
стратегиях. |
|
|
Пара |
оптимальных |
смешанных |
стратегий: |
S* |
= (p , p |
); |
|||||||||||||||||||||
S* |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
A |
1 |
2 |
|
= (q ,q ), – и цена игры в этом случае определяется по формулам [7] |
|
|
||||||||||||||||||||||||||||
B |
1 2 |
|
|
|
|
a22 − a21 |
|
|
|
|
|
|
|
|
|
|
|
|
|
a11 − a12 |
|
|
|
|
||||||
|
p1 |
= |
|
|
|
|
; |
|
p2 =1− p1 = |
|
|
|
|
|
; |
(3.1) |
||||||||||||||
|
a |
+ a |
22 |
−a |
−a |
|
|
a |
|
+ a |
−a |
− a |
||||||||||||||||||
|
|
11 |
|
12 |
21 |
|
|
|
|
|
|
11 |
|
22 |
12 |
21 |
|
|
|
|||||||||||
|
q1 |
= |
|
a22 − a12 |
|
|
|
; |
|
q2 =1− q1; |
|
|
|
|
|
|
|
|
|
|||||||||||
|
a + a − a − a |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
11 |
22 |
|
12 |
21 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
γ = |
|
a22a11 − a12a21 |
|
|
|
|
|
|
|
(3.2) |
||||||||||
|
|
|
|
|
|
|
|
|
|
a |
|
|
+ a |
22 |
− a |
− a |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
11 |
|
12 |
21 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
Игра 2 ×2 |
и ее решение имеют простую геометрическую интерпрета- |
||||||||||||||||||||||||||||
цию. Отложим на некоторой числовой оси отрезок единичной длины |
A1A2 |
|||||||||||||||||||||||||||||
(рис. 3.1). Пусть точки |
|
A1 |
и A2 соответствуют применению одноименных |
стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии S*A = (p1, p2 ). В этом случае ординаты прямой B1B1 , про-
веденной так, как показано на рис 3.1, соответствуют выигрышу игрока A при применении им любой стратегии (чистой или смешанной) с условием, что B применяет B1. Прямая B2B2 также отражает выигрыш игрока A
в случае, когда B применяет B2 . Жирной линией отмечена нижняя граница выигрыша B1NB2 (минимальный выигрыш игрока A при любой его смешан-
ной стратегии). Очевидно, решение достигается в точке максимума нижней границы (N на рис. 3.1). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях. По рисунку легко находятся α, β, γ и проводится анализ игры.
Геометрическим способом также легко анализируются и решаются игры 2 ×n . Они задаются матрицей игры, представленной в табл. 3.3, а на рис. 3.2 представлена геометрическая интерпретация этой игры для случая n = 4 .
69
|
|
B2 |
|
|
B1 |
|
|
|
|
|
N |
||
|
|
|
|
B2 |
||
a12 |
B1 |
|
|
|||
γ |
a22 |
|
β a21 |
|||
|
||||||
|
|
|
|
α |
||
a11 |
|
|
||||
|
|
|
|
A2 |
||
|
A1 |
|
p2 |
SA p1 |
|
Рис. 3.1
Геометрические построения осуществляются так же, как и для игры 2 ×2 , только число наклонных линий получается равным n, по числу стратегий игрока B. Нижняя граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.
Таблица 3.3
Ai |
|
|
Bj |
|
|
B1 |
B2 |
|
… |
Bn |
|
|
|
||||
A1 |
a11 |
a12 |
|
… |
a1n |
A2 |
a21 |
a22 |
|
… |
a2n |
a13 |
B3 |
|
B3 |
a23 |
|
|
|||
|
|
|
B1 |
a21 |
a12 |
B2 |
|
|
|
|
|
B4 |
a24 |
|
|
M |
N |
||
a14 |
B4 |
|
B2 |
a22 |
|
|
|||
|
|
|
||
|
B3 |
|
|
|
a11 |
|
|
|
|
A1 |
p2 |
S*A |
p1 |
A2 |
|
|
Рис. 3.2 |
|
|
Из рис. 3.2 видно, что нижняя граница выигрыша – прямая B1MNB2 , ее максимум достигается в точке N , которая определяет оптимальную стратегию S*A = (p1, p2 ). Следует отметить, что стратегия B3 вообще может не рассматриваться как заведомо невыгодная игроку B , а значения p1 и p2 можно
70