Добавил:

artemtvi Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Управление в биотехнических системах

Файл:

Учебное пособие Немирко Манило.pdf

Скачиваний:

Добавлен:

14.06.2020

Размер:

897.06 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 127 8 9 10 11 12 > Следующая >>>

3. ПРИМЕНЕНИЕ ТЕОРИИ ИГР ДЛЯ ОПТИМИЗАЦИИ КЛИНИЧЕСКИХ РЕШЕНИЙ В ХИРУРГИИ

3.1. Игры и методы их решения

Рассмотрим игру (модель конфликтной ситуации), в которой участвуют два игрока A и B , имеющие прямо противоположные интересы, поэтому выигрыш одного равен проигрышу другого. Такая игра называется парной игрой с нулевой суммой. Если игрок A выигрывает a , то игрок B при этом выигрывает −a , поэтому сумма выигрышей всегда равна нулю. Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока [6]. При конечном числе стратегий игра

будет конечной. Пусть у				игрока	A имеется m	возможных	стратегий
A1, A2, , Am ,		а у игрока B		– n возможных стратегий B1, B2, , Bn . Пусть
также известны величины aij				– выигрыши игрока A при использовании Ai с
его стороны и		B j со стороны противника. Тогда игра, называемая игрой
					m ×n , может быть представлена табли-
			Таблица 3.1		цей, называемой платежной матрицей
Ai			Bj		или просто матрицей игры (табл. 3.1).
					Приведение	игры к	матричной
	B1	B2	…	Bn
					форме может само по себе составить
A1	a11	a12	…	a1n	трудную задачу, однако таким путем
A2	a21	a22	…	a2n	многоходовая игра фактически сводит-
…	…	…	…	…	ся к одноходовой – от игрока требуется
Am	am1	am2	…	amn	сделать только один ход: выбрать под-

ходящую стратегию. Для данного игрока среди всех стратегий имеется оптимальная, обеспечивающая ему максимальный выигрыш. Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.

По матрице игры определяются нижняя α и верхняя β цены игры. Пусть

αi = minαij , βj = maxαij , тогда
j	i

α = maxαi = max minαij ;
i	i	j
β = minβj = minmaxαij .
j	j	i

Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными. Известно [7], что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α =β. Тогда матрица игры имеет седловую точку, а величина γ = α =β называется ценой игры. Стратегии Ai и B j , при которых достигается выигрыш γ,

называются оптимальными чистыми стратегиями, а их совокупность – решением игры.

Более часто α ≠β, и тогда для получения наибольшего выигрыша игроку выгодно не применять одну (чистую) стратегию, а чередовать случайным образом несколько стратегий. Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются смешанными и задаются соответ-

ствующими вероятностными векторами.			Пусть SA – смешанная стратегия
игрока	A, а	SB – смешанная	стратегия игрока	B . Тогда
SA = (p1,	p2, ,	pm ), SB = (q1, q2, , qn ), где pi – вероятность применения

игроком A стратегии Ai , q j – вероятность применения игроком B стратегии B j , причем

m	n
∑ pi = ∑ q j =1.
i=1	j=1

Если допустить применение смешанных стратегий (чистая стратегия – частный случай смешанной), то для каждой конечной игры можно найти хотя бы одно решение, т. е. пару устойчивых оптимальных стратегий игроков

(S*A, SB* ), обладающих следующим свойством: если один из игроков при-

держивается своей оптимальной стратегии, то другому не может быть вы годно отступить от своей [6]. Выигрыш, соответствующий решению, называется, как и раньше, ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α ≤ γ ≤β. Самая простая конечная игра – игра 2 ×2 . Ее матрица имеет вид табл. 3.2.

Таблица 3.2

Если для этой матрицы α =β,

то

игра

имеет

седловую

точку

ее

решение –

это пара

чистых страте-

гий,

пересекающихся

седловой

точке. Если же в матрице

2 ×2 сед-

a11

a12

ловой точки

нет

α ≠β,

то необ-

a21

a22

ходимо искать решение в смешанных

стратегиях.

Пара

оптимальных

смешанных

стратегий:

= (p , p

);

= (q ,q ), – и цена игры в этом случае определяется по формулам [7]

1 2

a22 − a21

a11 − a12

;

p2 =1− p1 =

;

(3.1)

+ a

−a

+ a

−a

− a

a22 − a12

;

q2 =1− q1;

a + a − a − a

γ =

a22a11 − a12a21

(3.2)

+ a

− a

Игра 2 ×2

и ее решение имеют простую геометрическую интерпрета-

цию. Отложим на некоторой числовой оси отрезок единичной длины

A1A2

(рис. 3.1). Пусть точки

и A2 соответствуют применению одноименных

стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии S*A = (p1, p2 ). В этом случае ординаты прямой B1B1 , про-

веденной так, как показано на рис 3.1, соответствуют выигрышу игрока A при применении им любой стратегии (чистой или смешанной) с условием, что B применяет B1. Прямая B2B2 также отражает выигрыш игрока A

в случае, когда B применяет B2 . Жирной линией отмечена нижняя граница выигрыша B1NB2 (минимальный выигрыш игрока A при любой его смешан-

ной стратегии). Очевидно, решение достигается в точке максимума нижней границы (N на рис. 3.1). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях. По рисунку легко находятся α, β, γ и проводится анализ игры.

Геометрическим способом также легко анализируются и решаются игры 2 ×n . Они задаются матрицей игры, представленной в табл. 3.3, а на рис. 3.2 представлена геометрическая интерпретация этой игры для случая n = 4 .

		B2			B1
				N	B1
				N	B2
a12		B1			B2
			γ	a22		β a21
						β a21
						α
a11						α
a11						A2
	A1		p2	SA p1		A2

Рис. 3.1

Геометрические построения осуществляются так же, как и для игры 2 ×2 , только число наклонных линий получается равным n, по числу стратегий игрока B. Нижняя граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.

Таблица 3.3

Ai			Bj
Ai	B1	B2		…	Bn
	B1	B2		…	Bn
A1	a11	a12		…	a1n
A2	a21	a22		…	a2n

a13	B3		B3	a23
a13			B3	a23
			B1	a21
a12	B2
a12			B4	a24
	M	N	B4	a24
a14	B4		B2	a22
				a22

	B3
a11
A1	p2	S*A	p1	A2
		Рис. 3.2

Из рис. 3.2 видно, что нижняя граница выигрыша – прямая B1MNB2 , ее максимум достигается в точке N , которая определяет оптимальную стратегию S*A = (p1, p2 ). Следует отметить, что стратегия B3 вообще может не рассматриваться как заведомо невыгодная игроку B , а значения p1 и p2 можно

<<< < Предыдущая 1 2 3 4 5 67 / 127 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете Управление в биотехнических системах

#
14.06.20207.69 Mб48Материалы по курсу (часть 1).docx
#
14.06.20207.78 Mб47Материалы по курсу (часть 2).docx
#
14.06.20202.6 Mб33Материалы по курсу (часть 2).pdf
#
14.06.20201.39 Mб70Методичка.pdf
#
14.06.2020281.63 Кб28Табличный алгоритм.pdf
#
14.06.2020897.06 Кб94Учебное пособие Немирко Манило.pdf