Добавил:

artemtvi Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Управление в биотехнических системах

Файл:

Материалы по курсу (часть 2)

.pdf

Скачиваний:

Добавлен:

14.06.2020

Размер:

2.6 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 97 8 9 > Следующая >>>

15. Решение игры в смешанных стратегиях.

Задача теории игр – нахождение оптимальных стратегий игроков в предположении одинаковой «разумности» противников.

Рассмотрим игру (модель конфликтной ситуации), в которой участвует два игрока A и B, имеющие прямо противоположные интересы.

Процесс игры заключается в последовательных ходах (личных – сознательных и случайных) противников, а совокупность правил, определяющих выбор варианта действий при каждом личном ходе в зависимости от сложившейся ситуации называется стратегией игрока.

При конечном числе стратегий игра будет конечной. Пусть у игрока A имеется m

возможных стратегий A1, A2…Am, а у игрока B – n возможных стратегий B1, B2…Bn. Пусть также известны величины aij – выигрыши игрока A при использовании Ai с его стороны и Bi

со стороны противника.

Тогда игра, называемая игрой m×n, может быть представлена таблицей, называемой платежной матрицей или просто матрицей игры.

По матрице игры определяются нижняя α и верхняя β цены игры.

i = max min ij

i = min max ij

Принцип выбора противниками стратегий, соответствующих получению ими выигрышей α и β называется принципом минимакса, а сами стратегии – минимаксными.

Известно, что минимаксные стратегии устойчивы по отношению к информации о поведении другой стороны только в случае, если α = β.

В случае α ≠ β для получения наибольшего выигрыша игроку выгодно применять не

одну (чистую) стратегию, а чередовать случайным образом несколько стратегий.

Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются

смешанными и задаются соответствующими вероятностными векторами.

Пусть SA - смешанная стратегия игрока A, а SB - смешанная стратегия игрока B. Тогда

SA =(p1, p2… pm), SB =(q1, q2… qn), где pi - вероятность применения игроком A стратегии Ai, qi -

вероятность применения игроком B стратегии Bi, причем

Чистая стратегия – частный случай смешанной.

Если допустить применение смешанных стратегий, то для каждой конечной игры можно найти хотя бы одно решение, т.е. пару устойчивых оптимальных стратегий игроков

(SA*, SB*), обладающих следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то другому не может быть выгодно отступить от своей.

Выигрыш, соответствующий решению, называется ценой игры и в общем случае (при применении смешанной стратегии) лежит в интервале α ≤ γ ≤ β.

α– нижняя цена игры

γ– выигрыш

β– верхняя цена игры

Рассмотрим игру 2×2.

Ее матрица имеет вид:

Если в матрице 2×2 седловой точки нет и α ≠ β, то необходимо искать решение в смешанных стратегиях.

Пара оптимальных смешанных стратегий SA = (p1, p2), SB = (q1, q2), и цена игры в этом случае определяются по формулам:

Игра 2×2 и ее решение имеют простую геометрическую интерпретацию.

Пусть точки A1 и A2 соответствуют применению одноименных стратегий, а любая точка внутри этого отрезка соответствует некоторой смешанной стратегии SA *= (p1, p2).

Рисунок 1 – геометрическая интерпретация задачи 2×2

Ординаты прямой B1B1, проведенной так, как показано на рис.1, соответствуют выигрышу игрока A при применении им любой стратегии (чистой или смешанной) при условии, что B применяет B1. Прямая B2B2 также отражает выигрыш игрока A в случае, когда

B применяет B2. Жирной линией отмечена нижняя граница выигрыша B1NB2 – минимальный выигрыш игрока A при любой его смешанной стратегией. Очевидно, решение достигается в точке максимума нижней границы (на рис.1 в точке N). Геометрические построения легко осуществляются по элементам матрицы игры, которые откладываются на вертикальных осях.

По рисунку легко находятся α, β, γ и проводится анализ игры.

Геометрическим способом также легко анализируются и решаются игры 2×n.

Они задаются матрицей игры:

Например, геометрическая интерпретация игры 2×4, в которой число наклонных линий получается равным 4, по числу стратегий игрока B. имеет вид:

Рисунок 2 – геометрическая интерпретация задачи 2×4

Нижняя граница игры может в данном случае уже представлять сложную ломаную линию, максимум которой, как и ранее, определяет решения игры.

Т.е. находим, самую нижнюю кривую и самая верхняя точка пересечения в этой кривой и есть решение игры.

Из рис. 2 видно, что нижняя граница выигрыша – прямая B1MNB2, ее максимум достигается в точке N, которая определяет оптимальную стратегию SA *= (p1, p2). Следует отметить, что стратегия B3 вообще может не рассматриваться как заведомо невыгодная игроку B, а значения p1 и p2 можно найти по формулам игры 2×2, учитывая, что в точке N

активных стратегий игрока B только две B2 и B4.

16. Игры 2х2 и их решение.

Игра 2х2 – самая простая конечная игра, её матрица имеет вид табл. 3.2.

Если для этой матрицы α=β, то игра имеет седловую точку и её решение – это пара чистых стратегий, пересекающихся в седловой точке.

Если в этой матрице седловой точки нет и α≠β, то необходимо искать решение в смешанных

стратегиях. Пара оптимальных смешанных стратегий: = (		,	);	= (	, ) − и цена
	1	2		1	2

игры в этом случае определяется по формулам:

17. Геометрическая интерпретация решений игры 2х2.

Решение игры 2х2 допускает наглядную геометрическую интерпретацию.

Пусть игра задана платежной матрицей Р = (аij), i, j = 1, 2. По оси абсцисс отложим единичный отрезок А1А2; точка A1 (x = 0) изображает стратегию А1, а все промежуточные точки этого отрезка —смешанные стратегии SA первого игрока, причем расстояние от SA до правого конца отрезка —это вероятностьр1стратегииА1, расстояние до левого конца — вероятность p2 стратегии А2. На перпендикулярных осях I—I и II—II откладываем выигрыши при стратегиях А1 и А2 соответственно. Если 2-й игрок примет стратегию В1, то она дает выигрыши а11 и а21 на осях I—I и II—II, соответствующие стратегиям А1 и А2. Обозначим эти точки на осях I—I и II—II буквой В1.Средний выигрыш v1, соответствующий смешанной стратегии SA, определяется по формуле математического ожидания v1 = а11р1 + а21р2 и равен ординате точки М1, которая лежит на отрезке В1В1 и имеет абсциссу SA (рис. 1).

Рис. 1 Рис. 2

Аналогично строим отрезок В2В2, соответствующий применению вторым игроком стратегии В2 (рис. 2). При этом средний выигрыш v2 = а12р1 + а22р2 — ордината точки М2.

В соответствии с принципом минимакса оптимальная стратегия S*A такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в

максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке B1N —

против стратегии В1, на участке NB2 —против стратегии B2). Оптимальную стратегию

S*A = (p*1, р*2) определяет точка N, в которой минимальный выигрыш достигает максимума;

ее ордината равна цене игры v. На рис.3 обозначены также верхняя и нижняя цены игры и.

Применим геометрический метод для решения следующей задачи.

Рис. 3

Рис. 4

Пример. Решить графически игру, заданную платежной матрицей:

= (1,52 31),

	− 0	=	− 1,5	или = 0,5 + 1,5 .

1	− 0		2 − 1,5

Решение. Откладываем по оси абсцисс (рис. 4) единичный отрезок А1А2. На вертикальной оси

I—I откладываем отрезки: а11 = 1,5, соответствующий стратегии В1, и а12 = 3,

соответствующий стратегии В2. На вертикальной оси II—II отрезок а21 = 2 соответствует стратегии В1, отрезок а22 = 1 соответствует стратегии В2 (см. рис. 4). Нижняя цена игры

=а11 = 1,5. Верхняя цена игры =а21 = 2, седловая точка отсутствует. Из рис. 4 видно, что абсцисса точки N определяет оптимальную стратегию S*A, а ордината —цену игры v. Точка N

является точкой пересечения прямых В1В1 и В2В2. Уравнение прямой В1В1, проходящей через точки (0; 1,5) и (1;2):

Уравнение прямой В2В2, проходящей через точки (0; 3) и (1;1):

Точка пересечения прямых является решением системы:

- там знак системы, он не исправляется

или х = 0,6; у = 1,8, т. е. N (0,6; 1,8).

Таким образом, р*1 = 0,6, р*2 = 1 — 0,6 = 0,4; оптимальная стратегия S*A = (0,6; 0,4),

цена игры v = 1,8.

Геометрически можно также определить оптимальную стратегию игрока В, если поменять местами игроков А и В и вместо максимума нижней границы А2МА1 в соответствии с принципом минимакса (рис. 5) рассмотреть минимум верхней границы.

Рис. 5

Абсцисса точки М определяет q*2в оптимальной стратегии игрока В, ордината этой точки —цена игры. Прямая А1А1, проходящая через точки (0; 1,5) и (1; 3), удовлетворяет уравнению

Прямая А2А2, проходящая через точки (0; 2) и (1; 1), удовлетворяет уравнению у =—х +2.

Координаты их точки пересечения М —это решение системы уравнений:

откуда х = 0,2; у = 1,8, т. е. q*2 = 0,2, q*1 = 1— q*2 = 0,8, х =у = 1,8, S*B = (0,8; 0,2).

Оптимальное решение игры найдено.

Из решения задачи следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока B, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В примере выше платежная матрица не имела седловой точки ( ).

При наличии седловой точки графическое решение дают варианты, изображенные на рис. 6 и 7. На рис. 6 наибольшей ординатой на ломаной B1NB2 обладает точка B2, поэтому оптимальной является чистая стратегия А2 для игрока А (В2 —для игрока В), т.е. оптимальное решение: S*A = (0; 1), S*B = (0; 1). Игра имеет седловую точкуа22 = v.

Рис. 6

Рис. 7

Чистая стратегия В2 (рис. 7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия В1. На основании принципа минимакса выделим прямую В1В1 и на ней точку В1 с наибольшей ординатой на оси

I—I. Чистая стратегияА2является оптимальной для игрока А, а чистая стратегия В1 —для игрока В.

Оптимальное решение: S*A = (0;1), S*B = (1;0), цена игры v=а21= = , т.е. имеется седловая точка.

<<< < Предыдущая 1 2 3 4 5 67 / 97 8 9 > Следующая >>>

Соседние файлы в предмете Управление в биотехнических системах

#
14.06.2020293.31 Кб32КР (вариант 5).docx
#
14.06.2020384.95 Кб43КР (вариант 5).pdf
#
14.06.202096.99 Кб28Манило ИДЗ (задание 9 вар).pdf
#
14.06.20207.69 Mб58Материалы по курсу (часть 1).docx
#
14.06.20207.78 Mб56Материалы по курсу (часть 2).docx
#
14.06.20202.6 Mб40Материалы по курсу (часть 2).pdf
#
14.06.20201.39 Mб78Методичка.pdf
#
14.06.2020281.63 Кб35Табличный алгоритм.pdf
#
14.06.2020897.06 Кб103Учебное пособие Немирко Манило.pdf