Добавил:

artemtvi Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Управление в биотехнических системах

Файл:

Материалы по курсу (часть 2).docx

Скачиваний:

Добавлен:

14.06.2020

Размер:

7.78 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1513 14 15 > Следующая >>>

16. Игры 2х2 и их решение.

Игра 2х2 – самая простая конечная игра, её матрица имеет вид табл. 3.2.

Если для этой матрицы α=β, то игра имеет седловую точку и её решение – это пара чистых стратегий, пересекающихся в седловой точке.

Если в этой матрице седловой точки нет и α≠β, то необходимо искать решение в смешанных стратегиях. Пара оптимальных смешанных стратегий: и цена игры в этом случае определяется по формулам:

17. Геометрическая интерпретация решений игры 2х2.

Решение игры 2х2 допускает наглядную геометрическую интерпретацию.

Пусть игра задана платежной матрицей Р = (а_ij), i, j = 1, 2. По оси абсцисс отложим единичный отрезок А₁А₂; точка A₁(x = 0) изображает стратегию А₁, а все промежуточные точки этого отрезка —смешанные стратегии S_Aпервого игрока, причем расстояние от S_Aдо правого конца отрезка —это вероятностьр₁стратегииА₁, расстояние до левого конца —вероятность p₂стратегии А₂. На перпендикулярных осях I—I и II—II откладываем выигрыши при стратегиях А₁и А₂соответственно. Если 2-й игрок примет стратегию В₁, то она дает выигрыши а₁₁и а₂₁на осях I—I и II—II, соответствующие стратегиям А₁и А₂. Обозначим эти точки на осях I—I и II—II буквой В₁.Средний выигрыш v₁, соответствующий смешанной стратегии S_A, определяется по формуле математического ожидания v₁ = а₁₁р₁ + а₂₁р₂и равен ординате точки М₁, которая лежит на отрезке В₁В₁и имеет абсциссу S_A (рис. 1).

Рис. 1 Рис. 2

Аналогично строим отрезок В₂В₂, соответствующий применению вторым игроком стратегии В₂(рис. 2). При этом средний выигрыш v₂ = а₁₂р₁ + а₂₂р₂— ордината точки М₂.

В соответствии с принципом минимакса оптимальная стратегия S^*_Aтакова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке B₁N —против стратегии В₁, на участке NB₂ —против стратегии B₂). Оптимальную стратегию S^*_A = (p^*₁, р^*₂) определяет точка N, в которой минимальный выигрыш достигает максимума; ее ордината равна цене игры v. На рис.3 обозначены также верхняя и нижняя цены игры  и .

Применим геометрический метод для решения следующей задачи.

Рис. 3 Рис. 4

Пример. Решить графически игру, заданную платежной матрицей:

Решение. Откладываем по оси абсцисс (рис. 4) единичный отрезок А₁А₂. На вертикальной оси I—I откладываем отрезки: а₁₁= 1,5, соответствующий стратегии В₁, и а₁₂ = 3, соответствующий стратегии В₂. На вертикальной оси II—II отрезок а₂₁ = 2 соответствует стратегии В₁, отрезок а₂₂ = 1 соответствует стратегии В₂ (см. рис. 4). Нижняя цена игры =а₁₁ = 1,5. Верхняя цена игры  =а₂₁ = 2, седловая точка отсутствует. Из рис. 4 видно, что абсцисса точки N определяет оптимальную стратегию S^*_A, а ордината —цену игры v. Точка N является точкой пересечения прямых В₁В₁и В₂В₂. Уравнение прямой В₁В₁, проходящей через точки (0; 1,5) и (1;2):

Уравнение прямой В₂В₂, проходящей через точки (0; 3) и (1;1):

Точка пересечения прямых является решением системы:

- там знак системы, он не исправляется

или х = 0,6; у = 1,8, т. е. N (0,6; 1,8).

Таким образом, р^*₁ = 0,6, р^*₂ = 1 — 0,6 = 0,4; оптимальная стратегия S^*_A = (0,6; 0,4), цена игры v = 1,8.

Геометрически можно также определить оптимальную стратегию игрока В, если поменять местами игроков А и В и вместо максимума нижней границы А₂МА₁в соответствии с принципом минимакса (рис. 5) рассмотреть минимум верхней границы.

Рис. 5

Абсцисса точки М определяет q^*₂в оптимальной стратегии игрока В, ордината этой точки —цена игры. Прямая А₁А₁, проходящая через точки (0; 1,5) и (1; 3), удовлетворяет уравнению

Прямая А₂А₂, проходящая через точки (0; 2) и (1; 1), удовлетворяет уравнению у =—х +2.

Координаты их точки пересечения М —это решение системы уравнений:

откуда х = 0,2; у = 1,8, т. е. q^*₂ = 0,2, q^*₁ = 1— q^*₂ = 0,8, х =у = 1,8, S^*_B = (0,8; 0,2).

Оптимальное решение игры найдено.

Из решения задачи следует, что геометрически можно определять оптимальную стратегию как игрока А, так и игрока B, в обоих случаях используется принцип минимакса, но во втором случае строится не нижняя, а верхняя граница выигрыша и на ней определяется не максимум, а минимум. Если платежная матрица содержит отрицательные числа, то для графического решения задачи лучше перейти к новой матрице с неотрицательными элементами; для этого к элементам исходной матрицы достаточно добавить соответствующее положительное число. Решение игры при этом не изменится, а цена игры увеличится на это число. В примере выше платежная матрица не имела седловой точки ().

При наличии седловой точки графическое решение дают варианты, изображенные на рис. 6 и 7. На рис. 6 наибольшей ординатой на ломаной B₁NB₂обладает точка B₂, поэтому оптимальной является чистая стратегия А₂для игрока А (В₂ —для игрока В), т.е. оптимальное решение: S^*_A = (0; 1), S^*_B = (0; 1). Игра имеет седловую точкуа₂₂ = v.

Рис. 6 Рис. 7

Чистая стратегия В₂(рис. 7) не выгодна для игрока В, поскольку при любой стратегии игрока А она дает последнему больший выигрыш, чем чистая стратегия В₁. На основании принципа минимакса выделим прямую В₁В₁и на ней точку В₁с наибольшей ординатой на оси I—I. Чистая стратегияА₂является оптимальной для игрока А, а чистая стратегия В₁ —для игрока В.

Оптимальное решение: S^*_A = (0;1), S^*_B = (1;0), цена игры v=а₂₁= =, т.е. имеется седловая точка.

<<< < Предыдущая 1 2 3 4 5 6 7 8 9 10 11 1213 / 1513 14 15 > Следующая >>>

Соседние файлы в предмете Управление в биотехнических системах

#
14.06.202014.81 Кб49ИДЗ - задание 2 (9 вариант).docx
#
14.06.2020293.31 Кб23КР (вариант 5).docx
#
14.06.2020384.95 Кб40КР (вариант 5).pdf
#
14.06.202096.99 Кб24Манило ИДЗ (задание 9 вар).pdf
#
14.06.20207.69 Mб48Материалы по курсу (часть 1).docx
#
14.06.20207.78 Mб47Материалы по курсу (часть 2).docx
#
14.06.20202.6 Mб33Материалы по курсу (часть 2).pdf
#
14.06.20201.39 Mб70Методичка.pdf
#
14.06.2020281.63 Кб28Табличный алгоритм.pdf
#
14.06.2020897.06 Кб94Учебное пособие Немирко Манило.pdf