Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Материалы по курсу (часть 1).docx
Скачиваний:
48
Добавлен:
14.06.2020
Размер:
7.69 Mб
Скачать

19. Решение игр mх2.

Все тоже самое пишем, как для 2xn. Но заменяем следующее

Решение игры mx2 осуществляется аналогично. Но в этом случае строится графическое изображение игры для игрока В и выделяется не нижняя, а верхняя граница выигрыша, и на ней находится точка оптимума с наименьшей ординатой (минимакс).

ОЧЕНЬ ПРИКОЛЬНАЯ ФИГНЯ МОЖНО ЗАФИГАЧИТЬ В КОНЕЦ КАК ИТОГ

ДЛЯ NX2

  1. строится графическое изображение игры;

  2. выделяется нижняя граница выигрыша и находится наибольшая ордината нижней границы, которая равна цене игры γ;

  3. определяется пара стратегий, пересекающихся в точке оптимума M. Эти стратегии являются активными стратегиями игрока B. Если в точке оптимума пересекаются более двух стратегий, то в качестве активных стратегий может быть выбрана любая пара из них;

  4. решается полученная игра 2x2.

Решение игры mx2 осуществляется аналогично. Вместо пункта 2 применяется:

2. Выделяется верхняя граница выигрыша, и на ней находится точка оптимума с наименьшей ординатой.

КАК У НЕЕ В МЕТОДЕ, НО ДЛЯ НАШЕГО СЛУЧАЯ

Игры mx2 можно легко решить с помощью геометрического способа. Они задаются матрицей игры (табл.1), а на рис.1 показана геометрическая интерпретация этой игры для случая m=4.

Таблица 1

Ai

Bj

B1

B2

A1

a11

a12

A2

a21

a22

………

Am

am1

am2

Рисунок 1

Геометрическое построение осуществляется так же, как и для игры 2х2, только число наклонных линий получается равным m, по числу стратегий для игрока A. Нижняя граница игры может быть сложной ломанной линией, максимум которой определяет решение игры.

Из рис.1 нижняя граница выигрыша А2NMА1, ее минимум достигается в точке N, которая определяет оптимальную стратегию . Стратегия A3 вообще может не рассматриваться как заведомая невыгодная игроку A, а значения q1 и q2 можно найти по формулам игры 2х2, учитывая, что в точке N активных стратегий игрока А только две, А2 и А4.

20. Решение игр mxn.

Нельзя применять геометрическую интерпретацию.

Применяются чисто расчетные методы.

Решение любой игры mxn может быть сведено к задаче линейного программирования.

Допустим у игрока А имеется m стратегий (A1, A2, …, Am), у игрока B есть n стратегий: B1, B2, B3. Игра задается матрицей mxn . Мы ищем две оптимальные смешанные стратегии и , где p1, p2, …, pm и q1, q2, …, qn – вероятности применения соответствующих стратегий A1, A2, …, Am и B1, B2, …, Bn и .

Для нахождения полагаем, что цена игры 𝛄 положительна (𝛄 ≥ 0). Если есть отрицательные члены, то мы добавляем к ним достаточно большое положительное число М (также можно умножить). На решение игры это не влияет, но в конце важно не забыть провести обратные действия с ценой игры (если прибавили вычесть, если умножили разделить) – нее написано прибавить, но потом в примере (который на стр.87) вычитают, так что делаем выводы. а вообще можно написать так: Тогда цена игры увеличится на М, а вероятности останутся теми же.

Когда мы применяем , а противник – чистую стратегию Bj, то наш средний выигрыш будет равен

Так как мф применяем , то наш средний выигрыш не может быть меньше цены игры 𝛄, т.е. aj>𝛄, j = 1, 2, …, n, поэтому

………………

(1)

СТРОКИ ВЫШЕПЕРЕЧИСЛЕННОЙ СИСТЕМЫ ПИШЕТСЯ ПО СТОЛБЦАМ МАТРИЦЫ ИГРЫ

Разделим все получившиеся на положительную величину 𝛄 и введем обозначения

x1 = p1/𝛄, x2 = p2/𝛄, …, xm = pm/𝛄.

Тогда система (1) превращается в следующую

………………

(2)

Так как р12+…+pm=1, то

x1+x2+…+xm=1/𝛄.

Мы хотим сделать наш гарантированный выигрыш максимально возможным. При этом величина 1/𝛄 принимает минимальное значение.

Мы получаем следующую задачу линейного программирования: найти такие неотрицательные значения x1, x2, …, xm, которые удовлетворяли бы линейным ограничениям (2) и обращали бы в минимум линейную функцию

L = x1+x2+…+xm

Решив эту задачу линейного программирования, мы можем найти оптимальную стратегию игрока А.

Нахождение . Оптимальная стратегия находится аналогично. Разница заключается в том, что игрок В стремится не максимизировать, а минимизировать выигрыш, а значить максимизировать величину 1/𝛄. Следовательно, вместо условий (2) должны соблюдаться условия

………………

(3)

где yj = qj/ 𝛄, j = 1, 2, …, n.

Требуется так выбрать неотрицательные значения переменных y1, y2, …, yn, чтобы они удовлетворяли условиям (3) и обращали в максимум линейную функцию

L = y1 + y2 + … + yn = 1/𝛄

или, что то же самое, обращали в минимум линейную функцию

L =y1 y2 yn = 1/𝛄

Таким образом, любая конечная игра nxm сводится к задачам линейного программирования.

Возможно, сюда еще надо будет вписать первую часть (теорию) из пункта 3.2., который идет дальше