Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
матан - теория.doc
Скачиваний:
2
Добавлен:
01.03.2025
Размер:
993.79 Кб
Скачать

37. Аналитическое решение игры (2 × 2), графическое решение игр вида (2 X n) и (n X 2).

Графический метод применим к играм, в которых хотя бы один игрок имеет только две стратегии, т.е. матричным антагонистическим игры размерностью 2 n или m 2 . Решение игры (2 n). Платёжная матрица в этом случае имеет всего две строки. Приписав 1-й строке вероятность p, а 2-й строке – вероятность 1p, получим n линейных зависимостей v(p) – значений средних выигрышей первого игрока в зависимости от применения вторым игроком 1-ой, 2-ой, …n-ой из его стратегий. Изобразим их графики в осях Ор, Оv. Возьмем нижнюю кусочно-линейную огибающую, то есть такую ломаную из отрезков построенных прямых v(p), что вся картинка с построенными прямыми лежит выше этой ломаной. Выбор нижней огибающей связано с тем, что при оптимальной смешанной стратегии цена игры должна быть минимально гарантированной. Координаты точки на ломанной кривой с наибольшим значением v дает нам значение p (1-я координата) и оптимально гарантированную цену игры V (2-я координата). Пусть это есть точка пересечения i–й и j–й прямых линий, т.е. оптимально гарантированный выигрыш первого игрока получается с учётом только i–й и j–й стратегий второго игрока. Тогда припишем i–му столбцу вероятность q, а j–му столбцу – вероятность 1-q. Всем остальным столбцам припишем нулевые вероятности. Составим два выражения средних проигрышей второго игрока, соответствующие 1-ой и 2-ой стратегии первого игрока, приравняем их и найдём значения q и 1-q.

Решение игры m×2. Платёжная матрица имеет всего два столбца. Приписав 1-му столбцу вероятность q, а 2-му столбцу – 1-q, получим m линейных зависимостей. Изобразим их графики, это будут прямые линии. Возьмем верхнюю кусочно-линейную огибающую, то есть такую ломаную из отрезков построенных прямых, что вся картинка с графиками лежит ниже этой ломаной. Выбор верхней огибающей связано с тем, что при оптимальной стратегии для второго игрока должен быть гарантирован оптимальный минимальный проигрыш. Координаты точки с наименьшей значением v на огибающей дают нам значение q (1-я координата) и цену игры V (2-я координата). Пусть это точка пересечения i–й и j–й прямых линий. Тогда припишем i–й строке вероятность p, а j–й строке – вероятность 1-p. Всем остальным строкам припишем нулевые вероятности. Составляя выражения для средних значений выигрыша первого игрока, использующего i – ю и j – ю стратегии, и приравнивая их, находим p и 1-p.

Решение игры 2×2. Покажем на примере платёжной матрицы размерностью 2×2 реализацию алгоритма построения оптимального решения игровой задачи в смешанных стратегиях. Пр-р 1. Найдем решение матричной игры . V* = -1, V* = 1, V* ≠V* - решения в чистых стратегиях не существует. Припишем строкам платёжной матрицы неизвестные вероятности p1 и p2 (вероятности выбора стратегий A1 и A2) соответственно: . Поскольку p1 + p2 =1 p2 = 1 – p1. Обозначим p1 = p, тогда p2 =1 – p. В результате получим: . Умножим столбец поэлементно на 1-й столбец и, сложив произведения, получим – математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует первой стратегии. Умножим столбец поэлементно на 2-й столбец и, сложив произведения, получим линейную зависимость – математическое ожидание (средний выигрыш) игрока A при применении игроком B второй стратегии Поскольку мы разыскиваем оптимальное решение первого игрока A , которое не должно зависеть от выбора стратегий вторым игроком B, приравняем полученные зависимости средних выигрышей: Отсюда, то есть оптимальная смешанная стратегия игрока A – это P = (1/2, 1/2) (каждую из стратегий надо применять с относительной частотой 1/2). Подставив в любую из зависимостей , i =1,2 найдем цену игры: V= = 0. Теперь припишем столбцам вероятности q1 и q2 соответственно, а поскольку: q1 + q2 =1 q2 = 1 – q1. Обозначим q1 = q, тогда q2 =1 – q. В результате получим: . Умножив строку (q, 1-q) на 1-ю строку и сложив произведения, получим линейную зависимость – математическое ожидание: Это средний выигрыш игрока A (равный проигрышу игрока B) при применении игроком A 1-й стратегии. Умножив строку (q, 1-q) на 2-ю строку и сложив произведения, получим линейную зависимость – математическое ожидание: Это средний выигрыш игрока A (равный проигрышу игрока B) при применении игроком A 2-й стратегии. Приравняем полученные зависимости: Отсюда, то есть оптимальная смешанная стратегия игрока B – это Q = (1/2, 1/2) (каждую из стратегий надо применять с относительной частотой 1/2). Решение о конкретном выборе одной из своих стратегий каждый из игроков может принимать с помощью подбрасывания монеты или бинарного датчика случайных чисел.

Как показывает приведённый пример, оптимальные смешанные стратегии сравнительно легко находятся для игр, имеющих небольшую размерность платёжной матрицы (небольшие m и n), т.е. для игр, в которых каждый из игроков имеет небольшое число стратегий. В то же время для игр, имеющих большую размерность, поиск решения становится достаточно сложным. Поэтому до построения оптимального решения в смешанных стратегиях проводят предварительный анализ платёжной матрицы на предмет её упрощения, исключения из неё дублирующих и доминируемых стратегий, что позволяет существенно упростить поиск решения игровой задачи в смешанных стратегиях.