- •Оглавление
- •Глава 9. Теория систем массового обслуживания 98
- •Введение
- •Глава 1. Построение математической модели задачи линейного программирования
- •Задачи для самостоятельного решения
- •Глава 2. Графический метод решения задач линейного программирования
- •1. Изобразим на плоскости систему координат
- •2. Рассмотрим ограничения неотрицательности
- •3. Строим множество точек, соответствующее множеству решений системы ограничений.
- •Задачи для самостоятельного решения
- •Глава 3. Стандартная и каноническая формы задачи линейного программирования
- •Задачи для самостоятельного решения
- •Глава 4. Симплексный метод решения задач линейного программирования
- •4.1.Общая идея симплексного метода
- •4.2.Табличный симплексный метод
- •4.3. Метод искусственного базиса
- •Задачи для самостоятельного решения
- •Глава 5. Двойственная задача линейного программирования
- •Задачи для самостоятельного решения
- •Глава 6. Целочисленные задачи линейного программирования
- •Задачи для самостоятельного решения
- •Глава 7. Транспортная задача
- •Задачи для самостоятельного решения
- •Глава 8. Теория игр
- •8.1. Общие понятия
- •8.2. Решение игр в чистых стратегиях
- •8.3. Решения игр в смешанных стратегиях
- •8.3.1. Решение игры 2×2 в смешанных стратегиях
- •8.3.2. Решение игры 2×2 в смешанных стратегиях геометрическим методом
- •8.3.3. Решение игр вида 2×n и m×2 геометрическим методом
- •8.4. Решение матричной игры m×n симплексным методом
- •Задачи для самостоятельного решения
- •Глава 9. Теория систем массового обслуживания
- •9.1. Компоненты и классификация моделей массового обслуживания
- •9.2. Определение характеристик одноканальных систем массового обслуживания
- •9.2.1. Одноканальная смо с отказами
- •9.2.2. Одноканальная смо с ожиданием и ограниченной длиной очереди
- •9.2.3. Одноканальная смо с ожиданием без ограниченной длины очереди
- •9.3. Определение характеристик многоканальных систем массового обслуживания
- •9.3.1. Многоканальная система массового обслуживания с отказами
- •9.3.2 Многоканальная система массового обслуживания с ожиданием и неограниченной очередью
- •9.4. Модель замкнутой системы массового обслуживания
- •Задачи для самостоятельного решения
- •Список литературы
8.3. Решения игр в смешанных стратегиях
Как мы отмечали выше, если матричная игра содержит седловую точку, то ее решение находится по принципу минимакса. Если же платежная матрица не имеет седловой точки, то применение минимаксных стратегий каждым из игроков показывает, что игрок A обеспечит себе выигрыш не меньше а, а игрок B обеспечит себе проигрыш не больше р. Так как α < β, то игрок А стремится увеличить выигрыш, а игрок В — уменьшить проигрыш. Если информация о действиях противной стороны будет отсутствовать, то игроки будут многократно применять чистые стратегии случайным образом с определенной вероятностью. Такая стратегия в теории игр называется смешанной стратегией. Из сказанного следует, что смешанная стратегия игрока — это полный набор его чистых стратегий при многократном повторении игры в одних и тех же условиях с заданными вероятностями. Для применения смешанных стратегий требуются следующие условия:
1) в игре отсутствует седловая точка;
2) игроками используется случайная смесь чистых стратегий с соответствующими вероятностями;
3) игра многократно повторяется в одних и тех же условиях;
4) при каждом из ходов один игрок не информирован о выборе стратегии другим игроком.
Основная теорема теории игр Дж. фон Неймана: каждая конечная игра имеет по крайней мере одно оптимальное решение в смешанных стратегиях. Следствие: каждая конечная игра имеет цену, являющуюся математическим ожиданием выигрыша игрока А и проигрыша игрока В, причем выигрыш, соответствующий оптимальному решению, называется ценой игры - γ, удовлетворяющий условию α ≤ γ ≤ β. Каждый игрок при многократном повторении игры, придерживаясь смешанных стратегий, получает более выгодный для себя результат. Оптимальное решение игры в смешанных стратегиях обладает следующим свойством: каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, так как это ему невыгодно.
Чистые стратегии игроков в их оптимальных смешанных стратегиях называются активными.
Обозначим вектор вероятностей (относительных частот) выбора заданных стратегий игрока A следующим образом:
P = (p1, p2,…, pm), i=1…m,
где pi≥ 0, p1 + p2 +…+ pm= 1. Величина pi называется вероятностью (относительной частотой) применения стратегии Ai.
Аналогично для игрока B вводится неизвестный вектор вероятностей (относительных частот) имеет вид:
Q = (q1, q2,…, qn), j=1…n,
где qj≥ 0, q1 + q2 +…+ qn = 1. Величина qj называется вероятностью (относительной частотой) применения стратегии Bj.
В игре 2x2, не имеющей седловой точки, обе стратегии являются активными.
8.3.1. Решение игры 2×2 в смешанных стратегиях
Покажем на примере платёжной матрицы размерностью 2×2 реализацию алгоритма построения оптимального решения игровой задачи в смешанных стратегиях.
Пример №6
Найти решение матричной игры:
.
Решение:
α= -1, β = 1, α ≠β - решения в чистых стратегиях не существует.
Припишем строкам платёжной матрицы неизвестные вероятности p1 и p2 (вероятности выбора стратегий A1 и A2) соответственно:
Поскольку p1 + p2 =1 , тогда p2 = 1 - p1. Обозначим p1 = p, тогда p2 =1 - p. В результате получим:
Умножим столбец поэлементно на 1-й столбец и, сложив произведения, получим - математическое ожидание (среднее значение) выигрыша первого игрока A, при условии, что второй игрок B следует первой стратегии:
M1(p) = 1∙p + (-1)(1-p) = 2p-1
Умножим столбец поэлементно на 2-й столбец и, сложив произведения, получим линейную зависимость - математическое ожидание (средний выигрыш) игрока A при применении игроком B второй стратегии:
M2(p) = (-1)∙p + 1(1-p) = -2p+1
Поскольку мы разыскиваем оптимальное решение первого игрока A, которое не должно зависеть от выбора стратегий вторым игроком B, приравняем полученные зависимости средних выигрышей:
2p-1 = -2p+1
Отсюда, p= ½, 1-p = ½, то есть оптимальная смешанная стратегия игрока A - это P = (½, ½) (каждую из стратегий надо применять с относительной частотой 1/2). Подставив p= ½, в любую из зависимостей, найдем цену игры:
.
Теперь припишем столбцам вероятности q1 и q2 соответственно, а поскольку:
q1 + q2 =1 →q2 = 1 - q1. Обозначим q1 = q, тогда q2 =1 - q. В результате получим:
Умножив строку (q, 1-q) на 1-ю строку и сложив произведения, получим линейную зависимость - математическое ожидание:
W1(q) = 1q + (-1)(1-q) = 2q - 1
Это средний выигрыш игрока A (равный проигрышу игрока B) при применении игроком A 1-й стратегии.
Умножив строку (q, 1-q) на 2-ю строку и сложив произведения, получим линейную зависимость - математическое ожидание:
W2 = (-1) q + 1· (1-q) = -2q + 1
Это средний выигрыш игрока A (равный проигрышу игрока B) при применении игроком A 2-й стратегии.
Приравняем полученные зависимости:
2q -1 = -2q + 1
Отсюда, q = ½, 1 - q = ½ , то есть оптимальная смешанная стратегия игрока B - это Q = (½;½) (каждую из стратегий надо применять с относительной частотой ½).
Решение о конкретном выборе одной из своих стратегий каждый из игроков может принимать с помощью подбрасывания монеты или бинарного датчика случайных чисел.
Для решения игр в смешанных стратегиях применяют решение с использованием системы уравнений, построенные для игрока А и В. Рассмотрим на примере.
Пример №7
Найти решение матричной игры:
.
Решение:
Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.
Находим гарантированный выигрыш, определяемый нижней ценой игры α = max(αi) = 4, которая указывает на максимальную чистую стратегию A1.
Верхняя цена игры β = min(βj) = 5, что свидетельствует об отсутствии седловой точки, так как α ≠ β:
Игроки |
B1 |
B2 |
α |
A1 |
4 |
5 |
4 |
A2 |
7 |
3 |
3 |
β |
7 |
5 |
|
Цена игры находится в пределах 4 ≤ γ ≤ 5.
Находим решение игры в смешанных стратегиях.
Запишем систему уравнений:
Для игрока A в общем случае:
В нашем случае:
Для игрока B в общем случае:
В нашем случае:
Решая эти системы методом Гаусса, находим:
Получили:
p1 = 4/5 (вероятность применения 1-ой стратегии).
p2 = 1/5 (вероятность применения 2-ой стратегии).
Оптимальная смешанная стратегия игрока А: P* = (4/5; 1/5)
q1 = 2/5 (вероятность применения 1-ой стратегии).
q2 = 3/5 (вероятность применения 2-ой стратегии).
Оптимальная смешанная стратегия игрока В: Q* = (2/5; 3/5)
Цена игры
γ= 43/5 .