
- •Гринева Наталья Владимировна
- •Сборник задач по дисциплине
- •Определения. Классификация
- •Антагонистические матричные игры с нулевой суммой
- •Антагонистические матричные игры с нулевой суммой, имеющие решение в чистых стратегиях.
- •Задачи для самостоятельного решения.
- •Антагонистические матричные игры с нулевой суммой имеющие решение в смешанных стратегиях.
- •Решение игр Решение игры 2х2
- •Задачи для самостоятельного решения.
- •Принцип доминирования
- •Задачи для самостоятельного решения.
- •Графическое решение игр 2xm или nx2.
- •Решение игры в общем виде. Сведение задачи по теории игр к паре взаимодвойственных задач линейного программирования
- •Задачи для самостоятельного решения.
- •Принятие решений в условиях неопределенности. Игры с природой.
- •4. Критерий минимаксного риска Сэвиджа
- •5. Критерий Ходжа-Лемана
- •6. Критерий Гермейера
- •7. Bl (mm) - критерий
- •8. Критерий произведений
- •9. Критерий Лапласа
- •Задачи для самостоятельной работы.
- •Рекомендуемая литература
Задачи для самостоятельного решения.
Решить игру 2х2:
1. 2. 3. 4.
5. 6. 7. 8.
9. 10. 11. 12.
13. 14. 15. 16.
17. 18. 19. 20.
Принцип доминирования
Матрицы размерностью 2х2 встречаются не так часто, как нам того бы хотелось, поэтому рассмотрим принцип, позволяющий уменьшить размерность матрицы.
Первый игрок стремиться максимизировать свой выигрыш и ему будет выгодна та стратегия, которая принесет больший выигрыш. Если элементы некоторой строки платежной матрицы С меньше соответствующих элементов другой строки, то интуитивно ясно, первую можно вычеркнуть. Сформулируем условия доминирования строк и столбцов платежной матрицы, позволяющие уменьшить ее размерность.
Определение.
Вектор
доминирует вектор
,
если все элементы вектора x
больше или равны соответствующим
элементам вектора y.
То есть
,
и хотя бы одно неравенство выполняется
как строгое. Про вектор y
говорят, что он доминируется вектором
x.
Определение.
Линейная комбинация векторов
называется
выпуклой, если существуют такие
коэффициенты
,
не равные нулю одновременно, что выполнено
условие
Теорема (о доминировании строк). Если в игре с платежной матрицей С какая-либо строка доминируется выпуклой комбинацией остальных строк, то она будет входить с нулевой вероятностью в оптимальную смешанную стратегию первого игрока и ее можно вычеркнуть.
Замечания к теореме:
1. Если в матрице существуют несколько одинаковых срок, то все, кроме одной можно вычеркнуть, и они будут входить с нулевой вероятностью в оптимальную смешанную стратегию первого игрока.
2. Если какая-либо строка доминируется другой, то меньшую можно вычеркнуть.
Теорема (о доминировании столбцов). Если в игре с платежной матрицей C какой-либо столбец доминирует выпуклую комбинацию остальных столбцов, то он будет входить с нулевой вероятностью в оптимальную смешанную стратегию второго игрока и его можно вычеркнуть.
Пример Используя принцип доминирования найти оптимальную стратегию.
Решение. Третий и четвертый столбец доминируют над вторым, поэтому, в соответствии с утверждением о доминировании строк, их можно вычеркнуть и они будут входить с нулевой вероятностью в оптимальную смешанную стратегию второго игрока.
Из
оставшихся трех строк и двух столбцов,
можно вычеркнуть первую строку, так как
она доминируется третьей строкой.
Оставшуюся игру 2х2 просто решить. Таким
образом, оптимальными смешанными
стратегиями игроков будут:
,
,
.
Задачи для самостоятельного решения.
Используя принцип доминировании, решить игру:
1. 2. 3.
4. 5. 6.
7. 8. 9.
10. 11. 12.
Графическое решение игр 2xm или nx2.
Рассмотрим сначала игру, в которой у первого игрока две стратегии, а у второго m стратегий. Тогда платежная матрица будет иметь вид:
Вектор
смешанной стратегии первого игрока
состоит из двух элементов, а второго –
из m
элементов, то есть
и
.
Воспользуемся правой частью определения
решения игры в смешанных стратегиях.
Пусть первый игрок применил свою
оптимальную смешанную стратегию, а
второй любую, кроме оптимальной
(поочередно свои чистые стратегии).
Тогда, умножив вектор p
на первый столбец матрицы, воспользуемся
нормировочным условием, для того, чтобы
сделать замену и получим функцию,
зависящую от одной переменной:
.
Аналогично поступим со всеми остальными столбцами:
и
т.д.
Последняя функция привет вид:
Сначала
на плоскости
последовательно рисуются прямые. Затем
для каждого значения
,
путем визуального сравнения соответствующих
ему значений l
на каждой из построенных прямых
определяется и отмечается минимальное
из них. В результате описания процедуры
получается ломаная, которая является
нижней огибающей. Верхняя точка нижней
огибающей определяет и цену игры и
оптимальную стратегию.
Объясняется этот выбор просто. Оптимальной стратегией первого игрока является максиминная стратегия и поэтому из всех минимумов он выбирает максимум. Пересечение прямых, дающих точку максимума определяет выигрыш игрока, а номера прямых, которые пересекаются в этой точке соответствуют применению вторым игроком данных стратегий с вероятностью, отличной от нуля. Вероятности применений стратегий второго игрока, которые не участвуют в образовании точки экстремума, равны нулю.
В
нашем случае эту точку дают пересечения
прямых
и
.
Разность между элементами одного столбца
является угловым коэффициентом прямой
и обозначим его через k.
Тогда:
,
или через угловые коэффициенты
,
откуда
просто определяется вероятность
применения первым игроком своей первой
стратегии:
.
Для того чтобы определить выигрыш, достаточно подставить вероятность в любое равенство, дающее точку экстремума.
Остается
определить вероятности применения
стратегий вторым игроком. Для этого
можно воспользоваться решением игры
2х2, а можно уже найденными угловыми
коэффициентами прямых. Рассмотрим игру,
составленную из строк и столбцов,
вероятности применения которых игроками
не равны нулю:
.
Тогда
для определений оптимальной стратегии
второго игрока необходимо воспользоваться
системой:
.
Вычтем из первого равенство второе и
сделаем замену переменных
и получим:
,
или в угловых коэффициентах
.
Откуда с помощью элементарных вычислений
имеем:
,
и тогда
будут являться оптимальными смешанными
стратегиями второго игрока.
Пример.
Рассмотрим игру, заданную матрицей
.
.
Шаг 1. Проверим, имеет ли данная игра решение в чистых стратегиях. Нижняя цена игры равна 1, а верхняя – 4. Седловой точки нет. Следовательно, обязано существовать решение в смешанных стратегиях.
Составим функции для построения графика:
Построим
график, где по оси абцисс отложим
вероятность
,
а по оси ординат – выигрыш.
Нас интересует нижняя огибающая и максимальная точка из нее. Это пересечение первой и четвертой прямых. Тогда
,
и, следовательно
Таким
образом, оптимальная смешанная стратегия
найдена. Найдем теперь оптимальные
смешанные стратегии второго игрока.
Так как в точке экстремума активными
стратегиями являются первая и четвертая,
то уравнение для нахождения оптимальных
вероятностей второго игрока имеет вид: