- •7. Решения некооперативных игр: доминирование сильное и слабое.
- •8. Равновесия в играх. Равновесие Нэша в чистых стратегиях.
- •9. Свойства ситуаций равновесия по Нэшу в антагонистических играх. Пример отсутствия этих свойств в неантагонистических играх.
- •12. Описание матричной игры.
- •13. Антагонистические игры.
- •15. Основные теоремы матричных игр
- •16. Понятие смешанной стратегией. Теорема Фон–Неймана
- •17. Решение матричной игры (2х2). Приведите алгоритм решения матричной игры 2х2
- •18. Упрощение матричных игр.
- •19. Решение игр 2xn и mx2.
- •20. Решение игр mхn. Эквивалентные задачи линейного программирования.
- •21. Приближенный метод решения матричных игр mxn.
- •22. Ситуации, оптимальные по Парето.
- •23. Неантагонистические игры.
- •24. Биматричные игры. Методы их решения.
- •25. Равновесие и доминирование в биматричных играх.
- •26. Основные понятия кооперативных игр.
- •28. Игры с «природой». Принятие решений в условиях неопределенности.
- •1. Критерий ожидаемого значения.
- •Критерий «ожидаемое значение — дисперсия».
- •3. Критерий предельного уровня
- •30. Выбор решений с помощью дерева решений
13. Антагонистические игры.
Антагонистическая игра (игра с нулевой суммой, англ. zero-sum) — термин теории игр. Антагонистической игрой называется некооперативная игра, в которой участвуют два игрока, выигрыши которых противоположны.
Формально
антагонистическая игра может быть
представлена тройкой <X, Y, F>,
где X и Y —
множества стратегий первого
и второго игроков, соответственно; F —
функция выигрыша первого игрока, ставящая
в соответствие каждой паре стратегий
(ситуации) (x,y),
действительное
число, соответствующее полезности
первого игрока при реализации данной
ситуации. Так как интересы игроков
противоположны, функция F одновременно
представляет и проигрыш второго игрока.
Простейшим примером антагонистической игры является игра «Орлянка». Первый игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она спрятана. Если он не угадывает — он платит первому одну денежную единицу, если угадывает — первый платит ему одну денежную единицу.
В данной игре каждый участник имеет две стратегии: «орел» и «решка». Множество ситуаций в игре состоит из четырех элементов. В строках таблицы указаны стратегии первого игрока х, в столбцах — стратегии второго игрока y. Для каждой из ситуаций указаны выигрыши первого и второго игроков.
В аналитическом виде функция выигрыша первого игрока имеет следующую форму:
где x ∈ X и y ∈ Y — стратегии первого и второго игроков, соответственно.
Так
как выигрыш первого игрока равен
проигрышу второго, то
.
X \ Y |
Орел |
Решка |
Орел |
-1, 1 |
1, -1 |
Решка |
1, -1 |
-1, 1 |
14. Принцип максимина в антагонистических играх. Седловая точка. для выбора оптимальной стратегии используют принцип максимина: выбирай ту стратегию, чтобы при наихудшем для нас поведении противника получить максимальный выигрыш. Другими словами, принцип максимина предполагает выбор той стратегии, при которой наш минимальный выигрыш для различных стратегий максимален. Отсюда и название «принцип максимина».Как видно, принцип максимина - это принцип крайне осторожного игрока, но именно он является основным принципом теории матричных игр.
Для пояснения принципа максимина рассмотрим пример 1 матричной игры G (4х5) с платежной матрицей, приведенной на рис. 2.2.
Пример 1.
B Ai |
B1 |
B2 |
B3 |
B4 |
B5 |
i |
|
|
A1 |
5 |
6 |
7 |
4 |
5 |
4 |
|
|
A2 |
3 |
10 |
6 |
5 |
6 |
3 |
|
|
A3 |
12 |
5 |
3 |
9 |
8 |
3 |
|
|
A |
6 |
7 |
5 |
6 |
10 |
5 |
максимин
|
|
j |
12 |
10 |
7 |
9 |
10 |
|
|
|
|
|
|
минимакс
|
|
|
|
||
Какой
стратегией игроку А воспользоваться?
Есть соблазнительный выигрыш 12, при
применении стратегии А3.
Но при этом противник может выбрать
стратегию В3,
и игрок А получит выигрыш, равный всего
трем.Для определения оптимальной
стратегии в соответствии с принципом
максимина, запишем в правом добавочном
столбце платежной матрицы минимальное
значение i в
каждой строке (минимум строки). Из всех
значений i (правый
столбец) выделим наибольшее. Ему
соответствует стратегия А4.
Выбрав эту стратегию, мы во всяком случае
можем быть уверены, что при любом
поведении противника выигрыш будет не
менее пяти.Эта величина - наш гарантированный
выигрыш. Он называется нижней
ценой игры (или
«максимином» - максимальный из минимальных
выигрышей). Будем обозначать его .
В нашем примере
=
aij =5.
Теперь станем на точку зрения игрока В и порассуждаем за него. Выбирая стратегию, он хотел бы отдать поменьше, но должен рассчитывать на наихудшее для него поведение игрока А.Очевидно, осторожный противник должен выбрать стратегию, при которой величина j минимальна. Эта величина называетсяверхней ценой игры (или “минимаксом” - минимальный из максимальных проигрышей). Будем обозначать ее . В нашем примере = aij = 7.
Итак, исходя из принципа осторожности, игрок А должен выбрать стратегию А4, а его противник - В3. Такие стратегии называются максиминными или минимаксными стратегиями (вытекающие из принципа максимина).До тех пор, пока обе стороны в нашем примере будут придерживаться своих максиминных стратегий, выигрыш игрока А и проигрыш игрока В будет равен а43=5.
Седловая точка – это пара оптимальных стратегий (Ai, Bj). В этом случае число a=b называется (чистой) ценой игры (нижняя и верхняя цена игры совпадают) . Это означает, что матрица содержит такой элемент, который является минимальным в своей строке и одновременно максимальным в своем столбце. Проверяем, имеет ли платежная матрица седловую точку. Если да, то выписываем решение игры в чистых стратегиях.

aij
aij