Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпора по ИСО.doc
Скачиваний:
3
Добавлен:
01.03.2025
Размер:
1.37 Mб
Скачать

Выбор наилучшего исхода.

Опр. Исход доминирует над , , , если , или . Обозначим через мн-во недоминируемых исходов по Парето.

Каждый из игроков выбирает ходы, чтобы их исходы были оптимальными по Парето, а доминируемые исходы можно исключить.

Опр. Осторожной стратегией для 1 игрока называется ход, выбираемый по правилу , , , т.е. при своем ходе 1 игрок предполагает, что 2 ответит худшим ходом, а потом среди них 1 игрок может гарантировать выигрыш не менее .

Опр. Осторожной стратегией для 2 игрока называется ход, выбираемый по правилу , , , игрок может гарантировать выигрыш не менее .

Опр. Исход называется оптимальным по Нэшу, если для любого , одновременно для любого , т.е. такой исход означает, что если соперник придерживается хода из него, то тебе не выгодно от него отклоняться.

1.8-1.15. Матричные игры. Постановка. Верхняя и нижняя цены игры. Седловая точка. Смешанные стратегии. Основная теорема матричных игр. Решение игры 2 2, m 2, 2 n, m n. Метод Брауна – Робинсона. Упрощение матричных игр.

Постановка задачи.

Пусть у первого игрока имеются ходы , а у второго игрока – .

Если первый игрок выбирает ход , а второй , то придем к исходу ( , ). Пусть для этого исхода выигрыши будут следующие: . Такая игра однозначно задается матрицей

Матрица А называется платежной матрицей.

, , т.е. интерес игроков взаимно-противоположен.

Т.о., выбирая свой ход , на самом деле игрок выбирает -ую строку матрицы , а второй игрок выбирает ход , т.е. -ый столбец матрицы . После этого находятся элементы матрицы и производится расчет между игроками. Первый игрок «получает от второго» число , а второй ему эту сумму «выплачивает», поскольку может иметь знак «-». Цель первого игрока выбрать такой свой ход, чтобы было как можно больше, желательно положительно. Цель второго выбрать такой ход, чтобы число было как можно меньше, желательно отрицательное. В результате каждого исхода ( ) могут быть 3 случая:

если >0, то первый игрок выигрывает,

если <0, то второй игрок выигрывает,

если =0, то соперники остаются при своих.

Розыгрыши могут производиться однократно, многократно, но конечное число раз, бесконечное число раз.

Цель в первом случае максимизировать однократный выигрыш, максимизировать средний выигрыш, максимизировать мат.ожидание, для второго – минимизировать эти величины.

Определение. Нижней ценой игры называется число .

Число соответствует осторожной стратегии первого игрока. Он предполагает, что на каждый выбор им строки, второй игрок выберет минимальный элемент в ней, а затем из этих минимальных выбирается наибольший. Соответствующая строка и даст осторожную стратегию. И в результате первый игрок может себе гарантировать выигрыш не меньше .

Определение. Верхней ценой игры называется число .

Оно соответствует осторожной стратегии второго игрока. Он вычисляет в каждом столбце наибольший элемент, а потом из этих чисел выбирает наименьшее. Соответствующий столбец и будет осторожным для второго игрока и при этом гарантирует себе проигрыш не больше .

Определение. Если в некоторой игре , то говорят, что у игры существует седловая точка – это такой элемент , который является минимальным в своей строке и максимальным в своем столбце .