- •Основания теории оптимизации (теоремы о необходимости и достаточности существования экстремума функции многих переменных).
- •5.2.Достаточные условия экстремума.
- •Матрица Гессе и вектор-градиент функции многих переменных. Привести пример определения (функцию многих переменных задать самостоятельно).
- •Методы одномерного поиска экстремума. Метод золотого сечения.
- •Методы одномерного поиска экстремума. Метод поиска с использованием чисел Фибоначчи.
- •Методы одномерного поиска экстремума. Метод квадратической интерполяции.
- •Графический метод решения задач квадратичного программирования.
- •Метод множителей Лагранжа.
- •Алгоритм обобщенного метода множителей Лагранжа.
- •Градиентные методы решения задач нелинейного программирования.
- •Метод тяжелого шарика.
- •Эвристические методы поиска экстремума. Метод Монте-Карло.
- •Гомеостат Эшби и его связь со случайным поиском.
- •Методы случайного поиска.
- •Алгоритм случайного спуска с линейной тактикой
- •Алгоритмы эволюционной оптимизации. Муравьинный алгоритм.
- •Алгоритмы эволюционной оптимизации. Роевой алгоритм.
- •В чем состоит смысл когнитивной составляющей алгоритма поиска с роевым интеллектом?
- •Виды игр (безкоалиционные, кооперативные, дифференциальные и другие).
- •Игра двух участников с нулевой суммой. Решение игры двух участников с нулевой суммой в смешанных стратегиях.
- •Графо-аналитический метод решения матричной игры 2 х n и m х 2.
- •Решение игр вида 2хn и mх2
Игра двух участников с нулевой суммой. Решение игры двух участников с нулевой суммой в смешанных стратегиях.
Антагонистическая игра (игра с нулевой суммой, англ. zero-sum) — термин теории игр. Антагонистической игрой называется некооперативная игра, в которой участвуют два игрока, выигрыши которых противоположны.
Формально
антагонистическая игра может быть
представлена тройкой <X, Y, F>,
где X и Y —
множества стратегий первого
и второго игроков, соответственно; F —
функция выигрыша первого игрока, ставящая
в соответствие каждой паре стратегий
(ситуации) (x,y),
действительное
число, соответствующее полезности
первого игрока при реализации данной
ситуации. Так как интересы игроков
противоположны, функция F одновременно
представляет и проигрыш второго игрока.
Исторически антагонистические игры являются первым классом математических моделей теории игр, при помощи которых описывались азартные игры. Считается, что благодаря этому предмету исследования теория игр и получила свое название. В настоящее время антагонистические игры рассматриваются как часть более широкого класса некооперативных игр.
X \ Y |
Орел |
Решка |
Орел |
-1, 1 |
1, -1 |
Решка |
1, -1 |
-1, 1 |
Простейшим примером антагонистической игры является игра «Орлянка». Первый игрок прячет монету орлом или решкой вверх, а второй пытается угадать, как она спрятана. Если он не угадывает — он платит первому одну денежную единицу, если угадывает — первый платит ему одну денежную единицу.
В данной игре каждый участник имеет две стратегии: «орел» и «решка». Множество ситуаций в игре состоит из четырех элементов. В строках таблицы указаны стратегии первого игрока х, в столбцах — стратегии второго игрока y. Для каждой из ситуаций указаны выигрыши первого и второго игроков.
В аналитическом виде функция выигрыша первого игрока имеет следующую форму:
где x ∈ X и y ∈ Y — стратегии первого и второго игроков, соответственно.
Так как
выигрыш первого игрока равен проигрышу
второго, то
.
Если результат полностью определяется игроком, совершившим последний ход (если правила хода идентичны для игроков), стратегия может быть найдена с помощью функции Гранди.
Матричная игра. Максминные и минимаксные стратегии, ситуации равновесия, смешанное расширение игры.
Матричная игра – это конечная игра двух игроков с ненулевой суммой, в которой задается выигрыш игрока 1 в вид матрицы (строка матрицы соответствует номеру применяемой стратеги игрока 2, столбец – номеру применяемой стратеги игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применемым стратегия ).
Смешанной стратегией называетс полный набор вероятностей применения его чистых стратегий
Сведение матричной игры к задаче линейного программирования. Доминирование стратегий.
Пусть
имеется произвольная матричная игра
без седловой точки с платёжной матрицей
.
Как известно, основная задача теории
игр заключается в определении оптимальных
стратегий игроков и цены игры. Пусть
−
оптимальные смешанные стратегии
игроков А и В соответственно.
Соотношения
между
и
ценой игры
можно
формализовать в виде системы неравенств:
(13.1)
причём
и
Аналогично
соотношения между
и
ценой игры
можно
формализовать в виде системы неравенств:
(13.2)
и
Пусть
Если
всегда
можно так преобразовать матричную игру,
чтобы сделать её цену положительной.
Положив
и
разделим
неравенства системы (13.1) и (13.2) на
Получим
следующие соотношения (табл. 13.1).
Таблица 13.1
Игрок А |
Игрок В |
Стремится максимизировать выигрыш
|
Стремится минимизировать проигрыш
|
Очевидно, в левом столбце табл. 13.1 записана стандартная задача минимизации линейного программирования, а в её правом столбце − стандартная задача максимизации линейного программирования. Кроме того, представленные в табл. 13.1 задачи линейного программирования образуют пару симметричных взаимодвойственных задач. Решив данные задачи линейного программирования (см. пункт 9) симплекс-методом, получим и решение матричной игры:
− цену
игры
;
− оптимальные
смешанные стратегии
и
