
- •1. Математическое программирование
- •1.1. Линейное программирование
- •Упражнения
- •1.2. Решение задач линейного программирования в Microsoft Excel
- •Лабораторная работа № 1
- •1.3. Геометрическое решение задач линейного программирования
- •1.4. Симплекс-метод решения задач линейного программирования
- •1.4.1. Поиск опорного решения задачи линейного программирования
- •1.4.2. Поиск оптимального решения
- •Лабораторная работа № 2
- •1.5. Нелинейное программирование
- •Решение задач нелинейного программирования в Microsoft Excel
- •Решение задач нелинейного программирования методом Лагранжа
- •Лабораторная работа № 3
- •2. Динамическое программирование
- •Лабораторная работа № 4
- •3. Сетевое планирование
- •3.1. Этапы сетевого планирования
- •3.2. Пример сетевого планирования
- •4. Потоки в сетях
- •4.1. Алгоритм построения максимального потока в транспортной сети
- •4.2. Построение максимального потока в сетях с неориентированными дугами
- •Лабораторная работа № 5
- •5. Принятие решений в условиях неопределённости
- •5.1. Основные понятия теории игр
- •5.2. Платёжная матрица игры
- •5.3. Нижняя и верхняя цены игры. Принцип минимакса
- •5.4. Решение игр в смешанных стратегиях
- •Лабораторная работа № 6
- •Литература
5.4. Решение игр в смешанных стратегиях
Если парная игра не имеет седловой точки, то она не имеет и решения, то есть, делая личные ходы (или, говоря иначе, в чистых стратегиях), игрок A гарантирует себе выигрыш, равный нижней цене игры, которая, вообще говоря, меньше верхней цены игры.
Если же игрок A будет чередовать свои стратегии случайным образом или, говоря иначе, придерживаться смешанной стратегии, то он получит оптимальную стратегию, которая в некоторых случаях будет гарантировать ему бόльший выигрыш.
Определение. Пусть игрок A имеет m стратегий, а игрок B – n стратегий. Смешанной стратегией игрока A называется набор вероятностей SA = (p1, p2, …, pm), где p1 + p2 +… + pm = 1, с которыми он чередует свои стратегии.
Аналогично определяется смешанная стратегия игрока B как набор SB = (q1, q2, …, qm), где q1 + q2 +… + qn = 1.
Имеет место следующая теорема.
Теорема (основная теорема теории игр). Любая m n игра имеет решение в смешанных стратегиях и её решение может получено методами линейного программирования.
Доказательство. Пусть m n игра имеет матрицу
требуется найти решение игры, то есть две оптимальные смешанные стратегии игроков SA = (p1, p2, …, pm) и SB = (q1, q2, …, qm), где p1 + p2 +… + pm = 1 и q1 + q2 +… + qn = 1.
Во-первых, можно считать, что цена игры (пока неизвестная) больше нуля. Действительно, если 0, то это означает, что некоторые элементы матрицы игры не положительные. Тогда найдём число M > 0, которое прибавим ко всем элементам матрицы игры и получим новую матрицу с положительными элементами. Это сложение сделает новую цену игры + M положительной, но не изменит решения игры.
Во-вторых, предположим, что игрок A
применяет свою оптимальную смешанную
стратегию
,
а игрок B свою чистую
стратегию Bj.
В этом случае средний выигрыш игрока A
будет равен
Стратегия является оптимальной, то есть при любой стратегии игрока B средний выигрыш игрока A будет больше или равен цены игры , таким образом, получаем систему ограничений
Разделим обе части всех неравенств на положительное число и обозначим
тогда система ограничений примет вид
Далее, так как p1 + p2 +… + pm = 1, то
Игрок A стремится
максимизировать свой средний выигрыш
, то есть минимизировать
отношение
Таким образом, получаем задачу линейного программирования:
Заметим, что эта задача имеет решение,
найдя которое
найдём новую цену игры
,
вычтя из которой число M,
получим искомую цену игры.
Аналогичные рассуждения дают оптимальную
стратегию
игрока B:
обозначим
тогда оптимальная стратегия
игрока B есть решение
следующей задачи линейного программирования:
причём
Применим основную теорему теории игр для отыскания оптимальных стратегий игроков в игре "поиск".
1. Матрица игры "поиск"
содержит отрицательные элементы,
поэтому, прибавляя к её элементам число
M= 1, получим
2. Для нахождения оптимальной стратегии игрока A решаем следующую задачу линейного программирования:
Так как последняя система ограничений эквивалентна системе
то минимум функции
равен 1 и достигается при
Так как
то = 1. Вычитая из
число M = 1, получим, что
цена игры равна 0 = 1 – 1, а оптимальная
стратегия
Итак, чередуя свои обе стратегии с
вероятностями
,
игрок A гарантирует себе
средний выигрыш, равный 0, что больше
нижней цены игры -1 при чистых стратегиях.
Аналогичные рассуждения приводят к тому, что игрок B, чередуя свои стратегии с вероятностями , получает средний выигрыш, равный 0.