
- •Исследование операций
- •Основные определения
- •Примеры типичных задач исследования операций. Показатель эффективности.
- •Общая постановка задачи исследования операций Детерминированный случай
- •Постановка задачи в условиях неопределенности
- •Исследование операций случайных процессов с использованием цепей Маркова и уравнений Колмогорова Марковские случайные процессы
- •Марковские случайные процессы с дискретными состояниями и дискретным временем
- •Однородная марковская цепь
- •Неоднородная марковская цепь
- •Марковские случайные процессы с дискретными состояниями и непрерывным временем. Уравнения Колмогорова для вероятностей состояний.
- •Правила формирования уравнений Колмогорова
- •Пример построения и решения уравнений Колмогорова для однородной непрерывной марковской цепи
- •Теория игр и принятия решений Предмет и задачи теории игр. Основные понятия
- •Антагонистические матричные игры Платежная матрица
- •Нижняя и верхняя цена игры. Принцип минимакса
- •Устойчивые и неустойчивые стратегии. Игры с седловой точкой. Чистые стратегии
- •Целесообразность случайного выбора стратегии в игре без седловой точки
- •Смешанные стратегии. Основная теорема теории игр
- •Решение игры без седловой точки. Поиск оптимальных смешанных стратегий
- •Пример решения задачи на нахождение оптимальных смешанных стратегий
- •Графическое решение игр вида 2×n
Пример решения задачи на нахождение оптимальных смешанных стратегий
Решим задачу из примера 2. Напомним ее формулировку: игроки A и В одновременно и независимо друг от друга записывают одно из трех чисел: либо «1», либо «2», либо «3». Если сумма записанных чисел оказывается четной, то игрок B платит игроку A эту сумму. Если сумма нечетная, то эту сумму выплачивает игрок A игроку В.
Матрица игры:
-
Bj
Ai
B1
B2
B3
минимум
в строках
αi
A1
2
–3
4
–3
максимин
A2
–3
4
–5
–5
A3
4
–5
6
–5
максимум
в столбцах βj
4
4
6
минимакс
Седловая точка отсутствует (минимакс не равен максимину), поэтому оптимальными в этой игре будут не чистые, а смешанные стратегии, заключающиеся в случайном выборе игроками стратегий с определенными вероятностями. Определим эти вероятности.
Чтобы использовать рассмотренный выше метод решения, необходимо, чтобы цена игры была положительной. Для этого достаточно добавить к каждому элементу матрицы такое число, чтобы нижняя цена игры α (максимин) стала положительной. Смысл этого действия – не допустить возможность получения решения ν = 0, поскольку в дальнейшем необходимо использовать величину 1/ν. Поскольку ν не меньше нижней цены игры (ν ≥ α), то при α > 0 цена игры ν также будет больше нуля.
Добавим к каждому элементу матрицы значение 4. При этом цена игры увеличится на 4, но оптимальные стратегии от этого не изменятся. Получим матрицу M:
Найдем смешанную стратегию игрока A:
Как показано выше, для этого необходимо
решить оптимизационную задачу:
при ограничениях
Данная задача решается с помощью методов линейного программирования. Для решения можно воспользоваться системами компьютерной математики. Например, используя функцию linprog системы MATLAB, получаем решение:
x1 = 0.0625,
x2 = 0.1250,
x3 = 0.0625.
Учитывая, что
,
получаем:
,
откуда ν = 4. Подставляя
ν в выражения
получаем
p1 = 1/4,
p2 = 1/2,
p3 = 1/4.
Поскольку при определении оптимальной стратегии мы добавили к каждому элементу матрицы игры значение 4, вычтем его из полученного значения ν и получим истинную цену игры (средний выигрыш):
ν = 0.
Итак, если игрок A при многократном повторении игры будет придерживаться оптимальной смешанной стратегии
заключающейся в том, что A будет случайным образом выбирать в половине партий стратегию A2, в четверти партий – A1 и еще в четверти партий – A3, а противник B также будет придерживаться своей оптимальной стратегии, то игрок A в среднем ничего не выиграет и ничего не проиграет ("справедливая игра"). Если же противник B отклонится от своей оптимальной стратегии, то A может в среднем даже выиграть.
Определим теперь для игрока B
оптимальную смешанную стратегию
и убедимся, что цена игры будет той же
самой. Для этого необходимо решить
оптимизационную задачу:
при ограничениях
Решение этой задачи:
y1 = 0.0625,
y2 = 0.1250,
y3 = 0.0625,
.
(Решение для игрока B совпало с решением для игрока A в силу того, что матрица игры симметричная. В общем случае при несимметричной матрице игры решения не обязаны совпадать.)
Вероятности для игрока B:
q1 = 1/4,
q2 = 1/2,
q3 = 1/4.
Цена игры (после вычитания добавленного значения 4):
ν = 0.
Итак, оптимальные смешанные стратегии для игроков:
Если при проведении серии игр игроки будут придерживаться этих оптимальных смешанных стратегий, то в среднем никто не выиграет и не проиграет. Если один из игроков отклонится от своей оптимальной стратегии, то другой игрок получит преимущество.