- •Оптимизация в конфликтных ситуациях. Теория игр
- •Основные объекты игры
- •Понятие о равновесной ситуации
- •Понятие о стратегически эквивалентных играх
- •Понятие седловой точки
- •Матричные игры
- •Понятие смешанной стратегии
- •Свойства цены игры и оптимальных стратегий
- •Методы решения игр Игра 22.
- •Двойственные задачи линейного программирования
- •Матричная игра и линейное программирование
- •Метод Робинсон
- •Бесконечные игры
- •Выпуклые игры
- •Элементы теории статистических игр
- •Статистические игры без эксперимента
- •Статистическая игра с единичным экспериментом
- •Статистическая игра с единичным неидеальным экспериментом
Двойственные задачи линейного программирования
Двойственность ЛП имеет прямое отношение к теории игр и наоборот.
Введем понятие двойственной пары задач ЛП. Рассмотрим две следующие задачи ЛП:
Две задачи ЛП 1,2,3 и 1а,2а,3а называются взаимнодвойственными, если:
матрицы системы ограничения являются взаимнотранспонированными;
число неизвестных в первой задаче равно числу ограничений во второй и наоборот, число неизвестных во второй задаче равно числу ограничений в первой;
первые члены системы ограничений первой задачи являются коэффициентами целевой функции второй задачи, и свободные члены второй задачи являются коэффициентами целевой функции первой задачи;
в первой задаче ищется минимум целевой функции, во второй максимум; в первой задаче система ограничений , во второй.
Теорема теории двойственности.
Если одна из двойственных задач имеет решение, то решение имеет и вторая. Причем экстремумы (оптимумы) обеих задач совпадают.
Матричная игра и линейное программирование
Исходя существа матричной игры и определения понятия цены игры можно записать следующие соотношения для компонент оптимальных смешанных стратегий игроков и
-
Максимизирующий игрок
Минимизирующий игрок
Сравнивая данную «двойную» задачу ЛП с определением двойственной пары мы видим, что задача решения матричной игры сводится к эквивалентной ей задаче двойственного линейного программирования. Отсюда следуют два вывода:
решение игр может быть получено решением двойственных задач ЛП;
принципиально задачи ЛП могут решаться методами теории игр.
Для решения двойственных задач разработан двойственный симплекс-метод.
Теорема двойственности обосновывает применение смешанных стратегий в теории игр и доказывает существование оптимальных смешанных стратегий и существование цены игры.
Метод Робинсон
Этот метод является итерационным методом решения игры достаточно большой размерности и принципиально на основании предыдущих методов может применяться и при решении двойственных задач ЛП.
Достоинство - простота, недостаток – плохая сходимость.
Идея метода: разыгрывается мысленный эксперимент, в котором реализуются элементарные партии.
Начинает первый игрок, он выбирает некоторую свою стратегию, на что противник отвечает своей стратегией bj. При этом он стремится выбрать bj так, чтобы определенная стратегия первого игрока выигрыш обращала в минимум. Первый игрок выбирает в своих стратегиях ak максимальную, чтобы его выигрыш был максимален при стратегии bj. Второй игрок выбирает такую стратегию, которая дает наихудший средний выигрыш для двух предыдущих стратегий первого игрока…
Таким образом на каждом шаге каждый игрок отвечает такой своей стратегией, которая оптимальна для него относительно всех предыдущих ходов обоих игроков.
Такое поведение рассматривается как смешанное, в котором чистые стратегии представляются в пропорциях соответствующих частоте их применения на предыдущих шагах.
Это как бы обучение игроков в процессе игр, когда каждый из них прощупывает способ поведения противника. Если эта имитация идет достаточно долго, то средний выигрыш приближается к цене игры, а частота применения стратегий противником стремится к составляющим оптимальной стратегии.
Пример: Игра 33
a\b |
b |
b2 |
b3 |
a1 |
8 |
2 |
4 |
a2 |
4 |
5 |
6 |
a3 |
1 |
7 |
3 |
n |
i |
b1 |
b2 |
b3 |
j |
a1 |
a2 |
a3 | |||
1 |
3 |
1 min |
7 |
3 |
1 |
8 max |
4 |
1 |
1 b1 |
8 a1 |
4.5 |
2 |
1 |
9 |
9 |
7 |
3 |
12 |
10 |
4 |
3.5 |
6 |
4.75 |
3 |
1 |
17 |
11 |
11 |
2 |
14 |
15 |
11 |
3.67 |
5 |
4.33 |
4 |
2 |
21 |
16 |
17 |
2 |
16 |
20 |
18 |
4 |
5 |
4.5 |
5 |
2 |
25 |
21 |
23 |
2 |
18 |
25 |
25 |
4.2 |
5 |
4.6 |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
… |
18 |
2 |
79 |
84 |
91 |
1 |
86 |
83 |
84 |
4.39 |
4.78 |
4.58 |
В таблице n – номер партии;
i – стратегия в этой партии первого игрока;
j – стратегия в этой партии второго игрока;
- средний верхний выигрыш за предыдущие партии;
- средний нижний выигрыш за предыдущие партии;
- средний выигрыш за все предыдущие партии.
В таблице выделены значения общего выигрыша за все предыдущие партии, на которые ориентируется противоположный игрок в выборе следующего хода.
При проведении достаточно большого числа итераций получим более точные результаты:
N=18;
4.6;
x14/18;
x211/18;
x33/18;
y18/18;
y29/18;
y31/18.