Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Саратовский Государственный Технический Университет им. Ю.А. Гагарина

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Миргородская 7сессия / Методы оптимизации / Лекции / Лекция 5.doc

Скачиваний:

Добавлен:

12.02.2015

Размер:

3.41 Mб

Скачать

☆

<<< < Предыдущая 1 2 34 / 74 5 6 7 > Следующая >>>

Двойственные задачи линейного программирования

Двойственность ЛП имеет прямое отношение к теории игр и наоборот.

Введем понятие двойственной пары задач ЛП. Рассмотрим две следующие задачи ЛП:

Две задачи ЛП 1,2,3 и 1а,2а,3а называются взаимнодвойственными, если:

матрицы системы ограничения являются взаимнотранспонированными;
число неизвестных в первой задаче равно числу ограничений во второй и наоборот, число неизвестных во второй задаче равно числу ограничений в первой;
первые члены системы ограничений первой задачи являются коэффициентами целевой функции второй задачи, и свободные члены второй задачи являются коэффициентами целевой функции первой задачи;
в первой задаче ищется минимум целевой функции, во второй максимум; в первой задаче система ограничений , во второй.

Теорема теории двойственности.

Если одна из двойственных задач имеет решение, то решение имеет и вторая. Причем экстремумы (оптимумы) обеих задач совпадают.

Матричная игра и линейное программирование

Исходя существа матричной игры и определения понятия цены игры можно записать следующие соотношения для компонент оптимальных смешанных стратегий игроков и

Максимизирующий игрок

Минимизирующий игрок

Сравнивая данную «двойную» задачу ЛП с определением двойственной пары мы видим, что задача решения матричной игры сводится к эквивалентной ей задаче двойственного линейного программирования. Отсюда следуют два вывода:

решение игр может быть получено решением двойственных задач ЛП;
принципиально задачи ЛП могут решаться методами теории игр.

Для решения двойственных задач разработан двойственный симплекс-метод.

Теорема двойственности обосновывает применение смешанных стратегий в теории игр и доказывает существование оптимальных смешанных стратегий и существование цены игры.

Метод Робинсон

Этот метод является итерационным методом решения игры достаточно большой размерности и принципиально на основании предыдущих методов может применяться и при решении двойственных задач ЛП.

Достоинство - простота, недостаток – плохая сходимость.

Идея метода: разыгрывается мысленный эксперимент, в котором реализуются элементарные партии.

Начинает первый игрок, он выбирает некоторую свою стратегию, на что противник отвечает своей стратегией b_j. При этом он стремится выбрать b_j так, чтобы определенная стратегия первого игрока выигрыш обращала в минимум. Первый игрок выбирает в своих стратегиях a_k максимальную, чтобы его выигрыш был максимален при стратегии b_j. Второй игрок выбирает такую стратегию, которая дает наихудший средний выигрыш для двух предыдущих стратегий первого игрока…

Таким образом на каждом шаге каждый игрок отвечает такой своей стратегией, которая оптимальна для него относительно всех предыдущих ходов обоих игроков.

Такое поведение рассматривается как смешанное, в котором чистые стратегии представляются в пропорциях соответствующих частоте их применения на предыдущих шагах.

Это как бы обучение игроков в процессе игр, когда каждый из них прощупывает способ поведения противника. Если эта имитация идет достаточно долго, то средний выигрыш приближается к цене игры, а частота применения стратегий противником стремится к составляющим оптимальной стратегии.

Пример: Игра 33

a\b	b	b₂	b₃
a₁	8	2	4
a₂	4	5	6
a₃	1	7	3

n	i	b₁	b₂	b₃	j	a₁	a₂	a₃
1	3	1 min	7	3	1	8 max	4	1	1 b₁	8 a₁	4.5
2	1	9	9	7	3	12	10	4	3.5	6	4.75
3	1	17	11	11	2	14	15	11	3.67	5	4.33
4	2	21	16	17	2	16	20	18	4	5	4.5
5	2	25	21	23	2	18	25	25	4.2	5	4.6
…	…	…	…	…	…	…	…	…	…	…	…
18	2	79	84	91	1	86	83	84	4.39	4.78	4.58