- •Теория принятия решений
- •Часть 2 нелинейное программирование, теория игр, многокритериальные задачи принятия решений
- •Введение
- •4. Нелинейное программирование
- •4.1. Характеристика задач
- •4.2. Условия оптимальности
- •4.3. Квадратичное программирование
- •4.4. Сепарабельное программирование
- •4.5. Задачи дробно-линейного программирования
- •4.6. Методы спуска
- •4.7. Методы одномерной минимизации
- •4.7.3. Метод деления интервала пополам
- •4.7.4. Метод золотого сечения
- •4.7.6. Метод первого порядка
- •4.8. Многомерный поиск безусловного минимума
- •4.8.1. Метод Гаусса – Зейделя (покоординатного спуска)
- •4.8.2. Метод Хука – Дживса (метод конфигураций)
- •4.8.3. Симплексный метод
- •4.8.4. Градиентные методы
- •4.8.6. Методы сопряженных направлений
- •4.8.7. Методы случайного поиска
- •Алгоритм с возвратом при неудачном шаге
- •Алгоритм с обратным шагом
- •Алгоритм наилучшей пробы
- •Алгоритм статистического градиента
- •4.8.8. Генетические алгоритмы
- •Исходная популяция
- •Результаты работы оператора скрещивания
- •Популяция первого поколения
- •4.9. Методы условной оптимизации
- •4.9.2. Метод проектирования градиента
- •4.9.3. Метод штрафных функций
- •Минимизация по методу Ньютона
- •4.9.4. Метод барьерных функций
- •Результаты поиска алгоритмом барьерных функций
- •4.9.5. Другие методы условной оптимизации
- •5. Методы теории игр в управлении
- •5.1. Теория игр в контексте теории принятия решений
- •5.2. Матричные игры с нулевой суммой
- •Использование линейной оптимизации при решении матричных игр. Пусть игра не имеет оптимального решения в чистых стратегиях, т.Е. Седловая точка отсутствует .
- •5.3. Игры с природой
- •5.4. Критерии, используемые для принятия решений
- •В играх с природой. Критерии, основанные
- •На известных вероятностях стратегий природы
- •Иногда неопределенность ситуации удается в некоторой степени ослабить с помощью нахождения вероятностей состояний на базе данных статистических наблюдений.
- •5.5. Оценка необходимости эксперимента
- •6. Многокритериальные задачи принятия решений
- •6.1. Основы многокритериальный оптимизации
- •6.2. Принцип оптимальности Парето.
- •6.3. Принцип равновесия по Нэшу
- •6.4. Конфликты, переговоры и компромиссы
- •6.5. Краткий обзор методов решения задачи векторной оптимизации
- •Значения компонентов вектор-функции
- •1. Оптимальность по Парето
- •Исходные данные для задачи оптимизации по Парето
- •Эффективность операции
- •2. Принятие решений в условиях неопределенности
- •Исходные данные для задачи принятия решения в условиях неопределенности
- •3. Многокритериальная оптимизация
- •Заключение
- •Библиографический список
- •Оглавление
- •Теория принятия решений
5.2. Матричные игры с нулевой суммой
Рассмотрим парную игру с нулевой суммой. Пусть игрок I имеет m стратегий (1, 2, …, m), а игрок II – n стратегий (1, 2, …, n). Такая игра называется матричной игрой размерности .
Предположим, игрок I выбрал одну из своих возможных стратегий i (), а игрок II, не зная результата выбора игрока I, – стратегию j (). Выигрыши игрока I и игрока II в результате выбора стратегий удовлетворяют соотношению ; таким образом, если ввести обозначение , то .
Элементы для каждой пары стратегий считаются известными и записываются в платежную матрицу (рис. 5.1), строки которой соответствуют стратегиям игрока I, а столбцы – стратегиям игрока II. Каждый положительный элемент матрицы определяет величину выигрыша игрока I и проигрыша игрока II при применении ими соответствующих стратегий. Естественно, целью игрока I является максимизация своего выигрыша, тогда как игрока II – минимизация своего проигрыша.
II I |
1 |
2 |
… |
n |
1 |
a11 |
a12 |
… |
a1n |
2 |
a21 |
a22 |
… |
a2n |
… |
… |
… |
… |
… |
m |
am1 |
am1 |
… |
amn |
Рис. 5.1. Платежная матрица
Решение парных матричных игр с нулевой суммой. Принцип минимакса. Используя платежную матрицу парной игры с нулевой суммой (см. табл. 5.1), определим наилучшую стратегию игрока I среди стратегий i () и наилучшую стратегию игрока II среди стратегий j ().
В теории игр предполагается, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все возможное для достижения своей цели.
Проанализируем стратегии игрока I. Игрок I, выбирая стратегию i, должен рассчитывать, что игрок II ответит на нее той из своих стратегий j, для которой выигрыш игрока I будет минимальным. Найдем минимальное число в каждой строке матрицы и, обозначив его , запишем в добавочный столбец платежной матрицы (рис. 5.2)
. (5.1)
Зная числа (свои выигрыши при применении i-х стратегий и разумном ответе игрока II), игрок I должен выбрать такую стратегию, для которой максимально. Обозначив это максимальное значение как α, (т.е. ) и используя формулу (5.1), получим
. (5.2)
I II |
1 |
2 |
. . . |
n | |
1 |
. . . | ||||
2 |
. . . | ||||
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
m |
. . . | ||||
. . . |
|
Рис. 5.2. Платежная матрица с добавочным столбцом
Величина представляет собой гарантированный выигрыш, который может обеспечить себе игрок I; она называется нижней ценой игры (максимином). Стратегия, обеспечивающая получение нижней цены игры , называется максиминной стратегией. Если игрок I будет придерживаться своей максиминной (перестраховочной) стратегии, то ему гарантирован выигрыш, не меньший при любом поведении игрока II.
В свою очередь, второй игрок стремится уменьшить свой проигрыш или, что то же самое, выигрыш игрока I обратить в минимум. В связи с этим для выбора своей наилучшей стратегии он должен найти максимальное значение выигрыша игрока I в каждом из столбцов и среди этих значений выбрать наименьшее. Обозначим через максимальный элемент в каждом столбце и запишем эти элементы в дополнительной строке (рис. 5.2). Наименьшее значение среди обозначим через ; эта величина представляет собой верхнюю цену игры (минимакс), которая определяется по формуле
. (5.3)
Стратегия игрока II, обеспечивающая «выигрыш» , является его минимаксной стратегией. Выбор минимаксной стратегии игроком II гарантирует ему проигрыш не больше .
В теории игр доказывается, что для нижней и верхней цены игры всегда справедливо неравенство:
.
Игры, для которых нижняя цена равна верхней, т.е. , называются играми с седловой точкой.
Общее значение нижней и верхней цены игры в играх с седловой точкой называется чистой ценой игры , а стратегии , позволяющие достичь этого значения, – оптимальными чистыми стратегиями; элемент является одновременно минимальным в i-й строке и максимальным в j-м столбце. Оптимальные стратегии определяют в игре положение равновесия, поскольку каждому из игроков невыгодно отходить от своей оптимальной стратегии. Чистую цену игры в игре с седловой точкой игрок I не может увеличить, а игрок II – уменьшить. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.
Игры без седловых точек. Итак, если матрица игры содержит седловую точку, то ее решение находится по принципу минимакса. Рассмотрим методику решения игры, в платежной матрице которой отсутствует седловая точка. Применение минимаксных стратегий каждым из игроков обеспечивает первому выигрыш не меньше α, а второму проигрыш не больше β. Учитывая, что α < β, естественно для игрока I желание увеличить выигрыш, а для игрока II – уменьшить проигрыш. Поиск такого решения приводит к применению сложной стратегии, состоящей в случайном применении двух и более чистых стратегий с определенными вероятностями. Такая сложная стратегия в теории игр называется смешанной. Смешанные стратегии игроков I и II будем обозначать соответственно, и , где , – вероятности применения соответствующих чистых стратегий. Очевидно, должны выполняться условия нормировки для вероятностей:
Одна из основных теорем теории игр утверждает, что любая конечная игра двух лиц с нулевой суммой имеет, по крайней мере, одно решение, возможно, в смешанных стратегиях. Из этой теоремы следует, что каждая конечная игра имеет цену. Обозначим ее так же, как чистую цену игры, через γ. Цена игры γ – средний выигрыш, приходящийся на одну партию, – всегда удовлетворяет условию α γ β, т.е. лежит между нижней (α) и верхней (β) ценами игры. Следовательно, каждый игрок при многократном повторении игры, придерживаясь смешанных стратегий, получает более выгодный для себя результат. Оптимальное решение игры в смешанных стратегиях так же, как и решение в чистых стратегиях, характеризуется тем, что каждый из игроков не заинтересован в отходе от своей оптимальной смешанной стратегии, если его противник применяет оптимальную смешанную стратегию, поскольку это ему невыгодно. Стратегии игроков, входящие в их оптимальные смешанные стратегии, называются активными.