
- •Курс лекций по дисциплине
- •Для специальностей
- •Минск 2010
- •Тема 19. Динамическое программирование 73
- •Тема 20. Использование имитационного моделирования в процессе принятия управленческих решений 89
- •Тема 21. Многокритериальные задачи теории принятия решений 103
- •Тема 22. Экспертизы и обработка экспертных оценок как база решения сложных проблемных ситуаций. Методы дерева целей и анализа иерархий 117
- •Тема 11. Предмет, задачи и основные понятия теории принятия решений Основные понятия и определения
- •11.1. Объект и предмет исследования теории принятия решений. Назначение теории принятия решений и ее основные понятия
- •11.2. Этапы процесса моделирования.
- •11.3. Классификация задач принятия решений
- •Вопросы для самоконтроля
- •Тема 12. Использование целочисленной оптимизации в задачах теории принятия решений Основные понятия и определения
- •12.1. Сущность целочисленной оптимизации (целочисленного линейного программирования (цлп))
- •Задача о распределении бюджета
- •12.2. Использование логических условий и формирование зависимых решений с помощью целочисленных переменных
- •Вопросы для самоконтроля
- •Тема 13. Игровые модели теории принятия решений Основные понятия и определения
- •13.1 Теория игр как раздел теории принятия решений. Матричные игры с нулевой суммой
- •Решение парных матричных игр с нулевой суммой. Принцип минимакса.
- •13.2 Игры без седловых точек. Использование линейной оптимизации
- •Вопросы для самоконтроля
- •Тема 14. Игры с природой Основные понятия и определения
- •14.1 Игры с природой в условиях риска
- •14.2 Игры с природой в условиях неопределенности
- •14.3 Многоэтапные процессы принятия решений
- •Вопросы для самоконтроля
- •Тема 15. Сетевые модели теории принятия решений Основные понятия и определения
- •15.1. Понятие о методах сетевого планирования и управления (спу)
- •15.2. Понятие о сетевых моделях и правила построения сетевых графиков
- •15.3. Расчет критического пути сетевого графика
- •Тема 16. Оптимизация сетевых потоков Основные понятия и определения
- •16.1. Задача о максимальном потоке
- •16.2. Задача о потоке минимальной стоимости
- •16.3. Задача о кратчайшем маршруте
- •Тема 17. Сетевое планирование в условиях неопределенности Основные понятия и определения
- •17.1. Общая характеристика, область использования и алгоритм определения временных параметров проекта по методу pert
- •17.2. Обоснование и использование центральной предельной теоремы при расчетах вероятности выполнения проекта в директивный срок
- •17.3. Понятие о стохастических сетях
- •18.1. Характеристика стохастических задач, решаемых в условиях риска
- •18.2. Простейшие методы решения стохастических задач: мм-постановка, mp-постановка (задача с вероятностными ограничениями), pp-постановка
- •Вопросы для самоконтроля
- •Тема 19. Динамическое программирование Основные понятия и определения
- •19.1. Понятие о динамическом программировании.
- •19.2. Принцип оптимальности Беллмана и алгоритм решения задач динамического программирования
- •19.3. Вероятностное динамическое программирование и марковские процессы принятия решений
- •19.4. Определение оптимальной стратегии, максимизирующей ожидаемый доход в случае конечного горизонта планирования
- •19.5. Определение оптимальной стратегии для процесса с бесконечным числом этапов (оптимальная долгосрочная стратегия)
- •Вопросы для самоконтроля
- •Тема 20. Использование имитационного моделирования в процессе принятия управленческих решений Основные понятия и определения
- •20.1 Виды имитационного моделирования
- •1. Произошло ли событие a?
- •Какое из нескольких событий произошло?
- •Какое значение приняла случайная величина ?
- •Какую совокупность значений приняли случайные величины ?
- •20.2 Имитационное моделирование как метод анализа инвестиционных проектов
- •20.3 Имитационное моделирование денежных потоков проекта
- •20.4 Имитационное моделирование чистой приведенной стоимости проекта
- •Вопросы для самоконтроля
- •Тема 21. Многокритериальные задачи теории принятия решений Основные понятия и определения
- •21.1 Классификация многокритериальных задач
- •21.2 Принцип оптимальности Парето.
- •21.3 Принцип равновесия по Нэшу
- •21.4 Обзор методов решения задач векторной оптимизации
- •1. Методы свертки системы показателей эффективности
- •Вопросы для самоконтроля
- •Тема 22. Экспертизы и обработка экспертных оценок как база решения сложных проблемных ситуаций. Методы дерева целей и анализа иерархий Основные понятия и определения
- •22.1 Экспертное оценивание важности объектов
- •22.1.1 Усреднение экспертных оценок
- •22.1.2 Попарное сравнение объектов
- •22.2 Назначение сложных экспертиз
- •22.3 Экспертный анализ сложной проблемы с помощью дерева целей
- •22.4 Метод анализа иерархий: особенности и область применимости
- •Вопросы для самоконтроля
Решение парных матричных игр с нулевой суммой. Принцип минимакса.
Используя платежную матрицу, определим наилучшие стратегии игроков.
В теории игр предполагается, что противники, участвующие в игре, одинаково разумны, и каждый из них делает все возможное для достижения своей цели.
Проанализируем
стратегии игрока I. Первый игрок, выбирая
стратегию
,
должен рассчитывать, что второй ответит
на нее той из своих стратегий
,
для которой выигрыш игрока I будет
минимальным. Найдем минимальное число
в каждой строке матрицы и, обозначив
его
,
запишем в добавочный столбец платежной
матрицы (см. табл. 2)
Зная
числа
(свои выигрыши при применении всех
стратегий и разумных ответах игрока
II), первый игрок должен выбрать такую
стратегию, для которой
максимально. Обозначив это максимальное
значение как
,
(т.е.
)
и используя (1), получим:
Таблица 13.2
I |
1 |
2 |
. . . |
|
|
1 |
|
|
. . . |
|
|
2 |
|
|
. . . |
|
|
. . . |
. . . |
. . . |
. . . |
. . . |
. . . |
|
|
|
. . . |
|
|
|
|
|
. . . |
|
|
Величина представляет собой гарантированный выигрыш, который может обеспечить себе первый игрок и называется нижней ценой игры (максимином). Стратегия, обеспечивающая получение нижней цены игры , называется максиминной стратегией. Если первый игрок будет придерживаться этой перестраховочной стратегии, то ему гарантирован выигрыш, не меньший при любом поведении второго игрока.
В
свою очередь, второй игрок стремится
уменьшить свой проигрыш или, - что то же
самое, - выигрыш первого игрока обратить
в минимум. Поэтому для выбора своей
наилучшей стратегии он должен найти
максимальное значение выигрыша первого
игрока в каждом из столбцов и среди этих
значений выбрать наименьшее. Обозначим
через
максимальный элемент в каждом столбце
и запишем эти элементы в дополнительной
строке табл. 2. Наименьшее значение среди
обозначим через
;
эта величина представляет собой верхнюю
цену игры (минимакс), которая определяется
по формуле:
Стратегия игрока II, обеспечивающая «выигрыш» , является его минимаксной стратегией. Выбор минимаксной стратегии игроком II гарантирует ему проигрыш не больше .
В теории игр доказывается, что для нижней и верхней цены игры всегда справедливо неравенство:
Игры,
для которых нижняя цена равна верхней,
т. е.
,
называются играми с
седловой точкой.
Общее
значение нижней и верхней цены игры в
играх с седловой точкой называется
чистой
ценой игры
,
а соответствующие стратегии
-
оптимальными
чистыми стратегиями.
Эти стратегии определяют положение
равновесия,
так как каждому из игроков невыгодно
отходить от своей оптимальной стратегии.
Если игра имеет седловую точку, то
говорят, что она решается в
чистых стратегиях.
Пример.
Компании A
и B
продают два вида лекарств. Компания A
рекламирует продукцию на радио (
),
телевидении (
)
и в газетах (
).
Компания B,
в дополнение к использованию радио (
),
телевидения (
)
и газет (
),
рассылает также по почте рекламные
проспекты (
).
В зависимости от качества и интенсивности
рекламной компании, каждая из них может
привлечь на свою сторону часть клиентов
конкурента. В Табл. 3 приведен процент
клиентов, привлеченных или потерянных
компанией A:
Таблица 13.3.
-
(минимумы
строк)
8
-2
9
-3
-
Максимин
3
6
5
6
8
5
-2
4
-9
5
-9
(максимумы
столбцов)
8
5
9
8
Минимакс
Если
компания A выбирает стратегию
,
то, независимо от реакции компании B,
наихудшим для нее результатом является
потеря 3% рынка в пользу конкурента.
Аналогично при выборе стратегии
наихудшим
исходом для компании A является увеличение
рынка на 5% за счет компании B. Наконец,
наихудшим исходом при выборе стратегии
является потеря компанией A 9 % в пользу
компании B. Чтобы достичь наилучшего
результата из наихудших, компания A
должна выбрать стратегию
.
Рассмотрим теперь стратегии компании B. Так как элементы матрицы являются платежами компании A, то наилучшей для компании B является стратегия .
Оптимальным решением игры является выбор стратегий и , т.е. обеим компаниям следует проводить рекламу на телевидении. При этом рынок компании A увеличится на 5 %. Так как в данном случае максимин и минимакс совпадают (5 %), то игра является игрой с седловой точкой, ее цена = 5%, и компании используют стратегии, соответствующие седловой точке.
Решение,
соответствующее седловой точке,
гарантирует, что ни одной компании нет
смысла пытаться выбрать другую стратегию.
Действительно, если компания B
перейдет к любой другой стратегии (
),
то компания A
может сохранить свой выбор стратегии
,
что приведет к большей потери рынка
компанией B
(6 или 8 процентов). По тем же причинам
компании A
нет смысла использовать другую стратегию
– если она использует, например, стратегию
,
то компания B
может использовать свою стратегию
и увеличить свой рынок на 9 %.