- •Курс лекций по дисциплине
- •Для специальностей
- •Минск 2010
- •Тема 19. Динамическое программирование 73
- •Тема 20. Использование имитационного моделирования в процессе принятия управленческих решений 89
- •Тема 21. Многокритериальные задачи теории принятия решений 103
- •Тема 22. Экспертизы и обработка экспертных оценок как база решения сложных проблемных ситуаций. Методы дерева целей и анализа иерархий 117
- •Тема 11. Предмет, задачи и основные понятия теории принятия решений Основные понятия и определения
- •11.1. Объект и предмет исследования теории принятия решений. Назначение теории принятия решений и ее основные понятия
- •11.2. Этапы процесса моделирования.
- •11.3. Классификация задач принятия решений
- •Вопросы для самоконтроля
- •Тема 12. Использование целочисленной оптимизации в задачах теории принятия решений Основные понятия и определения
- •12.1. Сущность целочисленной оптимизации (целочисленного линейного программирования (цлп))
- •Задача о распределении бюджета
- •12.2. Использование логических условий и формирование зависимых решений с помощью целочисленных переменных
- •Вопросы для самоконтроля
- •Тема 13. Игровые модели теории принятия решений Основные понятия и определения
- •13.1 Теория игр как раздел теории принятия решений. Матричные игры с нулевой суммой
- •Решение парных матричных игр с нулевой суммой. Принцип минимакса.
- •13.2 Игры без седловых точек. Использование линейной оптимизации
- •Вопросы для самоконтроля
- •Тема 14. Игры с природой Основные понятия и определения
- •14.1 Игры с природой в условиях риска
- •14.2 Игры с природой в условиях неопределенности
- •14.3 Многоэтапные процессы принятия решений
- •Вопросы для самоконтроля
- •Тема 15. Сетевые модели теории принятия решений Основные понятия и определения
- •15.1. Понятие о методах сетевого планирования и управления (спу)
- •15.2. Понятие о сетевых моделях и правила построения сетевых графиков
- •15.3. Расчет критического пути сетевого графика
- •Тема 16. Оптимизация сетевых потоков Основные понятия и определения
- •16.1. Задача о максимальном потоке
- •16.2. Задача о потоке минимальной стоимости
- •16.3. Задача о кратчайшем маршруте
- •Тема 17. Сетевое планирование в условиях неопределенности Основные понятия и определения
- •17.1. Общая характеристика, область использования и алгоритм определения временных параметров проекта по методу pert
- •17.2. Обоснование и использование центральной предельной теоремы при расчетах вероятности выполнения проекта в директивный срок
- •17.3. Понятие о стохастических сетях
- •18.1. Характеристика стохастических задач, решаемых в условиях риска
- •18.2. Простейшие методы решения стохастических задач: мм-постановка, mp-постановка (задача с вероятностными ограничениями), pp-постановка
- •Вопросы для самоконтроля
- •Тема 19. Динамическое программирование Основные понятия и определения
- •19.1. Понятие о динамическом программировании.
- •19.2. Принцип оптимальности Беллмана и алгоритм решения задач динамического программирования
- •19.3. Вероятностное динамическое программирование и марковские процессы принятия решений
- •19.4. Определение оптимальной стратегии, максимизирующей ожидаемый доход в случае конечного горизонта планирования
- •19.5. Определение оптимальной стратегии для процесса с бесконечным числом этапов (оптимальная долгосрочная стратегия)
- •Вопросы для самоконтроля
- •Тема 20. Использование имитационного моделирования в процессе принятия управленческих решений Основные понятия и определения
- •20.1 Виды имитационного моделирования
- •1. Произошло ли событие a?
- •Какое из нескольких событий произошло?
- •Какое значение приняла случайная величина ?
- •Какую совокупность значений приняли случайные величины ?
- •20.2 Имитационное моделирование как метод анализа инвестиционных проектов
- •20.3 Имитационное моделирование денежных потоков проекта
- •20.4 Имитационное моделирование чистой приведенной стоимости проекта
- •Вопросы для самоконтроля
- •Тема 21. Многокритериальные задачи теории принятия решений Основные понятия и определения
- •21.1 Классификация многокритериальных задач
- •21.2 Принцип оптимальности Парето.
- •21.3 Принцип равновесия по Нэшу
- •21.4 Обзор методов решения задач векторной оптимизации
- •1. Методы свертки системы показателей эффективности
- •Вопросы для самоконтроля
- •Тема 22. Экспертизы и обработка экспертных оценок как база решения сложных проблемных ситуаций. Методы дерева целей и анализа иерархий Основные понятия и определения
- •22.1 Экспертное оценивание важности объектов
- •22.1.1 Усреднение экспертных оценок
- •22.1.2 Попарное сравнение объектов
- •22.2 Назначение сложных экспертиз
- •22.3 Экспертный анализ сложной проблемы с помощью дерева целей
- •22.4 Метод анализа иерархий: особенности и область применимости
- •Вопросы для самоконтроля
19.4. Определение оптимальной стратегии, максимизирующей ожидаемый доход в случае конечного горизонта планирования
Модель вероятностного динамического программирования
с конечным числом этапов
Пусть что в нашем примере срок аренды участка земли агрофирмой истекает через N лет. В этом случае необходимо определить стратегию поведения для каждого года при конечном горизонте планирования. Очевидно, оптимальной стратегией будет такая, при которой агрофирма получит наибольший ожидаемый доход за этот срок.
Пусть
обозначает две возможные (альтернативные)
стратегии поведения фирмы. Будем
использовать матрицы переходных
вероятностей и функций дохода
,
заданные формулами (1)-(4).
Задачу ВДП можно сформулировать следующим образом. Пусть число состояний для каждого этапа (года) равно m (в нашей задаче m = 3).
Обозначим
через
оптимальный ожидаемый
доход,
полученный
на этапах от n
до N
включительно при условии, что система
находится в начале этапа n
в состоянии
.
Обратное
рекуррентное соотношение, связывающее
,
имеет вид:
причем
Уравнение
(5) учитывает то, что накапливающийся
доход
образуется в результате перехода из
состояния
на этапе n
+1 с вероятностью
.
Введя обозначение
рекуррентное уравнение ВДП можно записать в виде:
В нашей задаче, например, в случае, когда удобрения не используются (k = 1), получим
Таким образом, если состояние почвы в начале года оказывается хорошим, то при одном переходе ожидаемый годовой доход составляет 5,3, при удовлетворительном 3, и при плохом - 1 (убыток).
Рассмотрим задачу о стратегии агрофирмы с горизонтом планирования 3 года (N = 3) и матрицами (19.9)-(19.12).
Полученные рекуррентным способом значения параметров задачи сведены в таблицы, представленные ниже.
Таблица 19.1. Выигрыш для каждого этапа
-
1
5,3
4,7
2
3
3,1
3
-1
0,4
Этап 3.
|
|
Оптимальное решение |
||
|
|
|
|
|
1 |
5,3 |
4,7 |
5,3 |
1 |
2 |
3 |
3,1 |
3,1 |
2 |
3 |
-1 |
0,4 |
0,4 |
2 |
Этап 2.
|
|
Оптимальное решение |
||
|
|
|
|
|
1 |
|
|
8,19 |
2 |
2 |
|
|
5,61 |
2 |
3 |
|
|
2,13 |
2 |
Этап 1.
|
|
Оптимальное решение |
||
|
|
|
|
|
1 |
|
|
10,74 |
2 |
2 |
|
|
7,92 |
2 |
3 |
|
|
4,23 |
2 |
Оптимальное
решение показывает, что в 1-й и 2-й годы
агрофирма должна применять удобрения
(
)
независимо от состояния почвы. На третий
год следует применять удобрения только
тогда, когда система находится в
состояниях 2 или 3 (т.е. при удовлетворительном
или плохом состояниях почвы). Суммарный
ожидаемый доход за три года составит
при хорошем состоянии системы в первый
год,
- при удовлетворительном состоянии
системы в первый год и
при плохом состоянии.
Рассмотрим второй вариант ВДП – модель с бесконечным числом этапов.
