
- •Раздел 1. Общие понятия экономико-математического моделирования 6
- •Раздел 2. Линейные оптимизационные экономико-математические
- •Раздел 1
- •1.1. Понятие модели и процесса моделирования
- •1.2. Классификация моделей
- •1.3. Основные этапы математического моделирования
- •1.4. Особенности математического моделирования экономических систем
- •Раздел 2
- •2.1. Основные линейные оптимизационные задачи и их решение в среде excel
- •2.2. Многопродуктовая транспортная задача
- •2.3. Задача распределения кредита предприятиям с целью получения максимальной прибыли по процентам
- •2.4. Задача о назначениях и ее решение с помощью алгоритма венгерского метода
- •2.5. Задача коммивояжера (о переналадках оборудования) и ее решение с помощью алгоритма литтла
- •Раздел 3
- •3.1. Матричная модель планирования в. Леонтьева
- •3.2. Задача о нахождении равновесных цен на товары
- •3.3. Задача о максимизации суммарного конечного потребления товаров
- •Раздел 4
- •4.1. Общие принципы динамического программирования
- •Принцип оптимальности Беллмана
- •Уравнение Беллмана. Решение исходной задачи
- •4.2. Задача о кратчайшем расстоянии и ее решение методом динамического программирования
- •4.3. Задача о распределении средств и ее решение методом динамического программирования
- •4.4. Задача о замене оборудования и ее решение методом динамического программирования
- •Раздел 5
- •5.1. Основные элементы системы массового обслуживания (смо)
- •5.2. Расчет вероятностей состояний смо
- •5.3. Основные характеристики работы смо
- •Раздел 6
- •6.1. Понятие об игровых моделях
- •6.2. Платежная матрица. Нижняя и верхняя цена игры
- •6.3. Решение игр в смешанных стратегиях
- •6.4. Приведение матричной игры к задаче линейного программирования
- •6.5. Статистические игры
- •А) Случай известных априорных вероятностей qj состояний природы
- •Б) Случай неизвестных априорных вероятностей состояний природы
- •Раздел 7
- •7.1. Основные понятия теории управления запасами
- •7.2. Модель уилсона
- •7.3. Модель с конечной интенсивностью поступления заказа
- •7.4. Некоторые многономенклатурные модели
- •7.5. Страховой запас
- •Раздел 8
- •8.1. Сетевые графики и правила их построения
- •8.2. Расчет временных параметров сетевого графика
- •8.3. Оптимизация сетевого графика по времени
- •8.4. Оптимизация сетевого графика по ресурсам
- •Алгоритм оптимизации комплекса работ по распределению ресурсов
- •8.5. Оптимизационные задачи сетевого планирования по стоимости
- •Алгоритм оптимизации комплекса работ по стоимости
- •Вопросы к зачету
- •8. Общие принципы динамического программирования.
- •Литература
Принцип оптимальности Беллмана
Последовательность состояний S вместе с процессами перехода из одного состояния в другое называют траекторией системы S. Траекторию можно задать в виде схемы:
где символами
отмечены процессы перехода S
из состояния
в
под действием управления
.
Каждой траектории соответствует
некоторое значение функции
.
Траектория, на которой достигается
экстремум функции F
(при конкретных m
и y),
называется оптимальной
траекторией.
По-другому, траектория, соответствующая
оптимальному управлению, называется
оптимальной
траекторией.
Разобьем оптимальную
траекторию
на два куска
и
Принцип оптимальности гласит: последний кусок оптимальной траектории является оптимальной траекторией. По–другому: если
оптимальное
управление, то составляющая
также является оптимальным управлением.
Доказательство
принципа оптимальности легко проводится
рассуждением от противного. Пусть
– оптимальная траектория. В силу
аддитивности, значение
целевой функции на оптимальной траектории
можно представить в виде суммы двух
слагаемых
,
где
– значение целевой функции на траектории
.
Если предположить, что
не является оптимальной, то существует
траектория
для которой значение
более экстремально, чем
.
Тогда значение
менее экстремально, чем
,
т.е траектория
не является оптимальной, хотя по
предположению она оптимальная. Полученное
противоречие и доказывает принцип
оптимальности.
Уравнение Беллмана. Решение исходной задачи
Построение функции Беллмана начинают с последнего этапа. Именно
(4.1.6)
т.е. для каждого
определяется управление
,
при котором известная функция
принимает экстремальное значение,
равное
.
Обычно задача (4.1.6) значительно проще
задачи (4.1.3).
Предположим теперь,
что функция
уже построена для всех
Тогда при
в силу аддитивности целевой функции
имеем:
(4.1.7)
Перебирая значения
,
для каждого из них получим оптимальное
управление
,
на котором достигается экстремум функции
(4.1.7).
Уравнение (4.1.7) называется функциональным уравнением Беллмана. Оно имеет рекуррентный характер, т.е. значения функции Беллмана на предыдущем этапе выражаются через ее значения на последующем этапе. Соотношение (4.1.6), которое получается из (4.1.7) при k = n – 1 и B(y, n) = 0, можно считать краевым условием для уравнения Беллмана.
Разворачивая процесс построения функции Беллмана от конца к началу по формулам (4.1.5), (4.1.6), получим последовательность оптимальных управлений с соответствующими значениями функции B(y, m):
(4.1.8)
Укажем, как получить
решение исходной задачи. Пусть
– начальное состояние S
(в момент
).
Просматривая ряд (4.1.8) от начала к концу,
находим
– оптимальное управление на первом
этапе,
– оптимальное значение целевой функции
за весь процесс. Далее
– оптимальное
состояние системы после первого этапа,
и
– оптимальное управление на втором
этапе и оптимальное состояние системы
после второго этапа
и
– оптимальное управление на последнем
этапе и конечное оптимальное состояние
системы.