
- •Кафедра менеджмента экономико-математические методы Методические указания
- •080507 – «Менеджмент организации» и
- •050501 - «Профессиональное обучение (экономика и управление)» Новочеркасск 2008
- •1 Методы математического моделирования
- •Реальная
- •Оптимум
- •Оптимум
- •2 Динамическое программирование
- •2.1 Общая постановка задачи динамического программирования
- •2.2 Общая схема решения задачи динамического
- •2.3 Задача определения оптимального плана обновления
- •3 Моделирование экономических систем
- •Пример. Рассмотрим систему s, представляющую собой два окна в операционном зале банка: первое – «Коммунальные платежи» и второе – «Операции по вкладам». Возможны 4 состояния системы:
- •4 Решение многокритериальных задач методом интегральных критериев
- •Список рекомендуемой литературы
- •Приложение
- •Задание
- •Вариант 1
- •Подпись преподавателя________________ Подпись студента______________
- •Содержание
- •Учебно-методическое издание
- •Дашкова Ирина Александровна
- •Экономико-математические методы
- •Методические указания
- •080507 – «Менеджмент организации» и
- •050501 - «Профессиональное обучение (экономика и управление)»
2 Динамическое программирование
Динамическое программирование – это математический метод нахождения оптимальных решений многошаговых (многоэтапных) задач. Динамическое программирование дает возможность принять ряд последовательных решений, обеспечивающих оптимальность развития процесса в целом.
2.1 Общая постановка задачи динамического программирования
Рассматривается управляемый процесс, например, процесс использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов и т.д. В начальный момент времени система S (объект управления) находится в начальном состоянии S0.
На первом шаге под действием переменной управления система переходит из состояния S0 в состояние S1, т.е. S1= S1(S0,x1). Здесь целевая функция равна F1(S0,x1). Всю цепочку переходов системы можно изобразить в виде графа (рисунок 2).
xn-1
xn
x2
x3
x1
…
Fn(Sn-1,xn)
F3(S2,x3)
F2(S1,x2)
F1(S0,x1)
Рисунок 2 - Граф состояний системы при многошаговом процессе
Обозначим через Х = (x1,x2,…,xn) управление, переводящее систему за n шагов из начального состояния S0 в конечное состояние Sn.
Целевая
функция на k-м шаге Fk(Sk-1,xk)
()
называется функцией Беллмана.
Задача состоит в том, чтобы подобрать управление Х, переводящее систему за n шагов из начального состояния S0 в конечное состояние Sn, чтобы достичь экстремума целевой функции
Z(S0,
X) = F1(S0,
x1)
+ F2(S1,
x2)
+ … + Fn(Sn-1,xn)
=
.
В основе решения задач динамического программирования лежит принцип оптимальности Беллмана: на каждом этапе принимается такое решение, которое обеспечивает оптимальность с данного этапа до конца процесса, т.е. на каждом этапе необходимо принимать решение, просматривая его последствия до самого конца процесса.
Функциональные уравнения Беллмана – это математическая формулировка принципа оптимальности Беллмана. Оптимальное управление обладает следующим свойством: каковы бы ни были начальное состояние S0 и решение в начальный момент времени, последующие решения должны составлять оптимальное управление относительно состояния, полученного в результате предыдущего решения.
Предположим,
что в задаче необходимо найти максимум
целевой функции. На n-м шаге
,
т.е. выигрыш на n-м шаге зависит только
от выбора управления xn
на этом шаге.
На (n-1)-м шаге
т.е. на (n-1)-м шаге надо так подобрать управление xn-1, чтобы сумма выигрышей на (n-1)-м шаге Fn-1(Sn-2,xn-1) и на n-м шаге Zn(Sn-1(Sn-2,xn-1)) была максимальна.
На (n-2)-м шаге
т.е. на (n-2)-м шаге надо так подобрать управление xn-2, чтобы сумма выигрышей на (n-2)-м шаге Fn-2(Sn-3,xn-2) и на двух последних шагах
Zn-1(Sn-2(Sn-3,xn-2)) была максимальна.
На k-м шаге
т.е. на k-м шаге надо так подобрать управление xk, чтобы сумма выигрышей на k-м шаге Fk(Sk-1,xk) и на n-k последующих шагах Zk+1(Sk(Sk-1,xk)) была максимальна.
2.2 Общая схема решения задачи динамического
программирования
1.Определяют все состояния системы при переходе из начального состояния S0 в конечное состояние Sn, вид целевых функций на каждом шаге
Fk(Sk-1,xk)
(),
функции перехода Sk(Sk-1,xk)
из
состояния Sk-1
в состояние
Sk.
2. Записывают уравнения Беллмана.
3.
Из уравнения Беллмана для Z1(S0)
по S0
находят оптимальное управление на 1-м
шаге
.
По S0
и
определяют состояние системы после
1-го шага:
4.
Из уравнения Беллмана для для Z2(S1)
по S1
находят оптимальное управление на 2-м
шаге
.
По S1
и
определяют состояние системы после
2-го шага:
И т.д.
Условно этот процесс можно представить так:
S0
S1
S2 …
Sn-1
.