- •Г.И. Фощан
- •Рецензенты:
- •Оглавление
- •Предисловие
- •Введение
- •1. Модели оптимального планирования
- •1.1. Общая постановка одноиндексных задач
- •1.1.1. Задача использования ресурсов
- •1.1.2. Задача составления рациона
- •1.1.3. Раскрой материала
- •1.2. Общая постановка двухиндексных задач
- •1.2.1. Задача об использовании мощностей
- •1.2.2. Перевозка грузов
- •1.2.3. Задача о назначениях
- •1.2.4. Построение кольцевых маршрутов
- •1.2.5. Общая распределительная задача
- •1.3. Примеры составления задач
- •1.4. Решение задач лп средствами excel
- •1.4.1. Решение одноиндексных задач
- •1.4.2. Решение двухиндексных задач
- •Задачи для самостоятельного решения
- •1.5. Двойственные задачи
- •1.5.1. Построение двойственной задачи
- •1.5.2. Теоремы двойственности
- •1.5.3. Объективно обусловленные оценки и их смысл
- •Задачи для самостоятельного решения
- •2. Теория принятия решений
- •2.1. Классификация теории игр
- •2.1. Стратегические игры
- •2.3. Принятие решений в условиях неопределенности (игры с природой)
- •2.3. Принятие решений в условиях риска
- •Задачи для самостоятельного решения
- •3. Динамическое программирование
- •3.1. Общая постановка задач лп
- •3.2. Принцип оптимальности и уравнения Беллмана
- •3.3. Задача о замене оборудования
- •3.4. Оптимальное распределение инвестиций
- •Задачи для самостоятельного решения
- •Рекомендуемая литература Основная литература
- •Дополнительная
- •Фощан Галина Ивановна
- •350040, Г. Краснодар, ул. Ставропольская, 149
3. Динамическое программирование
3.1. Общая постановка задач лп
ДП - метод оптимизации, в котором процесс принятия решения может быть разбит на шаги.
Рассмотрим
управляемый процесс распределения
ресурсов (средств) между предприятиями,
замены оборудования, пополнение запасов
и т.д. В результате управления система
S
переводится из начального состояния
S0
в состояние
.
Пусть управление можно разбить на n
шагов, т.е. принимается последовательно
на каждом шаге, а управление, переводящее
систему S
из начального состояния в конечное,
представляет собой совокупность n
пошаговых управлений .
Пусть
= (Х1,
Х2,…,
Хк,…Хп)
- уравнение
переводящее систему S
из S0
в
.
Обозначим через Хк
уравнение
на к
шаге. Переменные Хк
удовлетворяют некоторым ограничениям
и в этом смысле называется допустимым.
Sк
- состояние системы после к
шага управления. Получаем последовательность
состояний.
Показатель эффективности рассматриваемой управляемой операции - целевая функция - зависит от начального состояния и управления: Z = F(S0, Х)
1. Состояние Sk системы в конце к шага зависит только от предшествующего состояния Sk-1 и управления на к шаге Хк. Это называется «отсутствием последствия».
Sk = φk(Sk-1, Хk), k = 1,n - уравнения состояний.
Целевая функция является аддитивной от показателя эффективности каждого шага. Обозначим показатель эффективности к шага через Zk = fk(Sk-1, Хk), тогда
.
Задача пошаговой оптимизации формулируется так:
определить такое дополнительное решение Х, переводящее систему S из S0 в , при котором функция принимает max(min) значения.
3.2. Принцип оптимальности и уравнения Беллмана
Принцип оптимальности: каково бы ни было состояние системы S в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех следующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный.
Уравнения Беллмана. Рассмотрим последовательность задач.
n шаг:
Sn-1 - состояние системы к началу n шага;
Sn = - конечное состояние; Хn - управление на данном шаге;
fn (Sn-1, Хn) – целевая функция n шага;
- условный max(min)
целевой функции на n
шаге;
- условное
оптимальное управление.
Согласно принципу оптимальности Хn - выбираем так, чтобы для любого Sn-1 получить max(min) целевой функции:
.
k
шаг:
Эти рекуррентные соотношения, позволяют найти предельное значение функции, зная последующие. Процесс решения уравнений Беллмана называется условной оптимизацией.
3.3. Задача о замене оборудования
Пусть планируется эксплуатировать оборудование в течение некоторого периода времени продолжительностью n лет. Оборудование имеет тенденцию с течением времени стареть и приносить все меньший доход r(t). При этом возможность в начале любого года продать устаревшее оборудование за цену S(t) и купить новое оборудование за цену P. Под возрастом оборудования понимают период эксплуатации оборудования после последней замены, определенных в годах.
Требуется найти оптимальный план замены оборудования с тем, чтобы суммарный доход за все n лет был бы наибольшим, учитывая, что к началу эксплуатации возраст оборудования составляет t0 лет.
Исходными данными в задаче является доход r(t) от эксплуатации в течении одного года оборудования возраста t лет, остаточная стоимость S(t), цена нового оборудования P и начальный возраст оборудования t0.
t |
0 |
1 |
… |
n |
r |
r(0) |
r(1) |
… |
|
S |
S(0) |
S(1) |
… |
S(n) |
Очевидно, что доход от эксплуатации оборудования за годы с k по n года будет зависеть от возраста оборудования к началу рассматриваемого шага.
Переменной управления на каждом шаге является логическая переменная, которая может принимать одно из двух значений:
Функцию Беллмана Fk(t) определяют как максимально возможный доход от эксплуатации оборудования за годы с к по n, если к началу каждого возраст оборудования составлял t лет:
Для k
= n
.
В результате безусловной оптимизации определяются годы, вначале которых следует произвести замену оборудования.
Пример 33. Найти оптимальную стратегию эксплуатации оборудования на период 6 лет, если годовой доход и остаточная стоимость S(t) в зависимости от возраста заданы в таблице. Стоимость нового оборудования P = 13, а возраст оборудования к началу эксплуатационного периода составлял один год.
t |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
r(t) |
8 |
7 |
7 |
6 |
6 |
5 |
5 |
S(t) |
12 |
10 |
8 |
8 |
7 |
6 |
4 |
Решение. Условная оптимизация.
k = 6.
F6 |
1 |
2 |
3 |
4 |
5 |
6 |
r(t) |
7 |
7 |
6 |
6 |
5 |
5 |
S(t) – P + r(0) |
5 |
3 |
3 |
2 |
1 |
-1 |
max |
7 |
7 |
6 |
6 |
5 |
5 |
С/З |
С |
С |
С |
С |
С |
С |
Реализация в EXCEL приведена на рис. 23. Для подсчета последней строки используется команда:
ЕСЛИ(И(C13 = C11;C13 =C 12);"С/З";ЕСЛИ(C13 = C11;"С";"З"))
Рис. 23. Экранный вид первого шага
Аналогично строятся остальные шаги: k = 5
F5 |
1 |
2 |
3 |
4 |
5 |
r(t) |
7 |
7 |
6 |
6 |
5 |
r + F6 |
14 |
13 |
12 |
11 |
10 |
S(t) – P + r(0) + F6(1) |
12 |
10 |
10 |
9 |
8 |
max |
14 |
13 |
12 |
11 |
10 |
С/З |
С |
С |
С |
С |
С |
F4 |
1 |
2 |
3 |
4 |
r(t) |
7 |
7 |
6 |
6 |
r + F5 |
20 |
19 |
17 |
16 |
S(t) – P + r(0) + F5(1) |
19 |
17 |
17 |
16 |
max |
20 |
19 |
17 |
16 |
С/З |
С |
С |
С/З |
С/З |
F3 |
1 |
2 |
3 |
r(t) |
7 |
7 |
6 |
r + F4 |
26 |
24 |
22 |
S(t) – P + r(0) + F4(1) |
25 |
23 |
23 |
max |
26 |
24 |
23 |
С/З |
С |
С |
З |
F2 |
1 |
2 |
r(t) |
7 |
7 |
r + F3 |
31 |
30 |
S(t) – P + r(0) + F3(1) |
31 |
29 |
max |
31 |
30 |
С/З |
С/З |
С |
F1 |
r(t) |
r + F2 |
S(t) – P + r(0) + F2(1) |
max |
С/З |
1 |
7 |
37 |
36 |
37 |
С |
Результаты сведены в таблице. В таблице выделено значение – замена оборудования
k/t |
1 |
2 |
3 |
4 |
5 |
6 |
1 |
37 |
|
|
|
|
|
2 |
31 |
30 |
|
|
|
|
3 |
26 |
24 |
23 |
|
|
|
4 |
20 |
19 |
17 |
16 |
|
|
5 |
14 |
13 |
12 |
11 |
10 |
|
6 |
7 |
7 |
6 |
6 |
5 |
5 |
Безусловная оптимизация.
k = 1 и F1(1) = 37 с сохранением оборудования, следовательно к началу второго года возраст оборудования t2 = t1 + 1 = 2; k = 2, Х2(2) = с; k = 3, Х3(3) = з, т.е. необходимо заменить оборудование; k = 4, Х4(1) = с; k = 5, Х5(2) =с; k = 6, Х6(3) = с. Т.е., за 6 лет эксплуатации оборудования, замену нужно произвести один раз – в начале третьего года эксплуатации.
