- •61.Лемма Лагранжа. Дифференциальное уравнение Эйлера.
- •62.Лемма Дюбуа – Раймона. Интегральное уравнение Эйлера.
- •63.Присоединенная задача о минимуме. Условие Лежандра – Клебша.
- •64. Исследование второй вариации. Условие Якоби. Достаточные условия слабого минимума.
- •67. Простейшая задача оптимального управления.
- •68.Простейшая задача терминального управления. Формула приращения критерия качества.
- •69. Простейшая задача терминального управления. Игольчатые вариации
- •70. Простейшая задача терминального управления. Принцип максимума Понтрягина.
- •73. Применение метода дп для решения задачи двух станков.
73. Применение метода дп для решения задачи двух станков.
Постановка задачи. Имеется n – деталей и два станка. Каждая деталь обрабатывается сначала на первом станке (станок 1), затем на втором (станок 2). Станки включаются одновременно в момент времени t=0. Время обработки детали i на первом станке равно ai, на втором bi. В какой последовательности надо запустить детали на обработку, чтобы общее время обработки всех деталей было минимальным?
Решение задачи
Пронумеруем детали, множество номеров обозначим через I={1,2,…n}.
Первый этап метода динамического программирования – погружение задачи в семейство аналогичных задач.
Для этого будем рассуждать следующим образом. Из партии I удалим k любых деталей с номерами i1, i2 ,…, ik . рассмотрим остальные n-k деталей. Пусть Ik=I\{ i1, i2 ,…, ik } – множество номеров оставшихся деталей. Каждая деталь i c номером из Ik обрабатывается сначала на станке 1, а затем на станке 2. Станок 1 включается в момент времени t=0, а станок 2 – через y ед.времени после станка 1.
Если Ik= I и у=0, то получим исходную задачу.
Введем функцию Беллмана – оптимальное (минимальное) время обработки n-k деталей с номерами из Ik, если станок 2 включается через y ед.времени после станка 1. обозначим ее Bn-k(i1, i2 ,…, ik|y} (1.1)
Cоставим уравнение Беллмана. Используем при этом принцип оптимальности. Из множества деталей с номерами из Ik возьмем произвольную деталь i и первой запустим на обработку.
Станок 1 включился в момент t=0, а значит в момент t= a1 он закончит обработку детали i и освободится. Деталь i уйдет на обработку на станок 2.
Станок 2 включился в момент t=y, а значит, время окончания обработки детали i на этом станке зависит от соотношения ai и у:
если у<= ai ( станок 2 включился, а станок 1 еще обрабатывает деталь i ), то в момент t=ai деталь i начнет обрабатываться на станке 2, а в момент t=ai+ bi обработка детали i на обоих станках закончится;
если у>ai ( станок 1 освободился, а станок 2 еще не включен, деталь i ждет момента включения), то деталь i начнет обрабатываться на станке 2 в момент t=у, а в момент t=у+ bi обработка детали i на обоих станках закончится.
Итак, момент освобождения станка 2 равен (1.2)
Далее будут обрабатываться детали с номерами из множества Ik\{i}. Для них станок 1 включается в момент t= ai, а станок 2 - в момент, который определяется согласно 1.2, т.е. через bi ед. времени после станка 1, если у<= ai, или через ((у-ai)+ bi) ед. времени, если y>a
74. Применение ДП для решения задачи замены оборудования.
Постановка задачи. На некотором производстве рассматривается процесс эксплуатации оборудования в период времени длительностью n лет. Этот период условно разбивается на этапы (например, один этап – один год). В начале каждого этапа относительно оборудования принимается решение: продолжать эксплуатировать старое или заменить его новым оборудованием. Решение зависит от следующих четырех характеристик оборудования: производительности, величины эксплуатационных расходов, остаточной стоимости старого и стоимости нового оборудования. Отметим, что первые три характеристики старого оборудования определяются его возрастом. Эти характеристики определяют прибыль, получаемую от эксплуатации оборудования.
Алгоритм решения. Введем обозначения. Пусть t – возраст оборудования, t=0, 1, …, n, где n – длина планового периода; r(t) – стоимость продукции, производимой за год на единице оборудования, возраст которого t лет (производительность); u(t) – ежегодные затраты на обслуживание этого оборудования (эксплуатационные расходы); s(t) – остаточная стоимость оборудования; p – стоимость нового оборудования.
Первый этап метода динамического программирования – погружение задачи в семейство аналогичных задач. Рассмотрим при всех сформулированных условиях плановый период, включающий последние n-k лет. Будем считать, что возраст оборудования на начало k+1 –го года равен t лет . ясно, что Если k=0, то получим исходную задачу.
Введем функцию Беллмана – максимальное значение прибыли за последние n-k лет планового периода от использования оборудования, возраст которого на начало k+1 –го года равен t лет. Обозначим ее через . Заметим, что это функция 2-х аргументов k и t. В принятых обозначениях возраст t=0 соответствует эксплуатации нового оборудования.
Перейдем ко второму этапу ДП – составлению уравнения Беллмана. Для этого рассмотрим 2 возможные ситуации на начало k+1 года.
Если на k+1-м году оборудование, возраст которого t лет, сохранить, то прибыль предприятия от его использования равна - стоимость произведенной продукции минус стоимость эксплуатационных издержек. Следуя принципу оптимальности, считаем, что все последующие годы решение о замене оборудования принималось оптимально. Поэтому общая прибыль за последние n-k лет в этом случае равна
(1.1)
Пусть на k+1 –ом году оборудование, возраст которого t лет, заменяется новым. Тогда прибыль предприятия за этот год состоит из выручки от продажи старого плюс стоимость произведенной продукции на новом оборудовании минус стоимость эксплуатационных издержек нового оборудования и минус затраты на его покупку, т.е. равна . Согласно принципу оптимальности за последние n-k лет прибыль в этом случае равна . (1.2)
Таким образом, если величина прибыли (1.1) больше или равна величине прибыли (1.2), то нужно работать на старом оборудовании, а противном случае оборудование следует заменить. Объединяя (1.1) и (1.2), запишем уравнение Беллмана: , (1.3)
Где первое выражение определяет прибыль, которая может быть получена за последние n-k лет на старом оборудовании, второе – при его замене. При этом предполагается, что переход к работе на новом оборудовании происходит за один этап.
Полагая в (1.3) k=n-1, получаем начальное условие для этого рекуррентного относительно аргумента k уравнения. Оно имеет вид уравнения одноэтапного процесса, для которого слагаемые и не имеют экономического смысла, и поэтому исключается, таким образом, прибыль от использования оборудования, возраст которого t лет, в последний год планового периода равна
(1.4)
Третий этап метода ДП – поиск решения уравнения (1.3) с начальными условиями (1.4) и построения по нему решения исходной задачи.
В уравнении (1.3) положим k=n-2:
(1.5)
Далее полагаем в уравнении (1.3) k=n-3, n-4,…,0. после процесса оптимизации получим последовательность , , …, .
Исходные данные заносим в таблицу 1:
Таблица 1 – Исходные данные
T |
0 |
1 |
2 |
… |
N |
r(t) |
r(0) |
r(1) |
r(2) |
… |
r(n) |
u(t) |
u(0) |
U(1) |
u(2) |
… |
u(n) |
s(t) |
s(0) |
s(1) |
s(2) |
… |
s(n) |
Далее составляем таблицу 2, заполняя ее значениями функции . Каждое значение функции Беллмана соответствует либо политике сохранения оборудования, либо политике его замены. В каждой строке таблицы будем отделять такие значения жирной линией границы клетки.
Таблица 2
T |
0 |
1 |
2 |
… |
n |
B1(t) – прибыль за последний год |
B1(0) |
B1(1) |
B1(2) |
… |
B1(n) |
B2(t) – прибыль за последние 2 года |
B2(0) |
B2(1) |
B2(2) |
… |
B2(n) |
… |
… |
… |
… |
… |
… |
Bn(t) – прибыль за весь плановый период |
Bn(0) |
Bn(1) |
Bn(2) |
… |
Bn(n) |