![](/user_photo/2706_HbeT2.jpg)
- •Математическое программирование
- •Часть 2
- •30 Мая 2013, протокол № 10
- •Тема 2 транспортная задача линейного программирования (тз) 4
- •Закрытая и открытая модели транспортной задачи
- •2.2 Решение транспортной задачи
- •Алгоритм решения транспортной задачи
- •Нахождение начального опорного плана методом «минимального элемента»
- •Нахождение начального опорного плана методом «северо-западного угла»
- •Нахождение начального опорного плана методом Фогеля
- •Проверка на оптимальность невырожденного опорного плана методом потенциалов
- •Переход к новому опорному плану
- •Цикл пересчета
- •Тема 3 задача о назначениях
- •3.1 Математическая модель задачи о назначениях
- •Закрытая и открытая модели задачи назначениях
- •3.2 Решение задачи о назначениях
- •Алгоритм венгерского метода решения задачи о назначениях
- •Тема 4 динамическое программирование
- •4.1 Задача оптимального распределения ресурсов
- •I этап. Условная оптимизация.
- •II этап. Безусловная оптимизация.
- •4.1.11–4.1.16
- •4.2. Задача об оптимальной стратегии замены оборудования
- •I этап. Условная оптимизация.
- •II этап. Безусловная оптимизация.
- •4.2.1–4.2.10
- •Список использованной литературы
- •Математическое программирование
- •220114, Минск, ф.Скорины, 8/2
Тема 4 динамическое программирование
Динамическое программирование (ДП) – это метод нахождения оптимальных решений в задачах с многошаговой (многоэтапной) структурой.
Приведем общую
постановку задачи ДП. Рассматривается
управляемый процесс (распределение
средств между предприятиями, использование
ресурсов в течение ряда лет и т. п.). В
результате управления система (объект
управления) переводится из начального
состояния
в состояние
.
Предположим, что управление можно
разбить на
шагов. На каждом шаге выбирается одно
из множества допустимых управлений
,
переводящее систему в одно из состояний
множества
.
Элементы множества
и
определяются из условий конкретной
задачи. Последовательность состояний
системы можно изобразить в виде графа
состояний, представленного на рисунке
4.1.
Рисунок 4.1
На каждом шаге nдостигается эффект.
Предположим, что общий эффект является
суммой эффектов, достигнутых на каждом
шаге. Тогда задача ДП формулируется
так: определить такое допустимое
управление
,
переводящее систему из состояния
в состояние
,
при котором функция цели
принимает наибольшее (наименьшее)
значение, т. е.
Решение задач методом ДП осуществляется на основе принципа оптимальности, который был сформулирован американским ученым Р.Беллманом: каково бы ни было состояние системы в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный.
Обозначим через
условно-оптимальное значение целевой
функции на интервале от шагаnдо последнего
-го
шага включительно, при условии, что
передn-ым шагом
система находилась в одном из состояний
множества
,
а наn-ом шаге было
выбрано такое управление из множества
,
которое обеспечило целевой функции
условно-оптимальное значение, тогда
условно-оптимальное значение целевой
функции в интервале от (n+1)-го
до
-го
шага включительно.
В принятых обозначениях принцип оптимальности Беллмана можно записать в математической форме следующим образом
.
(4.1)
Равенство (4.1) называется основным функциональным уравнением динамического программирования. Для каждой конкретной задачи уравнение имеет особый вид.
Вычислительная процедура метода ДП распадается на два этапа: условную и безусловную оптимизацию.
На этапе условнойоптимизациив соответствии с функциональным уравнением определяются оптимальные управления для всех возможных состояний на каждом шаге, начиная с последнего.
На этапе безусловной
оптимизациишаги рассматриваются,
начиная с первого. Поскольку исходное
состояниеизвестно, выбирается оптимальное
управление из множества
.
Выбранное оптимальное управление
приводит систему во вполне определенное
состояние
.
Благодаря тому, что исходное состояние
в начале второго шага известно, становится
возможным выбрать оптимальное управление
на втором шаге
и т. д. Таким образом, строится цепь
взаимосвязанных решений безусловной
оптимизации.