2.2. Модели динамического программирования

Динамическое программирование представляет собой математический аппарат, который подходит к решению некоторого класса задач путем их разложения на части. При этом отличительной особенностью является решение задач по этапам через фиксированные интервалы, промежутки времени, что и определило появление термина динамическое программирование. Методы динамического программирования (ДП) успешно применяются и для решения задач, в которых фактор времени не учитывается. Решение задач методами (ДП) проводится на основе сформулированного Р,Е. Беллманом принципа оптимальности: оптимальное поведение обладает тем свойством, что каким бы ни было первоначальное состояние системы и первоначальное решение, последующее решение должно определять оптимальное поведение относительно состояния, полученного в результате первоначального решения. Из этого следует , что планирование каждого шага должно проводиться с учетом общей выгоды, получаемой по завершении всего процесса, что и позволяет оптимизировать конечный результат по выбранному критерию.

ДП применяются для решения таких задач как, распределение капитальных вложений между новыми направлениями их использования, разработка правил управления спросом и запасами, разработка принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию, поиск кратчайших расстояний на транспортной сети, формирование последовательности развития коммерческих операций.

2.2.1. Постановка задачи динамического программирования

Постановку задачи (ДП) рассмотрим на примере инвестирования, связанного с распределением средств между предприятиями. В результате управления инвестициями система последовательно переводится из начального состояния S₀ в конечное S_n . предположим, что управление можно разбить на n шагов и решение принимается последовательно на каждом шаге, а управление представляет собой совокупность n пошаговых управлений. На каждом шаге необходимо определить два типа переменных – переменную состояния системы S_k и переменную управления Х_k . все Х_k должны удовлетворять некоторым ограничениям.

Допустим, Х = (х₁ ,х₂ ,… х_n ) – управление, переводящее систему из состояния S₀ в состояние S_n , а состояние S_k - есть состояние системы на к-ом шаге управления. Тогда последовательность состояний системы можно представить в виде графа:

x₁ x₂x_kx_k₊₁x_n

Рис.1.

Применение управляющего воздействия х_k на каждом шаге переводит систему в новое состояние S¹(S,x_k) и приносит некоторый результат W_k(S,x_k) , для каждого возможного состояния на каждом шаге среди всех возможных управлений выбирается оптимальное управление х^*_k , такое, чтобы результат, который достигается за шаги с к – го по последний n – ный, оказался бы оптимальным. Числовая характеристика этого результата называется функцией Беллмана F_k(S) и зависит от номера шага к и состояния системы S .

Задача (ДП) формулируется следующим образом: требуется найти такое управление Х^* ,переводящее систему из начального состояния S₀ в конечное состояние S_n , при котором целевая функция принимает наибольшее (наименьшее) значение

F(S_0,X^*)-->extr

Особенности математической модели (ДП) заключаются в следующем:

задача оптимизации формулируется как конечный многошаговый процесс управления;
целевая функция (выигрыш) является аддитивной и равна сумме целевых функций каждого шагa:

F=F(S_k-1,x_k)-->extr

^k⁼¹

3) выбор управления х_k на каждом шаге зависит только от состояния системы к этому шагу S_k_-1 и не влияет на предшествующие шаги (нет обратной связи).

4) состояние системы S_k после каждого шага управления зависит только от предшествующего состояния системы S_k_-1 и этого управляющего воздействия х_k (отсутствие последействия) и может быть записано в виде уравнения состояния:

S_k=f_k(S_k_-1,x_r), k=1,n

5) на каждом шаге управление х_k зависит от конечного числа управляющих переменных, а состояние системы S_k зависит от конечного числа параметров.

6) оптимальное управление представляет собой вектор Х^* , определяемый последовательностью оптимальных пошаговых управлений: Х^* = (х^*₁ ,х^*₂ ,… х^*_k ,… х^*_n ), число которых и определяет количество шагов задачи.

<<< < Предыдущая 6 7 8 9 10 11 12 13 14 15 16 1718 / 3718 19 20 21 22 23 24 25 26 27 28 29 30 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
14.04.2015950.1 Кб13лабы 1 часть.pdf
#
20.03.20169.27 Mб25Лабы по элтеху.doc
#
20.03.2016413.18 Кб25Лазерная техника и лазерные технологии.doc
#
21.03.20164.8 Mб92ЛАЗЕРЫ В СТОМАТОЛОГИИ (Беликов, Грисимов, Скрипник, Шатилова).pdf
#
21.03.201612.64 Mб575Лазеры и волоконная оптика в биомедицинских исследованиях.pdf
#
01.05.20251.54 Mб0Лек мат мет.doc
#
13.11.2019974.34 Кб19Лекции для сотрудников ЛОМО.doc
#
01.03.202546.3 Mб1Лекции КСЕ.docx
#
18.11.20198.29 Mб29лекции моделирование.doc
#
23.08.2019136.19 Кб28Лекции по ассемблеру.doc
#
21.08.2019828.42 Кб45Лекции по методике.doc