Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Институт экономики, управления и права

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Математика_Лекции(4семОЗО).doc

Скачиваний:

Добавлен:

20.08.2019

Размер:

649.73 Кб

Скачать

☆

<<< < Предыдущая 1 2 3 4 56 / 126 7 8 9 10 11 12 > Следующая >>>

Тема 3. Динамическое программирование (дп)

ДП – метод оптимизации, приспособленный к операциям, в которых процесс принятия решения может быть разбит на шаги (этапы). Такие операции называются многошаговыми.

Модели динамического программирования применяются при разработке правил управления запасами, при разработке принципов календарного планирования производства и т.д.

В.1. Общая постановка задачи дп

Рассмотрим управляемый процесс (например, экономические процессы распределения средств между предприятиями, использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов …).

В результате управления система (объект управления) S переводится из начального состояния S₀ в состояние S.

Пусть управление можно разбить на п шагов, а управление, переводящее систему S из состояния S₀ в состояние S, представляет собой совокупность п пошаговых управлений.

Обозначим его Х = (Х₁, Х₂, …, Х_п), где Х_k – управление на k – ом шаге ( ).

Х_k удовлетворяют некоторым ограничениям.

S_k – состояние системы после k – го шага управления.

Получаем последовательность состояний:

X₁ X₂ X_k-1 X_k X_k+1 X_n

S₀ S₁ … S_k-1S_k … S_n

Показатель эффективности управляемой операции – целевая функция – зависит от начального состояния и управления: .

Предположим:

1) Состояние S_k – системы в конце k – го шага зависит только от предшествующего состояния S_k_-1 и управления Х_k на k – ом шаге («отсутствие последействия»):

(1) – уравнения состояний.

2) Целевая функция является аддитивной от показателей эффективности каждого шага, которые обозначим

(2)

Т.о. получаем задачу пошаговой оптимизации (задачу ДП):

Определить такое допустимое управление Х, переводящее систему S из состояния S₀ в состояние S, при котором целевая функция Z принимает наибольшее (или наименьшее значение).

Особенности задачи ДП:

Задача интерпретируется как n шаговый процесс управления.
Целевая функция равна сумме целевых функций каждого шага.
Выбор управления на каждом шаге зависит только от состояния системы к этому шагу, не влияет на предшествующие шаги.
Состояние системы после k – го шага S_k зависит только от предшествующего состояния S_k_-1 и управления Х_k на k – ом шаге.
На каждом шаге управление Х_k зависит от конечного числа переменных, а S_k – от конечного числа параметров.

В.2. Принцип оптимальности и уравнения Беллмана

Принцип оптимальности: Каково бы ни было состояние системы в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный.

Беллманом были четко сформулированы и условия, при которых этот принцип верен. Основное требование – процесс управления должен быть без обратной связи, т.е. управление на данном шаге не должно оказывать влияния на предшествующие шаги.

Введем обозначения: - максимум целевой функции – показателя эффективности п-го шага при условии, что к началу последнего шага система S была в произвольном состоянии S_n_-1, а на последнем шаге управление было оптимальным. называется условным максимумом целевой функции на n-ом шаге.

(3).

Решение X_n, при котором достигается , также зависит от S_n_-1и называется условным оптимальным управлением на шаге. Оно обозначается .

Обозначим – условный максимум целевой функции, полученный при оптимальном управлении на n – k +1 шагах, начиная с k – го шага до конца, при условии, что к началу k – го шага система находилась в состоянии S_k_-1.

, . (4)

Управление Х_k на k–ом шаге, при котором достигается максимум (4), обозначается и называется условным оптимальным управлением на k – ом шаге (в правую часть выражения (4) следует вместо S_k_-1 подставить выражение , найденное из уравнения состояния (1)).

Уравнения (3)-(4) называются уравнениями Беллмана.

Они позволяют найти предыдущее значение функции, зная последующие. Процесс решения уравнений называется условной оптимизацией.

<<< < Предыдущая 1 2 3 4 56 / 126 7 8 9 10 11 12 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
10.11.20191.26 Mб12Математика и статистика_1сем (рекл).doc
#
04.11.20181.24 Mб20Математика лекции 1сем-р.doc
#
27.11.20191.17 Mб20Математика от Заплавной Т.А..doc
#
17.11.20192.74 Mб10Математика ТМ.doc
#
01.06.2015386.21 Кб18Математика_КР_ОЗО_1сем_2012_гр2621,2721.pdf
#
20.08.2019649.73 Кб18Математика_Лекции(4семОЗО).doc
#
26.03.201658.73 Кб31Материал к курсовой.docx
#
26.03.2016351.23 Кб17Материалы для главы по аудиту.doc
#
26.03.2016356.99 Кб138Материалы для подготовки к экзамену.docx
#
26.03.2016880.64 Кб113МАТЕРИАЛЫ ДЛЯ ПОДГТОВКИ.doc
#
23.11.2019542.72 Кб19материалы к ГОСу.doc