Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Пермский национальный исследовательский политехнический университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

ТВ. ГОЛЬДШТЕЙН А.Л. ТПР.doc

Скачиваний:

Добавлен:

01.04.2025

Размер:

1.67 Mб

Скачать

☆

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 1617 / 3117 18 19 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

Функциональное уравнение дп

Пронумеруем шаги в порядке проведения условной оптимизации с конца к началу. Эффективность i-го шага описывается функцией Z_i(S_i,U_i), где S_i - состояние к i-му шагу (точнее - вектор параметров состояния), U_i - управление на i-м шаге (точнее - вектор управляемых переменных или решение).

Модель задачи ДП включает целевую функцию , (1)

описание допустимой области управлений D, а также уравнение состояния , связывающее между собой два последовательных состояния.

Формализация вычислительной процедуры метода ДП базируется на принципе оптимальности: последующие решения должны быть оптимальными относительно состояния, сложившегося в результате предшествующих, пусть и не оптимальных, решений. Для описания этого свойства введем последовательность функций {f_k(S_k)}, так, что каждая из них есть зависимость экстремального значения критерия за k оставшихся шагов от состояния на начало k-го шага: . (2)

Функции (2) зависят только от состояния и не могут зависеть от искомых переменных (управлений), так как по ним ищется экстремум.

=> Состояние - это то, от чего зависит экстремум критерия.

Предположим, что осталось k шагов (k³2)

S_k - > U_k - > z_k(S_k, U_k) принимаем произвольное решение

k-1, S_k_-1 - > (в соответствии с принципом оптимальности) f_k_-1(S_k_-1)

.(3)

Она не является экстремальной для k шагов, так как U_k взято произвольно. Если воспользоваться уравнением состояния, то (3) примет вид

,(4)

Но экстремальное значение за k шагов по определению (2) есть f_k(S_k). Таким образом, окончательно получаем

(5)

основное функциональное уравнение ДП (рекуррентное соотношение).

Для k=1: . (6)

Процедура динамического программирования:

1. Имея описание и модель задачи, выделяем шаги и производим их нумерацию с конца.

2. Определяем параметры состояния и вводим последовательность функций {f_k(S_k)}, , в которой каждая функция f_k(S_k) есть наилучшее значение критерия за k оставшихся шагов относительно состояния S_k.

3. На основе принципа оптимальности составляем функциональное уравнение ДП и отдельно выражение для f₁.

4. Проводим условную оптимизацию, последовательно вычисляя f₁, f₂,...,f_N. При этом на каждом шаге для всех возможных значений состояния S_k запоминаются значения U_k^* и f_k (в таблице или файле).

5.Исходя из заданного состояния S_N^{^}, проводим безусловную оптимизацию по схеме:

S_N^{^}®табл.N®U_N^*®у.с.®S_N_-1^{^}®табл.N-1®U_N_-1^*®у.с.®...®S₁^{^}®табл.1® U₁^*,

где у.с. - уравнение состояния. Значение f_N(S_N) из N-й таблицы есть оптимальное значение критерия задачи.

Достоинства метода ДП:

1. Задача содержит N переменных, которые могут принимать m значений. Поэтому порядок числа вариантов распределения определяется величиной m^N. При расчете по рекуррентной формуле максимум ищется для m значений состояния, а поиск максимума путем просмотра всего диапазона переменной требует перебора от двух до m+1 вариантов, то есть в среднем ~m/2. Значит, один шаг включает расчет m²/2 вариантов, а вся задача в ДП - Nm²/2. Очевидно, что Nm²/2<<m^N.

2. В случае изменения, например, количества распределяемого ресурса метод полного перебора и другие регулярные численные методы требуют решать задачу заново. В динамическом программировании, если новое значение не больше X, достаточно провести безусловную оптимизацию, взяв за исходное состояние новое значение ресурса.

3. При использовании любого метода оптимизации, кроме ДП, исключение одного из предприятий из системы распределения приведет к необходимости решать изменившуюся задачу как новую. В динамическом программировании, если этому предприятию был присвоен номер N, то есть оно было последним по ходу условной оптимизации, решение измененной задачи находится сразу: по заданному количеству распределяемого ресурса входим не в N-ю, а в (N-1)-ю таблицу и далее действуем в соответствии со схемой безусловной оптимизации.

Метод ДП дает весь ансамбль оптимальных решений, свойственных задаче.

4. Метод ДП не накладывает каких-либо специальных требований на вид и форму представления функций, составляющих критерий.

5. Отыскание глобального экстремума многомерной функции является очень сложной проблемой. ДП снижает размерность решаемых задач в N раз (по числу переменных), что значительно облегчает нахождение глобального экстремума.

6. Наложение специфических условий на переменные не «утяжеляет» решение задачи методом.

7. Трудоемкость вычислений и объем памяти для хранения результатов на одном шаге не зависят от числа шагов. Поэтому увеличение числа шагов приводит только к пропорциональному возрастанию времени решения задачи, тогда как для других методов с увеличением размерности задачи трудоемкость ее решения растет гораздо быстрее.

<<< < Предыдущая 5 6 7 8 9 10 11 12 13 14 15 1617 / 3117 18 19 20 21 22 23 24 25 26 27 28 29 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
29.03.2015840.19 Кб40ТАУ Лаб раб методич.doc
#
29.03.2015707.07 Кб33ТАУ Лаб раб ЭС 2013-14.doc
#
01.05.20254.58 Mб9ТАУ учебное пособие 2007.doc
#
01.04.20251.1 Mб4ТАУ.docx
#
31.07.20193.72 Mб35ТАУ.rtf
#
01.04.20251.67 Mб6ТВ. ГОЛЬДШТЕЙН А.Л. ТПР.doc
#
01.04.2025192.46 Кб0ТВ. КУЗНЕЦОВ Д. Б. СПО.docx
#
01.04.2025580.1 Кб3ТВ. РУБЦОВ Ю.Ф. ИИСиАСУТП.doc
#
01.04.2025192.39 Кб0ТВ. ТЕБЕНЬКОВ Е.С. БД.docx
#
01.04.2025386.6 Кб2ТВ. ТЕБЕНЬКОВ Е.С. БД.docx
#
01.04.2025471.63 Кб6ТВ. ФАЙЗРАХМАНОВ Р.А. Основы теории управления....docx