Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Сибирский Государственный Индустриальный Университет

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Лекции_ Мат моделирование.doc

Скачиваний:

Добавлен:

01.05.2025

Размер:

1.29 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 67 / 187 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

4. Элементы динамического программирования

4.1. Постановка задачи

Существует класс задач, в которых требуется найти максимум или минимум некоторой величины при заданных ограничениях, решение которых естественно разделяется на ряд однородных этапов. В отличие от задач линейного программирования здесь необходим какой-то принцип, согласовывающий оптимальное решение на каждом этапе с оптимальным решением задачи в целом. Для содержательных задач такого рода формулируются модели, для моделей ставятся задачи, методы решения которых составляют тему динамического программирования.

Рассмотрим пример. Самолёт авиатранспортной компании загружается промышленным оборудованием 3 типов. Каждый предмет оборудования i-го типа (таблица 1) имеет вес w_i (в тоннах) и стоимость v_i (в тыс. рублей). Максимальная грузоподъёмность самолёта равна 5 тоннам. Какова наибольшая стоимость груза, которую может перевезти самолёт за один рейс?

Таблица1

I	w_i	v_i
1	2	65
2	3	80
3	1	30

Это простой пример, он решается перебором вариантов. Ясно, что наиболее выгодно перевезти 2 предмета 1-го типа и 1 предмет 3-го типа общей стоимостью 160 тыс. рублей. При увеличении типов предметов задача станет не такой простой, процедура перебора окажется громоздкой.

Однако с этим примером удобно связывать описание задачи для общей модели динамического программирования. Определение количества предметов каждого из трёх типов надо рассматривать как поэтапное решение, всего три этапа. В общей постановке разделение на этапы удобно интерпретировать как чередование во времени.

Имеется экономическая система, текущее состояние которой описывается вектором состояния , - i-ый показатель состояния системы. Состояние системы может изменяться под действием вектора управления , - мера управляющего воздействия j-го типа. Тогда модель управления системой.

Пусть управление системой не непрерывно во времени t, а происходит дискретно, в конце каждого из промежутков времени (t₀, t₁], (t₁, t₂], …, (t_n_-1, t_n]. В моменты времени t₁, t₂, …, t_n принимаются управляющие решения . Поэтому в период (t_k_-1, t_k) сохраняется состояние , наступившее после принятия решения в момент времени t_k_-1.

Упрощающие предположения.

а) Состояние системы в момент t_k зависит только от состояния на предыдущем шаге и принятого в момент t_k решения:

б) Состояние системы в период (t_k_-1, t_k) характеризуется числом – эффективностью ; эффективность аддитивна по шагам:

в) Система не должна иметь обратной связи, то есть принятие решения не влияет на состояния .

г) Состояние задано.

Требуется: построить такой набор решений (будем называть их оптимальными), который обеспечивает .

4.2. Принцип и уравнение Беллмана

Правило (принцип оптимальности по Беллману).

На любом k-ом шаге решение надо выбрать таким, чтобы было возможно выбрать последующие решения , для которых были бы максимальны как , так и .

Осуществление принципа Беллмана производится пошагово, «впопятную». Именно, вначале оценивается решение в момент времени t_n_-1 (последнее решение):

В пространстве решений перебираем решения . Для каждого состояния обозначим:

эффективность достигается выбором решения , которое называется условно оптимальным (при условии, что система находится в состоянии );

. Допустим, что состояние соответствует состоянию и решению .

Отступая назад на один шаг, находим:

;

значение зависит только от , так как , по модели управления системой.

Повторяем процедуру вплоть до вовлечения в выбор решения :

– это и есть уравнение Беллмана, воплощение принципа Беллмана. Таким образом находится набор оптимальных решений как функций аргументов соответственно, определяемых в обратном порядке (от к ). Зная значение и функцию , находится значение вектора решения; по модели управления определяется следующее состояние системы , по нему находится значение и так далее.

Уравнение Беллмана можно переписать в виде:

, демонстрирующим аддитивные свойства оптимальной эффективности.

<<< < Предыдущая 1 2 3 4 5 67 / 187 8 9 10 11 12 13 14 15 16 17 18 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
08.09.2019903.68 Кб56Лекции-Маркетинг.doc
#
01.05.20259.51 Mб7ЛЕКЦИИ. Введение, главы 1 и 2.doc
#
01.05.20256.88 Mб8ЛЕКЦИИ. Глава 3.doc
#
01.05.202524.16 Mб8ЛЕКЦИИ. Глава 4. Часть 3 Штучная тара.doc
#
01.05.20257.41 Mб10ЛЕКЦИИ. Глава 4.Ч1,2.doc
#
01.05.20251.29 Mб2Лекции_ Мат моделирование.doc
#
27.05.20151.79 Mб314Лекции_ВСЕ.docx
#
21.09.20192.93 Mб29Лекций_ТИ.doc
#
01.07.2025309.76 Кб0Лекционный материал (1).doc
#
27.05.2015386.56 Кб61ЛЕКЦИОННЫЙ МАТЕРИАЛ по ПРОГНОЗИРОВАНИЮ для ЭРМ.doc
#
25.03.2016629.22 Кб33Лекция 1 (ЖДСУ).doc