Добавил:

Yanus Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский Государственный Технический Университет

Предмет:

Теория принятия решений

Файл:

тпр / тпр / Методы_оптимизации_ТПР / Методички / Методичка по ТПP.doc

Скачиваний:

174

Добавлен:

15.06.2014

Размер:

2.52 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1610 11 12 13 14 15 16 > Следующая >>>

3.6 Задания по задаче о коммивояжере

3.1			3.2


3.3			3.4


3.5			3.6


3.7			3.8


3.9			3.10


3.11			3.12


3.13			3.14


3.15			3.16


3.17			3.18


3.19			3.20


3.21			3.22


3.23			3.24

4. Динамическое программирование

Методом динамического программирования (ДП) решаются задачи математического программирования, удовлетворяющие принципу последовательной оптимизации: решение исходной задачи оптимизации большой размерности заменяется решением последовательности задач оптимизации малой размерности. В силу этого основным условием применимости метода ДП является возможность разбиения процесса принятия решений на ряд однотипных шагов, или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах.

Рассмотрим, как происходит разбиение процесса принятия решений (который мы будем представлять как процесс функционирования некоторой системы) на nшагов. Обозначим черезначальное состояние всего процесса, в то же времябудет начальным состоянием первого шага. Тогда– состояние системы после первого шага (или начальное состояние второго шага),– состояние системы после второго шага (или начальное состояние третьего шага) и т.д.

Переход от начального состоянияk-го шагакконечному состояниюk-го шагапроисходит так.

Имеется набор допустимых управлений(способов действия на шагеk), каждое из которых позволяет перейти из состоянияк одному из возможных конечных состоянийk-го шага. Выбраное наk-м шаге управление обозначим через, а состояние, в которое перейдет процесс из состоянияпод воздействием управления, обозначим. При этом предполагается, что состояниезависит оти, и не зависит от того, каким образом процесс перешел в состояние(принцип отсутствия последействия). Это предположение записывается в виде уравнений состояний

, .

С учетом введенных понятий состояний и управлений запишем показатели эффективности для всего многошагового процесса и для каждого k-го шага процесса. Предполагая, что показатель эффективностиk-го шага зависит от начального состояния на этом шагеи от управления на этом шаге, получаем целевую функцию наk-м шаге в видеи целевую функцию всего многошагового процесса в виде

Сформулируем теперь задачу ДП. Определить совокупность допустимых управлений , переводящих процесс из начального состоянияв конечное состояниеи максимизирующих или минимизирующих показатель эффективности.

Управление, при котором достигается максимум (минимум) целевой функции F, называетсяоптимальным управлением.

Основное правило ДП, сформулированное американским математиком Р. Беллманом, называется принципом оптимальности: оптимальное управление обладает таким свойством, что каково бы ни было начальное состояние на любом шаге и управление, выбранное на этом шаге, последующие управления должны выбираться оптимальными относительно состояния, к которому придет процесс в конце данного шага.

<<< < Предыдущая 1 2 3 4 5 6 7 8 910 / 1610 11 12 13 14 15 16 > Следующая >>>

Соседние файлы в папке Методички

#
15.06.2014229.38 Кб29lecture1.doc
#
15.06.2014747.01 Кб75Методичка (Курсовые по ТПР).doc
#
15.06.20142.14 Mб39Методичка по теории игр.doc
#
15.06.20142.52 Mб174Методичка по ТПP.doc
#
15.06.20141.84 Mб40Методичка_по_МП_для_ОмГУ.doc