Добавил:

Yanus Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Омский Государственный Технический Университет

Предмет:

Методы оптимизации

Файл:

Методичка по теории игр.doc

Скачиваний:

Добавлен:

15.06.2014

Размер:

1.97 Mб

Скачать

☆

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 129 10 11 12 > Следующая >>>

3.5. Задания для самостоятельной работы

Решить задачу коммивояжера с матрицей расстояний:

3.1		3.2


3.3		3.4


3.5		3.6


3.7		3.8


3.9		3.10


3.11		3.12

4.Динамическое программирование

4.1. Постановка задачи

Методом динамического программирования (ДП) решаются задачи математического программирования, удовлетворяющие принципу последовательной оптимизации: решение исходной задачи оптимизации большой размерности заменяется решением последовательности задач оптимизации малой размерности. В силу этого основным условием применимости метода ДП является возможность разбиения процесса принятия решений на ряд однотипных шагов или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах.

Рассмотрим как происходит разбиение процесса принятия решений (который мы будем рассматривать как процесс функционирования некоторой системы) на шагов. Обозначим черезначальное состояние всего процесса, в то же времябудет начальным состоянием первого шага. Тогда- состояние системы после первого шага (или начальное состояние второго шага),- состояние системы после второго шага (или начальное состояние третьего шага) и т.д.

Переход от начального состояния - го шагакконечному состоянию - го шагапроисходит так.

Имеется набор допустимых управлений (способов действия на шаге ), каждое из которых позволяет перейти из состоянияк одному из возможных конечных состояний-го шага. Выбраное на- м шаге управление обозначим через, а состояние, в которое перейдет процесс из состоянияпод воздействием управления, обозначим. При этом предполагается, что состояниезависит отии не зависит от того, каким образом процесс перешел в состояние(принцип отсутствия последействия). Это предположение записывается в виде уравнений состояний

, .

С учетом введенных понятий состояний и управлений запишем показатели эффективности для всего многошагового процесса и для каждого - го шага процесса. Предполагая, что показатель эффективности- го шага зависит от начального состояния на этом шагеи от управления на этом шаге, получаем целевую функцию на- м шаге в видеи целевую функцию всего многошагового процесса в виде

Сформулируем теперь задачу ДП. Определить совокупность допустимых управлений переводящих процесс из начального состоянияв конечное состояниеи максимизирующих или минимизирующих показатель эффективности.

Управление, при котором достигается максимум (минимум) целевой функции F, назывется оптимальным управлением .

Основное правило ДП, сформулированное американским математиком Р. Беллманом, называется принципом оптимальности}:

оптимальное управление обладает таким свойством, что каково бы ни было начальное состояние на любом шаге и управление, выбранное на этом шаге, последующие управления должны выбираться оптимальными относительно состояния, к которому придет процесс в конце данного шага.

<<< < Предыдущая 1 2 3 4 5 6 7 89 / 129 10 11 12 > Следующая >>>

Соседние файлы в предмете Методы оптимизации

#
15.06.2014293.02 Кб4023.jpg
#
15.06.201454.49 Кб6025.jpg
#
15.06.201428.67 Кб18Вопрсы методы опт..doc
#
15.06.2014686.08 Кб12Записка2.doc
#
15.06.20141.74 Mб63Методичка по математич.программир.doc
#
15.06.20141.97 Mб96Методичка по теории игр.doc
#
15.06.20145.11 Mб58Методичка.doc
#
15.06.20141.84 Mб50Методичка_по_МП_для_ОмГУ.doc
#
15.06.2014392.7 Кб29РГР.doc
#
15.06.201471.68 Кб13ТЗ на РГР.doc
#
15.06.201430.72 Кб83Титульный лист.doc