
- •Теория принятия решений
- •1. Элементы теории игр
- •1.1 Основные понятия
- •1.2 Матричные игры
- •1.3 Принцип минимакса. Седловые точки
- •1.4 Смешанные стратегии
- •1.5 Пример полного решения матричной игры
- •1.6 Задания по теории игр
- •2. Задача о назначениях
- •2.1 Содержательная постановка
- •2.2 Математическая модель
- •2.3 Венгерский метод для задачи о назначениях
- •2.4 Алгоритм венгерского метода
- •2.5 Пример решения задачи о назначениях венгерским методом
- •2.6 Задания по задаче о назначениях
- •3. Задача о коммивояжере
- •3.1 Постановка задачи
- •3.2 Математическая модель
- •3.3 Метод ветвей и границ
- •3.4 Метод ветвей и границ для решения задачи коммивояжера
- •3.5 Пример решения задачи коммивояжера
- •3.6 Задания по задаче о коммивояжере
- •4. Динамическое программирование
- •4.1 Построение модели дп
- •4.2 Построение вычислительной схемы дп
- •4.3 Несколько замечаний к методу дп
- •4.4 Задача о распределении ресурсов
- •4.5 Пример решения задачи о распределении ресурсов
- •4.6 Задания по задаче о распределении ресурсов
- •4.7 Задача о замене оборудования
- •4.8 Пример решения задачи о замене оборудования
- •4.9 Задания по задаче о замене оборудования
- •Библиографический список
- •1. Элементы теории игр 3
- •2. Задача о назначениях 14
- •3. Задача о коммивояжере 25
- •4. Динамическое программирование 35
3.6 Задания по задаче о коммивояжере
3.1 |
|
3.2 | |
|
|
| |
|
|
| |
3.3 |
|
3.4 | |
|
|
| |
|
|
| |
3.5 |
|
3.6 | |
|
|
| |
|
|
| |
3.7 |
|
3.8 | |
|
|
| |
|
|
| |
3.9 |
|
3.10 | |
|
|
| |
|
|
| |
3.11 |
|
3.12 | |
|
|
| |
|
|
| |
3.13 |
|
3.14 | |
|
|
| |
|
|
| |
3.15 |
|
3.16 | |
|
|
| |
|
|
| |
3.17 |
|
3.18 | |
|
|
| |
|
|
| |
3.19 |
|
3.20 | |
|
|
| |
|
|
| |
3.21 |
|
3.22 | |
|
|
| |
|
|
| |
3.23 |
|
3.24 | |
|
|
| |
|
|
|
4. Динамическое программирование
Методом динамического программирования (ДП) решаются задачи математического программирования, удовлетворяющие принципу последовательной оптимизации: решение исходной задачи оптимизации большой размерности заменяется решением последовательности задач оптимизации малой размерности. В силу этого основным условием применимости метода ДП является возможность разбиения процесса принятия решений на ряд однотипных шагов, или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах.
Рассмотрим, как
происходит разбиение процесса принятия
решений (который мы будем представлять
как процесс функционирования некоторой
системы) на nшагов. Обозначим черезначальное состояние всего процесса, в
то же время
будет начальным состоянием первого
шага. Тогда
– состояние системы после первого шага
(или начальное состояние второго шага),
– состояние системы после второго шага
(или начальное состояние третьего шага)
и т.д.
Переход от начального
состоянияk-го
шагакконечному состояниюk-го
шага
происходит так.
Имеется набор
допустимых управлений(способов
действия на шагеk),
каждое из которых позволяет перейти из
состояния
к одному из возможных конечных состоянийk-го
шага
.
Выбраное наk-м
шаге управление обозначим через
,
а состояние, в которое перейдет процесс
из состояния
под воздействием управления
,
обозначим
.
При этом предполагается, что состояние
зависит от
и
,
и не зависит от того, каким образом
процесс перешел в состояние
(принцип отсутствия последействия).
Это предположение записывается в виде
уравнений состояний
,
.
С учетом введенных
понятий состояний и управлений запишем
показатели эффективности для всего
многошагового процесса и для каждого
k-го
шага процесса. Предполагая, что показатель
эффективностиk-го
шага зависит от начального состояния
на этом шагеи от управления на этом шаге
,
получаем целевую функцию наk-м
шаге в виде
и целевую функцию всего многошагового
процесса в виде
.
Сформулируем теперь
задачу ДП. Определить совокупность
допустимых управлений
,
переводящих процесс из начального
состояния
в конечное состояние
и максимизирующих или минимизирующих
показатель эффективности
.
Управление, при
котором достигается максимум (минимум)
целевой функции F,
называетсяоптимальным управлением.
Основное правило ДП, сформулированное американским математиком Р. Беллманом, называется принципом оптимальности: оптимальное управление обладает таким свойством, что каково бы ни было начальное состояние на любом шаге и управление, выбранное на этом шаге, последующие управления должны выбираться оптимальными относительно состояния, к которому придет процесс в конце данного шага.