- •Теория принятия решений
- •1. Элементы теории игр
- •1.1 Основные понятия
- •1.2 Матричные игры
- •1.3 Принцип минимакса. Седловые точки
- •1.4 Смешанные стратегии
- •1.5 Пример полного решения матричной игры
- •1.6 Задания по теории игр
- •2. Задача о назначениях
- •2.1 Содержательная постановка
- •2.2 Математическая модель
- •2.3 Венгерский метод для задачи о назначениях
- •2.4 Алгоритм венгерского метода
- •2.5 Пример решения задачи о назначениях венгерским методом
- •2.6 Задания по задаче о назначениях
- •3. Задача о коммивояжере
- •3.1 Постановка задачи
- •3.2 Математическая модель
- •3.3 Метод ветвей и границ
- •3.4 Метод ветвей и границ для решения задачи коммивояжера
- •3.5 Пример решения задачи коммивояжера
- •3.6 Задания по задаче о коммивояжере
- •4. Динамическое программирование
- •4.1 Построение модели дп
- •4.2 Построение вычислительной схемы дп
- •4.3 Несколько замечаний к методу дп
- •4.4 Задача о распределении ресурсов
- •4.5 Пример решения задачи о распределении ресурсов
- •4.6 Задания по задаче о распределении ресурсов
- •4.7 Задача о замене оборудования
- •4.8 Пример решения задачи о замене оборудования
- •4.9 Задания по задаче о замене оборудования
- •Библиографический список
3.6 Задания по задаче о коммивояжере
3.1 |
|
3.2 |
|
|
|
|
|
|
|
|
|
3.3 |
|
3.4 |
|
|
|
|
|
|
|
|
|
3.5 |
|
3.6 |
|
|
|
|
|
|
|
|
|
3.7 |
|
3.8 |
|
|
|
|
|
|
|
|
|
3.9 |
|
3.10 |
|
|
|
|
|
|
|
|
|
3.11 |
|
3.12 |
|
|
|
|
|
|
|
|
|
3.13 |
|
3.14 |
|
|
|
|
|
|
|
|
|
3.15 |
|
3.16 |
|
|
|
|
|
|
|
|
|
3.17 |
|
3.18 |
|
|
|
|
|
|
|
|
|
3.19 |
|
3.20 |
|
|
|
|
|
|
|
|
|
3.21 |
|
3.22 |
|
|
|
|
|
|
|
|
|
3.23 |
|
3.24 |
|
|
|
|
|
|
|
|
|
4. Динамическое программирование
Методом динамического программирования (ДП) решаются задачи математического программирования, удовлетворяющие принципу последовательной оптимизации: решение исходной задачи оптимизации большой размерности заменяется решением последовательности задач оптимизации малой размерности. В силу этого основным условием применимости метода ДП является возможность разбиения процесса принятия решений на ряд однотипных шагов, или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах.
Рассмотрим, как
происходит разбиение процесса принятия
решений (который мы будем представлять
как процесс функционирования некоторой
системы) на n
шагов. Обозначим через
начальное состояние всего процесса, в
то же время
будет начальным состоянием первого
шага. Тогда
– состояние системы после первого шага
(или начальное состояние второго шага),
– состояние системы после второго шага
(или начальное состояние третьего шага)
и т.д.
Переход от начального
состояния k-го
шага
к конечному состоянию k-го
шага
происходит так.
Имеется набор
допустимых управлений (способов
действия на шаге k)
,
каждое из которых позволяет перейти из
состояния
к одному из возможных конечных состояний
k-го
шага
.
Выбраное на k-м
шаге управление обозначим через
,
а состояние, в которое перейдет процесс
из состояния
под воздействием управления
,
обозначим
.
При этом предполагается, что состояние
зависит от
и
,
и не зависит от того, каким образом
процесс перешел в состояние
(принцип отсутствия последействия).
Это предположение записывается в виде
уравнений состояний
,
.
С учетом введенных
понятий состояний и управлений запишем
показатели эффективности для всего
многошагового процесса и для каждого
k-го
шага процесса. Предполагая, что показатель
эффективности k-го
шага зависит от начального состояния
на этом шаге
и от управления на этом шаге
,
получаем целевую функцию на k-м
шаге в виде
и целевую функцию всего многошагового
процесса в виде
.
Сформулируем теперь
задачу ДП. Определить совокупность
допустимых управлений
,
переводящих процесс из начального
состояния
в конечное состояние
и максимизирующих или минимизирующих
показатель эффективности
.
Управление, при
котором достигается максимум (минимум)
целевой функции F,
называется оптимальным управлением
.
Основное правило ДП, сформулированное американским математиком Р. Беллманом, называется принципом оптимальности: оптимальное управление обладает таким свойством, что каково бы ни было начальное состояние на любом шаге и управление, выбранное на этом шаге, последующие управления должны выбираться оптимальными относительно состояния, к которому придет процесс в конце данного шага.
