- •Основы оптимизации процесса управления Критерий качества управления
- •1.1. Математическое описание объекта управления и внешней среды
- •2. Одношаговые задачи управления
- •2.1. Линейное программирование
- •Решение задачи линейного программирования симплекс-методом
- •2.2. Двойственная задача линейного программирования
- •3. Многошаговые процессы управления
- •2. Задача распределения средств между предприятиями
- •3.1. Поиск оптимальной последовательности (цепочки) управлений методом динамического программирования
- •Управление конечным состоянием
- •Методика построения и решения задачи средствами динамического программирования
- •Примеры построения и решения многошаговых задач средствами динамического программирования
- •Построение модели
- •Решение задачи
- •4. Игровые задачи управления
- •4.1. Основы игровых задач
- •Понятие стратегии
- •Верхняя и нижняя цены игры
- •Цены и оптимальные стратегии игр
- •Чистые и смешанные стратегии
- •Верхняя и нижняя цены игры при смешанных стратегиях
- •Нахождение оптимальных стратегий
- •Примеры составления и решения чистых игровых задач
- •Пример решения смешанной игры
- •4.2. Кооперативные игры
- •Методика поиска оптимального дележа
- •Пример кооперативной игры
- •Литература
Управление конечным состоянием
В ряде задач характер движения объекта в процессе управления интереса не представляет, а существенным является только состояние хп, в которое переходит объект по окончании процесса управления. При этом критерием качества управления будет служить значение целевой функции в конце процесса управления, т е. величина
Рассмотрим
путь поиска оптимального управления
.
На метода Беллмана конечным состоянием,
который заключается в том, что если
система находилась в состоянии
,
то необходимо найти оптимальное
управление
,
которое на последующих шагах k+1,…,n
приводило бы к максимуму целевую функцию
.
Функция
носит название локального оптимума на
k-м
шаге (условный оптимум).
Беллман предложил следующий путь поиска локального оптимума. Записывается уравнение целевой функции на k-м шаге в виде:
,
где
m-
число возможных подсостояний хк
,
-
оптимальная (максимальная) целевая
функция или локальный оптимум на k+1
шаге; i=1,…z
- число возможных подуправлений Uk.
Из уравнения видно, что оптимальная целевая функция на k-м шаге определяется путем поиска максимума суммы оптимальной целевой функции на (k+1)-м шаге и эффективности перехода из (k-1)-го состояния в
k-е состояние.
Пользуясь
указанной формулой, Беллман предложил
локальную оптимальную целевую функцию,
а следовательно, и оптимальное управление
для каждого k-го
состояния определять, начиная с конечного
состояния
,
т.е. двигаясь с конца к исходному
состоянию. Такое предложение позволяет
существенно упростить расчеты, т.к.
,
а
для вычисления целевой функции на
(n-1)-м
шаге используется уже известная
оптимальная целевая функция на n-м
шаге
:
.
Зная оптимальную целевую функцию на (n-1)-м шаге, можно найти оптимальную целевую функцию на (n-2)-м шаге и т.д. до 1-го шага.
Таким
образом, можно построить ряд локальных
(условных) оптимумов. Условность состоит
в том, что оптимальный переход
осуществляется из состояния
.
Ряд условных оптимумов представляется
в виде последовательности
.
Для каждого условного оптимума определяется условное оптимальное управление в виде последовательности
.
Окончательным решением задачи является определение безусловных оптимумов и безусловных оптимальных управлений, т.е. необходимо выстроить обратный ряд ряд вида:
.
Методика построения и решения задачи средствами динамического программирования
Построение задачи ведется в следующей последовательности.
В поставленной задаче выделяются состояния
и выбирается способ деления процесса
на шаги k=1,…, n.Каждое из состояний xk представляется в виде множества подсостояний
и определяется управление
.Записывается уравнение, определяющее состояние
,
являющееся функцией предыдущего
состояния
и управления
,
в виде
;
j =1,…m,
i=1,…,
z..Вводится показатель эффективности для каждого k-го перехода
.Составляется общая целевая функция в виде суммы эффективностей на k-х шагах
.Для наглядности можно построить граф модели.
Этапы решения задачи следующие.
Записываются уравнения Беллмана для k-го и n-го шагов в виде:
,
.
Определяется ряд условных оптимальных управлений
.Строится ряд безусловных оптимумов и безусловного оптимального управления. Если начальное состояние x0 единственное, то максимум
общей
целевой функции равен условному оптимуму
1-го перехода
.
Далее
выстраивается ряд
.
Выполняется
это следующим образом. Предполагается,
что система находится в состоянии x0
. Из всех вариантов перехода на первом
шаге выбирается тот, у которого
максимален.
Исходя из этого выбирается оптимальное
.
Указанная процедура повторяется для
всех последующих состояний
.
4.
Если начальных состояний x0i
несколько i=1,…m
и они составляют множество
,
то максимум целевой функции определяется
по формуле
.
Далее
строится ряд
.
