
- •I Раздел – оптимальные системы.
- •Актуальность курса
- •Постановка задачи оптимального управления Ограничения : − на скорость движения
- •Задача экскаваторщика: управление двигателем постоянного
- •Задача о безударной стыковке двух тел
- •Задача оптимального управления консервативным объектом (задача крановщика)
- •Методы расчёта оптимального управления
- •Обсуждение уравнения Эйлера-Лагранжа
- •Задача с ограничением типа равенства
- •Изопериметрическая задача
- •Принцип взаимности
- •Задача с ограничениями типа неравенства
- •2. Принцип максимума Понтрягина.
- •Теорема принципа максимума Понтрягина
- •Синтез оптимального управляющего устройства
- •3. Динамическое программирование
- •Иллюстрация метода на примере решения задачи
- •Последний 0-ой шаг
- •Случайные методы поиска
Синтез оптимального управляющего устройства
U
+1
b t
t1
t2
-1
От управления функцией времени переходим к управлению функцией фазовых координат с использованием синтезирующих функций и метода фазовой плоскости.
Задача : управление двигателем с независимым возбуждением
(1)
Введём
фазовую плоскость с координатами
и
Тогда задача оптимального управления может быть сформулирована как задача наибыстрейшего перевода на фазовой плоскости (у1у2) из начальной точки в начало координат.
(2)
- уравнение объекта
U = +1 U = -1
(3)
(4)
Фазовые
траектории :
По скольку цель управления – перевод точки из любой точки фазового пространства в начало координат, то заключительный этап движения будет проходить по траекториям АО и ВО, т.о. движение системы на следующем отрезке будет проходить по линии переключения.
(5)
линия переключения АОВ
V = 0 – если находимся на линии переключения
V < 0 - U = -1
V > 0 - U = +1
V – синтезирующая функция, позволяющая перейти от управления функцией времени к управлению функцией фазовых координат.
Основным
недостатком
метода является неизвестное значение
введённой в гамильтониане ψ-функции.
Управляющее
воздействие U1
…
U2
– подвержено ограничениям типа насыщение.
Выбирается так, чтобы иметь максимальным
,
что даёт
,
(6)
(7)
Начальные
условия :
(8)
Имея Ui , выбранное согласно (6) уравнения (7) решаем через нач. условия (8).
Это
даёт :
(9)
(10)
Подставляя (9) и (10) получим :
(11)
Наконец, исключив время t и θ из (11) получим :
-
управляющее воздействие, зависящее от
фазовых
координат.
Задача синтеза оптимального управления заменяется другой задачей. От (1) до (8) пройти несколько раз, т.е. несколько итераций.
3. Динамическое программирование
( дискретный вариант )
Метод динамического программирования был разработан в 50-ом году нашего столетия Р.Белманом для решения различных задач в области техники, экономики… Метод справедлив для таких систем, для которых справедлив принцип оптимальности.
Оптимальное поведение обладает тем свойством, что какое бы ни было первоначальное состояние и решение в начальный момент времени следующее решение должны составлять оптимальное поведение оптимального состояния, полученного в результате первого решения.
В
динамических системах, описываемых
дифференциальными уравнениями состояние
характеризуется вектором
, поведение характеризуется изменениями
,
а решение соответствует оптимальному
управлению
.
Система, удовлетворяющая принципу
оптимальности обладает мартовскими
свойствами, т.е. поведение её на конечном
отрезке времени полностью определяется
управлением на этом отрезкеt1
≤
t ≤ t2
и состояние в момент времени t1.
Для динамических систем, описанных дифференциальными уравнениями, этот принцип обоснован и доказан, а для остальных систем принимается интуитивно.
Принцип оптимальности
ранее применялся к таким системам,
математическое описание которых было
неизвестно, а состояния, критерий
оптимальности которых, задавались
экспериментальными значениями в
дискретные моменты времени. В этих
случаях принцип оптимальности принимался
интуитивно.