- •Глава 6. Оптимальное управление
- •6.1. Общие понятия
- •6.2. Вариационное исчисление в оптимальном управлении
- •6.3. Принцип максимума
- •6.3.1. Свойства функции Гамильтона на оптимальном решении
- •6.4. Динамическое программирование
- •6.5. Аналитическое конструирование регуляторов
- •6.5.1. Аналитическое конструирование регуляторов для линейных стационарных объектов управления
- •6.5.2. Аналитическое конструирование регуляторов для линейного стационарного объекта на основе критерия обобщенной работы
- •6.5.4. Аналитическое конструирование регуляторов для линейных стационарных объектов, подверженных возмущениям
- •6.5.5. Аналитическое конструирование регуляторов для линейных нестационарных объектов
- •6.5.6. Аналитическое конструирование регуляторов для линейных стационарных объектов с запаздыванием по каналу управления
- •6.5.7. Аналитическое конструирование регуляторов для дискретных линейных объектов
- •6.5.8. Аналитическое конструирование регуляторов для одного класса нелинейных объектов
- •6.6. Синтез субоптимальных по быстродействию автоматических систем
- •6.7. Оптимальное управление системами с распределенными параметрами
- •6.8. Линейная оптимальная фильтрация непрерывных систем
- •6.9. Синтез терминального управления линейным зашумленным объектом по критерию обобщенной работы
- •Запишем, что
- •Второе слагаемое при малом можно записать в виде
- •6.10. Дискретный алгоритм линейной фильтрации
- •6.12. Метод последовательных приближений для решения задачи синтеза оптимальных управлений
- •6.13. Синтез наблюдателей переменных состояния
- •Контрольные вопросы
6.3. Принцип максимума
Принцип максимума является развитием классического вариационного исчисления и разработан академиком Л. С. Понтрягиным совместно с его коллегами в 1956 г.
Рассмотрим главные соотношения данного принципа на основе решения задачи о быстродействии системы управления. Пусть модель движения объекта управления имеет вид
(6.18)
и критерий оптимизации равен
.
(6.19)
Объект управления необходимо перевести из начального состояния х0 в фиксированное конечное xf. Предположим, что известна оптимальная траектория движения объекта (рис. 6.1) и оптимальный закон управления (рис. 6.2).
Рис. 6.1. Оптимальная траектория Рис. 6.2. Оптимальный закон
движения управления
Пусть при реализации оптимального закона управления в течение короткого времени произошло импульсное отклонение от оптимальной траектории, начиная с момента , а в момент управление возвращается к старой траектории. Траектории, приведенные на рис. 6.1, 6.2, трансформируются (рис. 6.3, 6.4).
Рис. 6.3. Траектория движения Рис. 6.4. Закон управления системы
системы
Обозначим
неоптимальную часть траектории движения
объекта через
,
а неоптимальный уровень управления
через
.
Запишем траектории движения неоптимальной и оптимальной систем на интервале :
;
(6.20)
.
(6.21)
Найдем вариацию траектории системы относительно оптимальной траектории
(6.22)
Пусть равна произведению положительного целого числа М на малое е. На интервале времени [, tf] движения неоптимальной и оптимальной систем запишем в виде
;
(6.23)
.
Если разложить в ряд Тейлора правую часть уравнения и ограничиться линейными членами разложения, то получим
.
(6.24)
В результате имеем зависимость для скорости изменения вариации траектории в виде
.
(6.25)
Проведем плоскость через N таким образом, чтобы ни одна неоптимальная траектория не доходила до данной плоскости. Местоположение данной плоскости характеризуется вектором , который соответствует нормали к данной плоскости в точке N. Отрезок NL соответствует ( х) вариации неоптимальной траектории относительно оптимальной в момент времени tf.
Между вектором и NL имеем тупой угол, который соответствует негативному значению скалярного произведения этих векторов
(6.26)
Можно записать составляющие данного неравенства
(6.27)
или
. (6.28)
Данное неравенство может превратиться в равенство при максимальном значении произведения
.
(6.29)
Из этого условия возникло наименование «принцип максимума». Для оценки взаимосвязи координат объекта и вектора примем, что
.
(6.30)
Продифференцировав выражение (6.30), имеем
;
(6.31)
.
Откуда следует
(6.32)
или, используя выражение (6.29), запишем
.
(6.33)
Система
дифференциальных уравнений
получила наименование сопряженной и
ее решение возможно совместно с основной
моделью движения объекта:
(6.34)
при условии задания начальных или граничных условий на координаты х и . Поскольку вектор введен искусственно, то одна из основных проблем при использовании данного метода заключается в неопределенности начальных или граничных координат . Для критериев качества, отличных от критерия быстродействия, используется процедура замены критерия новой координатой объекта управления. Например, имеем интегральный критерий качества вида
.
(6.35)
Обозначив J через дополнительную координату xn+1, получим
.
(6.36)
Присоединяем ее к основной модели динамики движения объекта управления:
(6.37)
или в виде
.
Относительно расширенной модели формируется функция
.
(6.38)
Функцию Н часто называют функцией Гамильтона. Если ищется минимум J, то n+1 = 1, а при поиске максимума J1 принимаем n+1 = 1.
Рассмотрим пример задачи о предельном быстродействии динамической системы:
;
,
которую нужно перевести из х1(0) = х2(0) = 0 в заданное состояние x1f и x2f .
Управляющее воздействие ограничено
.
Составим функцию Гамильтона:
.
Сопряженная система имеет вид
;
.
Интегрируя данную систему, имеем
что позволяет записать Н в виде
.
Максимум функции Н достигается при условии
.
Таким образом, оптимальное значение u(t) соответствует своим предельным значениям. При t = t1 управляющее воздействие меняет знак:
c2 – c1t1 = 0 и t1 = c2/c1.
На интервале времени [0, t1] закон управления определяется
u(t) = umsignc2,
что позволяет с учетом нулевых начальных условий х1(0) = х2(0) = 0 записать решения уравнений движения объекта в виде
.
Для интервала времени [t, tf] имеем
u(t) = umsignc2
и
С учетом граничных условий для tf находим
.
Поскольку tf t1, то выражение имеет следующий вид:
.
Равенство имеет место, когда процесс состоит из одного интервала. Значение для t1 определяется неравенством
.
На основании полученных неравенств можно определить sign C2:
при
и
;
при
и
.
Дополнительные исследования знаков sign C2 при x1f > 0, x2f > 0 и
х1f < 0, x2f < 0 позволяют записать следующие неравенства:
,
если
;
,
если
.
Рассмотрим для приведенного объекта синтез закона управления, который минимизирует интегральный квадратичный критерий:
.
Введем переменную
x3 = J
и
.
Функция Гамильтона для расширенной модели имеет вид
.
Максимальное значение Н находим из условия
.
Откуда находим оптимальный закон управления:
.
Сопрягающая система имеет следующий вид:
Перепишем уравнение для оптимального управления
;
.
