- •Раздел 2. Некоторые критерии оптимальности. 9
- •1. Введение. Основные понятия и определения.
- •1.1. Задача нахождения алгоритмов управления.
- •Раздел 2. Некоторые критерии оптимальности.
- •2.1. Задача о максимальном быстродействии.
- •2.2. Задача синтеза систем по интегральным критериям качества переходных процессов.
- •2.3. Задача ограничения энергетических ресурсов.
- •3. Математические основы теории оптимальных систем.
- •3.1. Функционалы, вариации и их свойства.
- •3.2. Понятие линейности функционала.
- •3.3. Уравнение Эйлера. Уравнение Эйлера-Пуассона. Условия трансверсальности.
- •3.4. Задачи на условный экстремум.
- •3.5. Принцип максимума.
- •3.6. Динамическое программирование.
- •3.7. Способы нахождения фазовых траекторий.
- •4. Управление, оптимальное по быстродействию, в разомкнутых системах.
- •4.1. Нахождение оптимальных управлений с помощью принципа максимума. Теорема об “n” интервалах.
- •4.2. Физическая сущность управления, оптимального по быстродействию.
- •4.3. Определение моментов переключения в линейных оптимальных управлениях.
- •4.4. Определение моментов переключения при дополнительных ограничениях, накладываемых на координаты.
- •4.5. Нахождение моментов переключения в нелинейных оптимальных управлениях.
- •4.6. Определение знака первого интервала.
- •5. Управление, близкое к оптимальному.
- •5.1. Уменьшение количества интервалов управления.
- •Перечень заданий для самостоятельной работы.
- •Список литературы
- •443100, Самара, ул. Молодогвардейская,244. Корпус №8
4.2. Физическая сущность управления, оптимального по быстродействию.
Оптимальное управление по быстродействию имеет глубокий физический смысл, связанный с балансом энергии в объекте. Вспомним основную формулу, связывающую мощность и работу,
(4.27)
Из (4.27) видно, что для совершения одной и той же работы за меньшее время потребуется большая мощность. Обычно в объектах управления работу А представляют в виде суммы
(4.28)
где Аз — энергия, запасенная в самом объекте (электрическая, тепловая, механическая и т. д.);
Ап — полезная работа, совершаемая в объекте. Объекты, обладающие свойствами, выраженными формулами (4.27) и (4.28), описываются различными дифференциальными уравнениями (линейными, нелинейными, в частных производных и т. д.).
Запишем формулу (4.27) с учетом (4.28) в виде
(4.29)
В
оптимальном управлении наибольший
интерес представляет член
,
характеризующий энергию, запасенную
в объекте. Нормально функционировать
объект может только тогда, когда энергия,
запасенная в нем, соответствует
номинальному режиму. Например, допустим,
что двигатель будет работать с постоянной
скоростью вращения
тогда, когда кинетическая энергия,
запасенная в его маховых массах,
соответствует
.
Теплообменник будет работать нормально
тогда, когда его пластины нагреваются
до заданной температуры
и ей соответствует некоторое количество
тепловой энергии, запасенной в пластинах
и контурах теплообменника. Расход
жидкости при свободном истечении из
резервуара, равный заданному Q,
соответствует определенной ее высоте,
а значит и объему резервуара. Таким
образом, в резервуаре имеется запас
веществ, в частности жидкости.
Из приведенных примеров видно, что несоответствие запасенной энергии номинальному режиму вызывает изменение управляемых координат.
Увеличивая мощность N, можно ускорить процессы запасания вещества и энергии в объекте, соответствующие номинальному режиму, и тем самым ускорить изменение управляемых координат. Однако совершенно очевидно, что беспредельно увеличивать ее нельзя. Мощность N, развиваемая объектом, ограничивается по двум причинам: ограничением мощности источника питания и ограничением, вызванным конструкцией объекта управления. Поясним это примерами. Если электрический двигатель управляется каким-либо усилителем (электронный, магнитный, электромашинный), то мощность управления ограничивается мощностью усилителя. Если двигатель управляется от сети практически неограниченной мощности, то мощность управления ограничивается конструкцией обмоток или коллектора.
Тепловая мощность, подводимая к теплообменнику, ограничивается или проходными сечениями управляющих органов, или тепловыми нагрузками, допустимыми для пластин.
|
|
|
|
Рис. 4.3. Процессы в объекте управления, который описывается дифференциальным уравнением первого порядка
Рассмотрим энергетические соотношения при оптимальном управлении некоторыми объектами. Начнем с объектов управления, которые описываются линейными дифференциальными уравнениями первого порядка,
(4.30)
Уравнение (4.30) описывает инерционное звено первого порядка. Решение его хорошо известно при скачкообразном изменении и
(4.31)
Изменение
координат и
и х
во времени показано на рис. 4.1, а.
Рассмотрим
площадь
,
ограниченную линией установившегося
состояния
и кривой
,
которая пропорциональна энергии,
запасенной в объекте управления. Возьмем
электрическую цепь, содержащую
последовательно включенные индуктивность
и сопротивление. Тогда х будет
соответствовать току
,
а и —
приложенному напряжению, и решение
(4.31) будет иметь вид
где
Определяем площадь
Возьмем
половину произведения
Получили хорошо известную формулу, которая дает величину магнитной энергии, запасенной в индуктивности.
Площадь
,
очевидно, пропорциональна полезной
работе, совершаемой на активном
сопротивлении. Таким образом, энергия,
подведенная к объекту, расходуется на
изменение запаса внутренней энергии
и на полезную работу. При отключении
объекта запасенная энергия превращается
в полезную работу, вызывая изменение
координаты х.
Увеличим
управляющее воздействие до значения
.
Координата х
должна принять установившееся значение
при том же характере изменения
(рис.4.3, б).
Определим
площадь
,
которая ограничена кривой
до значения
.
Для
определения площади нужно знать время
,
легко определяемое из решения (4.31),
или
так как
.
При этом
Покажем,
что эта площадь равна площади
Энергия,
запасенная объектом к моменту времени
,
равна энергии, соответствующей
значению
.
Это положение справедливо для любых
значений
и любых максимальных управляющих
воздействий. Если теперь в момент
сделать переключение управляющего
воздействия от значения
до значения
,
то управляемая координата х
сразу примет установившееся значение
.
Это произойдет потому, что запас энергии
в объекте точно равен тому запасу
энергии, который необходим в номинальном
режиме, а раз это так, то нет причин,
вызывающих изменение х.
Для оптимального по быстродействию
управления требуется один интервал
управления длительностью
.
По истечении интервала управление прекращать нельзя, его нужно поддерживать на уровне , чтобы удерживать координату на значении .
Многие объекты управления, содержащие интегрирующие звенья, описываются уравнением вида
(4.32)
Запишем решение уравнения (4.32) при нулевых начальных условиях и скачкообразном изменении U
(4.33)
Если задано значение , то из (4.33) легко находится время
Таким образом, интегрирующее звено совершает только полезную работу, и в нем не запасается энергия. Для оптимального управления, т. е. для достижения за минимальное время, требуется максимальное значение воздействия . Для объекта, который описывается уравнением (4.32), необходим один интервал управления длительностью . После достижения заданного значения координаты управление должно прекращаться, т. е. и = 0.
Рассмотрим оптимальное управление объектами, которые описываются линейными дифференциальными уравнениями второго порядка. Для наглядности представим себе объект, состоящий из двух инерционных звеньев, включенных последовательно. Уравнение такого объекта имеет вид
(4.34)
Запишем решение (4.34) при нулевых начальных условиях и скачкообразном управляющем воздействии
(4.35)
Изменения и м показаны на рис. 4.4, а. Очевидно, что площадь пропорциональна энергии, запасенной в объекте, а площадь — полезной работе.
Рис.
4.4. Процессы в объекте управления,
который описывается дифференциальным
уравнением второго порядка
Определим площадь
Как и следовало ожидать, запасенная энергия пропорциональна сумме энергий, запасенных в отдельных звеньях.
У
К
огда
координата достигнет значения
,
изменим
скачком от
до
.
Определим время
(каким-либо численным методом), за
которое координата достигнет значения
из уравнения
Подставив
значение
,
найдем величину
.
Если
сравнить площади
и
,
то можно убедиться, что
при любых
и
.
Таким
образом, энергия, запасенная в объекте,
будет превосходить энергию, соответствующую
номинальному режиму. Вследствие этого
выходная координата будет изменяться
до тех пор, пока запа
Рис.
4.5. Анализ процессов при различных
алгоритмах управления и нахождение
оптимального алгоритма
На
рис. 4.5 показано изменение всех координат,
характеризующих объект управления, и,
и х.
При длительности интервала
в звене 1 накапливается значительный
избыток энергии, пропорциональный
площади
.
Этот избыток в первом звене вызывает
изменение координаты во втором звене
в сторону ее увеличения (траектории
1).
Сделаем
переключение в момент времени
.
В этот момент запас энергии в системе
равен запасу энергии при установившемся
режиме, т.е.
,
На рис. 4.5 этому случаю соответствуют траектории 2. При этом координата х не достигает значения за конечное время. Очевидно, траектории 1 и 2 не будут оптимальными, так как они не оканчиваются за конечное время, имеют перерегулирования и дотягивания.
Управление координатой х можно осуществить другим путем. Дадим объекту управления запас энергии, несколько больший, чем требуется при номинальном режиме. При подходе к номинальному значению управляемой координаты отнимем этот излишек путем подачи отрицательного управляющего воздействия, равного максимально допустимому, т. е. . К моменту окончания управления энергия и координата х должны быть равны заданным значениям. Этот случай показан на рис. 4.5 траекториями 3. При этом процесс заканчивается за конечное время и протекает без перерегулирований. Этот процесс и будет оптимальным.
Из
приведенного примера видно, что для
оптимального управления требуется
два интервала управления
,
где управление должно один раз менять
знак. Для удержания координаты в
номинальном режиме управление прекращать
нельзя, его следует сделать соответствующим
номинальному режиму
.
Рассмотрим теперь объект, который описывается дифференциальным уравнением
(4.36)
Объект представляет собой два интегрирующих звена, включенных последовательно. Схема, на которой показано последовательное соединение двух маломощных двигателей, изображена на рис. 4.6, а. Если пренебречь их электромеханическими постоянными времени, а за выходные координаты принять перемещение движков и х, то такая система будет описываться уравнением вида (4.36).
Рассмотрим
отработку координаты х.
Подадим на
максимальное управляющее воздействие
.
Движок
будет перемещаться с постоянной
скоростью, а движок х
- с постоянным
ускорением
при
нулевых начальных условиях. Очевидно,
чтобы остановить движок х,
требуется движок
вернуть в нулевое положение. Для этого
на
следует
изменить знак управляющего воздействия,
т.е. среверсировать его. Тогда движок
будет двигаться к нулю, а движок
х—тормозиться.
При попадании движка
в нулевое положение, управляющее
воздействие следует сделать равным
нулю. Движение всех координат объекта
показано на рис. 4.6, б. Видно, что и в этом
случае требуется два интервала управления
и одна
смена знака.
Продолжая такие исследования для систем более высоких порядков, придем к выводу, что количество интервалов управления и смены их знака зависят от порядка дифференциального управления, которым описывается объект управления. Точное количество интервалов управления дается теоремой об «п» - интервалах. Теперь понятен и ее физический смысл: число интервалов должно быть равно порядку дифференциального уравнения, так как порядок его определяется количеством звеньев, в которых может запасаться тот или иной вид энергии или совершаться работа.
Рис.
4.6. Оптимальное управление двумя
интегрирующими звеньями:
Д
— двигатель; Р
— редуктор
Если рассматривать
параллельное соединение звеньев, то,
проводя аналогичные рассуждения о
балансе энергий, можно дать физическое
объяснение полученных алгоритмов
оптимального управления.
Наряду
с физическим толкованием оптимального
управления по быстродействию, дадим и
его геометрическое толкование. Функции
являются импульсами и указывают
направление движения системы. Рассмотрим
схему (см. рис. 4.2, а)
и уравнения
(4.3), характеризующие объект управления,
состоящий' из двух звеньев.
Для
такого объекта управление будет
определяться вектором
,
который один раз меняет знак, и вектором
,
который знака не меняет. Рассмотрим
оптимальное управление на фазовой
плоскости с осями
и
(рис. 4.).
Исходя, из начальных условий предположим,
что первый интервал положительный,
значит функции
и
также положительные, так как
они задают направление разгона. Построим
на плоскости участок фазовой траектории,
которая соответствует положительному
управлению (кривая 1).
Наметим
на этой кривой точку а,
из которой отложим вектор фазовой
скорости
,
касательной к траектории. Этот вектор
имеет составляющие по осям
и
.
Запишем
функцию Гамильтона
|
|
Рис.
4.7. Связь между векторами
|
Проекции
и
будут
со ответствовать проекциям вектора
,
и
.
Для
максимума гамильтониана Н
требуется,
чтобы знаки
,
и
,
совпадали. Поэтому векторы
и
параллельны (см. рис. 4.7).
В
некоторый момент времени, соответствующий
точке b,
функция
изменит знак на отрицательный. Вектор
изменит свое положение в пространстве.
Теперь проекция
будет отрицательной, а
по-прежнему — положительной.
Для
максимума гамильтониана
Н требуется,
чтобы изменила знак проекция скорости
.
Но знак
может измениться только за счет изменения
управляющего воздействия и.
После изменения управляющего
воздействия с и
на - и
движение системы пойдет по участку
траектории 2.
Направления векторов
и
после смены знака и
совпадают,
следовательно, на любом участке фазовой
траектории
.
Поэтому соотношения, определяющие
максимум функции Гамильтона, можно
проверять на любом участке оптимальной
траектории.
