
- •Глава 6. Оптимальное управление
- •6.1. Общие понятия
- •6.2. Вариационное исчисление в оптимальном управлении
- •6.3. Принцип максимума
- •6.3.1. Свойства функции Гамильтона на оптимальном решении
- •6.4. Динамическое программирование
- •6.5. Аналитическое конструирование регуляторов
- •6.5.1. Аналитическое конструирование регуляторов для линейных стационарных объектов управления
- •6.5.2. Аналитическое конструирование регуляторов для линейного стационарного объекта на основе критерия обобщенной работы
- •6.5.4. Аналитическое конструирование регуляторов для линейных стационарных объектов, подверженных возмущениям
- •6.5.5. Аналитическое конструирование регуляторов для линейных нестационарных объектов
- •6.5.6. Аналитическое конструирование регуляторов для линейных стационарных объектов с запаздыванием по каналу управления
- •6.5.7. Аналитическое конструирование регуляторов для дискретных линейных объектов
- •6.5.8. Аналитическое конструирование регуляторов для одного класса нелинейных объектов
- •6.6. Синтез субоптимальных по быстродействию автоматических систем
- •6.7. Оптимальное управление системами с распределенными параметрами
- •6.8. Линейная оптимальная фильтрация непрерывных систем
- •6.9. Синтез терминального управления линейным зашумленным объектом по критерию обобщенной работы
- •Запишем, что
- •Второе слагаемое при малом можно записать в виде
- •6.10. Дискретный алгоритм линейной фильтрации
- •6.12. Метод последовательных приближений для решения задачи синтеза оптимальных управлений
- •6.13. Синтез наблюдателей переменных состояния
- •Контрольные вопросы
6.5.4. Аналитическое конструирование регуляторов для линейных стационарных объектов, подверженных возмущениям
Имеем модель объекта с переменными в отклонениях, с допустимыми для измерения возмущениями в виде вектора F
,
(6.78)
а критерий качества в классической форме записи
.
(6.79)
Функцию принимаем в виде
. (6.80)
Подставляя исходные функции в уравнение Беллмана, имеем
(6.81)
Раскрывая скобки, перепишем данное выражение
(6.82)
Оптимальный закон управления, минимизирующий выражение в фигурных скобках, равен
. (6.83)
Подставляя полученный закон управления в функциональное уравнение Беллмана, и приравнивая коэффициенты при одинаковых степенях переменных состояния, находим уравнения для нахождения матриц R и L:
(6.84)
6.5.5. Аналитическое конструирование регуляторов для линейных нестационарных объектов
Модель динамики движения нестационарного объекта в отклонениях переменных состояния запишем в виде
.
(6.85)
Критерий качества системы управления имеет классический вид
.
(6.86)
Функцию, аппроксимирующую минимальные значения J, запишем
.
(6.87)
Подставляя исходные уравнения в уравнение Беллмана, получим
(6.88)
По аналогии с предыдущими случаями закон оптимального управления равен
. (6.89)
Подставив оптимальный закон управления в функциональное уравнение, получим уравнение Рикатти:
(6.90)
решение которого при начальных условиях R(0) обеспечивает аналитическое конструирование численных значений обратной связи системы управления. Формирование матрицы R(0) представляет отдельную задачу.
6.5.6. Аналитическое конструирование регуляторов для линейных стационарных объектов с запаздыванием по каналу управления
Пусть модель динамики движения объекта управления в области переменных состояния имеет вид
.
(6.91)
Квадратичный функционал качества системы запишем как
. (6.92)
Введем новую переменную (фиктивное управление)
(6.93)
и перепишем модель динамики объекта в виде
Используя новую переменную, перепишем критерий качества следующим образом:
(6.94)
Так как величина первого слагаемого функционала не зависит от управления, то задача минимизации сводится к отысканию экстремума интегральной квадратичной формы:
.
(6.95)
В такой постановке для вспомогательной задачи нами получено ранее решение оптимального закона управления в виде
(6.96)
или
.
(6.97)
Решение уравнения в переменных состояния относительно x(t + ) имеет вид
(6.98)
или
,
где (t) фундаментальная матрица системы.
В результате имеем закон оптимального управления в форме
.
(6.99)
Вторая составляющая закона управления формирует сигнал прогноза на основе измерения управляющих воздействий на интервале [t – , t], равном времени запаздывания объекта .
Возможен способ приближенного решения данной задачи.
Известно, что можно приближенно аппроксимировать запаздывание последовательно соединенными четырьмя-шестью апериодическими звеньями первого порядка.
Например, для четырех звеньев их можно описать в виде
(6.100)
где Xi+1 = u(t – ), I размерность исходного вектора х.
Включив модель для аппроксимации запаздывания в состав исходной модели объекта, имеем расширенную модель в области переменных состояния
,
(6.101)
где индекс тильда обозначает расширенные векторы и матрицы системы.
Для приведенной модели можно составить свой квадратичный интегральный критерий и получить известный закон управления, который будет включать часть фиктивных переменных состояния, аппроксимирующих запаздывание.