- •Глава 6. Оптимальное управление
- •6.1. Общие понятия
- •6.2. Вариационное исчисление в оптимальном управлении
- •6.3. Принцип максимума
- •6.3.1. Свойства функции Гамильтона на оптимальном решении
- •6.4. Динамическое программирование
- •6.5. Аналитическое конструирование регуляторов
- •6.5.1. Аналитическое конструирование регуляторов для линейных стационарных объектов управления
- •6.5.2. Аналитическое конструирование регуляторов для линейного стационарного объекта на основе критерия обобщенной работы
- •6.5.4. Аналитическое конструирование регуляторов для линейных стационарных объектов, подверженных возмущениям
- •6.5.5. Аналитическое конструирование регуляторов для линейных нестационарных объектов
- •6.5.6. Аналитическое конструирование регуляторов для линейных стационарных объектов с запаздыванием по каналу управления
- •6.5.7. Аналитическое конструирование регуляторов для дискретных линейных объектов
- •6.5.8. Аналитическое конструирование регуляторов для одного класса нелинейных объектов
- •6.6. Синтез субоптимальных по быстродействию автоматических систем
- •6.7. Оптимальное управление системами с распределенными параметрами
- •6.8. Линейная оптимальная фильтрация непрерывных систем
- •6.9. Синтез терминального управления линейным зашумленным объектом по критерию обобщенной работы
- •Запишем, что
- •Второе слагаемое при малом можно записать в виде
- •6.10. Дискретный алгоритм линейной фильтрации
- •6.12. Метод последовательных приближений для решения задачи синтеза оптимальных управлений
- •6.13. Синтез наблюдателей переменных состояния
- •Контрольные вопросы
6.9. Синтез терминального управления линейным зашумленным объектом по критерию обобщенной работы
Линейный объект управления характеризуется векторным управлением
.
(6.216)
Линейный измеритель фазовых координат пусть описывается выражением (6.183). Необходимо определить вектор управления и вектор, минимизирующий математическое ожидание функционала:
(6.217)
Преобразуем функционал (6.217). Для этой цели продифференцируем по времени квадратичную форму
Далее проинтегрируем это выражение в интервале [t0, tf]:
Используя уравнение (6.216), учитывая равенство Г(tf) = Гf, и подставляя полученное выражение ХТ(tf) Г(tf) Х(tf) в (6.217) имеем
Определим матрицу Г(t) так, чтобы она удовлетворяла уравнению
.
(6.218)
С учетом уравнения (6.218) функционал (6.217) принимает вид
(6.219)
Выражение M{VТ(t) Г(t) X(t)} можно записать в виде
,
где q(t, ) матрица весовых функций уравнения (6.216).
Воспользовавшись следующим соотношением для векторов
ST(t)X(t) = trace [S(t)XT(t)],
Запишем, что
Учитывая, что qТ(t,t) = E(t) единичная диагональная матрица, M{V(t)} = 0, M{V(t)VT()}= G(t)(t ), имеем
Множитель 1/2 появляется вследствие того, что при верхнем пределе интегрирования функция q(t,t) терпит разрыв первого рода и учитывается только половина площади -функции, симметричной относительно начала координат. Второй интеграл представим в виде
Поскольку вектор U() зависит от вектора измерения Z() на интервале t0 t , а V(t) белый шум в момент времени t, то подынтегральное выражение в первой слагаемой последней формулы равно нулю в силу равенства
M{V(t)UT()}= 0, t0 t .
Второе слагаемое при малом можно записать в виде
Если 0, то приведенный интеграл также стремится к нулю и тогда
.
Следовательно, функционал (6.219) принимает вид
(6.220)
В формуле положительно определенного функционала (6.220) от управления U не зависит первое и последнее слагаемые. Поэтому вектор оптимального управления U следует отыскивать путем минимизации только зависящих от него составляющих:
(6.221)
Если имеется вектор измерений Z, связанный с вектором состояния, то достаточно обеспечить минимум условного математического ожидания этого функционала при полученной в результате измерений реализации вектора Z(), т. е.
(6.222)
Применяя операцию условного математического ожидания в уравнении (6.222) и учитывая, что при заданной реализации Z() управление U(t) есть детерминированная функция, получим
(6.223)
Функционал (6.223) состоит из двух положительно определенных слагаемых. Он достигает своего минимального значения при выборе вектора управления в виде
.
(6.224)
При этом векторе управления минимальное значение выражения (6.223) равно
.
Как следует из формулы (6.224), оптимальное управление, минимизирующее функционал (6.217) для линейного объекта, является линейной функцией вектора оценки состояния объекта. Этот результат подтверждает теорему разделения о том, что в линейных системах при случайных гауссовских сигналах с помехами и квадратичном критерии качества оптимальный регулятор представляет собой последовательное соединение оптимального линейного фильтра для оценки состояния и детерминированного оптимального устройства (регулятора) управления.
Пусть в качестве примера имеем объект управления в виде двух апериодических звеньев, соединенных последовательно, который описывается уравнением
при a11 > 0, a21 > 0, a22 > 0, b11 > 0.
Переменная Х2 на интервале [t0, tf] измеряется с ошибкой N(t):
Z2 = X2 + N.
Пусть функционал качества вида (6.217) имеет следующие матрицы:
.
Согласно (6.224), оптимальное управление U1 имеет вид
.
Для определения 11(t) и 12(t) составляют уравнения
Для определения
оценок
и
используем уравнение Калмана – Бьюси:
