- •Глава 6. Оптимальное управление
- •6.1. Общие понятия
- •6.2. Вариационное исчисление в оптимальном управлении
- •6.3. Принцип максимума
- •6.3.1. Свойства функции Гамильтона на оптимальном решении
- •6.4. Динамическое программирование
- •6.5. Аналитическое конструирование регуляторов
- •6.5.1. Аналитическое конструирование регуляторов для линейных стационарных объектов управления
- •6.5.2. Аналитическое конструирование регуляторов для линейного стационарного объекта на основе критерия обобщенной работы
- •6.5.4. Аналитическое конструирование регуляторов для линейных стационарных объектов, подверженных возмущениям
- •6.5.5. Аналитическое конструирование регуляторов для линейных нестационарных объектов
- •6.5.6. Аналитическое конструирование регуляторов для линейных стационарных объектов с запаздыванием по каналу управления
- •6.5.7. Аналитическое конструирование регуляторов для дискретных линейных объектов
- •6.5.8. Аналитическое конструирование регуляторов для одного класса нелинейных объектов
- •6.6. Синтез субоптимальных по быстродействию автоматических систем
- •6.7. Оптимальное управление системами с распределенными параметрами
- •6.8. Линейная оптимальная фильтрация непрерывных систем
- •6.9. Синтез терминального управления линейным зашумленным объектом по критерию обобщенной работы
- •Запишем, что
- •Второе слагаемое при малом можно записать в виде
- •6.10. Дискретный алгоритм линейной фильтрации
- •6.12. Метод последовательных приближений для решения задачи синтеза оптимальных управлений
- •6.13. Синтез наблюдателей переменных состояния
- •Контрольные вопросы
6.5.7. Аналитическое конструирование регуляторов для дискретных линейных объектов
Уравнения динамики движения объекта управления в переменных состояния имеют вид
.
(6.102)
Пусть переменные удовлетворяют естественным граничным условиям
при функционале качества
.
(6.103)
Обозначим функцию, соответствующую min J(T), через
.
(6.104)
Запишем функциональное уравнение Беллмана:
(6.105)
Разложим (X(T)) в ряд Тейлора, сохранив в нем следующие члены:
где X = X(T) – X(0).
С учетом принятой функции (X(T))
(6.106)
перепишем функциональное уравнение
(6.107)
С учетом модели динамики движения объекта функциональное уравнение имеет вид
(6.108)
Производная от фигурных скобок по U(0) и соответственно оптимальный закон управления равны:
;
(6.109)
.
(6.110)
Обозначим выражение
.
(6.111)
Тогда
.
(6.112)
Подставим выражение для оптимального закона в функциональное уравнение (6.105):
(6.113)
Отсюда имеем
уравнение для нахождения матрицы
:
.
(6.114)
В сравнении с формулами для расчета матрицы R для непрерывных систем полученное выражение является более сложным. Полученный закон управления справедлив для любого такта U(RT) = = NX(XT).
Пусть в качестве примера уравнение объекта имеет вид
X[(k + 1)T] = 0,7X(kT) + 0,5U(kT),
а критерий качества равен
.
В соответствии с выражением (6.107) имеем
или
(1 + 0,25r)(1 – 0,5r) – 0,125r2 = 1 – 0,26r – 0,253r2 = 0,
0,253r2 + 0,26r – 1 = 0.
Имеем r1,2 0,13 1.
Устойчивому решению будет соответствовать r = 0,87. Подставляя это значение в уравнение (6.112), имеем
и
U(kT) = 0,24X(kT).
6.5.8. Аналитическое конструирование регуляторов для одного класса нелинейных объектов
Пусть динамическая модель объекта управления имеет вид
(6.115)
Раскладывая правые части в ряд Тейлора, имеем
.
(6.116)
Необходимо определить управления, которые при произвольных начальных условиях минимизируют квадратичный интегральный критерий
.
(6.117)
Рассмотрим решение этой задачи для случая n = m = 1:
;
(6.118)
.
(6.119)
Примем, что функция имеет вид
.
(6.120)
Подставим исходные функции в уравнение Беллмана
(6.121)
и раскроем внутренние скобки
Экстремальное значение выражения в фигурных скобках имеем при условии, что,
.
(6.122)
Значения коэффициентов rII и rIII определим, подставляя UIопт в функциональное уравнение
откуда имеем искомую систему алгебраических уравнений:
(6.123)
6.6. Синтез субоптимальных по быстродействию автоматических систем
Рассматриваемый метод основан на разделении быстрых и медленных движений, а также использовании методов обратных задач динамики. Методика синтеза алгоритмов управления, субоптимальных по быстродействию, разработана П. Д. Крутько.
В соответствии с методикой предлагается решать три задачи в следующей последовательности.
1. Заданную передаточную функцию объекта управления W0(p) аппроксимируют передаточной функцией W(p).
2. Для аппроксимирующей функции W(p) синтезируют алгоритм управления, который обеспечивает программную траекторию, соответствующую минимальному времени достижения окрестности назначенного состояния управляемого объекта.
3. Для полной модели с передаточной функцией W0(p) синтезируют алгоритм управления, который обеспечивает высокоточное слежение за программной траекторией.
Структурная схема системы, субоптимальной по быстродействию, приведена на рис. 6.6.
Рис. 6.6. Структурная схема субоптимальной системы
На вход системы поступает величина XT = const, характеризующая заданное конечное состояние управляемого объекта, которого нужно достигнуть за время Т. Величина Т не задана и определяется динамикой первой подсистемы. Методику синтеза алгоритма управления рассмотрим для объекта с передаточной функцией
,
(6.124)
где полином
.
Во временной области движение объекта описывается дифференциальным уравнением 4-го порядка
.
(6.125)
Управляющая функция ограничена
U U U. (6.126)
Для начального состояния объекта управления
X(0) = X0, X(v)(0) = Xv0,
требуется
синтезировать алгоритм управления
,
который обеспечит перевод объекта в
состояние
(6.127)
при почти минимальной длительности Т. Исходную передаточную функцию объекта управления представим в виде
.
(6.128)
Принимаем, что полюса p3,4 могут быть вещественными или комплексно-сопряженными и расположенными значительно дальше от мнимой оси, чем вещественный полюс p2. Тогда передаточную функцию, аппроксимирующую медленные движения, запишем в виде
,
(6.129)
где
.
Синтезируем
оптимальный по быстродействию алгоритм
управления
.
По методике синтеза оптимальных релейных
систем, рассмотренной А. А. Павловым
для объектов типа Wоб(p),
алгоритм управления имеет вид
(6.130)
Структурная схема замкнутой подсистемы с данным алгоритмом имеет вид, представленный на рис. 6.7.
Рис. 6.7. Схема релейной оптимальной по быстродействию системы
Уравнения (6.130)
можно упростить, разложив функцию
и ограничиваясь квадратными членами:
(6.131)
С учетом знака
производной
равенство (6.131) имеет вид
.
(6.132)
На основании (6.130)–(6.132) запишем
(6.133)
Структурная схема замкнутой подсистемы с алгоритмом (6.133) аналогична рис. 6.7, но реализация алгоритма (6.133) значительно проще, чем алгоритма (6.12).
Структуру алгоритма управления для второй подсистемы синтезируем методом обратных задач динамики.
Пусть требованиям высокой точности и быстродействию соответствует эталонная модель, движение которой описывается уравнением
(6.134)
Алгоритм управления синтезируется путем минимизации функционала
.
(6.135)
Минимизацию функционала можно выполнять по градиентной схеме первого или второго порядка. В случае схемы первого порядка закон управления имеет вид
где
= const.
(6.136)
Уравнения алгоритма управления равны
(6.137)
Замкнутая подсистема 2 обладает устойчивостью даже при R . Благодаря высокому коэффициенту R удается приблизить динамику X(t) к оптимальной по быстродействию Xa(t).
Когда минимизация функционала (6.135) осуществляется по градиентной схеме второго порядка, то дифференциальный закон управления имеет вид
.
(6.138)
В этом случае уравнение алгоритма управления имеет вид
(6.139)
Структурная схема замкнутой подсистемы 2 с приведенным к операторной форме алгоритмом и оператором дифференцирования D
представлена на рис. 6.8.
Рис. 6.8. Структурная схема управления второй подсистемы
Наличие ограничителя в составе системы может привести к автоколебаниям, что для задачи о быстродействии недопустимо. Поэтому необходимы дополнительные условия, при которых исключаются автоколебания.
Рассмотрим эквивалентную структуру замкнутой подсистемы в виде, представленном на рис. 6.9.
Рис. 6.9. Эквивалентная структура второй подсистемы
Операторные выражения
(6.140)
соответствуют левой и правой части уравнения (6.134), а B(D) и A(D) есть дробно-рациональные составляющие передаточной функции управляемого объекта с алгоритмом управления (6.138).
Уравнение замкнутой подсистемы имеет вид
(6.141)
или, исключив переменную x(t),
.
(6.142)
При Xa = 0 имеем передаточную функцию линейной части разомкнутой системы:
.
(6.143)
Из условий физической реализуемости принимаем
(6.144)
и возможность использования метода гармонической линеаризации.
С учетом гармонической линеаризации нелинейного звена запишем его передаточную функцию:
где
.
Условием автоколебаний является соотношение
.
Годограф,
соответствующий
,
лежит на действительной оси отрицательных
значений. Таким образом, если годограф
передаточной функции Wл(p)
не пересекает отрицательную ось, то в
системе будут отсутствовать автоколебания.
Принятая структура объекта управления
удовлетворяет этому условию.
Очевидно, это условие необходимо соблюдать при использовании этого метода для других объектов.
