ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ
.pdfЛекция 2
2Уравнения состояния линейных систем. Линеаризация уравнений состояния
2.1Линейные системы
Если функции f(·), g(·) линейны по x, u, то уравнения состояния (1.1) могут быть записаны
в виде [8, 20]
x˙ (t) = |
A(t)x(t) + B(t)u(t), x(t0) = x0, t ≥ t0, |
(2.2) |
y(t) = |
C(t)x(t) + D(t)u(t). |
|
Такие системы называются непрерывными линейными системами. 6 Здесь, как и выше,
x(t) Rn, y(t) Rl, u(t) Rm, а матрицы-функции A(t), B(t), C(t), D(t) имеют размеры
n×n, n×m, l×n, l×m соответственно.
Определение 1. Если D(t) ≡ 0, то то система (2.2) называется собственной (строго
реализуемой). В противном случае система называется несобственной. 7
Уравнения состояния (2.2) реализуемых непрерывных систем иллюстрируются струк-
турной схемой, приведенной на рис. 2.2.
Определение 2. Если матрицы A(t), B(t), C(t), D(t) постоянны (не зависят от времени
t), то система (2.2) называется стационарной, в противном случае – нестационарной.
Вид процессов в стационарных системах не зависит от того, какой момент времени
рассматривается как начальный. Поэтому для них можно считать t0 = 0.
Поскольку ниже основное внимание уделяется стационарным собственным системам, запишем соответствующие уравнения состояния:
x˙(t) = Ax(t) + Bu(t), y(t) = Cx(t), x(0) = x0, t ≥ 0. |
(2.3) |
Аналогично могут быть записаны уравнения состояния реализуемых дискретных си-
6 Для линейных систем справедлив принцип суперпозиции, согласно которому реакция системы на линейную комбинацию (суперпозицию) воздействий совпадает с той же линейной комбинацией реакций на
каждое воздействие в отдельности.
7Такое название связано с тем, что операция «чистого» дифференцирования нереализуема практически
исвязана с трудностями при математическом описании. Введение нереализуемых звеньев в математическую модель системы оправдано в тех случаях, когда реально присутствующие постоянные времени прене-
брежимо малы в рассматриваемом диапазоне частот. Это дает возможность уменьшить порядок уравнений системы.
11
Рисунок 2.2 – Структурная схема системы (2.2). |
|
|||||||
стем. Они имеют вид разностных уравнений |
|
|
|
|
|
|
|
|
x k + 1] = f x[k], u[k], k , x k |
] = x , k |
≥ |
k |
, |
(2.4) |
|||
[ |
y[k] = g x[k], u[k], k |
[ 0 |
|
0 |
0 |
|
||
|
|
|
|
|
|
|
|
|
– для нелинейных систем и |
|
|
|
|
|
|
|
|
x[k + 1] = A[k]x[k] + B[k]u[k], |
x[t0] = x0, |
k ≥ k0, |
(2.5) |
|||||
y[k] = C[k]x[k] + D[k]u[k] |
|
|
|
|
|
|
|
|
– для линейных систем. В уравнениях (2.4), (2.5) k |
= k0, k0 + 1, k0 + 2, . . . |
– «дискрет- |
||||||
ное время», x[k] Rn, |
y[k] Rl, u[k] Rm, |
f(·) |
Rn, g(·) Rl. Матрицы-функции |
A[k], B[k], C[k], D[k] имеют размеры n×n, n×m, l×n, l×m.
З а м е ч а н и е . Иногда уравнения состояния записывают более подробно, выделяя в
них, кроме управления, внешние возмущения ϕ(t), а также разделяя выходной сигнал на
управляемый yc(t) и измеряемый ym(t) выходы. Тогда уравнения (2.3) принимают вид
x˙ (t) = Ax(t) + Buu(t) + Bϕϕ(t), yc(t) = Ccx(t), ym(t) = Cmx(t).
Внекоторых случаях подобная детализация оказывается удобной и будет использоваться ниже.
2.2Линеаризация уравнений состояния
Вреальных системах всегда присутствуют нелинейные зависимости, обусловленные, например, такими свойствами физических звеньев, как насыщение, люфт, нечувствительность,
12
кулоново («сухое») трение и так далее. Эти эффекты приводят к нелинейности системы в целом. Исследование системы можно существенно упростить путем линеаризации ее модели, т.е. приближенной заменой уравнений вида (1.1) уравнениями (2.2) (или, для дискретных процессов, – использованием (2.5) вместо (2.4)).
Рассмотрим процесс линеаризации в общем виде. Пусть динамика системы описывается
уравнениями состояния (1.1) |
|
x˙ (t) = f(x, u, t), y(t) = g(x, u, t). |
(2.6) |
Введем некоторые произвольно изменяющиеся по времени ("опорные") функции x (t)
Rn и u (t) Rm. Найдем линейную часть разложения функций f(·), g(·) в окрестности x (t), u (t) в ряд Тейлора. 8 В результате получим
|
|
|
|
|
∂f |
x, u, t |
) |
|
|
|
|
x, u, t |
|
|
|
|
|
|
|
|
|
|
||||
|
|
x˙ (t) + |
x˙ (t) = f(x (t), u (t), t) + |
|
|
( |
x(t) + |
∂f( |
) |
u(t) + O2, |
(2.7) |
|||||||||||||||
|
|
|
|
∂x |
|
|
∂u |
|
||||||||||||||||||
|
|
|
|
|
|
∂g(x, u, t) |
|
|
∂g(x, u, t) |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y(t) = g(x (t), u (t), t) + |
|
∂x |
|
|
|
x(t) + |
|
∂u |
|
|
|
|
u(t) + O2, |
|
|
|
|
|||||
где |
|
x(t) = x(t) − x (t) – отклонение состояния исходной модели по отношению к вектору |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∂f( |
) |
, |
∂f( |
) |
, |
∂g( |
) |
, |
|||
x (t); |
u(t) = u(t) − u (t) – отклонение входного процесса от u (t), |
|
· |
|
· |
|
· |
|
|
|||||||||||||||||
|
∂x |
|
∂u |
|
∂x |
|
|
|||||||||||||||||||
∂g( |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
· |
|
– матрицы частных производных вектор-функций f(·), g(·) |
|
(матрицы Якоби) |
|
2по |
||||||||||||||||||||
∂u |
|
|
|
|||||||||||||||||||||||
компонентам |
векторов x, u, вычисленные при значениях x(t) ≡ x (t), u(t) ≡ u (t); O |
|
– |
|||||||||||||||||||||||
малые величины второго порядка малости по |
x(t), u(t). |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
Отсюда следует общий вид уравнений для приращений: |
|
|
|
|
|
|
|
|
|
|
|
|
|
x˙ (t) = A(t)Δx(t) + B(t)Δu(t) + f (t) − x˙ (t) + O2,
y(t) = C(t)Δx(t) + D(t)Δu(t) + O2,
где
A(t) = |
|
x, u, t |
) |
, B(t) = |
∂f x, u, t |
) |
, |
||||
∂f(∂x |
|
(∂u |
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
C(t) = |
∂g( |
x, u, t |
) , D(t) = |
∂g x, u, t |
) − |
||||||
∂x |
(∂u |
||||||||||
|
|
|
|
|
|
|
|
|
|
8 Для осуществимости этой операции требуется дифференцируемость функций f(·), g(·) по x, u в окрестности x (t), u (t).
13
матрицы-функции размеров n×n, n×m, l×n, l×m (соответственно), f (t) = f(x (t), u (t), t).
При достаточно малых отклонениях x(t), u(t) от опорных траекторий x (t), u (t) малы-
ми величинами более высокого порядка можно пренебречь.
Конкретный вид линеаризованной модели зависит от выбора опорного движения
x (t), u (t). Основной интерес представляют следующие частные случаи [8, 9, 14, 22, 32]:
– в качестве опорного выбирается некоторое невозмущенное движение, когда x (t), u (t)
удовлетворяют исходному уравнению (2.7).
В этом случае линеаризованная модель имеет вид |
|
x˙(t) = A(t)Δx(t) + B(t)Δu(t), |
|
y(t) = C(t)Δx(t) + D(t)Δu(t) |
(2.8) |
–в качестве опорного движения выбираются неизменные во времени состояние системы
ивходной процесс, т.е. считается, что x˙ (t) ≡ 0, u˙ (t) ≡ 0, x (t) ≡ x , u˙ (t) ≡ u (t). Тогда линеаризованная модель имеет вид
x˙(t) = A(t)Δx(t) + B(t)Δu(t) + f (x , u , t), |
|
y(t) = C(t)Δx(t) + D(t)Δu(t). |
(2.9) |
Заметим, что в приведенных выше соотношениях в качестве u(t), u (t) можно рассматривать не только внешние воздействия на систему, но и ее параметры. Тогда модель, полученная в результате линеаризации, позволяет приближенно судить о чувствительности решений системы к отклонению параметров от расчетных значений, причем эти отклонения представляются в виде аддитивных возмущений (так как они являются компонентами "расширенного"входного процесса u(t)).
Пример. Линеаризация модели маятника
Для иллюстрации рассмотрим линеаризацию уравнений свободного движения математического маятника массой m и длиной l. Влиянием сил трения будем пренебрегать. Для вектора состояния x(t) = [ϕ(t), ϕ˙(t)]T , где ϕ – угол поворота маятника, получим систему уравнений
x˙1(t) |
= |
x2 |
(t), |
(2.10) |
|
x˙2(t) |
= |
−mglJ−1 sin(x1(t)). |
|||
|
14
Здесь J = ml2− момент инерции маятника, g− ускорение свободного падения. Нулевому значению угла ϕ соответствует положение маятника «вертикально вниз». Маятник (2.10) имеет два состояния равновесия: x10 = 0 и x20 = [π, 0]T . 9 Линеаризация (2.10) в окрестности этих состояний приводит к уравнениям вида (2.3) с матрицей
A = |
0 |
1 |
, |
gl−1 |
0 |
||
|
± |
|
|
где знак «минус» соответствует нижнему, а знак «плюс» – верхнему состояниям равновесия (т.е. точкам x10 и x20. )
Рассмотрим теперь в качестве опорной траектории процесс x (t), у которого x1(t) =
|
π cos(βt), x (t) = |
|
π |
β sin(βt), где β = |
|
|
|
|
|
Заметим, что такой процесс |
соответствует по- |
|||||||||||||||||||||
|
− |
gl |
− |
1. |
||||||||||||||||||||||||||||
|
2 |
|
2 |
2 |
|
|
|
|
|
|
|
|
|
|
π |
|||||||||||||||||
ведению модели, полученной линеаризацией относительно состояния x1 |
при x(0) = [ |
|
, 0]T . |
|||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Тогда функция |
|
|
f = − |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
π |
|
|
|
|
|
|
|
|
|
|
|
π |
|
|
|
T |
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
−mglJ−1 sin( |
|
|
cos(βt)) |
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
β sin(βt), |
|
|
|
. |
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
2 |
|
2 |
|
|
|
|
||||||||||||||||||||
В свою очередь x˙ (t) = [− |
π |
β sin(βt), |
− |
π |
β2 cos(βt)]T , откуда получаем уравнения в откло- |
|||||||||||||||||||||||||||
|
|
|||||||||||||||||||||||||||||||
2 |
2 |
|||||||||||||||||||||||||||||||
нениях |
x(t) = x(t) − x (t) : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
x˙1(t) = |
x2(t), |
|
|
|
|
|
|
|
π |
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
x˙2(t) |
= |
mglJ−1 cos( |
cos(βt))Δx1 |
(t) |
− |
|
|
|
(2.11) |
||||||||||||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
− |
− |
|
|
|
|
|
|
π |
2 |
|
|
π |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
mglJ− sin( |
cos(βt)) + |
|
|
|
β |
|
cos(βt). |
|
|
|
|
Уравнения (2.11) представляют собой систему линейных неоднородных нестационарных
уравнений и дают более точное приближение к колебательному процессу в исходной нели-
нейной системе (2.10), чем линеаризация в окрестности состояния x1 |
. Отметим, что (2.11) |
|||||||||||
|
|
|
|
|
|
0 |
|
|
|
|
||
имеют вид (2.2) со входным процессом v(t) = − mglJ−1 sin( |
π |
|
π |
и мат- |
||||||||
|
cos(βt))+ |
|
β2 cos(βt) |
|||||||||
2 |
2 |
|||||||||||
рицами |
|
|
|
|
|
|
|
|
|
|
||
− |
2 |
|
1 |
|
|
|
|
|||||
A(t) = |
0 |
|
|
0 |
|
|
|
|
||||
mglJ−1 cos( |
π |
cos(βt)) |
0 |
, B = 1 . |
|
|
|
|
||||
|
|
|
|
|
||||||||
|
|
x0 = = [πn, 0]T , n = . . . − 2, −1, 0, 1, 2, . . . , |
||||||||||
9 Строго говоря, имеется множество состояний равновесия |
||||||||||||
поэтому для задач данного типа пространство состояний удобнее отождествлять не с плоскостью |
2, а с |
|||||||||||
поверхностью цилиндра. |
|
|
|
|
|
|
|
|
|
|
|
R |
15
Приведенная здесь процедура линеаризации может применяться (с очевидной заменой обозначений и аргументов) и для дискретных систем. Для линеаризации колебательных процессов также известен и широко используется так называемый метод гармонического баланса (гармонической линеаризации) [11, 33, 38, 39, 42, 50].
2.3Примеры уравнений состояния систем
Рассмотрим несколько примеров моделей линейных систем в виде уравнений состояния.
2.3.1 Электротехнические устройства
Пример 1. RC-цепь. Рассмотрим систему, состоящую из последовательно соединенных емкостного элемента C и резистора с сопротивлением R (рис. 2.3, а). Входным процессом
считаем напряжение u(t) от внешнего источника, приложенное к зажимам цепи. Рассмотрим следующие два случая.
Рисунок 2.3 – Электротехнические устройства
1. Выход системы – напряжение uC(t) на зажимах емкостного элемента. RC-цепь описывается уравнением
RC |
duC(t) |
+uC(t) = u(t). |
(2.12) |
|
dt |
||||
|
|
|
Введем T = RC – постоянную времени цепи и примем x(t) = uC (t). Выразив из (2.12) значение x˙ (t), получим уравнение состояния вида (2.3), в котором n = 1, A = −T −1, B = T −1,
16
C = 1. Матрицы порядка 1×1 обычно отождествляются со скалярными элементами, поэтому при их записи квадратные скобки опускаются. Найденные уравнения соответствуют собственной системе.
2. Выход системы – напряжение uR(t) на зажимах резистора.
Уравнение состояния (для x(t)) имеет тот же вид. Изменяется уравнение выхода, так
как теперь y(t) = uR(t) ≡ u(t)− uC(t) ≡ u(t)− x(t). Поэтому данная система не относится к строго реализуемым и имеет матрицы A = −T −1, B = T −1, C =−1, D = 1.
Пример 2. Колебательный контур (RLC-цепь). Запишем теперь уравнения состояния колебательного контура, включающего последовательно соединенные R, L, C- элементы (рис. 2.3, б). Выходным сигналом y(t) будем считать напряжение на зажимах индуктивного элемента uL(t), а входом, как и в предыдущем случае, – падение напряжения
на всей цепи u(t).
Как известно из электротехники, выполнены соотношения
L |
di(t) |
= uL(t), C |
duC(t) |
= i(t), |
|
dt |
dt |
||||
|
|
|
uR(t) = Ri(t), u(t) = uL(t)+uC(t)+uR(t), где i(t) – сила тока в цепи, uC(t) – напряжение на зажимах емкостного элемента, uR(t) – падение напряжения на активном сопротивлении. Определив вектор состояния x(t) = [i(t), uC(t)]T и выход y(t) = uL(t), получим следующую систему уравнений:
x˙ |
1 |
(t) |
= |
(u(t) − Rx1(t) − x2(t))L−1, |
(2.13) |
x˙2(t) |
= |
C−1x1(t), |
|
y(t) = u(t) − Rx1(t) − x2(t).
Следовательно, в рассматриваемом примере n = 2, m = l = 1 и уравнения состояния (2.2) содержат матрицы
RL−1 |
L |
1 |
, B = |
|
L−1 |
, C = [−R, −1] , D = 1. |
A = −C−1 |
− 0− |
|
0 |
Пример 3. Двигатель постоянного тока с независимым возбуждением.
Рассмотрим линеаризованные уравнения электрического двигателя постоянного тока с независимым возбуждением (рис. 2.3, в). Пусть обмотка возбуждения двигателя создает постоянный магнитный поток, управление осуществляется изменением электродвижущей
17
силы источника в якорной цепи e(t). Внутренним сопротивлением источника пренебрегаем. Входными воздействиями считаем e(t) и приведенный момент нагрузки на валу двигателя
M(t). Выходами системы считаем угол поворота ротора α(t) и ток в якорной обмотке i(t). Динамику системы можно описать следующими уравнениями [11, 33]:
|
|
dα(t) = ω(t), |
|
|
||||
|
|
|
dt |
|
|
|
− |
|
|
|
|
dt |
|
|
|
|
|
|
|
|
di(t) |
|
|
|
|
|
|
L |
|
+Ri(t) = e(t) Ceω(t), |
(2.14) |
||||
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dω(t) |
|
|
|||
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
J |
dt |
|
= CM i(t)−M(t). |
|
Здесь обозначены: L, R – индуктивность и активное сопротивление якорной цепи, J – приведенный момент инерции ротора, Ce, CM – постоянные, зависящие от конструктивных параметров двигателя и величины потока возбуждения.
В данном примере n = 3, m = l = 2. Введем вектор состояния так, чтобы его компонен-
ты соответствовали значениям α(t), |
i(t), ω(t) : x(t) = [α(t), i(t), |
ω(t)]T R3. Аналогично |
||||||||
определим вектор входа u(t) = [e(t), |
M(t)]T R2 и вектор выхода y(t) = [α(t), i(t)]T R2. |
|||||||||
Как легко убедиться, уравнения (2.14) принимают вид (2.3), в которых |
|
|||||||||
0 |
0 |
1 |
|
0 |
0 |
|
1 |
0 |
0 |
|
A = 0 |
−RL−1 |
CeL−1 , B = L−1 |
0 |
, C = |
||||||
0 |
1 |
0 . |
||||||||
0 |
CM J−1 |
− 0 |
|
0 |
J−1 |
|
|
|
|
|
|
|
|
|
− |
|
|
|
2.3.2Угловое движение искусственного спутника Земли.
Рассмотрим упрощенную модель углового движения искусственного спутника Земли (ИСЗ) относительно продольной оси [12], рис. 2.4.
Обозначим через γ(t), ωx(t) – угол и угловую скорость крена ИСЗ; Jx – момент инерции ИСЗ относительно продольной оси x; Mx(t) – управляющий момент относительно этой оси,
развиваемый, например, реактивными двигателями. Запишем уравнение динамики вращательного движения и кинематическое соотношение, связывающее угол и угловую скорость.
Получим |
|
|
|
|
|
|
|
dγ(t) |
|
|
|
|
|
|
|
|
|
|
||
|
dt |
= ωx(t), |
(2.15) |
|||
dωx(t) |
= Mx(t). |
|
||||
|
|
|
|
|
|
|
|
dt |
|
Jx |
|
Для данной системы n = 2, m = 1. Естественным образом можно определить вектор состояния, сопоставив его компонентам значения угла и угловой скорости: x(t) = [γ(t), ωx(t)]T .
18
Рисунок 2.4 – Искусственный спутник Земли.
Снова получаем уравнения вида (2.3), в которых матрицы
0 |
1 |
0 |
. |
A = 0 |
0 , B = |
Jx−1 |
Вид матрицы C определяется тем, какие переменные измеряются или относительно каких из них формулируется цель управления. Например, если измеряется только угол крена, то l = 1 и C = [1, 0]. Если измеряются обе переменные, то l = 2, C = I2 . 10
Как видно из приведенных примеров, несмотря на то что вектор состояния принадлежит некоторому абстрактному пространству X , его компоненты могут отождествляться с
числовыми значениями конкретных физических переменных, представленных в выбранной системе единиц.
10 Здесь и далее через In обозначена единичная матрица порядка n. Иногда индекс n в записи будет опускаться.
19
Лекция 3
3Передаточные функции и их определение по уравнениям состояния
3.1Передаточные функции линейных систем
Рассмотрим линейную стационарную систему непрерывного времени
x˙(t)=Ax(t)+Bu(t), y(t)=Cx(t)+Du(t) |
(3.16) |
либо дискретную линейную стационарную систему
x[k + 1]=Ax[k]+Bu[k],
где x Rn, y Rl, u Rm.
Определение [4, 8, 22, 29]. Выражение
−1
W(λ) = C λIn −A
y[k]=Cx[k]+Du[k], |
(3.17) |
B+D, λ C, |
(3.18) |
называется передаточной функцией системы (3.16) (или (3.17)) от входа u к выходу y.
Заметим, что W(λ) является матричной функцией размера l×m от комплексного аргумента. В литературе по теории регулирования обычно принято для непрерывных систем аргумент передаточной функции обозначать через s или p, а для дискретных систем – через
z [8, 11, 22, 29, 33, 38, 42].
Передаточные функции часто используются в различных задачах исследования динамических (в первую очередь – линейных и стационарных) систем. Применение этих функций для получения частотных характеристик будет показано в следующем параграфе. Чтобы сделать данное определение менее формальным и показать, как можно ввести передаточные функции в других ситуациях, используем для вывода выражения (3.18) преобразование Лапласа 11 [11,29,33,38,39,42]. Для этого при нулевых начальных условиях x0 =0 пе-
рейдем к изображениям по Лапласу [29]: X(s) = |
x(t) |
, Y (s) = |
y(t) |
, U(s) = |
u(t) . |
|||
Тогда при det(sIn |
− |
|
получаем |
L |
|
L |
|
L |
|
A) = 0 |
X(s)=(sIn −A)−1 BU(s) и Y (s)= C (sIn −A)−1 B+D U(s).
11 Изображением по Лапласу X(s) вектор-функции x(t) называется функция комплексной переменной
s, заданная как L x(t) = ∞ e−stx(t)dt.
0
20