
Стабилизация динамических систем с использованием свойства пассивности (120
..pdf
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
m |
m |
˙ |
( |
)−2 |
( |
m |
m |
m |
|
|
Поскольку матрица M q |
|
C |
q,q˙) кососимметрическая при всех |
|||||||
q R , q˙ R , то при всех q R , q˙ R |
и e˙ |
R справедливо |
||||||||
равенство |
|
|
т |
˙ |
|
|
|
|
(3.10) |
|
|
|
e˙ |
− 2C(q,q˙))˙e = 0. |
|
||||||
|
|
|
(M(q) |
|
С учетом соотношения (3.10) и неотрицательной определенности матрицы D = Dт ≥ 0 получим следующую оценку:
V˙ = −e˙тDe˙ + e˙тv ≤ e˙тv = yтv,
где y = e˙. Таким образом, система (3.8) с выходом y = e˙ пассивна. Далее при y(t) = e˙(t) ≡ 0 имеем e¨(t) ≡ 0. Если дополнительно v = v(t) ≡ 0, то из соотношения (3.8) следует, что e(t) ≡ 0. Следовательно, система (3.8) с выходом y = e˙ наблюдаема в нулевом состоянии.
Заметим, что функция V (e,e˙) является бесконечно большой при (eт,e˙т)т → ∞. Тогда согласно теореме 3.5 управление v = −k(y) = −k(˙e), где k(·) — любая локально липшицева функция, такая, что k(0) = 0, yтk(y) > 0 при всех y =, 0глобально стабилизирует положение равновесия e = 0, e˙ = 0 замкнутой системы (3.8). Одним из стабилизирующих законов управления является линейная обратная связь
v = −Ly = −Le,˙ |
(3.11) |
где L = Lт > 0 — произвольная симметрическая положительно определенная матрица размером m × m. Следовательно, управление u = G(q) − Ke − Le˙ глобально стабилизирует положение равновесия e = 0, e˙ = 0 замкнутой системы (3.6).
Использование закона управления (3.7) соответствует преобразованию потенциальной энергии системы (3.6) к виду P(q) =
= 12eтKe, где K = Kт > 0, e = q −qr. Отметим, что полная энер-
гия системы (3.8), имеющая вид (3.9) и представляющая собой сумму кинетической и преобразованной потенциальной энергий, имеет глобальный минимум в точке e = 0, e˙ = 0. Далее управление (3.11) играет роль демпфирования и приводит к убыванию полной энергии (3.9) на траекториях замкнутой системы (3.8).
Замечание 3.3. Далее при пассификации системы, имеющей вид (1.1), в независимости от физической природы системы будем
рассматривать использование закона управления = ˜( ) как v
x,
k
u
21

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
преобразование механизма накопления в системе энергии, причем такое, что преобразованная энергия имеет глобальный минимум в точке x = 0. При последующей стабилизации пассивной системы (3.4) будем рассматривать управление v = −k(y) = −k(h(x)) как использование «демпфирования», приводящее к убыванию накопленной в системе энергии на траекториях замкнутой системы (3.4).
Пример 3.4. Рассмотрим задачу стабилизации системы, имеющей вид
x˙1 = x2,
(3.12)
x˙2 = u,
где x = (x1,x2)т R2 — вектор состояния системы; u R — управление.
Возьмем функцию
|
1 |
x1 |
|
|
|
0 |
|
|
|
V (x) = |
2x22 + |
k1(s)ds > 0, |
(3.13) |
где k1(·) — произвольная локально липшицева функция, такая, что k1(0) = 0, sk1(s) > 0 при всех s =. 0Производная по времени функции V (x) в силу системы (3.12) выразится cледующим обра-
зом:
V˙ = x2x˙2 + k1(x1)x˙1 = x2u + k1(x1)x2.
При выборе управления u = −k1(x1) + v, где v R — новое управление системы, имеем
V˙ = x2(−k1(x1) + v) + k1(x1)x2 = x2v = yv,
где y = x2. Следовательно, система
x˙1 |
= x2, |
|
x˙2 |
= −k1(x1) + v, |
(3.14) |
y = x2 |
|
является системой без потерь энергии c функцией запаса V (x), имеющей вид (3.13).
Далее, если y(t) = x2(t) ≡ 0 и v = v(t) ≡ 0, то из соотношений (3.14) следует, что x1(t) ≡ 0. Поэтому система (3.14)
22
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
наблюдаема в нулевом состоянии. Заметим, что если несобствен-
ция V (x) |
|
|
→ ∞ |
|
||
ные интегралы |
0+∞ k1(s)ds и |
0−∞ k1(s)ds расходятся, то функ- |
||||
|
является бесконечно большой при |
x |
|
. Тогда |
||
согласно |
теореме 3.5 управление v = −k2(y) |
= |
−k2(x2), где |
k2(·) — любая локально липшицева функция, такая, что k2(0) = 0, yk2(y) > 0 при всех y =, 0глобально стабилизирует положение равновесия x = 0 замкнутой системы (3.14). Следовательно, управление u = −k1(x1) − k2(x2) глобально стабилизирует положение равновесия x = 0 замкнутой системы (3.12).
Рассмотрим случай, когда система (1.1) имеет вид
z˙ = f(z) + g(z,y)y, x˙ = a(x) + b(x)u,
где z Rl, x Rp, l + p = n; u Rm — управление; y = h(x), отображение h : Rn → Rm локально липшицево, h(0) = 0; f(·), g(·,·), a(·), b(·) — локально липшицевы функции своих аргументов, f(0) = 0, a(0) = 0.
Динамическая система (3.15) представляет собой каскадную взаимосвязь систем
z˙ = f(z) + g(z,y)y
и
x˙ = a(x) + b(x)u, y = h(x).
Сформулируем следующую теорему.
Теорема 3.6. Пусть 1) система (3.17) пассивна с положительно определенной и бесконечно большой при x → ∞ функцией запаса V (x) и наблюдаема в нулевом состоянии; 2) система (3.16) при y(t) ≡ 0 асимптотически устойчива в целом в точке z = 0; 3) W(z) > 0 — непрерывно дифференцируемая бесконечно большая при z → ∞ функция Ляпунова для системы (3.16) при
y(t) ≡ 0, удовлетворяющая соотношению |
∂W(z) |
f(z) < 0 при |
|||||
|
|
||||||
∂z |
|||||||
z =. 0Тогда управление |
∂W z |
) |
|
т |
|
|
|
|
|
|
|
|
|||
u = − |
( |
g(z,y) |
− k(y), |
(3.18) |
|||
∂z |
|
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где k(·)— любая локально липшицева функция, такая, что k(0) = 0, yтk(y) > 0 при всех y =, 0глобально стабилизирует положение равновесия z = 0, x = 0 замкнутой системы (3.15).
Рассмотрим функцию
U(z,x) = W(z) + V (x), |
(3.19) |
представляющую собой сумму функции Ляпунова для системы (3.16) при y(t) ≡ 0 и функции запаса для системы (3.17). Заметим, что согласно условиям теоремы функции V (x) и W(z) являются положительно определенными и бесконечно большими приx → ∞ и z → ∞ соответственно. Следовательно, функция U(z,x) положительно определенная и бесконечно большая при(zт,xт)т → ∞. Производная по времени функции U(z,x) в силу системы (3.15) имеет вид
˙ |
∂W(z) |
|
∂W(z) |
|
∂V (x) |
∂V (x) |
||||
U = |
∂z |
|
f(z) + |
∂z |
|
g(z,y)y + |
|
a(x) + |
|
b(x)u. |
|
|
|
∂x |
∂x |
С учетом пассивности системы (3.17) справедлива следующая оценка:
|
∂W(z) |
|
|
∂W(z) |
|
|
|
|
|
|
|
|
|||||||
U˙ ≤ |
|
|
f(z) + |
|
|
|
|
|
g(z,y)y + yтu = |
|
|
|
|||||||
∂z |
|
∂z |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
∂W z |
) |
|
|
|
|
∂W z |
) |
|
т |
||||
|
|
|
= |
|
( |
|
f(z) + yт |
|
( |
g(z,y) |
+ yтu. |
||||||||
|
|
|
|
∂z |
|
|
∂z |
|
|||||||||||
При выборе управления |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
∂W z |
) |
|
|
т |
|
|
|
||||
|
|
|
u = − |
|
|
|
( |
g(z,y) |
+ v, |
(3.20) |
|||||||||
|
|
|
|
|
|
∂z |
|
|
|||||||||||
где v Rm — новое управление системы, имеем |
|
||||||||||||||||||
|
|
|
|
|
|
|
∂W(z) |
|
|
|
|
|
|||||||
|
|
|
U˙ ≤ |
|
|
|
|
|
|
f(z) + yтv. |
|
|
(3.21) |
||||||
|
|
|
|
|
|
∂z |
|
|
|
|
|||||||||
Тогда в силу соотношения |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
∂W(z) |
f(z) < 0, z =, 0 |
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
∂z |
|
|
|
|
|
|
справедлива оценка
U˙ ≤ yтv.
24

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Таким образом, система
z˙ = f(z) + g(z,y)y,
x˙ = a(x) − b(x) ∂W∂z(z)g(z,y) т + b(x)v, y = h(x)
пассивна c функцией запаса U(z,x), имеющей вид (3.19).
При управлении v = −k(y), где k(·т) — любая локально лип- |
|||||||||||
шицева функция, такая, что k(0) = 0, y k(y) > 0 при всех y =, 0 |
|||||||||||
неравенство (3.21) примет вид |
|
|
|
|
|
|
|||||
|
∂W(z) |
|
|
|
|
|
|
||||
U˙ ≤ |
|
|
f(z) − yтk(y) < |
0, (z,y) |
=,(0). |
(3.23) |
|||||
∂z |
|
||||||||||
Рассмотрим |
множество S = |
{ |
(zт,xт)т |
т т т |
(z,x) = 0 |
} |
. |
||||
|
Rn : U˙ |
|
|||||||||
Из неравенства (3.23) следует, что при всех (z ,x ) |
S спра- |
||||||||||
ведливо соотношение |
|
|
|
|
|
|
|||||
|
|
|
|
∂W(z) |
f(z) = yтk(y) = 0. |
(3.24) |
|||||
|
|
|
|
||||||||
|
|
|
|
∂z |
|
|
|
|
|
|
Отметим, что функция W(z) является положительно определенной и непрерывно дифференцируемой и, согласно условиям тео-
ремы, ∂W∂z(z) = 0при любом z =. 0Следовательно, равенство
∂W∂z(z) = 0 выполнено, если и только если z = 0. Тогда в силу соотношений yтk(y) > 0 при всех y =, 0f(0) = 0 и f(z) = 0 при всех z =, 0где последнее является следствием асимптотической устойчивости в целом системы (3.16) при y(t) ≡ 0 в точке
z= 0, равенство (3.24) имеет место тогда и только тогда, когда
z= 0 и y = 0. Таким образом, множество S состоит из всех (zт,xт)т = (0,xт)т Rn, таких, что y = h(x) = 0. Далее из соот-
|
∂W z |
|
|
|
|
|
|
|
= 0 |
|
|
что u = 0, если z = 0 |
|
|
|||
ношений (3.20), |
∂z( |
) z=0 = 0, v = −k(y) и k(0) = 0 получаем, |
|||
|
|
|
|
|
|
|
|
и y |
|
. Заметим, что согласно условиям |
|
теоремы система (3.17) |
наблюдаема в нулевом состоянии, т. е. если |
||||
|
|
|
|
y(t) ≡ 0 и u(t) ≡ 0, то x(t) ≡ 0. Следовательно, множество S не содержит целых траекторий системы (3.15) с управлением (3.18), за исключением z(t) ≡ 0, x(t) ≡ 0. Тогда в силу третьей теоремы Барбашина — Красовского положение равновесия z = 0, x = 0
25

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
системы (3.15) с управлением (3.18) асимптотически устойчиво в целом. Следовательно, управление (3.18) глобально стабилизирует положение равновесия z = 0, x = 0 замкнутой системы (3.15).
Пример 3.5. Рассмотрим динамическую систему
η˙ = −η + η2ξ,
(3.25)
ξ˙ = u,
где (η, ξ)т R2 — вектор состояния системы; u R — управление. Заметим, что система (3.25) имеет вид (3.15), где y = ξ. Со-
гласно примеру 2.5 система
ξ˙ = u,
(3.26)
y = ξ
является системой без потерь энергии с бесконечно большой при
| ξ | → ∞ функцией запаса V (ξ) = 12ξ2 > 0. Дополнительно, так
как y = ξ, система (3.26) наблюдаема в нулевом состоянии. Cистема η˙ = −η асимптотически устойчива в целом в точке
η = 0. Соответствующая бесконечно большая при | η | → ∞функ-
ция Ляпунова имеет вид W(η) = |
1 |
η2 > 0, причем |
∂W(η) |
(−η) = |
|
|
|||
2 |
∂η |
= −η2 < 0 при η =. 0Тогда согласно теореме 3.6 управление u = −η3 − kξ,
где k > 0 — произвольная положительная константа, глобально стабилизирует положение равновесия η = 0, ξ = 0 замкнутой системы (3.25).
3.3. Метод обхода интегратора
Рассмотрим динамическую систему
x˙ = f(x) + g(x)ξ,
ξ˙ = u,
где (x, ξ)т R2 — вектор состояния системы; u R — управление; f(·), g(·) — непрерывно дифференцируемые функции своих аргументов, f(0) = 0.
26

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
Следствием теоремы 3.6 является следующий результат.
Лемма 3.1. (лемма об обходе интегратора). Пусть 1) существует такая непрерывно дифференцируемая функция α(x), α(0) = 0, что система
x˙ = f(x) + g(x)α(x) |
(3.28) |
асимптотически устойчива в целом в точке x = 0; 2) W(x) > 0 — непрерывно дифференцируемая бесконечно большая при | x | → → ∞ функция Ляпунова для системы (3.28), удовлетворяющая соотношению
|
∂x( |
) f(x) + g(x)α(x) |
< 0 при x =. 0 (3.29) |
|
|
∂W x |
|
|
|
Тогда управление |
|
|
|
u = −k(ξ − α(x)) + ∂α∂x(x) f(x) + g(x)ξ − ∂W∂x(x)g(x), (3.30) где k > 0 — произвольная положительная константа, глобально стабилизирует положение равновесия x = 0, ξ = 0 замкнутой системы (3.27).
Используя обозначение z = ξ−α(x), запишем систему (3.27)
ввиде
x˙ = f(x) + g(x)α(x) + g(x)z, |
|
||
|
∂α(x) |
|
(3.31) |
z˙ = u − |
|
f(x) + g(x)(z |
+ α(x)) . |
∂x |
При выборе управления
u = |
∂α(x) |
f(x) + g(x)(z + α(x)) + v, |
(3.32) |
∂x |
где v R — новое управление системы, система (3.31) примет вид
x˙ = f(x) + g(x)α(x) + g(x)z,
(3.33)
z˙ = v.
Заметим, что система (3.33) имеет вид (3.15), где y = z. Согласно примеру 2.5 система
z˙ = v,
(3.34)
y = z
27

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
является системой без потерь энергии с бесконечно большой при
| z | → ∞ функцией запаса V (z) = 12z2 > 0. Дополнительно, так
как y = z, система (3.34) наблюдаема в нулевом состоянии. Cогласно условиям теоремы система (3.28) асимптотически
устойчива в целом в точке x = 0, а W(x) > 0 — соответствующая непрерывно дифференцируемая бесконечно большая при | x | → ∞ функция Ляпунова, удовлетворяющая соотношению (3.29). Тогда согласно теореме 3.6 управление
v = − |
∂W(x) |
g(x) − kz, |
(3.35) |
∂x |
где k > 0 — произвольная положительная константа, глобально стабилизирует положение равновесия x = 0, z = 0 замкнутой системы (3.33). Следовательно, в силу соотношений (3.32), (3.35), z = ξ−α(x) и α(0) = 0 управление (3.30) глобально стабилизирует положение равновесия x = 0, ξ = 0 замкнутой системы (3.27).
Рассмотрим случай, когда нелинейная динамическая система (1.1) имеет вид
x˙1 = x2 + f1(x1), |
|
x˙2 = x3 + f2(x1,x2), |
|
··· |
(3.36) |
x˙n−1 = xn + fn−1(x1,...,xn−1), x˙n = u + fn(x),
где x = (x1,...,xn)т Rn — вектор состояния системы; u R —
управление; fi(·), i = 1,n — гладкие функции своих аргументов,
fi(0) = 0, i = 1,n.
Следствием леммы 3.1 является следующий способ решения задачи стабилизации системы (3.36), основанный на пошаговой пассификации системы и называемый методом обхода интегратора.
Шаг 1. Рассмотрим функцию
V1(z1) = 12z12,
где z1 = x1. Для удобства используем далее также обозначение z2 = x2 − α1(x1), где α1(·) — некоторая гладкая функция. Произ-
28

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
водная по времени функции V1(z1) в силу системы (3.36) имеет вид
V˙1 = z1z˙1 = z1(x2 + f1(x1)) = z1(z2 + α1(x1) + f1(x1)).
Выбрав функцию α1(x1) = −c1z1 − f1(x1), где c1 |
> 0 — произ- |
вольная положительная константа, получим |
|
V˙1 = −c1z12 + z1z2. |
(3.37) |
Функцию V1(z1) = V1(x1) > 0 можно рассматривать как функцию запаса для пассивной системы
x˙1 = x2 + f1(x1) = α1(x1) + f1(x1) + z2,
(3.38)
y = z1 = x1,
где z2 — вход системы. Из соотношения (3.37) следует, что для производной по времени функции V1(x1) в силу системы (3.38) справедлива оценка
V˙1 ≤ z1z2 = yz2.
Шаг 2. Рассмотрим функцию
V2(z1,z2) = V1(z1) + 12z22.
Для удобства используем далее обозначение z3 = x3 − α2(x1,x2), где α2(·) — некоторая гладкая функция своих аргументов. Производная по времени функции V2(z1,z2) в силу системы (3.36) имеет вид
V˙2 = −c1z12 + z1z2 + z2z˙2 = |
∂α1 |
|
||
= −c1z12 + z1z2 + z2 x3 + f2(x1,x2) − |
= |
|||
|
x˙1 |
|||
∂x1 |
=−c1z12 + z2 z1 + z3 + α2(x1,x2) + f2(x1,x2)−
−∂α1 x2 + f1(x1) . ∂x1
Выбрав
α2(x1,x2) = −c2z2 − z1 − f2(x1,x2) + ∂α1 x2 + f1(x1) , ∂x1
29

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
где c2 > 0 — произвольная положительная константа, получим
V˙2 = −c1z12 − c2z22 + z2z3. |
(3.39) |
Функцию V2(z1,z2) = V2(x1,x2 − α1(x1)) = V˜2(x1,x2) > 0
можно рассматривать как функцию запаса для пассивной системы
x˙1 = x2 + f1(x1),
x˙2 = x3 + f2(x1,x2) = α2(x1,x2) + f2(x1,x2) + z3, (3.40) y = z2 = x2 − α1(x1),
где z3 — вход системы. Из соотношения (3.39) следует, что для производной по времени функции V˜2(x1,x2) в силу системы (3.40) справедлива оценка
V˜˙2 ≤ z2z3 = yz3.
Шаг 3. Рассмотрим функцию
V3(z1,z2,z3) = V2(z1,z2) + 12z32.
Для удобства используем далее обозначение z4 =x4−α3(x1,x2,x3), где α3(·) — некоторая гладкая функция своих аргументов. Производная по времени функции V3(z1,z2,z3) в силу системы (3.36) имеет вид
V˙3 = −c1z12 − c2z22 + z2z3 + z3z˙3 = |
|
|
|
|
|
|
∂α2 |
||||||||
= −c1z12 − c2z22 + z2z3 + z3 x4 + f3(x1,x2,x3) − |
|
||||||||||||||
|
|
x˙1− |
|||||||||||||
|
∂x1 |
||||||||||||||
− |
∂α2 |
= −c1z12 − c2z22 + z3 z2 |
+ z4 + α3(x1,x2,x3)+ |
||||||||||||
|
x˙2 |
||||||||||||||
∂x2 |
|||||||||||||||
+f3(x1,x2,x3) − |
∂α2 |
|
x2 + f1(x1) − |
∂α2 |
x3 + f2 |
(x1,x2) . |
|||||||||
∂x1 |
∂x2 |
||||||||||||||
Выбрав |
|
|
|
|
|
|
|
|
|
|
|
||||
α3(x1,x2,x3) = −c3z3 − z2 − f3(x1,x2,x3)+ |
|
|
|
||||||||||||
|
|
|
|
|
∂α2 |
|
|
|
∂α2 |
|
|
|
|||
|
|
|
+ |
|
x2 + f1(x1) |
+ |
|
x3 + f2(x1,x2) , |
|||||||
|
|
|
∂x1 |
∂x2 |
|||||||||||
где c3 > 0 — произвольная положительная константа, получим |
|||||||||||||||
|
|
|
V˙3 = −c1z12 − c2z22 − c3z32 + z3z4. |
(3.41) |
|||||||||||
30 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|