Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Стабилизация динамических систем с использованием свойства пассивности (120

..pdf
Скачиваний:
7
Добавлен:
15.11.2022
Размер:
297.07 Кб
Скачать

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

m

m

˙

(

)−2

(

m

m

m

 

Поскольку матрица M q

 

C

q,q˙) кососимметрическая при всех

q R , q˙ R , то при всех q R , q˙ R

и e˙

R справедливо

равенство

 

 

т

˙

 

 

 

 

(3.10)

 

 

− 2C(q,q˙))˙e = 0.

 

 

 

 

(M(q)

 

С учетом соотношения (3.10) и неотрицательной определенности матрицы D = Dт ≥ 0 получим следующую оценку:

V˙ = −e˙тDe˙ + e˙тv ≤ e˙тv = yтv,

где y = e˙. Таким образом, система (3.8) с выходом y = e˙ пассивна. Далее при y(t) = e˙(t) ≡ 0 имеем e¨(t) ≡ 0. Если дополнительно v = v(t) ≡ 0, то из соотношения (3.8) следует, что e(t) ≡ 0. Следовательно, система (3.8) с выходом y = e˙ наблюдаема в нулевом состоянии.

Заметим, что функция V (e,e˙) является бесконечно большой при (eт,e˙т)т → ∞. Тогда согласно теореме 3.5 управление v = −k(y) = −k(˙e), где k(·) — любая локально липшицева функция, такая, что k(0) = 0, yтk(y) > 0 при всех y =, 0глобально стабилизирует положение равновесия e = 0, e˙ = 0 замкнутой системы (3.8). Одним из стабилизирующих законов управления является линейная обратная связь

v = −Ly = −Le,˙

(3.11)

где L = Lт > 0 — произвольная симметрическая положительно определенная матрица размером m × m. Следовательно, управление u = G(q) − Ke − Le˙ глобально стабилизирует положение равновесия e = 0, e˙ = 0 замкнутой системы (3.6).

Использование закона управления (3.7) соответствует преобразованию потенциальной энергии системы (3.6) к виду P(q) =

= 12eтKe, где K = Kт > 0, e = q −qr. Отметим, что полная энер-

гия системы (3.8), имеющая вид (3.9) и представляющая собой сумму кинетической и преобразованной потенциальной энергий, имеет глобальный минимум в точке e = 0, e˙ = 0. Далее управление (3.11) играет роль демпфирования и приводит к убыванию полной энергии (3.9) на траекториях замкнутой системы (3.8).

Замечание 3.3. Далее при пассификации системы, имеющей вид (1.1), в независимости от физической природы системы будем

рассматривать использование закона управления = ˜( ) как v

x,

k

u

21

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

преобразование механизма накопления в системе энергии, причем такое, что преобразованная энергия имеет глобальный минимум в точке x = 0. При последующей стабилизации пассивной системы (3.4) будем рассматривать управление v = −k(y) = −k(h(x)) как использование «демпфирования», приводящее к убыванию накопленной в системе энергии на траекториях замкнутой системы (3.4).

Пример 3.4. Рассмотрим задачу стабилизации системы, имеющей вид

1 = x2,

(3.12)

2 = u,

где x = (x1,x2)т R2 — вектор состояния системы; u R — управление.

Возьмем функцию

 

1

x1

 

 

 

0

 

 

V (x) =

2x22 +

k1(s)ds > 0,

(3.13)

где k1(·) — произвольная локально липшицева функция, такая, что k1(0) = 0, sk1(s) > 0 при всех s =. 0Производная по времени функции V (x) в силу системы (3.12) выразится cледующим обра-

зом:

V˙ = x22 + k1(x1)x˙1 = x2u + k1(x1)x2.

При выборе управления u = −k1(x1) + v, где v R — новое управление системы, имеем

V˙ = x2(−k1(x1) + v) + k1(x1)x2 = x2v = yv,

где y = x2. Следовательно, система

1

= x2,

 

2

= −k1(x1) + v,

(3.14)

y = x2

 

является системой без потерь энергии c функцией запаса V (x), имеющей вид (3.13).

Далее, если y(t) = x2(t) ≡ 0 и v = v(t) ≡ 0, то из соотношений (3.14) следует, что x1(t) ≡ 0. Поэтому система (3.14)

22

23
(3.16)
(3.17)
(3.15)

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

наблюдаема в нулевом состоянии. Заметим, что если несобствен-

ция V (x)

 

 

→ ∞

 

ные интегралы

0+∞ k1(s)ds и

0−∞ k1(s)ds расходятся, то функ-

 

является бесконечно большой при

x

 

. Тогда

согласно

теореме 3.5 управление v = −k2(y)

=

−k2(x2), где

k2(·) — любая локально липшицева функция, такая, что k2(0) = 0, yk2(y) > 0 при всех y =, 0глобально стабилизирует положение равновесия x = 0 замкнутой системы (3.14). Следовательно, управление u = −k1(x1) − k2(x2) глобально стабилизирует положение равновесия x = 0 замкнутой системы (3.12).

Рассмотрим случай, когда система (1.1) имеет вид

z˙ = f(z) + g(z,y)y, x˙ = a(x) + b(x)u,

где z Rl, x Rp, l + p = n; u Rm — управление; y = h(x), отображение h : Rn → Rm локально липшицево, h(0) = 0; f(·), g(·,·), a(·), b(·) — локально липшицевы функции своих аргументов, f(0) = 0, a(0) = 0.

Динамическая система (3.15) представляет собой каскадную взаимосвязь систем

z˙ = f(z) + g(z,y)y

и

x˙ = a(x) + b(x)u, y = h(x).

Сформулируем следующую теорему.

Теорема 3.6. Пусть 1) система (3.17) пассивна с положительно определенной и бесконечно большой при x → ∞ функцией запаса V (x) и наблюдаема в нулевом состоянии; 2) система (3.16) при y(t) ≡ 0 асимптотически устойчива в целом в точке z = 0; 3) W(z) > 0 — непрерывно дифференцируемая бесконечно большая при z → ∞ функция Ляпунова для системы (3.16) при

y(t) ≡ 0, удовлетворяющая соотношению

∂W(z)

f(z) < 0 при

 

 

∂z

z =. 0Тогда управление

∂W z

)

 

т

 

 

 

 

 

 

 

 

u = −

(

g(z,y)

− k(y),

(3.18)

∂z

 

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

где k(·)— любая локально липшицева функция, такая, что k(0) = 0, yтk(y) > 0 при всех y =, 0глобально стабилизирует положение равновесия z = 0, x = 0 замкнутой системы (3.15).

Рассмотрим функцию

U(z,x) = W(z) + V (x),

(3.19)

представляющую собой сумму функции Ляпунова для системы (3.16) при y(t) ≡ 0 и функции запаса для системы (3.17). Заметим, что согласно условиям теоремы функции V (x) и W(z) являются положительно определенными и бесконечно большими приx → ∞ и z → ∞ соответственно. Следовательно, функция U(z,x) положительно определенная и бесконечно большая при(zт,xт)т → ∞. Производная по времени функции U(z,x) в силу системы (3.15) имеет вид

˙

∂W(z)

 

∂W(z)

 

∂V (x)

∂V (x)

U =

∂z

 

f(z) +

∂z

 

g(z,y)y +

 

a(x) +

 

b(x)u.

 

 

 

∂x

∂x

С учетом пассивности системы (3.17) справедлива следующая оценка:

 

∂W(z)

 

 

∂W(z)

 

 

 

 

 

 

 

 

U˙

 

 

f(z) +

 

 

 

 

 

g(z,y)y + yтu =

 

 

 

∂z

 

∂z

 

 

 

 

 

 

 

 

 

 

 

 

∂W z

)

 

 

 

 

∂W z

)

 

т

 

 

 

=

 

(

 

f(z) + yт

 

(

g(z,y)

+ yтu.

 

 

 

 

∂z

 

 

∂z

 

При выборе управления

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂W z

)

 

 

т

 

 

 

 

 

 

u = −

 

 

 

(

g(z,y)

+ v,

(3.20)

 

 

 

 

 

 

∂z

 

 

где v Rm — новое управление системы, имеем

 

 

 

 

 

 

 

 

∂W(z)

 

 

 

 

 

 

 

 

U˙

 

 

 

 

 

 

f(z) + yтv.

 

 

(3.21)

 

 

 

 

 

 

∂z

 

 

 

 

Тогда в силу соотношения

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂W(z)

f(z) < 0, z =, 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

∂z

 

 

 

 

 

 

справедлива оценка

U˙ ≤ yтv.

24

(3.22)

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

Таким образом, система

z˙ = f(z) + g(z,y)y,

x˙ = a(x) − b(x) ∂W∂z(z)g(z,y) т + b(x)v, y = h(x)

пассивна c функцией запаса U(z,x), имеющей вид (3.19).

При управлении v = −k(y), где k(·т) — любая локально лип-

шицева функция, такая, что k(0) = 0, y k(y) > 0 при всех y =, 0

неравенство (3.21) примет вид

 

 

 

 

 

 

 

∂W(z)

 

 

 

 

 

 

U˙

 

 

f(z) − yтk(y) <

0, (z,y)

=,(0).

(3.23)

∂z

 

Рассмотрим

множество S =

{

(zт,xт)т

т т т

(z,x) = 0

}

.

 

Rn : U˙

 

Из неравенства (3.23) следует, что при всех (z ,x )

S спра-

ведливо соотношение

 

 

 

 

 

 

 

 

 

 

∂W(z)

f(z) = yтk(y) = 0.

(3.24)

 

 

 

 

 

 

 

 

∂z

 

 

 

 

 

 

Отметим, что функция W(z) является положительно определенной и непрерывно дифференцируемой и, согласно условиям тео-

ремы, ∂W∂z(z) = 0при любом z =. 0Следовательно, равенство

∂W∂z(z) = 0 выполнено, если и только если z = 0. Тогда в силу соотношений yтk(y) > 0 при всех y =, 0f(0) = 0 и f(z) = 0 при всех z =, 0где последнее является следствием асимптотической устойчивости в целом системы (3.16) при y(t) ≡ 0 в точке

z= 0, равенство (3.24) имеет место тогда и только тогда, когда

z= 0 и y = 0. Таким образом, множество S состоит из всех (zт,xт)т = (0,xт)т Rn, таких, что y = h(x) = 0. Далее из соот-

 

∂W z

 

 

 

 

 

 

 

= 0

 

что u = 0, если z = 0

 

 

ношений (3.20),

∂z(

) z=0 = 0, v = −k(y) и k(0) = 0 получаем,

 

 

 

 

 

 

 

 

и y

 

. Заметим, что согласно условиям

теоремы система (3.17)

наблюдаема в нулевом состоянии, т. е. если

 

 

 

 

y(t) ≡ 0 и u(t) ≡ 0, то x(t) ≡ 0. Следовательно, множество S не содержит целых траекторий системы (3.15) с управлением (3.18), за исключением z(t) ≡ 0, x(t) ≡ 0. Тогда в силу третьей теоремы Барбашина — Красовского положение равновесия z = 0, x = 0

25

(3.27)

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

системы (3.15) с управлением (3.18) асимптотически устойчиво в целом. Следовательно, управление (3.18) глобально стабилизирует положение равновесия z = 0, x = 0 замкнутой системы (3.15).

Пример 3.5. Рассмотрим динамическую систему

η˙ = −η + η2ξ,

(3.25)

ξ˙ = u,

где (η, ξ)т R2 — вектор состояния системы; u R — управление. Заметим, что система (3.25) имеет вид (3.15), где y = ξ. Со-

гласно примеру 2.5 система

ξ˙ = u,

(3.26)

y = ξ

является системой без потерь энергии с бесконечно большой при

| ξ | → ∞ функцией запаса V (ξ) = 12ξ2 > 0. Дополнительно, так

как y = ξ, система (3.26) наблюдаема в нулевом состоянии. Cистема η˙ = −η асимптотически устойчива в целом в точке

η = 0. Соответствующая бесконечно большая при | η | → ∞функ-

ция Ляпунова имеет вид W(η) =

1

η2 > 0, причем

∂W(η)

(−η) =

 

 

2

∂η

= −η2 < 0 при η =. 0Тогда согласно теореме 3.6 управление u = −η3 − kξ,

где k > 0 — произвольная положительная константа, глобально стабилизирует положение равновесия η = 0, ξ = 0 замкнутой системы (3.25).

3.3. Метод обхода интегратора

Рассмотрим динамическую систему

x˙ = f(x) + g(x)ξ,

ξ˙ = u,

где (x, ξ)т R2 — вектор состояния системы; u R — управление; f(·), g(·) — непрерывно дифференцируемые функции своих аргументов, f(0) = 0.

26

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

Следствием теоремы 3.6 является следующий результат.

Лемма 3.1. (лемма об обходе интегратора). Пусть 1) существует такая непрерывно дифференцируемая функция α(x), α(0) = 0, что система

x˙ = f(x) + g(x)α(x)

(3.28)

асимптотически устойчива в целом в точке x = 0; 2) W(x) > 0 — непрерывно дифференцируемая бесконечно большая при | x | → → ∞ функция Ляпунова для системы (3.28), удовлетворяющая соотношению

 

∂x(

) f(x) + g(x)α(x)

< 0 при x =. 0 (3.29)

 

∂W x

 

 

 

Тогда управление

 

 

 

u = −k(ξ − α(x)) + ∂α∂x(x) f(x) + g(x)ξ − ∂W∂x(x)g(x), (3.30) где k > 0 — произвольная положительная константа, глобально стабилизирует положение равновесия x = 0, ξ = 0 замкнутой системы (3.27).

Используя обозначение z = ξ−α(x), запишем систему (3.27)

ввиде

x˙ = f(x) + g(x)α(x) + g(x)z,

 

 

∂α(x)

 

(3.31)

z˙ = u −

 

f(x) + g(x)(z

+ α(x)) .

∂x

При выборе управления

u =

∂α(x)

f(x) + g(x)(z + α(x)) + v,

(3.32)

∂x

где v R — новое управление системы, система (3.31) примет вид

x˙ = f(x) + g(x)α(x) + g(x)z,

(3.33)

z˙ = v.

Заметим, что система (3.33) имеет вид (3.15), где y = z. Согласно примеру 2.5 система

z˙ = v,

(3.34)

y = z

27

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

является системой без потерь энергии с бесконечно большой при

| z | → ∞ функцией запаса V (z) = 12z2 > 0. Дополнительно, так

как y = z, система (3.34) наблюдаема в нулевом состоянии. Cогласно условиям теоремы система (3.28) асимптотически

устойчива в целом в точке x = 0, а W(x) > 0 — соответствующая непрерывно дифференцируемая бесконечно большая при | x | → ∞ функция Ляпунова, удовлетворяющая соотношению (3.29). Тогда согласно теореме 3.6 управление

v = −

∂W(x)

g(x) − kz,

(3.35)

∂x

где k > 0 — произвольная положительная константа, глобально стабилизирует положение равновесия x = 0, z = 0 замкнутой системы (3.33). Следовательно, в силу соотношений (3.32), (3.35), z = ξ−α(x) и α(0) = 0 управление (3.30) глобально стабилизирует положение равновесия x = 0, ξ = 0 замкнутой системы (3.27).

Рассмотрим случай, когда нелинейная динамическая система (1.1) имеет вид

1 = x2 + f1(x1),

 

2 = x3 + f2(x1,x2),

 

···

(3.36)

n−1 = xn + fn−1(x1,...,xn−1), x˙n = u + fn(x),

где x = (x1,...,xn)т Rn — вектор состояния системы; u R —

управление; fi(·), i = 1,n — гладкие функции своих аргументов,

fi(0) = 0, i = 1,n.

Следствием леммы 3.1 является следующий способ решения задачи стабилизации системы (3.36), основанный на пошаговой пассификации системы и называемый методом обхода интегратора.

Шаг 1. Рассмотрим функцию

V1(z1) = 12z12,

где z1 = x1. Для удобства используем далее также обозначение z2 = x2 − α1(x1), где α1(·) — некоторая гладкая функция. Произ-

28

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

водная по времени функции V1(z1) в силу системы (3.36) имеет вид

V˙1 = z11 = z1(x2 + f1(x1)) = z1(z2 + α1(x1) + f1(x1)).

Выбрав функцию α1(x1) = −c1z1 − f1(x1), где c1

> 0 — произ-

вольная положительная константа, получим

 

V˙1 = −c1z12 + z1z2.

(3.37)

Функцию V1(z1) = V1(x1) > 0 можно рассматривать как функцию запаса для пассивной системы

1 = x2 + f1(x1) = α1(x1) + f1(x1) + z2,

(3.38)

y = z1 = x1,

где z2 — вход системы. Из соотношения (3.37) следует, что для производной по времени функции V1(x1) в силу системы (3.38) справедлива оценка

V˙1 ≤ z1z2 = yz2.

Шаг 2. Рассмотрим функцию

V2(z1,z2) = V1(z1) + 12z22.

Для удобства используем далее обозначение z3 = x3 − α2(x1,x2), где α2(·) — некоторая гладкая функция своих аргументов. Производная по времени функции V2(z1,z2) в силу системы (3.36) имеет вид

V˙2 = −c1z12 + z1z2 + z22 =

∂α1

 

= −c1z12 + z1z2 + z2 x3 + f2(x1,x2) −

=

 

1

∂x1

=−c1z12 + z2 z1 + z3 + α2(x1,x2) + f2(x1,x2)−

∂α1 x2 + f1(x1) . ∂x1

Выбрав

α2(x1,x2) = −c2z2 − z1 − f2(x1,x2) + ∂α1 x2 + f1(x1) , ∂x1

29

Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»

где c2 > 0 — произвольная положительная константа, получим

V˙2 = −c1z12 − c2z22 + z2z3.

(3.39)

Функцию V2(z1,z2) = V2(x1,x2 − α1(x1)) = V˜2(x1,x2) > 0

можно рассматривать как функцию запаса для пассивной системы

1 = x2 + f1(x1),

2 = x3 + f2(x1,x2) = α2(x1,x2) + f2(x1,x2) + z3, (3.40) y = z2 = x2 − α1(x1),

где z3 — вход системы. Из соотношения (3.39) следует, что для производной по времени функции V˜2(x1,x2) в силу системы (3.40) справедлива оценка

V˜˙2 ≤ z2z3 = yz3.

Шаг 3. Рассмотрим функцию

V3(z1,z2,z3) = V2(z1,z2) + 12z32.

Для удобства используем далее обозначение z4 =x4−α3(x1,x2,x3), где α3(·) — некоторая гладкая функция своих аргументов. Производная по времени функции V3(z1,z2,z3) в силу системы (3.36) имеет вид

V˙3 = −c1z12 − c2z22 + z2z3 + z33 =

 

 

 

 

 

 

∂α2

= −c1z12 − c2z22 + z2z3 + z3 x4 + f3(x1,x2,x3) −

 

 

 

1

 

∂x1

∂α2

= −c1z12 − c2z22 + z3 z2

+ z4 + α3(x1,x2,x3)+

 

2

∂x2

+f3(x1,x2,x3) −

∂α2

 

x2 + f1(x1) −

∂α2

x3 + f2

(x1,x2) .

∂x1

∂x2

Выбрав

 

 

 

 

 

 

 

 

 

 

 

α3(x1,x2,x3) = −c3z3 − z2 − f3(x1,x2,x3)+

 

 

 

 

 

 

 

 

∂α2

 

 

 

∂α2

 

 

 

 

 

 

+

 

x2 + f1(x1)

+

 

x3 + f2(x1,x2) ,

 

 

 

∂x1

∂x2

где c3 > 0 — произвольная положительная константа, получим

 

 

 

V˙3 = −c1z12 − c2z22 − c3z32 + z3z4.

(3.41)

30

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]