В заключение заметим, что прямой метод Ляпунова весьма плодотворен, но из-за сложности выбора функций Ляпунова остается, в основном, инструментом теоретиков, позволяющим получить общие сведения о поведении систем разных классов.
Рассмотренные ниже в п. 21 методы теории абсолютной устойчивости иллюстрируют возможности применения метода Ляпунова для получения инженерных критериев устойчивости [17, 37, 39].
Более подробно применение функций Ляпунова к синтезу нелинейных и адаптивных систем рассмотрено в книге [30].
20.6Примеры
Пример 1. Собственные движения маятника. Рассмотрим уравнения математического маятника массой m и длиной l (см. также с. 14). Учтем влияние момента сил сопротивления, вызванного «вязким» трением. Полагаем, что этот момент пропорционален величине угловой скорости. Угол отклонения маятника от вертикальной оси ϕ(t) подчиняется уравнению Jϕ¨(t)+ρϕ˙(t)+ mgl sin ϕ(t) = 0, в котором J = ml2 – момент инерции маятника; ρ ≥ 0
– коэффициент трения (считаем, что ϕ = 0 соответствует положению «вертикально вниз» ). После деления на J запишем это уравнение в виде
ϕ¨(t) + ϕ˙(t) + ω02 sin ϕ(t) = 0, |
(20.18) |
где параметр ω0 = gl .
Полная энергия H маятника включает кинетическую и потенциальную составляющие и определяется выражением
ϕ˙2 −
H(ϕ, ϕ˙) = J 2 + mgl(1 cos ϕ).
Введем вектор состояния x = col{ϕ, ϕ˙} и перепишем уравнение (20.18) в виде
x˙1(t) = x2(t),
x˙2(t) = −ω02 sin x1(t) − x2(t).
Зададимся функцией Ляпунова V (x), пропорциональной H(ϕ, ϕ˙), а именно, положим
|
x˙22 |
2 |
(1 |
−cos x1) (x = col{ϕ, ϕ˙}). Как нетрудно убедиться, данная функция удовле- |
V (x) = |
|
+ω0 |
2 |
творяет перечисленным на с. 183 условиям положительной определенности за исключением п. 3, так как H(ϕ, ϕ˙) = 0 на множестве точек с координатами ϕ = ±2kπ, ϕ˙ = 0
191
(k = 0, 1, 2, . . .), а не только в начале координат. Поэтому ограничимся в дальнейшем областью Ω = {x : |ϕ| ≤ π, V (x) < 2ω02}. Границей данной области является кривая с коорди-
натами (ϕ, ϕ˙), при которых полная энергия маятника HΩ равна наибольшему значению ее
потенциальной составляющей, HΩ = maxϕ mgl(1 − cos ϕ) = 2mgl. Эта линия выражается
формулой x2 = ω0 2(cos x1 + 1). Очевидно, что Ω является ограниченной окрестностью
внутри которой функция V (x) обращается в ноль только при x = 0. |
начала координат, |
|
|
|
|
Вычислим производную |
˙ |
в силу системы (20.20). В соответствии с формулой |
V (x(t)) |
(20.9), с. 184, получим |
|
|
|
|
|
|
˙ |
2 |
(20.21) |
|
|
V (x) = − x2. |
Поскольку выполнено неравенство |
˙ |
≤ 0 при x |
Ω, то согласно теореме 1 (с. 184) |
V (x) |
положение равновесия устойчиво по Ляпунову.
Рассмотрим теперь отдельно случаи = 0 (демпфирование отсутствует) и > 0 (демп-
фирование есть).
При |
= 0 из (20.21) следует, что |
˙ |
≡ 0, т.е. функция Ляпунова остается неиз- |
V (x) |
менной. Так как выбранная функция V (x) пропорциональна полной энергии системы, то полученное выражение означает, что энергия маятника при отсутствии трения постоянна,
т.е. рассматриваемая система является консервативной. Из равенства V (x) = C для некоторого заданного 0 < C < HΩ следует, что фазовые траектории удовлетворяют уравнению
x22 − 2ω02 cos x1 = 2(C − ω02). |
(20.22) |
Заметим, что это же выражение можно получить исходя из (20.20). Действительно, исключая из (20.20) время t, получим уравнение x2dx2 = −ω02 sin x1dx1, интегрирование которого дает (20.22). 6 Метод Ляпунова позволяет определить свойства системы без вычисления ее решений или нахождения фазовых траекторий.
Таким образом, исследуя поведение функции V (x) находим, что для всех t переменные состояния системы подчиняются уравнению (20.22). В области Ω имеется единственное состояние равновесия x = 0. Оно не удовлетворяет (20.22) при C = 0; следовательно, движение маятника будет иметь характер незатухающих колебаний с амплитудой, зависящей от начальных условий (от константы C). Фазовые траектории (и совпадающие с ними линии равного уровня функции V (x)) при = 0 показаны на рис. 20.1, с. 176.
6 См. также с. 76, п. 10.3.1
Рассмотренный пример позволяет также проследить связь между функцией Ляпунова
консервативной системы и известным в теории дифференциальных уравнений понятием первых интегралов.
Как известно [10, 36], первым интегралом уравнения
x˙ = f(x), x Rn называется функция Q(x) определенная и непрерывная вместе со своими
частными производными в некотором открытом множестве Ω (содержащемся в области, где
определена и непрерывна вместе со своими частными производными вектор-функция f(x)),
если при подстановке в Q(x) произвольного решения, траектория которого расположена
целиком во множестве Ω, получается постоянная относительно t величина. Любой первый
интеграл удовлетворяет условию [36] |
∂Q(x) |
f(x) = 0. Сопоставляя это условие с формулой |
|
|
∂x |
(20.9) видим, что если имеется возможность использовать первый интеграл в качестве фу-
˙ |
и система консервативна. |
нкции Ляпунова, V (x) = Q(x), то V (x) ≡ 0 |
Перейдем теперь к рассмотрению системы с демпфированием, = 0. Заметим, что из
˙
(20.21) следует, что V (x) = 0 только при x2 = 0. Для остальных точек пространства со-
стояний она отрицательна. Следовательно, указанное в теореме 6 множество ω является прямой x2 = 0. Но в рассматриваемой области нет ни одной целой траектории, для которой x2(t) ≡ 0, за исключением начала координат. Поэтому M = {0}. Согласно утверждению теоремы, при t → ∞ каждая траектория стремится к множеству M, т.е. к точке x = 0.
Таким образом, доказана асимптотическая устойчивость в большом положения равновесия
системы (20.20), несмотря на отсутствие отрицательной определенности функции Ляпунова.
Фазовая траектория и линии равного уровня функции V (x) показаны на рис. 20.7, с. 185. Поведение функции Ляпунова и ее производной во времени для выбранной фазовой
кривой показано на рис. 20.8.
Пример 2. Возбуждение колебаний маятника. Обратимся снова к движению маятника, полагая, что на него действует внешний управляющий момент M(t). Введем управ-
|
ляющее воздействие u(t) = |
M(t) |
. Пренебрежем силами трения. Тогда, вместо (20.18) по- |
|
J |
|
лучим уравнение |
|
|
|
|
|
|
|
|
ϕ¨(t) + ω02 sin ϕ(t) = u(t). |
(20.23) |
Для полной энергии маятника H выполнено соотношение (20.19). Рассмотрим задачу возбуждения колебаний маятника, которая сводится к выводу на заданный уровень и стаби-
193
Рисунок 20.8: Графики функций |
V x(t) |
|
˙ |
x(t) для одной из реализаций процесса |
|
V |
(20.20). |
|
и |
|
|
|
лизации энергии H маятника (подробнее см. [5, 30]). Для этой цели можно использовать |
пропорциональный |
|
|
|
|
|
u = −γ H − H )ϕ˙(t) |
(20.24) |
или релейный |
|
|
|
|
|
u = −γsign H − H )ϕ˙(t) |
(20.25) |
алгоритмы управления [5, 8, 30]. Они являются разновидностями алгоритмов скоростного градиента [5,8,30,48]. В выражениях (20.24), (20.25) через H обозначен требуемый уровень энергии, а γ > 0 – параметр алгоритма (для (20.24) это коэффициент усиления, а для (20.25)
– величина «полки» реле).
Как и выше, возьмем функцию Ляпунова пропорциональную полной энергии маятника,
V (x) = |
x˙22 |
2 |
− cos x1), где x = col{ϕ, ϕ˙}, и вычислим ее производную в силу системы. |
|
+ ω0 (1 |
2 |
Получим |
|
|
|
|
|
|
|
˙ |
2 |
(20.26) |
|
|
|
V = ϕ˙ϕ¨ + ω0 ϕ˙ sin ϕ = uϕ˙. |
При использовании пропорционального закона управления (20.24) находим, что |
|
|
|
|
|
V˙ = −γ H − H ϕ˙2, |
(20.27) |
а для релейного закона управления (20.25) – |
|
|
|
|
V˙ |
= −γsign H − H |ϕ˙|. |
(20.28) |
|
|
|
|
194 |
|
Отсюда видно, что при |
H < H |
и |
ϕ˙ = 0 |
производная |
V˙ > 0. |
Поскольку |
ϕ˙(t) |
≡ |
0 |
сов- |
|
|
|
|
|
местимо с уравнениями системы только при ϕ(t) ≡ 0, начало координат (ϕ = ϕ˙ = 0)
неустойчиво по Ляпунову. Вне этой точки следует рассмотреть множество, определяемое
условием H = H . Нетрудно убедиться, что оно является инвариантным множеством, так
как при u(t) ≡ 0 и соответствующих начальных условиях (таких, что H ϕ(0), ϕ˙(0) = H )
получается траектория, для которой H(t) = H (см. выше уравнение (20.22), с. 192). Так
˙
как при H > H имеет место V < 0, а функция V – положительно определенная в области
Ω = {x : V (x) ≤ 2ω02} (см. с. 192), то все траектории, начинающиеся внутри этой области (кроме тривиального решения ϕ(t) ≡ 0) будут асимптотически стремиться к предельному циклу, определяемому условием H(t) ≡ H . Следовательно, в системе возбуждаются автоколебания заданной амплитуды.
На рис. 20.9 показана последовательность положений маятника при возбуждении колебаний по знаковому алгоритму (а) и соответствующий фазовый портрет (б).
Рисунок 20.9 – Процесс раскачки маятника.
Пример 3. Исследование автоколебательной системы. В данном примере рас-
смотрим так называемое уравнение Баутина: [26] |
|
|
|
|
|
|
|
|
|
x˙1(t) = ωx (t) + a2x1(t) x1(t) x1(t)2 + x2(t)2 |
, |
|
x |
− |
2 |
− |
− |
t |
|
t 2 |
|
x |
t |
2 , |
(20.29) |
2 |
|
x |
+ |
˙2 |
(t) = ωx1(t) + a x2 |
(t) x2( ) |
1 |
( ) |
2 |
( ) |
|
|
где ω > 0, a > 0 – параметры. Состояние x = 0 является состоянием равновесия Исследуем устойчивость этого состояния наличие у системы предельных циклов. Введем квадратичную функцию Ляпунова V (x) = x21 + x22. Заметим что условие роста (см. теорему 4, с. 185)
для этой функции выполнено. Производная V (x) в силу системы (20.29) определяется вы-
˙ |
2 |
2 |
2 |
2 |
2 |
˙ |
при x < a и |
ражением V (x) = (x1 |
+ x2)(a |
|
− x1 |
− x2). Нетрудно заметить, что V (x) > 0 |
x = 0. Следовательно, состояние равновесия неустойчиво по Ляпунову. В области x > a
выполнено V (x) < 0, поэтому система является диссипативной и все траектории, начина-
| ≤ ˙
ющиеся вне области x a стремятся к ней. Так как V (x) = 0 при x = a и в силу того, что решение x1(t)2 + x2(t)2 = a2 удовлетворяет (20.29), то данное решение является асимптотически устойчивым предельным циклом – система (20.29) является автоколебательной.
˙
Для иллюстрации на рис. 20.10 а. показаны графики функций V (x), V (x), (принято a = 1, ω = π) на которых отражены траектории процессов V (x(t)) при начальных условиях x0 = [−0.1, 0]T (расходящиеся колебания) и x0 = [−3, 0]T (затухающие колебания). Соответствующие фазовые траектории приведены на рис. 20.10 б.
Рисунок 20.10 – Функция Ляпунова и фазовый портрет автоколебательной системы.
Пример 4. Преследование зайца. Рассмотрим погоню собаки за зайцем [53]. Предположим, что заяц движется вдоль оси x с постоянной скоростью vr, а гончая - с постоянной по модулю скоростью vh, причем вектор скорости в каждый момент времени направлен на зайца (траектория сближения в этом случае представляет собой трактрису, или «собачью тропу» ). Обозначим через xh, yh и xr, yr, соответственно, координаты гончей и зайца. Тогда x˙r(t) = vr, y˙r(t) = 0, yr(0) = 0. Учитывая направление вектора скорости гончей, получим, что для некоторой постоянной k > 0 выполнено
x˙ h(t) = −k xh(t) − xr(t) , y˙h(t) = −k yh(t) − yr(t) .
Постоянную k определим из очевидного соотношения
x˙h(t)2 + y˙h(t)2 = v2 |
. Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
|
h |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x˙h(t) = |
− |
|
|
|
xh(t) − xr(t) |
vh, |
|
|
|
|
|
|
|
|
|
|
|
|
− |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xh(t) xr(t) 2 + yh(t)2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yh(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y˙h(t) = |
− |
|
|
|
|
|
|
|
|
|
vh. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xh(t) − xr(t) 2 + yh(t)2 |
|
|
|
|
|
|
|
В относительных координатах x = xh − xr, y = yh эта система принимает вид |
|
x˙h(t) = − |
|
|
x t) |
|
|
|
|
|
|
( |
|
vh − vr, |
|
|
|
|
|
|
|
|
|
|
x(t)2 |
+ y(t)2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
2 |
|
(20.30) |
|
|
|
|
|
|
|
yh(t) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y˙h(t) = |
− |
|
|
|
|
|
|
vh. |
|
|
|
|
|
|
x(t) + y(t) |
|
|
|
|
|
|
|
|
|
|
|
Спрашивается, поймает ли собака зайца? В терминах рассматриваемой модели это значит: всякое ли решение с начальным состоянием (x0, y0) стремится к началу координат? Для ответа на поставленный вопрос исследуем устойчивость решений (20.30). Заметим, что уравнения (20.30) не определены в точке x = y = 0 (когда заяц пойман).
Для выбора подходящей функции Ляпунова учтем, что целью преследования является уменьшение расстояния между собакой и зайцем. Именно расстояние и будем использовать в качестве функции Ляпунова: V (x, y) = x2 + y2. Производная этой функции в силу (20.30)
˙ |
|
|
2 |
2 |
|
˙ |
во всех |
равна V (x, y) = −2vh |
x +y |
|
−2vrx. Видно, что при vh > vr функция V (x, y) < 0 |
точках, кроме |
начала координат. 7 |
Следовательно, если гончая бежит быстрее зайца (а |
|
|
|
|
|
|
|
заяц – по прямой), то она его поймает (асимптотически).
Пример 5. Устойчивость нелинейной дискретной системы. Рассмотрим систему
[53] |
|
|
|
|
|
|
x1[k + 1] = |
1 |
x |
k |
|
|
(20.31) |
+ |
2x[2[]k]2 , |
|
|
|
|
|
|
|
x2[k + 1] = |
|
x1[k] |
2 . |
|
|
|
|
|
|
|
|
|
1 |
+ x2[k] |
|
|
|
Состояние x = 0, x = col{x1, x2} является состоянием равновесия (действительно, условие x = f(x ) при x = 0, очевидно, выполнено). Введем функцию Ляпунова V (x) = x21 + x22.
Чтобы проверить, убывает ли она вдоль траекторий системы (20.31), вычислим V (f(x)).
7 Действительно, при x = 0 это очевидно, а при x = 0 получим −vh x2 + y2 − vrx < −(vh − vr)|x| < 0.
Получим
x2 x2 x2 + x2 V (x)
V (f(x)) = 1 + 2x22 2 + 1 + 1x22 2 = 11+ x22 2 2 = 1 + x22 2 .
Отсюда видно, что V (f(x)) < V (x) при x = 0. Несложно проверить выполнение и других условий теоремы 2 с. 189, следовательно, состояние равновесия x = 0 дискретной системы (20.31) асимптотически устойчиво в целом.
Лекция 21
21 Методы теории абсолютной устойчивости
21.1Задача абсолютной устойчивости
Предпложим, что нелинейная система представлена в виде системы Лурье: линейной динамической подсистемы и нелинейного статического звена в цепи обратной связи. Для простоты ограничимся случаем системы с одним нелинейным блоком, уравнения которой, следовательно, можно представить в виде ( см. 19.3)
A(p)σ(t)=−B(p)ξ(t), |
(21.1) |
ξ(t)=ϕ(σ(t)), |
(21.2) |
где p ≡ dtd – оператор дифференцирования A(p), B(p) – операторные многочлены.
Линейная часть рассматриваемой системы имеет передаточную функцию от входа (−ξ) к выходу σ:
где аргумент s C, а многочлены B(s), A(s) получаются заменой аргумента p в A(p), B(p) на s.
Займемся задачей исследования устойчивости замкнутой системы (21.3) не для конкретной функции ϕ(σ), а для всех таких функций, принадлежащих некоторому множеству (классу) Φ. 1 Таким образом, рассмотрим некоторые общие условия устойчивости, не зависящие от того, какая конкретно нелинейная зависимость имеет место.
Определение [17]. Линейная часть системы (или, короче, система (21.1)) абсолютно устойчива в классе Φ нелинейных блоков (21.2), если любая замкнутая система (21.1), (21.2) с функцией ϕ(·) Φ асимптотически устойчива в целом.
Физически это означает, что система имеет достаточно хорошие свойства, которые не пропадают при замене одних блоков из данного класса другими.
1 Такая постановка задачи соответствует рассмотренному в предыдущем параграфе примеру, в котором достаточные условия устойчивости устанавливались для любой нелинейной характеристики, график которой лежит в заданном секторе.
Обычно рассматриваются так называемые секторные нелинейности, удовлетворяющие
условию |
|
|
k1 ≤ |
ϕ(σ) |
≤ k2, σ = 0, ϕ(0)=0. |
|
σ |
Заметим, что условия (21.4) можно переписать в виде одного квадратичного неравенства
k2σ−ϕ(σ) ϕ(σ)−k1σ) ≥ 0.
Прежде чем перейти к критериям абсолютной устойчивости нелинейных систем, рассмотрим подобную задачу для линейного случая, т.е. будем считать, что ϕ(σ) = k0σ для некоторого постоянного коэффициента k0. С помощью известных в теории линейных систем методов можно установить граничные значения параметра k0, при которых сохраняется устойчивость линейной системы k0 [k1, k2].2, Этот промежуток определяет так называемый сектор (угол) Гурвица. Графически условие устойчивости выглядит в виде сектора на плоскости (ϕ, σ), ограничивающего график зависимости ϕ=ϕ(σ).
В конце 40-х годов М.А.Айзерманом была выдвинута гипотеза, согласно которой сектор абсолютной устойчивости нелинейной системы совпадает с сектором Гурвица, т.е. каждая нелинейная система, у которой график зависимости ϕ = ϕ(σ) лежит внутри гурвицевого угла, устойчива в целом [11,33,39]. Впоследствии были найдены опровергающие примеры, хотя гипотезу Айзермана можно использовать для многих практически важных случаев. Известны попытки уточнить формулировку этой гипотезы с тем, чтобы расширить область ее применения. Например, Р. Калманом предъявлены более жесткие ограничения: согласно гипотезе Калмана, устойчивость линейной системы должна иметь место для всех k0, ограниченных не только сектором, содержащим нелинейность ϕ(σ), но и граничными
значениями производной dϕ(σ) [39]. Заметим, что функции ϕ(σ), удовлетворяющие гипо- dσ
тезе Калмана, удовлетворяют и гипотезе Айзермана. Но, хотя данная гипотеза оказывается
справедливой для более широкого класса систем, для нее также найдены опровергающие примеры.
Перейдем к строгим критериям.
Для последующего изложения пригодится трактовка секторного условия устойчивости линейной системы по частотному критерию Найквиста. Как нетрудно заметить, устойчивость линейной системы в секторе Гурвица означает, что амплитудно-частотная характери-
стика линейной части системы W(jω) не пересекает отрезок вещественной оси − 1 , − 1 , k1 k2
2 Возможно, граничных пар будет несколько.