Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

.pdf
Скачиваний:
108
Добавлен:
26.03.2015
Размер:
1.78 Mб
Скачать

охватывая его требуемое (по количеству "неустойчивых"полюсов разомкнутой системы) число раз.

Сформулируем основные положения наиболее известных критериев абсолютной устойчивости: кругового критерия и критерия Попова. Более подробное изложение, включающее и доказательства, можно найти в [27]. Доказательства основаны на так называемой

частотной теореме (лемме) В.А.Якубовича–Р.Калмана, (см. [1, 8, 17, 31, 33]) 3.

21.2Круговой критерий

Пусть выполнены следующие условия:

1) k1 ϕ(σ) ≤ k2, σ = 0, ϕ(0) = 0 (т.е. выполнено секторное условие (21.4)), причем

σ

k1 = ∞, k2 = −∞; 2) существует такое k0, k1 ≤ k0 ≤ k2, что линейная система с обратной

связью вида ϕ(σ)=k0σ асимптотически устойчива; 3) разомкнутая система W(s) = B(s) не

A(s)

имеет полюсов на мнимой оси, т.е. A() = 0 для всех ω; 4) при всех ω [−∞,+] выполнено

частотное условие Re 1+k1W() k2W()+1 >0. 4

Тогда замкнутая нелинейная система абсолютно устойчива в заданном классе нелинейных блоков, более того, имеет место равномерная экспоненциальная устойчивость, т.е. существуют такие постоянные c > 0, ε > 0, что для любого решения системы (19.2) и любых t > t0 выполнено |x(t)| ≤ c|x(t0)|e−ε(t−t0) [17].

Частотное условие 4 графически интерпретируется, как отсутствие общих точек у АФХ линейной части системы с окружностью с центром на вещественной оси, проходящей на

этой оси через точки 1 , − 1 . k1 k2

Видно, что круговой критерий задает более жесткие условия для линейной части системы, чем гипотеза Айзермана. Подчеркнем, что он является только достаточным условием абсолютной устойчивости в том смысле, что невыполнение условия 4 означает неприменимость к данной системе этого критерия. Возможно, посредством другого критерия абсолютную устойчивость удастся обосновать.

Круговой критерий исчерпывает все критерии, которые могут быть получены с помо-

3Отметим, что первоначальное доказательство В.М. Попова было получено другим методом: так называемым методом априорных оценок, который имеет и иные применения в теории нелинейных систем [27].

4Звездочкой здесь обозначена операция комплексного сопряжения, как частный случай эрмитового сопряжения, означающего для матриц, кроме того, и транспонирование.

201

щью квадратичной функции Ляпунова V (x) = xT Hx, H = HT > 0 [17]. Рассмотрим теперь следующий, более "тонкий"частотный критерий В.М. Попова, который для простоты сформулируем лишь для случая k1 = 0 (общий случай может быть сведен к этому заменой

ϕ˜ = ϕ + k1σ).

21.3Критерий В. М. Попова

Частотный критерий В.М. Попова гласит, что если выполнены условия: 1) линейная часть системы асимптотически устойчива; 2) нелинейность ϕ(·) – однозначная и стационарная

(допускаются изолированные точки разрыва первого рода), 5 0

ϕ(σ)

≤ k,

σ = 0, ϕ(0)=0

σ

 

(k = не исключается); 3) существует ϑ такое, что для всех ω

[0,

] справедливо

1

частотное неравенство k +Re 1+jωϑ W() > 0, то имеет место абсолютная устойчивость в заданном классе нелинейных блоков [11, 17, 33, 37, 39].

Данный критерий имеет удобную графическую интерпретацию. Для этого вводится

видоизмененная частотная характеристика W () = U (ω)+jV (ω), где U (ω) = U(ω) = Re(W()), V (ω) = ωV(ω)=ωIm(W()). Тогда, в соответствии с частотным неравенством, годограф видоизмененной частотной характеристики должен лежать "правее"некоторой

прямой, проходящей через точку k1 на вещественной оси.

Заметим, что выполнение приведенных условий Попова означает существование у си-

стемы функции Ляпунова вида V (x)=xT Hx+ϑ σ ϕ(σ)dσ. [17, 39].

0

Подробные сведения о более общем методе получения частотных условий устойчивости – частотной теореме Якубовича–Калмана приведены в [17, 27], см. также тематический выпуск журнала Автоматика и телемеханика [1] и сборник [31], посвященные 80-летнему юбилею проф. В. А. Якубовича.

5 Это условие может быть несколько ослаблено, [17].

202

Лекция 22

22Исследование скользящих режимов. Метод эквивалентного управления

22.1Понятие о скользящих режимах

Пусть (замкнутая) система описывается уравнениями вида (18.6):

x˙ (t)=f (x(t), t)

(22.1)

либо эквивалентными им уравнениями вида (18.7), (18.8):

x˙ (t)=Ax(t)+(t), σ(t)=Cx(t),

(22.2)

ξ(t)=ϕ(σ, t).

Кроме того, используем следующую форму записи уравнений системы [46], в которой явно

выделено управляющее воздействие u(t) : 1

x˙(t)=ψ (x(t), u(t), t) ,

(22.3)

u(t)=U(x, t).

Известно много систем, для которых нелинейные зависимости (функции в правых частях

(22.3)) претерпевают разрыв. Типичными примерами служат механические системы с су-

хим (кулоновским) трением, различные системы с релейным законом управления, в том

числе и оптимальные по быстродействию системы управления, а также системы с регуля-

торами переменной структуры (СПС) ( [6, 8, 33, 38, 46]).

Для таких систем возникают трудности, связанные с определением движений на мно-

жестве точек разрыва. В некоторых ситуациях решение можно получить, рассматривая движение системы до и после точки разрыва, используя конечные значения переменных

состояния в качестве начальных на следующем участке траектории. Такая ситуация имеет

место, когда фазовые траектории «прошивают» поверхность разрыва. Но возможны слу-

чаи, в которых фазовые кривые «стыкуются» на поверхности разрыва. Тогда изображаю-

щая точка не может покинуть эту поверхность и остается на ней. Возникает «скользящий

1 Заметим, что эти уравнения можно рассматривать как представление модели замкнутой системы «по функциональному признаку», в которых выделены уравнения объекта управления (18.4) и уравнения регулятора (18.6). Однако в (22.3) не указано, чт´о является выходом и состоянием объекта. Поэтому регулятор может быть динамическим и некоторые компоненты вектора состояния могут относиться к регулятору.

203

режим» – движение изображающей точки по поверхности разрыва в течение некоторого конечного интервала времени. Существенно, что в этом случае решение бесконечно много раз попадает на поверхность разрыва. Здесь моменты разрыва не являются изолированными точками, как в предыдущем случае, а образуют отрезки оси времени. Возникает вопрос определения понятия решения уравнений с разрывной правой частью, когда моменты, для которых наступает разрыв, плотно лежат на некотором интервале. Данные определения должны учитывать как инженерно-физические, так и математические соображения. Они должны обеспечивать возможность математического исследования систем (включая теоремы существования и продолжимости решений, теоремы устойчивости), а также адекватно описывать физическую реальность [17].

Известно несколько способов определения движений в скользящем режиме. Рассмотрим некоторые из них.

Среди указанных методов можно выделить физический и аксиоматический подходы [8, 17, 46].

Физический подход развит в работах М.А. Айзермана и Е.С. Пятницкого и вкратце состоит в следующем. Для рассматриваемой системы составляется более точная математическая модель, в которой учитываются такие факторы, как запаздывание, гистерезис, инерционность, ограниченность скорости изменения сигнала и коэффициента усиления, и т.д. Действие этих факторов приводит к тому, что в рассматриваемой модели системы отсутствует описанный выше «идеальный» скользящий режим и возникает «реальный» сколь-

зящий режим с изолированными моментами разрыва правых частей уравнений. Изображающая точка не остается на поверхности разрыва, а «прошивает» ее в противоположных

направлениях. 2 Для таких систем исчезает отмеченная выше специфическая проблема, связанная с тем, что моменты принадлежности изображающей точки поверхности разрыва образуют отрезки времени, следовательно решение может быть получено обычным образом. После того, как получены уравнения реального скользящего режима, выполняется предельный переход. Движение системы в идеальном скользящем режиме рассматривается как предел, к которому стремится реальный скользящий режим при стремлении указанных факторов к нулю.

С одной стороны, такой подход оправдан с инженерной точки зрения. С другой стороны, он является трудоемким. Кроме того, нет гарантии, что при составлении модели учтены все (или именно те, которые необходимы) факторы. Эти обстоятельства препят-

2 Можно также сказать, что если в идеальном скользящем режиме изображающая точка совершает колебания с бесконечной частотой и нулевой амплитудой относительно поверхности разрыва, то в реальном скользящем режиме частота колебаний конечна, а амплитуда не равна нулю.

204

ствуют применению физического подхода, в том числе и в практических приложениях. Аксиоматический подход состоит в доопределении уравнений системы при движении в

скользящем режиме так´им образом, чтобы получились уравнения с гладкой правой частью, решения которых описывали бы движение по поверхности разрыва. Применение аксиоматического подхода существенно проще, чем физического, но полученные с помощью его результаты нуждаются в проверке с точки зрения соответствия физической реальности. В качестве критерия адекватности иногда используют физический подход [46].

В следующих параграфах аксиоматический подход рассмотрен более подробно.

22.2Определение движения в скользящем режиме

Задача определения движений в скользящем режиме разными авторами рассматривается

внесколько отличающихся постановках.

Вбольшом числе математических работ рассматриваются уравнения вида (22.1) и считается, что на некоторой поверхности, заданной уравнением σ(x, t) = 0, функция f(·) претерпевает разрыв первого рода, т.е. 3

f+(x, t),

σ(x, t) > 0,

f(x, t)= f(x, t),

σ(x, t) < 0.

Требуется определить такую непрерывную (по x) функцию f0(x, t), чтобы уравнение

x˙(t) = f0(x, t) описывало движение изображающей точки по поверхности разрыва, т.е. при

σ(x, t) 0 на некотором временн´ом интервале.

Другими словами, если векторы фазовой скорости по разные стороны от поверхности разрыва v+(x), v(x) направлены в противоположные области, то в системе возникает скользящий режим. Требуется определить вектор фазовой скорости v0 на поверхности

σ(x, t)=0, при котором изображающая точка двигалась бы по указанной поверхности.

В работе [17] дается несколько другая постановка данной задачи. Рассматриваются уравнения (22.2) и считается, что при некоторой σ = σ0(t) функция ϕ(σ, t) имеет разрыв. Ставится задача определения выходов нелинейных блоков ϕ(σ, t) при σ(t) ≡ σ0(t).

Для таких систем в [17] рекомендуется использовать запись уравнений нелинейной части системы в виде включений ξ(t) ϕ(σ, t), где функция ϕ(σ, t) принимает конкретные значения вне точек разрыва (и тогда включение превращается в обычное равенство) ли-

3 Заметим: это означает, что вектор фазовой скорости v(x) имеет разные направления в соседних точках, разделенных поверхностью разрыва σ(x, t)= 0.

205

бо имеет значения из некоторого выпуклого множества Ξ, например промежутка [ξ, ξ+].

Тогда задача определения движения в скользящем режиме сводится к определению конкретного значения ξ0(t) Ξ при σ(t) = σ0(t). Заметим, что если вернуться к предыдущей постановке задачи, то такой подход аналогичен использованию вместо дифференциального уравнения (22.1) дифференциального включения x˙(t) f (x(t), t) .

В работе [46] рассматриваются уравнения вида (22.3), причем считается, что управляющее воздействие имеет разрыв на поверхности σ(x, t)=0, т.е.

u+(x, t), σ(x, t) > 0, u(t)= u(x, t) σ(x, t) < 0

Требуется найти такое непрерывное управление ueq(t) (называемое «эквивалентным»), которое отвечало бы движению системы по поверхности разрыва σ(x, t)=0.

Рассмотрим теперь некоторые методы определения решений систем с разрывной правой частью.

22.3Методы определения движения в скользящем режиме

Одним из наиболее известных методов определения решений разрывных систем является

метод А.Ф. Филиппова.

В этом методе используются уравнения вида (22.1). Для определения поля фазовых скоростей на поверхности разрыва в соответствии с определением Филиппова следует построить отрезок, соединяющий концы векторов v+(x) и v(x) для данной точки на поверхности разрыва и провести из точки x вектор v0(x) в точку пересечения данного отрезка

с касательной плоскостью. 4 Полученный вектор и является искомым вектором фазовой скорости на поверхности разрыва.

Как показано в [17], определению Филиппова соответствует минимально возможное множество ϕ(σ, t) из всех допустимых, поэтому для данного метода чаще, чем для других, имеется единственность решений. Однако, как отмечено там же, имеется много случаев, когда физически осмысленные решения не являются решениями в смысле Филиппова.

Согласно [17], решения разрывных систем должны удовлетворять уравнениям вида

4 В данном изложении дается геометрическая интерпретация метода Филиппова, который может быть представлен и аналитическими соотношениями. Кроме того, здесь рассматривается частный вид функции f(·) и поверхность разрыва считается гладкой [17, 46].

206

(22.2), где уравнения нелинейных блоков понимаются как включения, т.е. выполнено

x˙(t) = Ax(t)+(t),

ξ(t) ϕ(Cx(t), t).

Вектор-функция ξ(t) называется тогда доопределенной нелинейностью. Каждому решению x(t) соответствует своя доопределенная нелинейность. При det BT B = 0, ξ(t) можно получить из уравнений системы единственным образом, а именно как

ξ(t)=(BT B)1 BT (x˙ (t)−Ax(t)) .

Таким образом, согласно [17], неоднозначная нелинейная функция ϕ(·) в (22.2) принимает конкретные (и различные в разные моменты времени) значения согласно поведению линейной части системы.

Далее будем рассматривать системы, у которых dimξ(t)=dimσ(t) = m и i-я компонента вектора ϕ зависит от i-й компоненты вектора σ: ϕi =ϕi(σi).

Для того чтобы определить, как ведет себя решение в скользящем режиме, надо принять, что по условию должно выполняться равенство σ(t) = σ0(t). Таким образом, для линейной части можно записать систему алгебро-дифференциальных уравнений

x˙ (t)=Ax(t)+(t), Cx(t)=σ0(t),

где σ0(t) – заданная функция времени. Характеристический многочлен этой системы имеет вид

 

 

 

 

sIn −A

 

 

D(s)=det

B .

 

 

 

 

C

0

По лемме Шура

D(s)=det(sIn A) det

C(sIn A)1B . 5

Поскольку полученное выражение есть

 

произведение характеристического

многочлена линейной части системы на определитель

ее передаточной матрицы, то имеем следующий результат.

Характеристический многочлен системы линейных дифференциальных уравнений, описывающих полный (т.е. для всех компонент вектора σ(t)) скользящий режим системы

5Леммой Шура называются следующие тождества [17]:

при

det A = 0, det

A

B

= det A

·

det(D

CA1B),

 

C

D

 

 

 

а при det D = 0, det

A

B

= det D · det(A − BD1C)

C

D

.

207

(22.2), с точностью до знака совпадает с произведением характеристического многочлена линейной части системы на определитель ее передаточной матрицы [17].

Для систем с одной скалярной нелинейностью характеристический многочлен скользящего режима с точностью до знака совпадает с числителем передаточной функции (в случае вырожденности которой предполагается, что степень знаменателя равна порядку уравнений состояния системы, сокращений не произведено).

22.4Метод эквивалентного управления

Рассмотрим теперь изложенный в [46] метод эквивалентного управления. В данном методе используются уравнения вида (22.3). Предполагая наличие в системе скользящего режима по поверхности σ(x)=0, получаем, что в производная по времени от σ(x(t)) в силу системы (22.3) должна равняться нулю. Так как эта производная зависит от управления, то можем найти соответствующее эквивалентное управление ueq(t) из уравнения σ˙ (t) = 0.

Найденное управление подставляется в уравнения (22.3), которые решаются совместно с уравнением скользящего режима σ(x(t)) = 0. Как и выше, получаем систему алгебродифференциальных уравнений, которая в данном случае имеет вид

x˙(t)=ψ (x(t), ueq(t), t) , σ(x(t))=0.

Рассмотрим более подробно применение метода эквивалентного управления для системы вида (22.2), полагая σ0(t)0. Сравнивая (22.2) и (22.3), получим

x˙(t)=Ax(t)+Bu(t), σ(t)=Cx(t).

Вычисляя σ˙ (t) находим, что σ˙ (t) = C Ax(t) + Bu(t) , откуда по методу эквивалентного

управления ueq(t) = (CB)1CAx(t) (полагаем det CB = 0). Отсюда получаем систему алгебро-дифференциальных уравнений

x˙(t)= A−B(CB)1CA x(t), Cx(t)=0.

Нетрудно убедиться, что данная система имеет характеристический многочлен D(s) =

det(sIn−A) det −C(sIn−A)1B , совпадающий с полученным выше по методу работы [17] многочленом.

Таким образом, мы видим, что часто разные способы определения движений в скользящем режиме приводят к одинаковым результатам. Более подробные сведения имеются в работах [17, 46].

208

Столь большое внимание к определению поведения систем в скользящих режимах связано не только со стремлением к полноте математических методов теории систем или с

появлением разрывных зависимостей при описании некоторых физических процессов. Как

отмечено выше, имеется целый класс систем с искусственно введенной нелинейностью, ко-

торые работают в принудительно возбужденном скользящем режиме – системы с перемен-

ной структурой (СПС) со скользящими режимами [6, 8, 45, 46]. Сведения о построении и

использовании таких систем приведены в п. 23

209

Лекция 23

23 Системы с переменной структурой в задаче управления

Для управления в условиях неполной информации о параметрах объекта могут оказаться эффективными так называемые системы с переменной структурой (СПС) [6–8,46]. Основная идея построения СПС состоит в использовании переключающихся законов управления (соответствующим различным структурам замкнутой системы) [8,46]. Переключение происходит на основе текущей информации о состоянии объекта управления в соответствии с выбранной функцией переключения.

Возможны различные способы построения СПС. Наиболее универсальным и разработанным методом является принудительная организация в замкнутой системе скользящих режимов, при которых изображающая точка в пространстве состояний системы движется по выбранной поверхности. На эту поверхность точка попадает за конечное время после начала переходного процесса [45, 46], а затем остается на ней неограниченно долго (или в течение конечного промежутка времени). В результате, поведение замкнутой системы мало зависит (или совсем не зависит) от параметров объекта управления, а определяется выбранным при синтезе регулятора уравнением поверхности переключений. 1

Как будет показано ниже, принудительные скользящие режимы позволяют снизить чувствительность системы к параметрическим и координатным возмущениям, а также до-

биться инвариантности по отношению к задающему воздействию. Это связано с тем, что " разрывный"характер управления сближает СПС с системами, имеющими бесконечный коэффициент усиления (в то же время, само управление в СПС остается ограниченным). Создание устойчивых скользящих режимов в СПС достигается с помощью переключения закона управления (обычно – путем изменения его параметров) на основе информации о текущем состоянии объекта [6, 8, 46]. Этот режим является желательным для обеспечения инвариантности системы [46]. 2 Требуемые динамические свойства замкнутой системы обеспечиваются надлежащим выбором поверхности переключения, вид которой задается при синтезе. Полезной особенностью скользящих режимов является также возможность

декомпозиции задачи проектирования. Синтез регулятора разбивается на две более про-

1 Следует иметь в виду, что данное утверждение относится именно к установившемуся скользящему режиму. Траектория движения вне этого режима зависит от свойств объекта. Существенным является возникновение устойчивого скользящего режима за конечное время.

2Заметим, что кроме положительного свойства инвариантности, для СПС в скользящем режиме, как

идля систем с неограниченным коэффициентом усиления имеется проблема обеспечения устойчивости при неполной текущей информации о состоянии объекта, а также возможность появления нежелательных колебательных процессов.

210