Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

.pdf
Скачиваний:
108
Добавлен:
26.03.2015
Размер:
1.78 Mб
Скачать

стые подзадачи:

создание устойчивых скользящих режимов;

выбор поверхности переключения, движение по которой обладает желаемыми свой-

ствами.

Скользящие режимы могут использоваться также для идентификации параметров и состояния объекта, построения экстремальных и адаптивных систем [8, 46].

Рассмотрим задачу стабилизации линейного стационарного объекта со скалярным управлением. Динамика объекта задается уравнением

x˙(t) = Ax(t) + Bu(t), x(t) Rn, u(t) R.

(23.1)

Зададим (как это обычно делается) линейное уравнение желаемой поверхности скольжения

n

 

!i

(23.2)

σ(x(t)) = Cx(t) ≡ cixi(t),

=1

 

где C = [c1, c2, . . . , cn] – вектор-строка постоянных параметров, значения которых определяется при синтезе системы.

Скользящему режиму в системе соответствует тождество σt 0 (через σt обозначено значение σ(x(t)) при функции x(t), удовлетворяющей (23.2)).

При синтезе СПС с принудительно организованными скользящими режимами требуется обеспечить выполнение следующих условий [6, 46]:

попадание изображающей точки на поверхность разрыва (23.2);

возникновение скользящего режима на этой поверхности;

устойчивость скользящего режима.

Скользящий режим возникает, если отклонение от поверхности σt и скорость его изменения σ˙ t имеют разные знаки, т.е.

lim σ˙ > 0,

lim σ˙ < 0.

(23.3)

σ→−0

σ→+0

 

Другими словами, в окрестности поверхности скольжения должно иметь место неравенство

σ (x(t), t) σ˙ (t) < 0.

(23.4)

Выполнение этого неравенства для всех x X , t R является

достаточным (но не необ-

ходимым, [46]) условием попадания изображающей точки на поверхность разрыва.

211

Движение системы в скользящем режиме описывается системой уравнений (23.1), (23.2), которые эквивалентны уравнению порядка n − 1. Как отмечено выше, характери-

стический многочлен этого уравнения совпадает с числителем передаточной функции от u к σ :

W(s) = (sIn − A)

1

B =

B(s)

(23.5)

 

A(s)

и, следовательно, зависит от коэффициентов ci вектор-строки (1×n-матрицы) C.

Эти коэффициенты определяются методами теории линейных систем, исходя из требо-

ваний устойчивости и качества процесса стабилизации. Возможность использования СПС со скользящими режимами для решения задач адаптивного управления определяется тем,

что при соответствующем выборе переменных состояния динамика движения системы по поверхности скольжения зависит от вектора C, а не от параметров объекта (матриц A, B).

3

Управляющее воздействие должно быть выбрано так, чтобы обеспечить устойчивый скользящий режим по заданной поверхности (гиперплоскости). Здесь проявляется упомянутая декомпозиция задачи синтеза СПС – обеспечение качества процессов в системе (в скользящем режиме) и обеспечение устойчивого скользящего режима являются разными подзадачами. Возможность их независимого решения упрощает процедуру синтеза.

Рассмотрим сначала управление в виде линейной комбинации переменных состояния системы [45]

 

n

 

u(t) =

!i

(23.6)

ki(x(t))xi(t),

 

=1

 

где коэффициенты регулятора претерпевают разрыв на поверхности σ(x) = 0 и определяются выражением

ki+,

если

xiσ(x) > 0,

 

 

ki(x) = ki,

если

xiσ(x) < 0,

i = 1, 2, . . . , n.

(23.7)

σ (x) = x.

Здесь ki+, ki– постоянные коэффициенты закона управления, определяемые при синтезе. Для их выбора используем неравенство (23.4) σtσ˙ t < 0. Исходя из этого условия, получим

3 Точное утверждение, позволяющее установить количественные соотношения сформулировано на с. 206. Отметим, что если уравнения объекта имеют вид управляемого канонического представления (см. [4,8,46], п. 6), то при σ(x) = x для (23.5) выполнено B(s) = c1 + c2s + · · · + cnsn−1 и движение в скользящем режиме не зависит от параметров объекта (23.1).

212

[45] неравенства

 

 

(sign (B)) ki+ > |B|1ai,

 

(23.8)

(sign (B)) ki< |B|1ai,

i = 1, 2, . . . , n ,

 

где ai – столбцы матрицы A = a1, a2, . . . , an

. Эти же условия достаточны и для попа-

дания на плоскость x = 0 из любого исходного состояния. Следовательно, в такой системе

за конечное время возникает устойчивый (не прекращающийся) скользящий режим, дви-

жение в котором за счет надлежащего выбора вектора может быть наделено желаемыми

свойствами.

Количество используемых переменных и коэффициентов в законе управления можно

уменьшить. Например, можно использовать алгоритм [45]

n−1

 

!i

(23.9)

u (x) = − ki(x)xi − δ0sign(σ(x)),

=1

 

где δ0 = const > 0 – выбираемый при синтезе параметр алгоритма так, чтобы выполнялось

условие sign(δ0) = sign(B). Достаточные условия возникновения и устойчивости скользящего режима при этом несколько усложняются и принимают вид

(sign (B)) ki+

≥ |B|1ai

− ci (an) ,

 

(23.10)

(sign (B)) k

≤ |

B

1ai

c

(an) ,

i = 1, 2, . . . , n ,

an < 0.

i

|

 

i

 

 

Рассмотрим теперь некоторое линейное непрерывное управление

ul (t) = γT x(t),

(23.11)

где γ – выбранный вектор коэффициентов (которые могут иметь и нулевые значения).

Пусть n − 1 корень характеристического многочлена замкнутой системы (23.1), (23.11) со-

ответствует желаемому расположению корней в скользящем режиме, а оставшийся корень

принимает произвольное (вещественное) значение.

Рассмотрим также разрывное управление в СПС-регуляторе

u+(x),

если

σ(x) > 0,

 

u(x) = u(x),

если

σ(x) < 0,

(23.12)

где u+(x), u(x) – непрерывные функции состояния.

213

Можно показать [46], что условия, при которых в системе (23.1), (23.12) на всей плос-

кости x = 0 существуют устойчивые скользящие режимы, следуют из неравенств (23.3) и имеют вид

Bu+(x) > Bul(x),

Bu(x) > Bul(x)

(23.13)

Поскольку ul является линейной комбинацией некоторых координат вектора состояния, то

видно, что неравенства (23.13) можно выполнить, если брать u кусочно-линейным относительно тех же координат:

 

u(t) = Ψ(x(t))x(t) − δ(x(t)),

(23.14)

где Ψ = [ψ1, . . . , ψk, 0, . . . , 0],

 

 

 

 

 

ψi(x) =

αi,

если

(B)xiσ(x) > 0,

 

 

βi,

если

(B)xiσ(x) < 0,

i = 1, 2, . . . k,

 

δ(x) = δ0sign((x)),

где δ0 > 0, αi ≥ −γi. Поэтому управление можно выбирать и в более простом виде

u(t) = −ψl(x(t))ul(x(t)) − δ(x(t)),

(23.15)

где

ψl(x) =

αl,

если

(B)ulσ(x) > 0,

 

βl,

если

(B)ulσ(x) < 0,

 

δ(x) = δ0sign((x)), αl ≥ −1, βl ≤ −1.

Во всех приведенных выше уравнениях СПС-регуляторов предполагается наличие информации о полном векторе состояния объекта x(t) (в первую очередь – при формировании сигнала σ(x)). Это обстоятельство существенно затрудняет применение СПС на практике, так как обычно приходится работать в условиях неполной текущей информации.

Одним из путей устранения этой трудности является применение наблюдающих устройств (см. гл. 16 а также [4, 6, 8, 22, 46]). Но при синтезе "обычных"наблюдающих устройств требуется достаточно точное знание динамических свойств объекта управления.

При использовании наблюдающих устройств со скользящими режимами, описанными в [7, 8, 46] уменьшается чувствительность наблюдателей к параметрическим возмущениям,

что позволяет получить оценки состояния при изменении параметров объекта в широких пределах.

214

Более сложная (но потенциально имеющая более широкие возможности) процедура, предполагающая совмещение процессов оценки состояния и параметров объекта, реализу-

ется в адаптивных наблюдающих устройствах [2, 8, 48].

Задача построения систем со скользящими режимами, в которых используются изме-

рения только выходной координаты объекта рассматривается в [7, 8].

Рассматривается объект управления

 

x˙ (t) = Ax(t) + Bu(t), y(t) = Lx(t),

(23.16)

где x(t) Rn, u(t) R, y(t) Rl. Требуется обеспечить возникновение (за конечное время) устойчивого скользящего режима по поверхности y = 0, где c – заданный l-мерный вектор. Для достижения поставленной цели используем релейный закон управления

u = −γsignσ(y), σ(y) = y,

 

(23.17)

с некоторым γ > 0.

 

 

Будем говорить, что передаточная функция W(s) =

B(s)

соответствует строго

A(s)

 

 

минимально-фазовой системе, если B(s) – гурвицев (устойчивый) многочлен степени n − 1

с положительными коэффициентами [1, 8, 48], где n = degA(s). Определение на случай

векторного управления (MIMO-объект) дано в [1,30,48]. На основе применения частотной

теоремы с обратной связью показано, что если передаточная функция Wuσ(s) от управления u к переменной σ

Wuσ(s) = L (sIn − A)1 B

(23.18)

строго минимально-фазовая, то при достаточно большом γ за конечное время возникает скользящий режим и обеспечивается цель управления limt→∞ x(t) = 0. 4 Для уменьшения зависимости устойчивости системы от начальных условий и параметров объекта в [7] предлагается алгоритм с адаптивной настройкой вектора коэффициентов усиления K Rl :

u(t) = −KT (t)y(t) − γsign (σ(y(t))) , σ(y(t)) = y(t),

(23.19)

˙

 

K(t) = −σ(y(t))Γy(t),

 

где Γ = ΓT > 0, γ > 0 – параметры алгоритма.

4 Доказательство, основанное на использовании функции Ляпунова V (x) = (y(x))| дано в [48].

215

24Системы с переменной структурой в задаче оценивания состояния

Известным методом получения более полной текущей информации о поведении объекта управления является использование рассмотренных в гл. 16 с. 114 наблюдателей. При синтезе алгоритма оценивания имеет смысл не ограничиваться описанными в гл. 16 линейными структурами, а использовать и возможности нелинейных методов управления, в том числе

– организации скользящих режимов в системах с переменной структурой [8, 46]. Поскольку такие системы обладают, в некотором смысле, адаптивными свойствами, близкими к свойствам систем с сигнальной адаптацией (по этому поводу см., например, [7, 8]), аналогичных свойств можно ожидать и от систем оценивания состояния. Использование скользящих режимов в наблюдателях предназначено, в первую очередь, для уменьшения ошибок, связанных с неточностью математической модели объекта. Рассмотрим этот подход более подробно.

Запишем уравнения линейного стационарного объекта в виде

x˙(t)=Ax(t)+Bu(t), y(t)=Cx(t), x(t) Rn, y(t) Rl.

(24.20)

Объект (24.20) считаем полностью наблюдаемым. Не нарушая общности рассуждений, можно принять, что rank C = l.

Следуя [46], рассмотрим возможность осуществления декомпозиции движения наблюдателя за счет преднамеренного введения скользящего режима. Представим выход объекта в виде y(t) = C1x1(t)+ C2x2(t), причем

x(t) = col{x1(t), x2(t)}, x2(t) Rl, det C2 = 0. Заметим, что выполнение указанного представления всегда возможно, так как, по условию, rank C = l. Перейдем к новым переменным состояния. В качестве нового вектора состояния используем вектор x˜(t) = col{x1(t), y(t)}

(ср. с описанными в п. 16.2.2 с. 119 наблюдателями Луенбергера). Очевидно, переход к вектору x˜ выполняется невырожденным преобразованием с матрицей

 

 

 

 

T = In−l

0

}n − l .

 

C1

C2

}l

 

 

 

˙

˜

Уравнения состояния системы в результате преобразования принимают вид x˜(t) = Ax˜(t) +

Bu˜ (t), где A˜ = T AT 1, B˜ = T B. Более подробно их можно записать как

 

x˙1(t) = A11x1(t) + A12y(t) + B1u(t),

 

y˙(t) = A21x1(t) + A22y(t) + B2u(t).

(24.21)

216

З A˜ =

A11

A12

 

}n − l

, B˜ =

B1

 

}n − l .

 

A21

A22

}l

 

B2

}l

Как показано в работе [46], из наблюдаемости пары (A, C) следует и наблюдаемость пары

(A11, A21), т.е. наблюдаемость системы x˙1 = A11x1 с выходом z = A21x1.

Запишем теперь уравнения наблюдателя со скользящим режимом. Они имеют вид [46]

˙

.

.

 

.

(24.22)

x1

(t) = A11x1

(t) + A12y(t) + B1u(t) − Lv(t),

.

.

.

 

y˙ (t) = A21x1(t) + A22y(t) + B2u(t) + v(t),

 

где v(t) = Msign σt, σt = y(t)− y.(t), постоянная M > 0 – величина "полки реле функция sign(·) от векторного аргумента понимается покомпонентно.

Вычитая из (24.21) уравнения (24.22), получим уравнения относительно ошибок оценивания:

ε˙(t) = A11ε(t) + A12σt + Lv(t), ε = x1(t) x.1(t). (24.23) σ˙ (t) = A21ε(t) + A22σt − v(t).

Разрывная вектор-функция v(t) выбирается таким образом, чтобы на многообразии

σ = 0 возникло движение в скользящем режиме. Этим обеспечивается равенство y(t) ≡ yˆ(t).

Как показано в [46], при ограниченном начальном рассогласовании всегда найдется такое (достаточно большое) M, при котором скользящий режим возникает.

Матрица L определяется исходя из требования устойчивости движения в скользящем режиме и желаемой динамики системы относительно рассогласования ε. По методу эквивалентного управления (см. с. 208) для получения уравнения скольжения следует решить уравнение σ˙ t = 0 относительно v(t) и найденное решение v = veq подставить в первое уравнение системы (24.23), полагая σt 0. Выполняя эти преобразования, получаем veq = A21x.1, поэтому

ε˙(t) = A11ε(t) + LA21(t)

(24.24)

В силу наблюдаемости пары (A11, A21) всегда можно подобрать матрицу L так, чтобы обеспечить любое заданное расположение собственных чисел системы (24.24), и, следовательно

– желаемую динамику движения в скользящем режиме (по этому поводу см. п. 15.3 , с. 111, и п. 16.5 с. 118).

Можно заметить общие и отличительные свойства наблюдателя (24.22) и рассмотренного в п. 16.2.2 на с. 120 наблюдателя Луенбергера (16.10). При синтезе обоих наблюдателей

217

выполняются однотипные преобразования базиса переменных состояния, сходным образом находится матрица коэффициентов обратной связи, а также и в том, и в другом случае обеспечивается равенство нулю рассогласования σ между выходом объекта и его оценкой. Разница состоит в том, что наблюдатель Луенбергера является системой пониженного порядка, в которой последнее условие выполняется тождественно в силу самой процедуры синтеза. Порядок наблюдателя (24.22) равен порядку объекта управления и условие σt 0

обеспечивается организацией скользящих режимов и наступает по истечении некоторого промежутка времени. 5

5 Выше, на с. 212, уже отмечено, что в скользящем режиме система описывается уравнениями пониженного порядка.

218

Лекция 25

25 Методы адаптивного управления

25.1Задача адаптивного управления

Вконце XX столетия развитие теории систем автоматического управления и ее практических приложений характеризовалось интенсивной разработкой методов адаптивного управления. Эти методы служат для построения систем управления при значительной неопределенности параметров объекта управления и условий его функционирования (характеристик среды), имеющейся на стадии проектирования или до начала эксплуатации системы. Рассматриваются такие задачи управления, при которых динамические свойства объекта могут изменяться в широких пределах неизвестным заранее образом. Имеющейся начальной (априорной) информации недостаточно для построения систем управления с оптимальными (или заданными) показателями качества. В адаптивных системах управления недостаток априорной информации восполняется в процессе ее функционирования на основе текущих данных о поведении объекта. Эти данные обрабатываются в реаль-

ном масштабе времени (в темпе протекания управляемого процесса) и используются для повышения качества системы управления.

Применение принципов адаптации позволяет:

обеспечить работоспособность системы в условиях значительного изменения динамических свойств объекта;

произвести оптимизацию режимов работы объекта при изменении его параметров;

снизить технологические требования к изготовлению отдельных узлов и элементов системы;

унифицировать отдельные регуляторы или блоки регуляторов, приспособив их для работы с различными видами однотипных объектов;

сократить сроки конструкторских испытаний;

повысить надежность системы.

Внастоящее время этот раздел теории управления достиг высокой степени зрелости. Ниже рассматриваются основные положения теории адаптивных систем. Более подробно об этой теории можно прочесть [8, 30, 47, 48].

219

25.2Структура адаптивных систем управления

Процесс адаптивного управления можно рассматривать как процесс взаимодействия трех подсистем [8, 38, 47, 48]:

объекта;

настраиваемого регулятора основного контура (собственно регулятора);

блока адаптации («адаптора»).

Два последних блока объединяются в адаптивный регулятор, который имеет двухуровневую иерархическую структуру. Регулятор основного контура непосредственно формирует управляющее воздействие u(t), поступающее на объект управления. Закон (алгоритм) управления в основном контуре зависит от некоторого набора настраиваемых параметров

регулятора θ. Настройка этих параметров производится на втором уровне в соответствии с некоторым законом, называемым алгоритмом адаптации на основе доступной текущей

информации и без непосредственного использования значений параметров, априорно не известных.

Располагаемая априорная информация о значениях параметров характеризуется заданием некоторого множества Ξ их возможных значений [8, 47]. Конкретный набор параметров объекта (и характеристик среды) образует вектор неизвестных параметров ξ Ξ.

Считается заданной некоторая цель управления. Адаптивный регулятор должен привести к выполнению поставленной цели управления для любого ξ Ξ. Если то условие выполнено, то система называется адаптивной в классе Ξ [47] (или просто адаптивной). 1

Цель управления обычно задается с помощью некоторого фукнционала качества, значения которого вычисляются по измеряемым выходам объекта. В зависимости от конкретной задачи цель управления считается достигнутой, если указанный функционал либо принимает экстремальное значение, либо его величина находится в заданных пределах.

Кроме цели управления используется и цель адаптации. Она также формализуется с помощью некоторого функционала и может либо совпадать с целью управления, либо отличаться от нее, являясь некоторой вспомогательной целью, служащей для решения основной задачи управления. Такой целью может быть, например, идентификация объекта

ˆ

– получение оценок ξ неизвестных параметров ξ.

При аналоговой реализации адаптивного регулятора процессы в системе описываются в

1 Ниже для конкретных типов систем это общее определение будет уточнено и в некоторых случаях модифицировано. Например, имеются системы с сигнальной адаптацией [8], у которых задача адаптивного

управления решается с помощью дополнительного сигнала управления, а не путем настройки параметров регулятора. Кроме того, для систем других типов возможно использование других обозначений.

220