Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

.pdf
Скачиваний:
108
Добавлен:
26.03.2015
Размер:
1.78 Mб
Скачать

Обратным преобразованием с матрицей T 1 получаем оценку xˆ(t) вектора состояния системы (16.7).

Качество полученной оценки состояния в значительной степени определяется матрицей

A11 − EA21. Можно показать [8], что если исходная система (16.8) полностью наблюдаема, то этим же свойством обладает и пара (A11, A21). Следовательно, могут быть обеспечены произвольно заданные значения коэффициентов характеристического многочлена наблюдателя путем подходящего выбора матрицы E.

В [4,8] синтез наблюдателей Луенбергера рассмотрен более детально. Алгоритм состоит из следующих шагов.

1.Уравнения состояния системы (матрицы A, B, C) невырожденным преобразованием приводим к виду ИКП (см. с. 44).

2.Задаемся желаемыми коэффициентами βi характеристического многочлена наблюдателя (det In−1 − A) = sn−1 + β1sn−2 + · · · + βn−1.

3.Строим матрицу преобразования P вида

 

 

In−1

−βn−2

 

 

 

 

In−1

βn−2

 

 

 

βn−1

 

 

 

 

 

 

βn−1

 

P =

 

1

,

P 1

=

 

1

 

 

. .β.

 

 

 

.β. .

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

0 . . . 0

 

 

 

 

0 . . . 0

1

 

Нетрудно заметить, что если матрица A приведена к виду ИКП, то в результате пре-

образования получим

˜

A = P AP

 

 

 

0 0 . . . 0 −βn−1

(α1 −β1)βn−1 − αn

 

 

 

1 0 . . . 0 −βn−2 (α1 −β1)βn−2 −αn−1 +βn−1

1

 

 

 

1

 

 

1

 

1 1 2 2

 

 

 

. . . . . . . . . . . . . .

 

 

 

 

β ).β. .

 

 

 

=

.0 0 . . . 1

β

 

(α

 

 

α +β

 

 

 

 

 

 

 

 

 

1

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

0 0 . . . 0

 

 

 

α +β

 

 

 

 

 

 

b1 βn−1bn

 

 

 

 

 

 

 

 

b2 − βn−2bn

 

 

 

 

и также B˜ = P B =

n−1 1

n

 

 

 

 

 

b

 

 

 

 

 

 

 

b

. . .β b .

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

˜

¯

порядка n − 1, расположенную в верхнем

4. Из матрицы A

выделим подматрицу A

˜

 

˜

левом углу матрицы A, а также первые n-1 строк матрицы B, из которых образуем матрицу

121

¯

 

˜

через

(вектор-столбец) B. Обозначим n − 1

верхние строки последнего столбца матрицы A

a¯n.

 

 

 

Запишем уравнения наблюдателя Луенбергера:

 

 

¯

¯

(16.11)

˙

 

x¯(t) = Ax¯(t) + a¯ny(t) + Bu(t).

Для вычисления оценки вектора состояния в исходном базисе (считаем, что исходная система уже имеет вид ИКП), сформируем вектор x˜(t) = col{x¯(t), y(t)}. Оценка состояния в базисе ИКП тогда получается по формуле xˆ(t) = P 1x˜(t).

16.3Оценивание возмущений

Как видно из (16.4), неизмеряемые внешние воздействия (возмущения и помехи) приводят к появлению дополнительных составляющих ошибки оценивания переменных состояния и снижают точность системы управления. Уменьшить влияние возмущений можно, если выполнять, наряду с оцениванием состояния объекта, также идентификацию неизмеряемых внешних воздействий.

Основная идея использования наблюдателей для оценивания возмущений и помех измерения состоит в следующем.

Для внешних воздействий, как и для объекта управления, строится некоторая математическая модель («модель внешней среды», или «internal model of disturbances»). Согласно этой модели, возмущения представлются как решения системы однородных дифференциальных (или разностных) уравнений с известными коэффициентами и неизвестными начальными условиями. В этих начальных условиях и содержится вся неопределенность относительно внешних воздействий. 6 Таким образом, возмущения и помехи представляются, как выходы некоторой автономной динамической системы с заданными уравнениями и неизвестным начальным состоянием. Затем модель внешних воздействий объединяется с моделью объекта управления и для полученной расширенной системы строится наблюдатель. Полученные с помощью него оценки содержат как собственно оценки состояния объекта, так и оценки внешних воздействий 7.

Подход к синтезу систем управления на основе постулирования динамических моделей для отдельных подсистем и сигналов в настоящее время нашел широкое применение и

называется «принципом внутренних моделей» («internal model principle»). Для построения

6Случай неизвестных параметров модели среды рассматривается в рамках теории адаптивного оценивания [8, 33, 38, 47, 48].

7Естественно, требуется полная наблюдаемость расширенной системы.

122

As, Cs – известные матрицы, Cs =

эффективных алгоритмов проектирования, оценивания, управления системами модели в виде уравнений состояния могут задаваться не только для возмущающих воздействий, но и для помех измерений, командных сигналов («эталонные модели»), динамики изменения параметров объекта и т.д. 8

Достаточно просто процедура синтеза выглядит, если внешние процессы можно пред-

 

N

 

ставить как квазимногочлены – выражения вида

!i

C – известные по-

eλitPi(t), где λi

 

=1

 

стоянные, Pi(t) - многочлены с заданными коэффициентами. Сюда относятся степенные´ функции, гармоники с заданной частотой, экспоненты с заданным показателем затухания, произведения гармоник на экспоненты и линейные комбинации этих функций. Моделями источников таких процессов являются линейные дифференциальные уравнения с постоянными коэффициентами. Рассмотрим процедуру оценивания для этого случая более подробно.

Пусть внешние воздействия f(t), v(t) можно представить в виде выходных процессов линейной системы, заданной уравнениями

x˙s(t)=As(t)xs(t), ys(t)=Csxs(t), xs(t0)=xs0 , t ≥ t0.

(16.12)

Здесь xs(t) Rns – вектор состояния «среды», ys(t) Rn+l - выход модели источника возмущений – вектор внешних по отношению к объекту воздействий; ys(t) = col{f(t), v(t)},

Cf ; Cf , Cv – подматрицы размеров n×ns, l×ns, опре-

Cv

деляющие связь между состоянием xs(t) модели внешних воздействий и возмущениями f(t), помехами v(t) в (16.1). Начальное состояние xs0 системы (16.12), как и (16.1), считается неизвестным. Введем расширенный («совокупный») вектор состояния объекта и среды x¯(t) = (x(t), xs(t)) Rn+ns . Объединяя уравнения (16.1), (16.12), получим уравнения расширенной системы в виде

¯

¯

¯

(16.13)

˙

 

y(t)=Cx¯(t), x¯(t0)=x¯0, t ≥ t0,

x¯(t)=Ax¯(t)+Bu(t),

¯

¯

в которых матрицы A,

B,

¯

A=

¯

 

 

 

C имеют следующую блочную структуру:

A Cf

, B¯

B

, C¯ =[C, Cv].

0ns ×n As

= 0ns ×m

8 Иллюстраций применения этого принципа может служить и алгоритм перехода к дискретной модели, описанный в 13.3

123

Расширенная система (16.13) рассматривается как некоторый новый объект порядка n¯ = n+ns, для которого строится наблюдатель (16.3).

124

Лекция 17

17 Синтез модальных и терминальных регуляторов

17.1Задача модального управления

Характер переходных процессов в системе определяется расположением корней si ее характеристического многочлена. 1 Действительно, решение y(t) однородного дифференциаль-

ного уравнения n-го порядка имеет вид y(t)=

n

i=1 Ciyi(t), где постоянные Ci определяются

начальными условиями, а составляющие

yi(t) («моды») имеют вид yi(t) = esit - при простых

 

 

si или yi(t) = Pi(t)esit – при кратных корнях (здесь Pi(t) – многочлены, степени которых определяются кратностью корня). Поэтому обеспечение «хороших» переходных процессов в системе может быть достигнуто если характеристический многочлен имеет заданные корни. Это непосредственно приводит к условию получения заданных коэффициентов характеристического многочлена замкнутой системы. Регуляторы, построенные исходя из указанного требования, называются модальными регуляторами.

17.2Модальное управление по состоянию объекта

Рассмотрим вначале решение этой задачи при полном измерении вектора состояния объекта. Для простоты изложения будем также предполагать, что управление скалярное, u(t) R.

Пусть динамика объекта управления описывается уравнением

 

x˙ (t)=Ax(t)+Bu(t).

(17.1)

Вектор состояния x(t) объекта (17.1) считаем доступным измерению. Рассмотрим закон управления вида

u(t)=−Kx(t),

(17.2)

где K – подлежащая определению n×l-матрица коэффициентов регулятора (в нашем случае m = 1). Замкнутая система объект-регулятор описывается уравнением

x˙(t)=(A−BK)x(t).

(17.3)

Ставится задача определения коэффициентов регулятора (элементов матрицы K) таких, что характеристический многочлен det(sIn − A+BK) = D(s) = sn +d1sn−1 +. . .+dn−1 +dn

1 Здесь рассматриваются стационарные системы.

125

имел заданные коэффициенты di. Принципиальная возможность решения этой задачи для полностью управляемых объектов следует из указанного в 15.2 свойства 4. 2

Рассмотрим процедуру синтеза более подробно.

Предположим вначале, что уравнения (17.1) соответствуют управляемому канониче-

скому представлению, т.е. матрицы A, B имеют вид

 

 

 

0

 

 

 

0

0

1

. . .

0

 

 

 

 

 

 

0

1

0

. . .

0

 

 

 

 

0

 

 

 

 

0

0

0

. . .

1

 

 

0

 

 

 

 

.

 

 

 

 

 

 

 

 

.

 

 

 

A=

..

− −

 

 

, B =

 

..

 

,

(17.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

an

an 1

an 2 . . .

a1

 

 

1

 

 

det(sIn − A) = sn + a1sn−1 + · · · + an.

При

использовании

регулятора

(17.2) с матрицей

K = [k1, k2, . . . , kn], как легко убедиться непосредственной подстановкой, матрица A − BK

замкнутой системы (17.3) также имеет вид матрицы Фробениуса и ее характеристический многочлен det(sIn − A+BK) = = sn +(a1 +kn)sn−1 +. . .+(an−1 +k2)s+an +k1. Приравнивая коэффициенты зтого многочлена заданным значениям di, сразу получаем выражения для параметров регулятора:

 

k1

=

dn −an,

 

 

 

· · ·

 

 

an−1,

k2

= dn−1

 

 

 

 

 

(17.5)

 

 

 

=

d a ,

k

 

 

 

 

 

2 2

 

 

 

n−1

 

 

 

 

 

 

 

 

 

=

d1 −a1.

kn

Пусть теперь уравнения состояния системы записаны в произвольном, а не в каноническом базисе. По-прежнему предполагаем полную управляемость объекта (17.1). В этом случае, согласно свойству 8 управляемых систем (см. п. 15.2), имеется матрица T преобразования подобия, приводящая уравнения состояния к указанному каноническому ви-

3

 

˜

1

˜

ду.

Следовательно, полагаем, что матрицы A = T AT

 

, B = T B имеют вид (17.4), причем

 

˜

˜ ˜

 

 

det(sIn−A) det(sIn−A). Найдем для системы (A, B) коэффициенты модального регуля-

˜

 

тора K по формуле (17.5). После этого выполним переход к исходному базису. Для этого

˜

˜

заметим, что поскольку x˜(t)=T x(t), то u(t)=−Kx˜(t)=−KT x(t)=−Kx(t), если

˜

(17.6)

K =KT.

2Оттуда же следует, что если объект не обладает полной управляемостью, получить любые заданные коэффициенты многочлена D(s) в принципе невозможно.

3Формула для вычисления матрицы T через матрицы управляемости приведена там же.

126

Таким образом, для полностью управляемой системы со скалярным управлением получен

алгоритм решения задачи модального управления. Этот алгоритм включает:

вычисление коэффициентов характеристического многочлена системы;

вычисление матрицы преобразования к канонической форме (если исходные уравнения имеют неканонический вид);

вычисление коэффициентов регулятора по формулам (17.5), (17.6).

Вместе с тем здесь содержится доказательство того, что для полностью управляемых систем (со скалярным управлением) свойство 4 выводится из свойства 11. Отметим также, что в силу дуальности задач управления и оценивания изложенный здесь метод применим и в рассмотренной в п. 16.2 задаче синтеза наблюдателя состояния. Более подробные сведения по этому вопросу приведены в [4].

Определение значений желаемых полюсов замкнутой системы является самостоятельной задачей, решение которой связано с предъявляемыми к системе требованиями.

Изложенные в настоящем параграфе результаты непосредственно переносятся на решение задачи модального управления для дискретных систем. Для стационарных дискретных систем имеется возможность получить конечное время переходного процесса. Это обеспечивается выбором характеристического многочлена замкнутой дискретной системы с ну-

левыми коэффициентами, что дает время переходного процесса, не превышающее n шагов дискретности.

17.3Модальное управление по выходу объекта. Теорема разделения

Рассмотрим теперь более характерную для практики задачу, когда измерению доступен не вектор состояния x(t), а выход объекта y(t). Объект будем считать невырожденным (полностью управляемым и наблюдаемым). В этом случае представляется естественным использовать в законе управления не сами переменные состояния объекта x(t), а их оценки

xˆ(t), полученные с помощью наблюдателя (рис. 17.1). Уравнения замкнутой системы тогда принимают вид

x˙(t)

=

Ax(t)+Bu(t), y(t)=Cx(t),

x(t0)=x0,

(17.7)

u(t) = −Kxˆ(t),

 

(17.8)

˙

=

(A−LCx(t)+Bu(t)+Ly(t),

xˆ(t0)=xˆ0.

(17.9)

xˆ(t)

Уравнения (17.8), (17.9) описывают регулятор, входом которого является процесс y(t), выходом – управляющее воздействие u(t).

127

Рисунок 17.1 – Система стабилизации с динамическим компенсатором.

В отличие от регулятора (17.2) данный регулятор является динамической системой, порядок которой совпадает с порядком уравнений объекта управления (17.7). Регуляторы такого вида называются иногда динамическими компенсаторами [33]. 4

Возникает вопрос: каковы динамические свойства системы (17.7)–(17.9), как влияет на свойства системы замена в модальном регуляторе значений состояния на его оценки? Для ответа на него найдем характеристический многочлен замкнутой системы.

Упростить вычисление данного многочлена можно преобразованием уравнений состояния. Для этого снова используем ошибку оценивания ε(t)=x(t)−xˆ(t). Тогда можем записать xˆ(t)=x(t)−ε(t), и уравнения (17.7) – (17.9) преобразуются к виду

x˙ (t)

= Ax(t)+Bu(t),

x(t0)=x0,

(17.10)

u(t)

=

−Kx(t)+(t),

 

(17.11)

ε˙(t)

=

(A−LC)ε(t),

ε(t0)=x0 −xˆ0.

(17.12)

Переход от уравнений (17.7)–(17.9) к (17.10)–(17.12) соответствует преобразованию вектора

состояния системы (17.7)–(17.9) x˜(t) = col x(t),

xˆ(t) к вектору x¯(t) = col x(t), x(t)

xˆ(t) = col x(t), ε(t) , которое, конечно, является

невырожденным.

Относительно

вектора

x¯(t) получим

однородную

систему x¯(˙ t) = Ax¯¯(t), где матрица A¯ имеет следующую блочную

4 Использование наблюдателей Луенбергера позволяет уменьшить порядок уравнений компенсатора на величину p= rank C.

128

структуру:

A¯= A−0BK

BK

.

A−LC

¯

Поскольку матрица A имеет блочную треугольную форму, ее характеристический многочлен равен произведению характеристических многочленов диагональных блоков

I ¯ I − · I

det(s n A)=det(s n A+BK) det(s n A+LC).

Ввиду того что система (17.10)–(17.12) получена невырожденным преобразованием уравнений (17.7)–(17.9), исходная замкнутая система (17.7)–(17.9) имеет такой же характеристический многочлен. Следовательно, справедлива следующая теорема.

Теорема разделения [4,22]. Характеристический многочлен замкнутой системы с регулятором, использующим оценки состояния объекта, и набюдателем равен произведению характеристического многочлена системы с "идеальным"модальным регулятором (17.2) и характеристического многочлена (16.5) наблюдателя (17.9).

Корни характеристического многочлена системы (17.7)–(17.9) получаются объединением корней системы с модальным регулятором и собственных чисел наблюдателя состояния. Таким образом, задачи синтеза модального регулятора (определения матрицы K) и наблюдателя (вычисления матрицы L) могут решаться независимо.

Заметим, что аналогичная теорема справедлива и при использовании наблюдателей пониженного порядка, описанных в п. 16.2.2 [4].

Уравнения (17.10)–(17.12) позволяют также сделать вывод, что при отсутствии внешних воздействий процессы в системе (17.7) – (17.9) будут асимптотически приближаться к процессам в системе с модальным регулятором по состоянию (17.2), как если бы система (17.3) была подвержена действию затухающих возмущений. Роль этих возмущений играет составляющая (t) в уравнении (17.11). Скорость затухания ошибки ε(t) определяется при синтезе наблюдателя. Практически рекомендуется выбирать время переходного про-

цесса наблюдателя t в несколько раз меньшим требуемого времени переходного процесса в системе с модальным регулятором.

Нетрудно убедиться, что для SISO-систем (l =m=1) уравнения (17.8), (17.9) приводятся к передаточной функции динамического регулятора в цепи обратной связи. 5 Поэтому

5 Это положение иллюстрируется рассмотренным в 17.5.1 примером.

129

изложенный метод синтеза можно рассматривать как подход к определению параметров корректирующего звена, обеспечивающего заданное расположение корней характеристического многочлена замкнутой системы. Решение этой задачи на основе операций с многочленами приведено, например, в [33]. Следует также отметить, что и в том, и в другом случае требуется невырожденность объекта управления. Если в передаточной функции разомкнутой системы имеются совпадающие нули и полюса, то их значения неизбежно будут содержаться среди корней характеристического многочлена замкнутой системы D(s). Действительно, D(s) = A(s)+B(s), где A(s), B(s) – знаменатель и числитель передаточной функции разомкнутой системы. Пусть A(s) = A (s)R(s), B(s) = B (s)R(s), т.е. имеются общие нули и полюса. Тогда D(s) = R(s) A (s) + B (s) и среди корней многочлена D(s) при любых A (s), B (s) содержатся корни R(s). Устойчивость замкнутой системы может быть обеспечена только в том случае, когда они имеют отрицательные вещественные части, что соответствует стабилизируемости и обнаруживаемости объекта управления.

17.4Терминальное управление

Как отмечено при определении понятия управляемости (с. 105), полностью управляемую стационарную систему можно (теоретически) перевести из любого начального состояния в любое другое за произвольно заданный конечный промежуток времени. Рассмотренное выше модальное управление обеспечивает лишь асимптотическую стабилизацию системы, т.е.

– приведение из любого исходного состояния в нулевое при t → ∞. Во многих приложениях требуется именно решение задачи попадания в заданное состояние к назначенному моменту времени. Такие задачи называются задачами терминального, или финитного, управления [4,13]. Они возникают, например, при выведении ракет-носителей, сближении и посадке космических аппаратов [12, 13], выполнении типовых маневров самолетов [14], при управлении манипуляционными роботами и транспортными средствами. 6 Решение этой задачи для стационарных систем фактически дано при доказательстве положительной определенности грамиана управляемости в п. 15.2 (п. 10, с. 109). Там показано, что для приведения стационарного, полностью управляемого объекта x˙(t) = Ax(t) + Bu(t) из начального состояния x0 в заданное состояние x1 за указанный временной интервал θ = t1 − t0 > 0 можно

6 Стоит заметить, что под термином "терминальное управление"обычно подразумевается управление, минимизирующее функционал, который зависит от значения управляемого процесса в конце рассматриваемого интервала. В отличие от термина «финитное управление» здесь не обязательно подразумевается требование приведения состояния системы в конкретную точку [2, 4, 14, 38].

130