Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

.pdf
Скачиваний:
108
Добавлен:
26.03.2015
Размер:
1.78 Mб
Скачать

˜ 1 ˜ 1

Матрица T определяется формулой T = QQ , где Q, Q – матрицы управляемости

˜ ˜

систем (A, B) и (A, B) соответственно. В частности, любую полностью управляемую ста-

ционарную SIMO-систему (m = 1) можно преобразовать к каноническому управляемому

представлению (см. п. 8.2), в котором матрица

˜

– сопровождающая для своего характе-

A

ристического многочлена (матрица Фробениуса)

 

 

 

 

 

 

 

0

1

 

0 . . .

0

 

 

 

0

0

 

1 . . .

0

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

A˜=

..

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

0

0

 

0 . . .

1

 

 

 

an

an 1

 

an 2 . . .

a1

 

 

 

 

 

˜

 

n

+a1s

n−1

+

 

 

 

det(sIn −A)=s

 

 

 

· · ·+an,

ט 6

аn 1-матрица B =[0, 0, . . . , 0, 1]T .

12.Всегда найдется такая (1×n)-матрица C, что передаточная функция

W(s)=C(sI−A)1B =

B(s)

 

 

(15.5)

det(sI

A)

 

 

 

 

 

– несократимая дробь (т.е. не имеет общих нулей и полюсов и степень знаменателя W(s)

равна n).

13. Для любого заданного многочлена B(s) степени n − 1 всегда найдется такая

(1×n)-матрица C, что передаточная функция имеет вид (15.5).

Свойство 12 дает удобное достаточное условие полной управляемости систем со скаляр-

ным входом: если W(s) несократима, то система полностью управляема. Обратное может оказаться неверным.

15.3Критерии наблюдаемости. Теорема дуальности

Для исследования наблюдаемости систем также имеется несколько эквивалентных критериев. В частности, по аналогии со свойством п.6 управляемости равенство CeAtx0 = 0 при всех t, t1, t2, t1 < t < t2 возможно только при x0 =0. Следовательно, наблюдая за выходом

y(t) = Cx(t) такой системы при нулевом входе, всегда можно определить, находится ли система в состоянии равновесия.

6

Полная управляемость пары

˜ ˜

 

(A, B) указанного вида всегда выполнена. В этом можно убедиться

непосредственным использованием критерия п.1.

111

Другим критерием полной наблюдаемости является равенство rankQ = n, где n

размерность пространства состояний системы, Q матрица наблюдаемости, Q = [CT , AT CT , . . . , (AT )n−1CT ] размера n×nl. В частности, для MISO-систем (l =1) матрица наблю-

даемости должна быть невырожденной.

Анализируя указанные выше свойства, убеждаемся в справедливости теоремы дуальности Калмана, согласно которой из полной управляемости пары (A, B) следует полная наблюдаемсть пары (AT , BT ), и, наоборот, из полной наблюдаемости пары (A, C) следу-

ет полная управляемость пары (AT , CT ). Поэтому нет необходимости рассматривать все критерии полной наблюдаемости, достаточно в формулировках критериев управляемости

произвести замену A на AT и B на CT .

Отсюда, в частности, получаем, что полностью наблюдаемую систему нельзя привести

невырожденным преобразованием к виду

 

 

 

˜

A

0

n1 ×n2

 

˜

.

, n=n1

 

11

 

.

 

A =

A21

 

A22

, C =

C1.0l ×n2

+n2.

Данная пара матриц обладает тем свойством, что у соответствующей системы имеются компоненты вектора состояния, которые ни прямо, ни косвенно (через другие компоненты) не участвуют в формировании выходного процесса.

˜ ˜

По аналогии со свойством управляемости уравнения с матрицами A и C указанного

вида называются канонической формой наблюдаемости [22, 53]. Соответствующая структурная схема приведена на рис. 15.3, б).

 

 

Далее, для

полностью наблюдаемой MISO-системы (y(t)

R) всегда найдется

n

1

-матрица

B

такая, что передаточная функция

W(s) = C(sI

A)1B

– несократимая

 

×

 

 

 

дробь со степенью знаменателя, равной n. Таким образом, нетрудно показать, что несо-

кратимость передаточной функции при m = l = 1 является необходимым и достаточным условием невырожденности SISO-систем.

В общем случае MIMO-систем невырожденность системы соответствует выполнению следующего условия для передаточных матриц [17].

Для любого собственного числа матрицы A существует такой минор M(s) матрицы

W(s), что

 

 

s→si

 

(15.6)

lim

A(s)M(s) = 0,

 

где A(s) = det(sIn −A) – характеристический многочлен матрицы A. Для SIMO и MISO-

112

систем это свойство означает невозможность представления W(s) в виде отношения двух многочленов (матричного и скалярного) со степенью знаменателя меньшей, чем n. Невырожденность передаточной функции для SISO-систем вытекает отсюда как частный случай.

Проверку условия невырожденности MIMO-систем можно упростить, если воспользоваться следующим результатом [17].

Для полной управляемости системы (A, B) необходимо и достаточно, чтобы для любого корня si многочлена A(s)=

det(sIn −A) у матрицы W(s) нашелся бы такой минор M(s) порядка, равного дефекту d

матрицы (siIn −A), что выполнено (15.6).

З а м е ч а н и е . Пусть rB = rank(B), rC = rank(C). Выше отмечено, что если хотя бы для одного корня si выполнено d > rB, то система (A, B) неуправляема, а если d > rC , то система (A, C) ненаблюдаема. Поэтому передаточная матрица W(s) может быть невырожденной лишь при d ≤ rB и d ≤ rC . Значит, условие (15.6) имеет смысл проверять лишь при выполнении указанных неравенств и для миноров M(s) порядка d. Если дефект d

неизвестен, то (15.6) следует проверять лишь для миноров, порядок которых не превосходит max{rB , rC , pi}, где pi – кратность корня si [17].

Подпространство ненаблюдаемых состояний системы представляет собой нульпространство матрицы QT , т.е. является множеством таких x, что QT x = 0. Если система полностью наблюдаема, то это подпространство вырождается в точку x=0.

Для проверки нормальности системы следует воспользоваться критерием управляемости для матриц A, bi, где bi,

i=1, . . . , m – столбцы матрицы B.

Для проверки управляемости по выходам можно исследовать ранг матрицы L = [CB, CAB, . . . , CAn−1B] [40].

113

Лекция 16

16 Оценивание состояния объекта и возмущений

16.1Постановка задачи оценивания

При наличии информации о текущих значениях переменных состояния объекта может быть решена задача модального управления – обеспечения заданных значений коэффициентов характеристического многочлена. Кроме того, решение различных задач оптимального управления процессами основано на использовании значений всего вектора состояния. Актуальной является также задача оценивания неизмеряемых возмущений для организации комбинированного управления. В реальных условиях измерение вектора состояния, как правило, неосуществимо из-за необходимости установки датчиков в труднодоступных местах, измерения производных высоких порядков и так далее. Еще более сложной задачей является измерение возмущений. Преодолеть (или уменьшить) эти трудности можно, если наиболее полно использовать имеющуюся априорную информацию о модели объекта и текущие измерения его входов и выходов. С этой целью в систему управления вводится подсистема (алгоритм) оценивания состояния объекта и возмущений [4, 6, 8, 22, 33, 38, 40].

Различают три типа оценок состояния:

• сглаживание – по текущим данным определяется поведение системы в прошлом, т.е. по результатам измерений к моменту времени t оценивается состояние системы на момент t−T, T > 0;

фильтрация – по текущим данным определяется состояние системы в тот же самый момент времени;

прогноз – производится экстраполяция результатов измерений, т.е. по данным к

моменту времени t оценивается состояние системы в будущем, на момент t+T, T > 0.

Таким образом, оценивание является задачей восстановления состояния системы по

доступной текущей информации о ее входах и выходах. Эта задача принципиально разрешима, если имеется взаимно-однозначное соответствие между переменными вход-выход и

состоянием объекта. Это соответствие имеется для полностью наблюдаемых объектов. 1

В системах управления наиболее распространены оценки типа «фильтрация». При таких оценках темп оценивания совпадает с темпом получения информации, что существенно для построения систем реального времени. Ниже будет рассматриваться именно задача

1 Кроме того, предполагается, что имеется достаточно полная априорная информация об объекте в

виде его математической модели и параметров. Задачи с неполной априорной информацией относятся к

адаптивным..

114

фильтрации применительно к линейным объектам управления.

Рассмотрим модель объекта в виде уравнений состояния:

 

x˙(t)=A(t)x(t)+B(t)u(t)+f(t),

 

y(t)=C(t)x(t)+v(t), x(t0)=x0, t ≥ t0.

(16.1)

Здесь x(t) Rn – вектор состояния объекта; u(t) Rm, y(t) Rl - входной и выходной

векторы; A(t), B(t), C(t) – известные матричные функции. Объект подвержен действию

возмущений f(t) и «шума (погрешности) измерений» v(t). Считается, что при работе системы доступны измерению процессы u(t), y(t), а x(t), f(t), v(t) – недоступны. Рассматривается задача получения оценки состояния объекта xˆ(t). Процесс xˆ(t), полученный с помощью некоторого алгоритма, должен в определенном (например, в асимптотическом) смысле приближаться к процессу x(t) (ˆx(t) → x(t) при t → ∞) независимо от исходного начального состояния объекта x0. Как показано в следующем параграфе, для полностью наблюдаемого стационарного объекта при отсутствии возмущений можно получить асимптотически точную оценку состояния с любым заданным временем переходного процесса.

2 Влияние возмущений и шумов измерения приводит к появлению ошибок оценивания. Некоторый анализ этого влияния будет дан в следующем параграфе.

З а м е ч а н и е . Уравнения (16.1) соответствуют системе непрерывного времени. Задача оценивания рассматривается также для дискретных систем, поэтому ниже наряду

с (16.1) будут использованы разностные уравнения

 

x[k+1]=A[k]x[k]+B[k]u[k]+f[k],

 

y[k]=C[k]x[k]+v[k], x[t0]=x0, k =k0, k0 +1, . . .

(16.2)

Дискретный алгоритм оценивания задается разностным уравнением и служит для получения оценки состояния xˆ[k].

16.2Наблюдатели состояния

16.2.1 Наблюдатель полного порядка

Наблюдатель состояния (идентификатор состояния, наблюдающее устройство, наблюдатель) можно представить в виде модели объекта управления, на вход которой поступает то

2 Более того, полная наблюдаемость теоретически позволяет построить алгоритм оценивания, обладающий конечным временем сходимости оценок состояния. Однако реализация такого алгоритма затруднена

из-за влияния параметрических и координатных возмущений, а также сложностей вычислительного характера.

115

же управляющее воздействие, что и на объект управления и, кроме того, дополнительный сигнал коррекции (обратной связи). Этот сигнал получается из невязки между выходами объекта и модели (рис. 16.1).

Рисунок 16.1 – Принцип построения и структурная схема наблюдателя.

Его влияние придает поведению модели качественно новые свойства (отличные от свойств объекта). Собственные движения модели и объекта оказываются различными, но переменные состояния модели служат оценками состояния объекта. Для систем непрерывного времени наблюдатель описывается уравнением

˙

 

xˆ(t)=A(tx(t)+B(t)u(t)+L(t)(y(t)−yˆ(t)),

(16.3)

yˆ(t)=C(tx(t), xˆ(t0)=xˆ0, t ≥ t0.

Здесь xˆ(t) Rn – вектор состояния наблюдателя, служащий оценкой состояния объекта; yˆ(t) Rl – вектор выхода; L(t) – n×l-матрица коэффициентов обратной связи по невязке между выходами объекта и наблюдателя. Синтез наблюдателя заключается в выборе матрицы L(t).

Отметим, что мы рассматриваем наблюдатель, у которого размерность вектора состояния такая же, как и у объекта (так называемый наблюдатель полного порядка, или наблюдатель Калмана). Однако это условие необязательно: встречаются наблюдатели как пониженного порядка (см. ниже «наблюдатель Луенбергера»), так и повышенного порядка (адаптивные наблюдатели) [8].

116

Для исследования работы наблюдателя рассмотрим ошибку оценивания ε(t) = (x(t)− xˆ(t)). Вычитая из (16.1) уравнение (16.3), получаем уравнение для ошибки

ε˙(t)=(A(t)−L(t)C(t)) ε(t)+f(t)−L(t)v(t),

(16.4)

ε(t0)=ε0 = x0 −xˆ0, t ≥ t0.

Как видно из этого уравнения, источниками ошибки ε(t) являются начальное рассогласование ε0 =x0−xˆ0, возмущение f(t) и помеха измерений v(t). Динамика переходного процесса ошибки ε(t) определяется матрицей Aн(t) = A(t)−L(t)C(t).

Исследуем поведение процесса ε(t) для стационарного случая, когда матрицы A, B, C, L

не зависят от времени. 3 Динамика переходного процесса в таких системах определяется корнями характеристического многочлена наблюдателя det(sIn −Aн), т.е. собственными числами матрицы Aн = A − LC. Если они имеют отрицательные вещественные части, а возмущения f(t) и шумы v(t) отсутствуют, то процесс оценивания асимптотически устойчив и ε(t) 0 при t → ∞ для любых начальных значений x0, xˆ0. Матрица Aн зависит от параметров объекта управления (матриц A, C в (16.1)) и матрицы L, выбор которой определяется проектировщиком. Как следует из приведенных выше в п. 15.3 критериев, для полностью наблюдаемого объекта всегда имеется такая матрица L, что собственные числа матрицы Aн будут заданными. Следовательно, выбором L можно обеспечить требуемое быстродействие процесса оценивания. 4 При отсутствии сигнала коррекции (L = 0)

динамика процесса оценивания полностью определяется динамикой объекта. В частности, для неустойчивых и нейтрально-устойчивых объектов асимптотическое оценивание было бы неосуществимо. Матрица Aн, а следовательно и L, влияет также на точность процесса оценивания при внешних воздействиях. Как видно из (16.4), это влияние оказывается разным по отношению к возмущениям f(t), с одной стороны, и помехам измерений v(t) – с другой. Поэтому при определении L следует учитывать характеристики внешних воздействий и обеспечивать компромисс между требованиями быстродействия и точности системы. Обычно повышение быстродействия связано с увеличением элементов матрицы L и, следовательно, с подавлением влияния возмущений и подчеркиванием действия помех измерения. Для более детального анализа можно использовать передаточные функции по ошибке

3 Именно стационарные системы и будут рассмотрены в настоящей главе. Сведения о нестационарных алгоритмах оценивания приведены, например, в [4, 22].

4 Следует, правда, отметить, что величина перерегулирования ε(t) может оказаться значительной. Время переходного процесса характеризует скорость затухания величины относительной ошибки.

117

от возмущений Wfε(s) и помех Wvε(s), определяемые формулами

Wfε(s)=(sIn −A + LC)1 , Wvε(s)=(sIn −A + LC)1 L.

Оптимальный (в смысле минимума дисперсии ||ε(t)||) выбор матрицы L при действии случайных возмущений и помех приводит к оптимальному фильтру Калмана-Бьюси [22].

Рассмотрим определение L из условий быстродействия. Характеристический многочлен наблюдателя представим в виде

det(sIn −Aн) det(sIn −A+LC)=sn +α1sn−1 +· · ·+αn.

(16.5)

Коэффициенты αi зависят от параметров объекта и матрицы L. Приравнивая их к заданным значениям, получаем систему n линейных алгебраических уравнений относительно искомых n·l элементов матрицы L. При полной наблюдаемости объекта данная система имеет решение для любых A, C, αi (при l =1 это решение единственно). Если измерению доступно несколько выходных переменных (l > 1), то матрица L определяется неоднозначно. Следовательно, при выборе L можно учесть дополнительные требования по ошибкам от внешних воздействий и соответственно перераспределить коэффициенты передачи. Решение задачи синтеза можно выполнять алгебраическими методами с использованием специальных канонических форм уравнений состояния (см., например, [4]). Для определения желаемых коэффициентов характеристического многочлена (16.5) рекомендуется использовать стандартные формы, например биномиальную форму, или форму Баттерворта: [8, 22, 33]

 

n

 

 

 

 

 

"

s

j π + 2ν−1

π

 

det(sIn −Aн) =

ν=1

ω0

− e ( 2 2n

 

) ,

где параметр ω0 – среднегеометрический корень многочлена определяет быстродействие наблюдателя.

Для дискретного объекта управления (16.2) наблюдатель состояния описывается разностными уравнениями:

xˆ[k+1]=A[kx[k]+B[k]u[k]+L[k](y[k]−yˆ[k]),

(16.6)

yˆ[k]=C[kx[k], xˆ(t0)=xˆ0, t ≥ t0.

В стационарном случае его динамика определяется характеристическим многочленом det(zIn −Aн) det(zIn −A+LC), корни zi которого из условия устойчивости должны быть

118

по модулю меньше единицы. Свойства дискретного наблюдателя и процедура синтеза аналогичны изложенным выше для непрерывного случая. Заметим, что для (16.6) матрица L

может быть выбрана из условия zi = 0, i = 1, 2, . . . , n , что дает конечное время переходного процесса оценивания, не превышающее nT0, где n – порядок системы, T0 – интервал квантования. 5

Как отмечено выше, для построения систем оценивания, обладающих заданными динамическими свойствами, требуется полная наблюдаемость объекта управления. Если для объекта это свойство не выполняется, но он является обнаруживаемым [8], то устойчивость процесса оценивания может быть обеспечена, однако нельзя получить произвольное

заданное расположение корней многочлена (16.5).

16.2.2 Наблюдатели пониженного порядка

Выше рассматривались так называемые наблюдатели полного порядка, или наблюдатели Калмана, размерность вектора состояния которых совпадает с порядком уравнений объекта и равна n. Можно уменьшить порядок наблюдателя, используя непосредственно содержащуюся в выходных переменных информацию о состоянии объекта. Это дает возможность построить алгоритм оценивания порядка n − p, где p = rank C (обычно p = l.)

Такие идентификаторы состояния называются наблюдателями пониженного порядка, или

наблюдателями Луенбергера [4, 8, 53].

Рассмотрим стационарный полностью наблюдаемый объект, уравнения которого имеют

вид

 

x˙(t) = Ax(t) + Bu(t), y(t) = Cx(t).

(16.7)

Пусть ранг p×n-матрицы C равен p.

Для упрощения вида уравнения выхода выполним преобразование базиса в (16.7). Выберем произвольную (n − p)×n-матрицу V так, чтобы матрица

V T = C

была невырожденной. Последнее всегда возможно, так как rank C = p. Введем теперь новый вектор состояния x¯(t) = T x(t) и представим его в виде

x¯(t) =

w(t)

}n − p

,

 

y(t)

}p

 

5 Точнее говоря, переходный процесс завершается не более, чем за n шагов, что в системах реального времени с постоянным периодом квантования T0 соответствует указанному временн´ому интервалу.

119

где w(t) Rn−p, y(t) Rp, т.е. выходы объекта совпадают в выбранном базисе с последними

p компонентами его вектора состояния. Выполнив преобразование базиса с матрицей T ,

перейдем к уравнениям состояния

w˙ (t)

=

A11

A12

w(t)

+

B1

u(t).

 

y˙(t)

A21

A22

y(t)

B2

(16.8)

Из этой системы можно выделить подсистему порядка n − p с известными (доступными

измерению) входами u(t), y(t). Более того, для этой подсистемы всегда можно обеспечить

заданные коэффициенты характеристического многочлена.

Для этого умножим второе уравнение в (16.8) на произвольную (n − p)×p-матрицу E и

сложим полученное выражение с первым уравнением. Получим

w˙ (t) − Ey˙(t) = (A11 − EA21)w(t) + (A12 − EA22)y(t) + (B1 + EB2)u(t).

 

Это выражение можно переписать в виде

 

w˙ (t) − Ey˙(t) = (A11 − EA21) w(t) − Ey(t) +

 

+(A11E − EA21E+ A12 − EA22)y(t) + (B1 − EB2)u(t).

 

Введя v(t) = w(t) − Ey(t), получим

 

v(t) = (A11 − EA21)v(t)+

(16.9)

+(A11E − EA21E+ A12 − EA22)y(t) + (B1 − EB2)u(t).

 

Здесь v(t) – неизмеряемый вектор состояния, в то время как u(t), y(t) измеряются. Введем

наблюдатель, уравнение которого в точности повторяет уравнение для v(t), а именно

vˆ(t) = (A11 − EA21v(t)+

(16.10)

+(A11E − EA21E+ A12 − EA22)y(t) + (B1 − EB2)u(t).

 

Как и выше, вычитая (16.9) из (16.10), найдем уравнение для ошибки оценивания vˆ(t)−v(t) :

˙ − −

vˆ(t) v˙(t) = A11 EA21 vˆ(t) v(t) .

Из полученного уравнения следует, что vˆ(t) − v(t) 0, причем динамика ошибки опреде-

ляется собственными числами матрицы A11 − EA21.

Получив оценку вектора v(t), нетрудно перейти к оценке всего вектора состояния как

вканоническом (16.8), так и в исходном базисе. Оценки wˆ(t), yˆ(t) вектора x¯(t) получаются

ввиде

wˆ(t) = vˆ(t) + Ey(t), yˆ(t) = y(t).

120