Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

.pdf
Скачиваний:
108
Добавлен:
26.03.2015
Размер:
1.78 Mб
Скачать

точную функцию, выделив в ней целую часть путем деления многочленов

 

 

B(s)

 

˜

 

W(s)

 

B(s)

 

 

=d+

 

.

 

A(s)

A(s)

 

Коэффициент d образует 1×1-матрицу D в (4.3), а передаточная функция

˜

W(s) =

˜

B(s)

A(s)

оказывается строго реализуемой и приводится к уравнениям состояния обычным образом.

Врезультате этого преобразования находятся матрицы A , B , C.

За м е ч а н и е 3. В некоторых задачах удобно получать уравнения состояния не для всей системы (пусть даже разомкнутой), а для отдельных звеньев (подсистем). Например, такая ситуация имеет место, когда система задана в виде структурной схемы. Как правило, переход к уравнениям состояния звеньев оказывается существенно более простым. Например, при синтезе цифровых фильтров применяется «каскадная реализация», при которой передаточная функция системы представляется в виде произведения передаточных функций первого и второго порядков.

За м е ч а н и е 4. Приведенные выше уравнения рассмотрены для непрерывных систем, однако изложенные в настоящей главе канонические формы и методы получения

уравнений состояния по передаточным функциям с очевидным изменением обозначений применимы и к дискретным системам.

9.5Случай систем с несколькими входами и выходами

Коснемся вопроса определения минимальной реализации для MIMO-систем, имеющих несколько входов и несколько выходов (m > 1, l > 1). Задача получения минимальной реализации уравнений состояния для таких систем существенно сложнее рассмотренной выше, поэтому ограничимся некоторыми примерами. 5

Пример 1. Пусть заданы матричные 2×2 передаточные функции

s

1

 

0

s

1

1

 

1

01 .

W1(s)= s1

и W2(s)= s

Нетрудно установить, что реализацией минимального порядка W1(s) будут уравнения состояния:

x˙(t)=u1(t),

y1(t)=x(t)+u2(t), y2(t)=x(t)+u2(t).

5 Более подробные сведения о решении этой задачи имеются в работах [3, 40, 53].

61

Этим уравнениям соответствуют матрицы

 

 

1

0

1

A1 =0, B1 =[1, 0], C1 = 1

, D1 = 0

1 .

В свою очередь передаточная функция W2(s) имеет минимальную реализацию вида

x˙1(t)

=

u1(t),

y1(t)=x1(t),

x˙2(t)

=

u2(t),

y2(t)=x2(t),

которой отвечают матрицы

0

0

1

0

1

0

0

0

A2 = 0

0

, B2 = 0

1

, C2 = 0

1

, D2 = 0

0 .

Как видим, уравнения состояния существенно отличаются: даже размерности векторов

состояния у данных систем оказываются различными. Данный пример показывает, что

при переходе к уравнениям состояния для MIMO-систем следует учитывать более "тон-

кие"свойства матричных передаточных функций, а характеристический многочлен матри-

цы получаемых уравнений состояния необязательно совпадает с многочленом A(s), полу-

ченным в виде общего кратного знаменателей передаточных функций Wi,j (s).

Пример 2. [40]. Пусть задана матричная передаточная функция

 

 

0.7

0

 

.

W(s)=

s+1

 

0.4

 

92.0

 

 

 

 

 

 

 

 

 

 

8s+1

 

9s+1

 

Вычисляя матричные вычеты в полюсах s1 =19, s2 =18, получим разложение

 

1

 

0.7 0

1

 

0

0

1

 

 

1

 

W(s) =

 

 

0 0.4 +

 

 

2

0 =

 

M1

+

 

M2.

9s+1

8s+1

9s+1

8s+1

Размерность пространства состояний минимальной реализации определяется, как сумма

рангов матриц M1 и M2. В данном примере

M1 =

0.7

0

0

0

 

0

0.4

, rankM1 =2, M2 = 2

0 , rankM2

=1,

62

следовательно n=dimX =3. Матрицу A записываем в диагональной форме:

91

01

0

 

 

0

0

8

A=

0

9

01

.

Далее определяем элементы 3×2-матрицы B и 2×3-матрицы C так, чтобы получить задан-

ные числители W(s). Нетрудно убедиться, что указанному условию удовлетворяют матрицы

 

1

0

 

 

 

 

 

0.7

0

 

 

 

 

 

9

.4

 

1

0

0

4

 

 

 

B = 0

09

, C = 0

1

1 .

Рассмотренный в Примере 2 метод рекомендуется для систем, передаточные функции которых имеют только вещественные простые полюса [40]. В общем случае алгоритмы преобразования к уравнениям состояния сложнее (см., например, [3], а также Приложение 2 в [48]) и здесь не рассматриваются.

63

Лекция 10

10 Фазовые траектории и фазовые портреты линейных систем

Дополнительную наглядную информацию о поведении систем можно получить рассмотрением их фазовых портретов. Дадим основные определения и рассмотрим общие свойства фазовых траекторий применительно к линейным системам. Будем рассматривать автономные системы, т.е. такие, в уравнения которых явно не входит время. Таким образом, будем считать, что параметры системы не меняются во времени (система стационарна), а

также что входное воздействие отсутствует и рассматривать только собственные движения системы

x˙(t)=Ax(t),

x(0)=x0.

(10.1)

10.1 Определения и основные свойства фазовых траекторий и фазовых портретов

При построении фазовых траекторий каждому решению ставится в соответствие движение точки по некоторой кривой в пространстве состояний (фазовом пространстве). Это дает

возможность получить геометрическую, а точнее – кинематическую [10, 11, 36], интерпретацию поведения системы.

При заданном начальном состоянии x0 получим решение x(t) уравнения (10.1). В функции от t в процессе своего движения точка x описывает некоторую кривую в пространстве состояний X . Эта кривая называется фазовой траекторией , или фазовой кривой системы (10.1), соответствующей заданным начальным условиям. Поскольку представляет интерес развитие процесса во времени, на фазовой траектории указывается (стрелкой) направление движения изображающей точки при возрастании времени t.

Фазовым портретом системы называется совокупность фазовых траекторий, полученных при различных начальных условиях.

Рассмотрим основные свойства фазовых траекторий и фазовых портретов систем указанного класса. Эти свойства следуют из общих характеристик решений дифференциальных уравнений [10, 36].

Для систем вида (10.1) выполнены условия стандартных теорем существования и единственности решения. Кроме того, они выполнены и для уравнений в «обратном» времени

τ =−t. Эти уравнения имеют вид dx/dτ =−Ax(τ). Отсюда следует, что решения уравнения (10.1) определены в области t (−∞, ∞). Свойство стационарности системы приводит к то-

64

му, что при построении фазовых траекторий начальный момент не существен – траектории, проходящие через некоторую точку x0 в различные моменты времени t1, t2, представляют собой одну траекторию.

Поэтому:

Через каждую точку пространства состояний проходит некоторая фазовая траек-

тория. Следовательно, фазовый портрет системы может быть заполнен фазовыми траекториями сколь угодно плотно.

Никакая фазовая траектория не имеет точек разветвления, т.е. она не может распадаться на другие траектории.

Никакие различные траектории не могут иметь точек пересечения. Это свойство следует из единственности решения уравнений в обратном времени. Поэтому для систем

указанного вида текущее состояние однозначно определяет как будущее, так и прошлое развитие процесса.

Таким образом, различные фазовые траектории не могут пересекаться. Если у них есть хотя бы одна общая точка, то такие траектории представляют собой участки некоторой одной «более полной» траектории, построенной для более протяженного временн´ого интервала. 1 Коротко говоря, траектории либо не пересекаются, либо совпадают (с точностью до продолжения), или, другими словами, через каждую точку фазового пространства проходит одна и только одна фазовая кривая.

Самопересекающиеся траектории соответствуют либо положениям (состояниям)

равновесия системы, и тогда они вырождаются в точку, либо периодическим движениям. В первом случае выполнено, что для всех t R : x(t) = x , где x X не зависит от t. Во втором случае существует некоторое значение T > 0, называемое периодом такое, что при произвольном t имеют место равенства x(t)=x(t + T ), но при |t1−t2| < T хотя бы для одной компоненты xi(t) выполнено xi(t1) = xi(t2).

Фазовая траектория периодического процесса представляет собой замкнутую кривую, называемую замкнутой траекторией, орбитой или циклом. Само решение x(t) называется

периодическим с периодом T.

1 Используется понятие максимальных (непродолжаемых) траекторий. Соответствующие им решения не могут быть продолжены ни на какой более широкий интервал. Для линейных систем интервалом определения максимальных траекторий является вся вещественная прямая R.

65

10.2Поле фазовых скоростей. Классификация особых точек

10.2.1 Вектор фазовой скорости

Как отмечено выше, решению x(t) соответствует движение точки в пространстве X . Пусть в момент времени t0 точка проходит состояние x0. Определим векторную скорость точки,

описывающей данное решение, в момент ее прохождения через положение x0

: v = x˙ (t)

.

Значение вектора

v,

 

t=t0

-

 

называемого вектором фазовой скорости или просто фазовой скоро

стью, зависит не от момента t0, а от координат точки, через которую в данный момент проходит траектория. Эта зависимость выражается уравнением (10.1), из которого следу-

ет, что для автономных линейных систем вектор фазовой скорости в точке x определяется равенством

v(x)=Ax.

Поскольку вектор фазовой скорости показывает векторную скорость решения x(t), то, если

его изобразить относительно данной точки, получим направление касательной к фазовой траектории, а модуль вектора скорости характеризует темп движения точки вдоль траектории.

Если в каждой точке пространства X изобразить соответствующую ей фазовую скорость, получим поле фазовых скоростей. Заметим, что для построения поля фазовых скоростей нет необходимости решать дифференциальное уравнение (10.1), так как для

каждого x значение v(x) = Ax. Поле фазовых скоростей дает наглядное и удобное представление о поведении системы, так как касательные к траекториям позволяют достаточно

точно представить и вид самих траекторий. 2 В качестве примера на рис. 10.1 показаны поле фазовых скоростей и фазовый портрет системы второго порядка. (Моделировалась рассмотренная в [39] нелинейная система x¨ + 2x˙ 3x + 4 sat(x) = 0, sat(·) – функция насыщения).

10.2.2Состояния равновесия системы

Впространстве состояний системы могут быть особые точки, в которых вектор фазовой скорости обращается в ноль, v(x) = 0. Это условие эквивалентно тому, что данные точки представляют собой состояния (положения) равновесия системы [10, 36]. Таким образом, если для некоторой x0 выполнено v(x0) = 0, то имеется решение x(t) ≡ x0. Справедливо и обратное утверждение – каждому решению x(t) ≡ x0 соответствует нулевой вектор фазовой

2 На этом свойстве основан так называемый метод изоклин, являющийся приближенным графоанали-

тическим методом построения фазовых портретов нелинейных систем x˙ = f(x) второго порядка. В связи с развитием вычислительных средств к настоящему времени метод изоклин потерял свое значение.

66

Рисунок 10.1 – Поле фазовых скоростей.

скорости в точке x0. Как отмечено выше, фазовые траектории в состояниях равновесия вырождаются в точки, а векторы фазовой скорости «никуда не направлены» (в этом смысле такие точки «особые»).

Рассмотрим состояния равновесия системы (10.1). Из изложенного ясно, что множество

X 0 = {x0} состояний равновесия этой системы определяется линейным уравнением

Ax0 =0,

(10.2)

где A n×n-матрица, x0 n-мерный вектор. Как известно из линейной алгебры [23, 29,

51], уравнение (10.2) имеет единственное тривиальное решение x0 = 0 в том и только том случае, когда матрица A невырожденная: detA = 0. Рассмотрим, что это означает с точки зрения свойств динамической системы. Поскольку характеристический многочлен A(s), т.е. знаменатель передаточной функции системы выражается равенством A(s) = det(sIn

A), находим, что A(0) ≡ an = (1)ndetA. Значит, свободный член характеристического многочлена с точностью до знака совпадает с определителем матрицы A. Если он не равен нулю, то у системы (10.1) будет единственное нулевое состояние равновесия. Условие an =0

выполняется для звеньев интегрирующего типа. Именно для них возможны ненулевые состояния равновесия. Рассмотрим это подробнее.

Так как для всех x0 X 0 имеет место равенство Ax0 = 0, то X 0 является нуль-про- странством 3матрицы A , X 0 = N (A). Как известно, [23, 51], пространство N (A) является

3 Нуль-пространством (аннулируемым пространством) N (A) матрицы A называется множество {x}

такое, что для всех x N (A) выполнено Ax= 0 [23, 51]. Очевидно, что всегда точка {0} N (A).

67

линейным подпространством пространства X . Размерность пространства N (A) равна разности между размерностью пространства X и рангом матрицы A : dimN (A) = n−rankA.

Таким образом, в зависимости от матрицы A (точнее, от ее ранга) состояния равновесия линейной системы являются либо точкой {0}, либо прямой, содержащей эту точку, либо плоскостью, проходящей через начало координат, либо линейным подпространством более высокой размерности.

10.2.3 Декомпозиция пространства состояний

Выше, в п. 7.2 использовалось понятие инвариантных подпространств. Рассмотрим его более подробно.

Напомним следующие положения [23, 51].

Определение. Пространство X является прямой суммой своих подпространств X1,

X2 , . . . , Xm (иногда записывают X =X1 X2 · · · Xm), если :

для всякого x X существует разложение x=x1+x2+· · ·+xm, где x1 X1, . . . , xm

Xm.

это разложение единственно. (данное условие можно записать в эквивалентной более простой форме, а именно: если x = x1 +x2 +· · ·+xm = 0, где x1 X1, . . . , x1 Xm, то x1 =x2 =· · ·=xm =0).

Из единственности разложения следует, что всякие подпространства X1, . . . , Xm имеют общим лишь один элемент {0}.

Если матрица A имеет в пространстве X инвариантные подпространства X1, . . . , Xm,

т.е. для всех x Xi выполнено Ax Xi, i = 1, 2, . . . , m, и если пространство X можно представить в виде прямой суммы инвариантных подпространств, то невырожденным преобразованием матрица может быть приведена к блочно-диагональному виду. Справедливо и обратное утверждение: если матрица имеет квазидиагональную (блочно-диагональную) структуру, то пространство X разлагается на прямую сумму инвариантных (по отношению к данной матрице) подпространств.

Если аннулирующий многочлен f(s) (см. 8) матрицы A разложить в произведение двух взаимно-простых множителей: f(s) = f1(s)f2(s), то пространство X можно разложить в прямую сумму двух подпространств X =X1 X2, инвариантных относительно матрицы A.

Если некоторый аннулирующий многочлен f(s) матрицы A представить в виде f(s) =

m (s−si)ri , где si – все (различные) корни многочлена, а ri – их кратности, то пространство

i=1

68

X разлагается на прямую сумму m подпространств X1, . . . , Xm, инвариантных относительно матрицы A, причем эти подпространства являются нуль-пространствами матрицы (siI−A)ri .

Наконец, если аннулирующий многочлен f(s) матрицы A представить в виде

m

 

q

"i

(s−si)ri

"

f(s)=

(s2 2αj +αj2 +βj2)pj ,

=1

 

j=1

где si – все различные вещественные корни многочлена, а sj,j+1 = αj ± jβj, – различные

невещественные корни, то пространство X разлагается на прямую сумму инвариантных подпространств

m

q

!

!

X = Xkr

Xjc.

k=1

k=1

Такому разбиению пространства состояний системы соответствует приведение матрицы A

к канонической форме Жордана (5.3).

Исходя из изложенного, пространство состояний X системы можно представить в виде прямой суммы L инвариантных подпространств XiA, т.е. каждый вектор x X записать в

виде линейной комбинации x=

L

αixi, где xi XiA, i= 1, 2, . . . , L ( [4, 23]). Рассмотрим

i=1

связь этого разбиения с

фазовыми портретами системы, обращая основное внимание на

 

 

 

случай простых собственных чисел.

Если матрица A имеет попарно различные корни характеристического многочлена, то нетривиальными вещественными инвариантными подпространствами наименьшей размерности будут собственные прямые (для вещественных корней) и собственные плоскости (для мнимых комплексно-сопряженных корней характеристического многочлена). Пусть начальное состояние системы принадлежит собственной прямой Gi, соответствующей (простому) вещественному корню si, т.е. x0 = αi0x0i , где αi0 R – некоторое число, а x0i – собственный вектор, отвечающий собственному значению si. Для вектора фазовой скорости в этой точке можно записать v(x0) = Ax0 = αi0six0i . Поэтому вектор фазовой скорости будет направлен по этой же прямой. 4 и собственные прямые системы соответствуют некоторым фазовым траекториям. Следовательно, вся фазовая траектория остается на прямой

Gi 5 При указанных начальных условиях нетрудно получить и формулу для процесса x(t).

4Подробное доказательство можно найти в [10].

5Заметим, что фазовая траектория принадлежит собственной прямой, но нельзя считать, что прямая Gi является фазовой траекторией. Действительно, на прямой Gi лежат по крайней мере три непересекающиеся фазовые траектории: две из них находятся по разные стороны от начала координат, а третья есть точка

{0}. Кроме того, при si = 0 каждая точка прямой Gi является отдельной фазовой траекторией.

69

Действительно, так как выполнено (10.1), то x˙ (t) = six(t), x(0) = α0x0

. Отсюда получа-

i i

 

ем решение x(t) = esitx(0). Это выражение можно записать и в следующем виде. Введем функцию αi(t) R как решение уравнения α˙ i(t) = siαi(t), αi(0) = αi0. Тогда x(t) = αi(t)x0i .

Очевидно, что αi(t) = esitαi0. Таким образом, изображающая точка будет двигаться вдоль прямой Gi с коэффициентом αi(t). Направление движения определяется знаком si : при si < 0 движение будет направлено к состоянию равновесия {0}, при si > 0 – от точки {0}, а при si =0 – x(t) ≡ x0, и каждая точка прямой является состоянием равновесия. 6

Обобщая приведенные рассуждения, примем, что система обладает k простыми вещественными корнями. Как отмечено выше, им отвечает k линейно независимых собствен-

ных векторов и, соответственно, k собственных прямых [4, 23, 51]. Из линейности системы следует, что движение при произвольных начальных условиях можно представить, как

суперпозицию движений по собственным направлениям. Более подробно: если начальное состояние x(0) принадлежит инвариантному подпространству, порожденному собственны-

ми векторами x0

, x0

,

. . . , x0

, то это состояние можно разложить по базису, состоящему из

1

2

 

k

 

 

 

 

 

 

 

 

собственных векторов: x(0) =

k

αix0

. Тогда решение x(t) имеет вид: x(t) =

k

αi(t)x0

,

 

 

 

 

 

i=1

i

 

i=1

i

 

где αi(t)=esitαi0.

 

 

 

 

 

 

 

 

 

 

Если имеются простые мнимые комплексно-сопряженные корни характеристического многочлена, то они не определяют никакого собственного направления в вещественном пространстве. Однако с помощью изложенного в п. 7.2 приема таким корням можно поставить в соответствие собственную плоскость, которая также является инвариантным подпространством матрицы A. Рассуждая аналогично предыдущему случаю приходим к выводу, что траектория, начинающаяся на собственной плоскости будет ей всегда принадлежать.

Окончательно можно сделать вывод, что при отсутствии кратных корней характеристического многочлена фазовую траекторию можно получить суперпозицией движений по собственным прямым и собственным плоскостям.

Случай кратных корней более сложен, так как при нем возможны ситуации, в которых нельзя разложить пространство на сумму инвариантных подпространств размерности не

более двух.

В следующем параграфе вид фазовых траекторий на плоскости будет рассмотрен более подробно.

6 Напомним, что здесь мы рассматриваем случай простых вещественных корней.

70