Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗИРОВАННОГО УПРАВЛЕНИЯ

.pdf
Скачиваний:
108
Добавлен:
26.03.2015
Размер:
1.78 Mб
Скачать

использовать программное управление [4, 17, 37].

 

u(t) = BT eAT (t1−t)W(θ)1 x1 ex0 ,

(17.13)

где грамиан управляемости

 

 

W(θ) = '0

θ eBBT eAT τ dτ.

(17.14)

Таким образом, найдено управление не в форме обратной связи по состоянию (или другой текущей информации о поведении объекта), а в виде функции времени, которая должна быть рассчитана заранее, исходя из заданных значений x0, x1, θ.

Управление (17.13) для решения данной задачи не является единственным [4]. Оно определяется с точностью до некоторой аддитивно добавляемой функции r(t), удовлетво-

ряющей условию t1 eA(t1−τ)Br(τ)= 0. Действительно, данный интеграл (по формуле Ко-

t0

ши (11.9), с. 81) выражает реакцию системы на воздействие r(t). При равенстве его нулю реакции на u(t) и u(t) + r(t) совпадают. Как показано в [4], управление u(t) (17.13) из всех воздействий, переводящих x0 в x1, обладает минимальной нормой (т.е. минимизирует

t1

интеграл u(t)T u(t)dt).

t0

Перечислим некоторые свойства функции W(t0,t1) [4, 22]:

t1

 

W(t0, t1) = t'0

Φ(t0, t)B(t)B(t)T Φ(t0, t)T dt.

Это n×n матричная функция, которая

1)симметрична – W(t0, t1) = W(t0, t1)T ;

2)неотрицательно определена для всех t0, t1 ≥ t0;

3)удовлетворяет линейному матричному дифференциальному уравнению (уравнению Ляпунова) 7:

˙

T

T

 

(17.15)

W(t, t1) = A(t)W(t, t1) + W(t, t1)A(t)

B(t)B(t)

,

 

 

 

W(t1, t1) = 0.

 

7 Более подробно дифференциальное и алгебраическое уравнения Ляпунова рассматриваются в п. 20.4 на с. 187 в связи с исследованием устойчивости.

131

В частности, для стационарных систем при θ → ∞ матрица W(θ) приближается к решению

W алгебраического уравнения Ляпунова

AW + WAT − BBT = 0);

4) удовлетворяет функциональному уравнению

W(t0, t1) = W(t0, t) + Φ(t0, t)W(t, t1)Φ(t0, t)T .

При вычислении грамиана управляемости (17.14) можно также учесть следующие соотношения. Введем функцию w(t) = eAtB. Как показано в 11.4 (с. 83), при скалярном входном воздействии (m = 1) можно трактовать w(t), как функцию веса рассматриваемой системы и находить, решая однородное уравнение x˙(t) = Ax(t) при x(0) = B. Если m > 1, то в ка-

. . .

. . .

честве начальных условий берутся столбцы bi матрицы B = [b1.b2. . . . .bm] и w(t) находится объединением m решений.

Эти свойства можно использовать при решении задач финитного и терминального управления.

Полученное выше решение задает программное управление. Представляет интерес получить управление в форме обратной связи, как это обычно принято в системах автоматического управления. Покажем, как это сделать при решении задачи стабилизации, – когда

требуется привести состояние объекта в начало координат, x1 = 0.

Обратимся к формуле (17.13). Обозначив C =

W

(θ)1

 

x1

ex0 , C R, получим

 

 

 

 

u(t) = BT eAT (t1−t)C = BT e−AT (t−t0)eAT θ, θ = t1 − t0.

Введем сопряженное уравнение 8

 

 

 

 

 

 

 

˙

T

 

 

 

 

(17.16)

ψ(t) =

−A ψ(t),

ψ(t0) = e .

 

Согласно формуле Коши, его решение ψ(t) = e−AT (t−t0)ψ(t0) = eAT (t1−t). Сравнивая полученное выражение для ψ(t) с формулой для u(t), видим, что управляющее воздействие можно

8 Линейное однородное дифференциальное уравнение для ψ(t) называется сопряженным уравнению относительно x(t), если для любых начальных условий скалярное произведение x(t)T ψ(t) = const. Нетрудно

˙

T

ψ являются сопряженными [4].

убедиться, что уравнения x˙ = Ax и ψ = −A

 

132

выразить как u(t) = BT ψ(t), где ψ(t) удовлетворяет уравнению (17.16), ψ(t0) = eAT θC. Объединяя уравнения объекта, закон управления и сопряженное уравнение, получим систему

 

x˙ (t) = Ax(t) + Bu(t), x(t

x ,

 

 

u(t) = BT ψ(t),

0) =

0 T

θC.

(17.17)

 

ψ˙(t) = AT ψ(t),

ψ(t0) = eA

 

 

 

 

 

 

Подставляя второе уравнение в первое, получим систему

 

 

x˙(t) = Ax(t) + BBT ψ(t), x(t0) = x0,

 

ψ˙(t) = −AT ψ(t),

ψ(t0) = eAT θC.

(17.18)

Для решения этой системы можно использовать преобразование Риккати [4, 22, 40]. Будем искать ψ(t) в виде ψ(t) = S(t)x(t), где S(t) – подлежащая определению матрицафункция. Подстановкой ψ(t) во второе уравнение и путем дифференцирования получаем

˙ ˙

Sx + Sx˙ = AT Sx. Учитывая первое уравнение системы, после подстановок получаем Sx+

SAx+ SBBT Sx = −AT Sx. Чтобы полученное равенство было выполнено при всех x, S(t)

должна удовлетворять следующему матричному дифференциальному уравнению:

˙

T

T

S(t) = 0.

(17.19)

S(t) + S(t)A + A

S(t) + S(t)BB

Чтобы найти начальное значение S(t0), учтем, что рассматривается задача стабилизации и x1 = 0. Поэтому

C = −W(θ)1ex0, ψ(t0) = eAT θW(θ)1ex0.

(17.20)

Так как должно выполняться условие ψ(t0) = S(t0)x(t0), то получим S(t0) = eAT θW(θ)1 e. Таким образом, управление, переводящее состояние объекта из x(t0) = x0 в нулевое за заданное время θ > 0, выражается в виде обратной связи

u(t) = BT S(t)x(t),

(17.21)

где S(t) удовлетворяет уравнению (17.19). Данное уравнение является частным случаем так называемого уравнения Риккати, которое часто встречается при решении различных оптимизационных задач [2, 4, 14, 22, 38].

133

17.5Примеры систем модального и терминального управления

17.5.1 Стабилизация углового движения ИСЗ с компенсацией возмущений

Рассмотрим задачу стабилизации ИСЗ. Пусть требуется обеспечить движение без вращения по крену. Пропорциональный закон стабилизации угловой скорости имеет вид

u(t) = −kωωx(t).

(17.22)

Рассмотрим также комбинированный закон стабилизации, при котором в сигнал управления (в данном случае – в управляющий момент) вводится также компенсирующее воздействие по возмущению. Так как возмущающий момент непосредственно измерен быть не

ˆ

может, используем его оценку M(t), полученную наблюдателем. Тогда комбинированный закон управления принимает вид

ˆ

(17.23)

u(t) = −kωωx(t) − kmM(t).

Выбор коэффициента kω выполним исходя из условия быстродействия процесса стабилизации в замкнутом контуре. Соответствующий этому контуру характеристический многочлен

имеет вид D(s) = s + kω , откуда kω = −Jxs1, где s1 – заданное значение корня D(s). Оче-

Jx

видно, что для данной системы коэффициент передачи по возмущению km = 1. Результаты моделирования системы стабилизации при s1 = 0.2 с1 приведены на рис. 17.2.

Рисунок 17.2 – Процессы стабилизации ИСЗ. 1 – пропорциональный регулятор (17.22), 2 – динамический компенсатор (17.23).

134

Как видно из рисунка, при пропорциональном законе управления устанавливается равноускоренное вращательное движение. Использование комбинированного закона управления с оценкой и компенсацией возмущения в данных условиях приводит к асимптотическому стремлению скорости к нулю. Пунктирной линией на графике u(t) показана "идеаль-

ная"компенсирующая составляющая в управляющем воздействии, равная −M(t).

Вычисляя передаточную функцию компенсатора от входа ωx к управлению u получим,

что рассмотренный закон управления можно реализовать звеном W(s) = k

τs2 + 2ξτs + 1

,

s2(T s + 1)

где k = 1.13 с2, T = 0.83 с, τ = 5.3 с.

 

 

17.5.2 Возбуждение колебаний в цепочке осцилляторов

 

 

Рассмотрим систему, состоящую из последовательности осцилляторов (например, маятников), соединенных упругими связями. Такая модель используется для описания различных физических и механических систем [8]. В отсутствии сил трения и при линейных упругих деформациях связей (в области действия закона Гука) цепочка N маятников описывается системой уравнений

 

ϕ¨

t

ω2

sin

ϕ

t = k ϕ

(t)

ϕ

(t) + u(t),

 

 

 

1( ) +

 

 

1( ). . .

2

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ϕ¨i(t) + ω2 sin ϕi(t) =

k ϕi+1(t)

 

2ϕi(t) + ϕi+1(t) ,

(17.24)

 

 

 

 

 

 

. . .

 

 

(i = 2, 3, . . . , N

1),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(t) + ω2 sin ϕN (t) =

k ϕN−1(t) − ϕN (t) ,

 

ϕ¨N

 

где ϕi(t) (i = 1, 2, . . . , N) – углы поворота маятников; u(t) – внешнее управляющее воздействие, пропорциональное моменту, приложенному к первому маятнику; ω, k – параметры системы (ω – собственная частота малых колебаний маятников, k – коэффициент жесткости пружин).

Далее будем использовать линеаризованную модель, предполагая, что амплитуда коле-

баний маятников незначительна. Такая модель имеет вид

 

 

 

ϕ

2

ϕ1(t) = k ϕ2

(t) − ϕ1(t) + u(t),

 

.¨.1.(t) + ω

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(17.25)

 

ϕ¨i(t) + ω2ϕi(t) = k ϕi+1(t)

2ϕi(t) + ϕi+1(t) ,

 

. . .

 

 

 

(i = 2, 3, . . . , N

1),

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ϕ¨N (t) + ω2ϕN (t) = k ϕN−1(t) − ϕN (t) .

 

 

 

R2N

x(t) = col1

, ϕ˙1, ϕ2, ϕ˙2, . . . , ϕN , ϕ˙N }. В стандартной

Введем вектор состояния x(t)

 

 

форме уравнений состояния

135

x˙(t) = Ax(t) + Bu(t) модель (17.25) задается матрицами

 

 

A1 A12

0

. . . 0

0

 

 

B

 

 

 

 

A12 A2

A12 . . . 0

0

 

 

01

 

 

A =

. .

 

. . .

.

 

, B =

 

0.

 

,

 

 

0

A12

A2

...

0

0

 

 

 

 

 

 

0

0

0

. . . A2

A12

 

 

 

0

 

 

 

 

 

 

 

 

..

 

 

 

 

.. ..

.. .. ..

..

 

 

 

 

 

 

 

 

0

0

0

. . . A12

A1

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

1

 

A2 = −ω202k

1

 

 

 

0

0

где A1 = −ω2 − k

0 ,

 

0 , A12

= k

0 ,

T

B1 = 0 1 .

Рассмотрим задачу возбуждения "волны"колебаний заданной амплитуды, при которых

соседние маятники находятся в противофазе. При этом ограничимся требованием приведе-

ния их в это состояние за заданное время из любого начального состояния. Для ее решения

воспользуемся изложенным в п. 17.4 методом. Управление будем искать в виде программ-

ной функции времени (17.13).

Рисунок 17.3 – Волна колебаний.

времени (17.13).

Результаты решения задачи для N = 10, k = 5 с2, ω = 0.4π с1, ϕi(0) = 0, ϕ˙i(0) = 0

(i = 1, 2, . . . , N), θ = 50 c, ϕi(θ) = (1)i+1 · 30 град., ϕ˙i(θ) = 0 показаны на рис. 17.3, 17.4. На

136

Рисунок 17.4 – Углы поворота маятников и управление.

первом изображены последовательности положений маятников в разные моменты времени (отмечены цифрой внизу). На втором 17.4 показаны графики углов поворота ϕ9(t), ϕ10(t) и

управляющее воздействие u(t) на промежутке t [30, 50] с. Заметим, что в данном примере (как и в общем случае) приведение системы в заданное состояние не означает, вообще говоря, что она останется в этом состоянии и дальше или будет совершать предписанное движение. Если из полученного состояния x(θ) построить управление, переводящее систему в это же состояние к моменту t = θ + , ( > 0), то получим колебания сложной формы, симметричные относительно середины интервала [θ, θ + Δ].

137

Лекция 18

18 Уравнения и характерные свойства нелинейных систем

18.1Общие сведения о нелинейных системах

Впредыдущих главах изучались линейные системы. Рассмотрим подробнее значение этого термина. Упрощенно можно считать, что линейные системы – это такие системы, для которых справедлив принцип суперпозиции – реакция системы на линейную комбинацию (суперпозицию) воздействий совпадает с такой же линейной комбинацией реакций на

каждое воздействие в отдельности. 1 Из этого общего принципа следует, например, что линейное статическое звено должно описываться линейной (пропорциональной) зависимостью y =Ku между входом u(t) Rm и выходом y(t) Rl, где K l×m-матрица, зависящая от t в нестационарном случае. Если рассматривается динамическая система непрерывного времени, то в линейном конечномерном случае она описывается линейными дифференциальными уравнениями, дискретная система – линейными разностными уравнениями и т.д.

Системы, для которых этот принцип не выполняется, относятся к нелинейным. Заметим, что данное определение носит «негативный« характер в том смысле, что оно указывает на свойство, которое у определяемых систем отсутствует. Правильнее сказать, что свойство линейности выделяет класс линейных систем из всех (вообще говоря, – нелинейных) систем, Однако и в терминологическом, и в методическом отношении удобнее считать, что линейные и нелинейные системы относятся к разным классам.

Отметим, что если в состав системы входит хотя бы одно нелинейное звено, то и вся система в целом становится нелинейной. Это дает основание иногда определять линейные системы, как системы, состоящие только из линейных звеньев. Нелинейной системой тогда называется система, содержащая хотя бы один нелинейный элемент.

Следует подчеркнуть, что все реальные системы являются нелинейными. Физическим звеньям свойственны явления насыщения, гистерезиса, люфта и т.д. Однако линейным системам не случайно уделено такое большое внимание в теории систем. Прежде всего, теория линейных систем достаточно проста. Можно даже считать ее практически завершенной. Теория нелинейных систем существенно сложнее, значительные усилия по исследованию нелинейных систем обычно приводят к менее детальному описанию процессов, чем в линей-

1 Такое определение линейной системы является достаточно общим. Оно применимо как к конечномерным, так и к бесконечномерным дифференциальным системам, а также к дискретным системам. Однако оно является не совсем полным, так как не отражает влияния начального состояния. Полное определение свойства линейности систем будет дано ниже, в 18.3.1

138

ном случае. Нелинейные системы могут обладать такой сложностью и таким разнообразием свойств, что представляется невозможным говорить о завершении теории таких систем в обозримом будущем. Конечно, простота исследования не является сама по себе достаточным основанием для применения линейной теории. Однако очень во многих случаях использование линеаризованной модели дает практически те же результаты, что и применение более точной нелинейной модели. Следует также учесть, что при составлении модели системы неизбежно возникают ошибки, связанные, например, с погрешностью определения значений параметров объекта. Влияние этих ошибок может оказаться более существенным, чем погрешностей, вызванных линеаризацией модели. Определенным теоретическим обоснованием применимости линейной теории систем служит первый метод А.М. Ляпунова, согласно которому при «гладкой« нелинейной характеристике устойчивость нелинейной системы можно исследовать по первому (линейному) приближению [18]. 2 Поэтому на практике обычно выполняется предварительное исследование линеаризованной модели, для которой и производится синтез закона управления. Затем осуществляется анализ полученной системы с использованием более полной, нелинейной, модели. Во многих случаях оказывается, что нелинейные свойства системы не играют существенной роли. При таком подходе целесообразно обеспечивать выполнение заданных технических требований с определенным «запасом«, что позволяет предотвратить нарушение требуемых показателей при влиянии неучтенных нелинейностей.

Вместе с тем имеется обширный класс систем, для которых нелинейные свойства являются принципиально важными и применение линейных моделей приводит к качественно неверным результатам. Выше уже упоминалось о ситуации, в которой устойчивость состояния равновесия не может быть исследована по линейному приближению. Более существенным является то, что для многих систем линеаризация в рабочей области значений просто невыполнима из-за негладкости (недифференцируемости) нелинейных характеристик. Это явление имеет место, когда в систему входят «разрывные» нелинейности, например релейные звенья. Кроме того, даже в тех случаях, когда линеаризация возможна и даже можно сделать вывод об устойчивости состояния равновесия, применение линейных моде-

лей может привести к весьма существенным количественным ошибкам. Наконец, в науке и технике все чаще возникают задачи, когда исследуемые или создаваемые режимы системы

являются неравновесными, например колебательными. При этом система может демон-

2 Напомним, что, согласно первому методу Ляпунова, если линеаризованная система асимптотически устойчива, то состояние равновесия нелинейной системы устойчиво в малом; если линеаризованная система неустойчива, то неустойчиво и состояние равновесия нелинейной системы; если линеаризованная система находится «на границе устойчивости«, то нельзя исследовать устойчивость состояния равновесия по первому приближению.

139

стрировать сложное (мультистабильное, хаотическое) поведение, которое принципиально не может быть описано в рамках линейной теории и требует новых подходов (см. главу 13).

Во всех перечисленных ситуациях требуется использование методов теории нелинейных систем.

Таким образом, нелинейности, свойственные реальным физическим системам, можно (со значительной степенью условности) разбить на два класса:

существенные нелинейности, влиянием которых нельзя пренебречь без существенной ошибки при определении характеристик системы;

несущественные нелинейности, влиянием которых пренебречь можно. 3

Имеется и другой способ классификации нелинейных звеньев, основанный на причинах их появления в системе. С этой точки зрения нелинейности можно разбить на естественные и искусственные (преднамеренно вводимые).

Естественные нелинейности присутствуют в системе в силу физических свойств материалов, из которых изготовлены входящие в нее устройства, особенностей уравнений, описывающих происходящие в объекте управления процессы, и т.д. В этой связи уже упоминались насыщение, люфт, гистерезис, свойственные реальным физическим звеньям разной природы. В цифровых системах управления присутствует специфичная ступенчатая нелинейность, вызванная конечностью разрядной сетки ЭВМ и преобразователей сигналов. При синтезе закона управления эти нелинейности можно учитывать, или нет, в зависимости от их уровня, однако они считаются заданными, не изменяемыми без переработки конструкции объекта или узлов системы.

Искусственные нелинейности вводятся проектировщиком в закон управления, чтобы обеспечить требуемое (оптимальное) качество работы системы. В зависимости от требований, предъявленных к системе управления и условий ее функционирования, могут быть различные варианты введения нелинейных зависимостей в закон управления. Эти вариан-

ты образуют целые, иногда весьма обширные, направления в теории управления. Перечислим некоторые из них.

Оптимальные по быстродействию системы управления. Оптимальное по быстродействию управление при ограниченном уровне управляющего воздействия достигается при существенно нелинейном (релейном) законе управления, когда сигнал управления принимает крайние значения в зависимости от текущего состояния системы [2, 33, 38, 39].

3 Условность такой классификации связана с тем, что в разных ситуациях данная нелинейность может оказаться либо существенной, либо несущественной. Поэтому часто не удается определить a priori, можно ли не учитывать ее влияние. Кроме того, требуется указать количественно, какая ошибка считается «существенной«.

140