Методы и системы оптимального управления. Ч. 3
.pdf2. СИНТЕЗ РЕГУЛЯТОРОВ НА ОСНОВЕ КОНЦЕПЦИИ ОБРАТНЫХ ЗАДАЧ ДИНАМИКИ
2.1. Содержание обратных задач динамики
Многие задачи аналитической механики (определение сил, вызывающих движение объектов), задачи теории автоматического управления относятся к классу задач, получивших название «обратные задачи динамики». Приведем некоторые положения, составляющие содержание понятия «обратная задача динамики».
Рассмотрим линейную стационарную систему, описываемую уравнением вида:
x a1x a0 x b0u t , |
X0 x 0 , x 0 . |
(2.1) |
Задача заключается в нахождении такого входного сигнала u (t) (оптимального управления), чтобы выходной процесс x(t) совпадал
или был, в известном смысле, близок к некоторой эталонной функ-
ции xэ(t).
Такие задачи часто встречаются на практике. К ним можно отнести задачу управления движением манипуляционных роботов по назначенным траекториям и задачу управления посадкой летательного аппарата. Такой подход используется, например, при проектировании систем нагружения для исследования и испытания машин и механизмов. К таким системам относят системы вибрационных испытаний. При проектировании такого класса систем имеет место обратная задача статистической динамики: необходимо на вход системы вибрационных испытаний подавать случайный сигнал с такими статистическими характеристиками, чтобы на выходе этой системы сигнал, воздействующий на объект, имел заданные (эталонные) статистические параметры. Под «эталонными» здесь понимаются статистические характеристики сигнала, действующего на объект в реальных условиях эксплуатации. Очень важным является достижение адекватности параметров реальным значениям, так как этим обеспечивается безопасная эксплуатация изделия. В задачах испытаний на основе математической обработки исходной информации получают эталонный процесс нагружения xэ(t). Тогда в системе нагру-
21
жения, используемой для испытаний изделия, необходимо построить такое управление u (t), чтобы для физически реализуемого x(t) и эталонного xэ(t) процессов было выполнено условие:

xэ(t) x(t)
min либо 
xэ(t) x(t)
.
Вернемся к уравнению (2.1) и рассмотрим подходы к решению задачи построения u (t). Предположим, что xэ(t) – осуществляе-
мая системой (2.1) траектория. Поскольку |
xэ(t) известно, то, под- |
||||||||
ставляя ее в уравнение (2.1), получим: |
|
|
|
|
|
|
|
||
u(t) b 1 |
x |
(t) a x |
э |
(t) a |
x |
э |
(t) . |
(2.2) |
|
0 |
э |
1 |
|
0 |
|
|
|
||
Последняя формула определяет оптимальное программное управление u (t). Построим систему, работающую по принципу обрат-
ной связи. Пусть для системы вида (2.1) |
xэ(t) имеет вид: |
||||
|
x |
э |
(t) c e 1t c e 2t , |
(2.3) |
|
|
|
1 |
2 |
|
|
где t 0, а 1 и 2 |
известны. |
|
|
||
Постоянные c1 |
и c2 |
находятся |
из условия: |
xэ(0) x(0), |
|
xэ(0) x(0). Подставляя (2.3) в (2.1) вместо x(t), после нескольких
преобразований получим искомое управление u x, x , |
реализую- |
|||||||||||
щее принцип обратной связи: |
|
|
|
|
|
|
|
|||||
|
|
|
u t |
b 1 |
A |
c e 1t A |
2 |
c e 2t |
, |
(2.4) |
||
|
|
|
|
0 |
|
1 |
1 |
2 |
|
|
||
где A |
k |
2 |
a |
a . |
|
|
|
|
|
|
|
|
|
k |
1 k |
0 |
|
|
|
|
|
|
|
|
|
На основе (2.4) можно построить систему, реализующую принцип обратной связи, то есть найти u (t), зависящее от x t и x t .
Имеем:
c1e 1t c2e 2t x(t),
(2.5)
1c1e 1t 2c2e 2t x(t).
22
В формулу (2.4), определяющую u t , входят сомножители
c e 1t и |
c e 2t. Из зависимостей (2.5), представляющих собой ли- |
|||||||||||||
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
нейную |
систему |
алгебраических |
|
уравнений относительно |
c e 1t |
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
и c e 2t |
при условии |
|
2 |
, можно легко получить соотношения: |
||||||||||
2 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
c e 1t |
2 x x ; |
c e 2t 1x x . Подставляя полученные форму- |
||||||||||||
1 |
2 1 |
|
2 |
2 1 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
||||||
лы в выражение (2.4), получим искомое управление u x, x , |
реа- |
|||||||||||||
лизующее принцип обратной связи: u x, x p x p x, |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
||
где p |
2 A 1 1A 2 |
; p |
2 |
|
A 1 A 2 |
. |
|
|||||||
|
|
|
||||||||||||
|
1 |
|
2 1 b0 |
|
|
|
|
2 1 |
b0 |
|
||||
|
|
|
|
|
|
|
|
|
||||||
Из рассмотренных положений ясно, что дифференциальное урав-
нение замкнутой системы должно иметь частные решения вида e kt ,
следовательно, реализовать предписанные требования можно только в том случае, когда с помощью алгоритма управления замкнутой системе придается соответствующая структура, отвечающая виду
назначенной траектории xэ(t), причем замкнутая система принад-
лежит к классу стационарных.
Существуют и другие постановки задач. Иногда вместо xэ(t)
можно задавать эталонную систему. Принципиальная особенность этого направления заключается в том, что искомые законы управления строятся из условия, чтобы замкнутая система была асимптотически устойчивой, а траектория ее движения следовала бы за траекторией движения некоторой системы сравнения.
При таком подходе задача синтеза решается по неполной информации о математической модели объекта, а построенные законы управления обеспечивают выполнение заданных требований при параметрических и координатных возмущениях. Это направление разработано Емельяновым и его сотрудниками. Идея этого направления состоит в следующем.
Объект управления описывается векторно-матричным уравнением вида:
23
X t F X (t), t BU (t), |
X (0) X0 , |
(2.6) |
где X (t) и U (t) – n-мерные векторы координат состояния и управ-
ления. На функцию F наложены известные ограничения: она непрерывна, по X удовлетворяет условию Липшица.
Дифференциальное уравнение первого порядка dy
dx f x, y
имеет решение y y(x), при y x0 y0 , если f x, y |
непрерывна |
|
в некоторой окрестности точки x0 , |
y0 . Кроме модели объекта (2.6), |
|
задается модель системы сравнения |
|
|
X э t GX э t , |
X э 0 X э0 , |
(2.7) |
движение которой соответствует требованиям замкнутой синтезированной системы. Задача заключается в построении закона управления
U X, t , при котором замкнутая система X t F X t , t BU t , X 0 X0 асимптотически устойчива в целом, а траектория X t, X0 ее движения из точки X0 в начало координат X 0 проходит в окрестности траектории X э t, X0 движения системы (2.7) из точки X э0 X0.
2.2. Построение программных управлений движением
Рассмотрим объект, поведение которого описывается уравнением:
X t F X , t U t , |
t 0, T ; |
(2.8) |
или в развернутой форме:
x1 t f1 x1 t , x2 t , , xn t u1 t ,
xn t fn x1 t , x2 t , , xn t un t .
24
Пусть вектор-функция |
X |
э |
t t |
t , |
2 |
t , , |
n |
t T |
– |
|
|
1 |
|
|
|
|
заданная траектория в фазовом пространстве (эталонный процесс). Задача заключается в нахождении такого управления U t , которое обеспечивало бы минимальное расстояние между векторфункциями t и X t . Очевидно, что эта задача относится
к классу обратных задач динамики.
Рассмотрим решение той же задачи для класса нелинейных
объектов, |
описываемых |
(2.8). |
Поскольку Z t X t t , то |
|||
X t Z t |
t , а |
|
|
|
|
|
Z t X |
t t и, следовательно, |
|
||||
|
|
X t F X t , t F X t t , t U t . |
(2.9) |
|||
Для Z t |
имеем уравнение: |
|
|
|||
|
t |
|
|
|
|
(2.10) |
Z |
X t t F |
Z t t , t U t t . |
||||
Прибавим к последнему равенству и вычтем из него функцию F t , t . Результат имеет вид:
Z t F Z t t , t U t t F t , t F t , t . (2.11)
Воспользуемся обозначениями:
FZ Z t , t F Z t t , t F t , t ,
t U t F t , t t .
Тогда имеет место дифференциальное уравнение, определяющее меру близости X t и Y t :
Z t FZ Z t , t t . |
(2.12) |
25
Если объект описывается линейным векторно-матричным дифференциальным уравнением X t A t X t U t , то
FZ Z t , t A t Z t t A t t A t Z t ,t U t A t t t
или в развернутом виде:
|
|
Z t |
|
a |
|
t a |
t |
Z |
t |
|
|
|
||||||||
|
|
|
1 |
|
|
|
11 |
|
|
1n |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Zn t |
|
|
an1 |
t ann t |
Zn |
t |
|
|
(2.13) |
|||||||||
a |
t a |
|
t |
|
t |
t |
|
U t |
||||||||||||
|
11 |
|
|
1n |
|
|
|
|
1 |
|
|
|
1 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
an1 t ann t |
|
n t |
|
|
|
|
Un t |
|
||||||||||||
|
n t |
|
||||||||||||||||||
Зависимость (2.12) является уравнением относительно Z t , оп-
ределяющим меру близости эталонного |
X э t t и реального |
|||
X t процессов на выходе объекта. |
|
|
|
|
В выражении (2.12) |
t – управление, определяющее процесс |
|||
изменения функции Z t . |
|
|
|
|
Предположим: |
|
|
|
|
|
F t , t |
|
t F Xэ t , t . |
(2.14) |
R t t |
X э |
|||
В формулу (2.14) входит только известная функция X э t t , в связи с чем функция R t является известной. Отсюда можно записать:
t R t U t . |
(2.15) |
26
Поскольку, с одной стороны, Z t определяет меру близости реальной траектории X t к эталонному процессу t , с другой стороны, Z t – решение уравнения (2.12), имеющего правую часть
t , то очевидно, что для уменьшения |
Z |
T |
|
|
|
Z t |
|
2 |
|
12 |
|
|
|
||||||||
|
|
|
|
|
|
dt |
не- |
|||
|
|
0 |
|
|
|
|
|
|
|
|
обходимо выбрать управление t |
|
из некоторого класса вектор- |
||||||
T |
|
|
|
t |
|
2 |
|
12 |
|
|
|
||||||
функций так, чтобы величина |
|
|
|
|
|
dt |
имела минималь- |
|
0 |
|
|
|
|
|
|
|
|
ное значение.
Указанная задача минимизации с учетом (2.15) может быть поставлена как:
2 |
T |
R t U t |
|
2 dt min. |
|
|
|
(2.16) |
|||
|
0 |
|
|
|
|
Зависимость (2.16) можно рассматривать как задачу аппроксимации t в пространстве квадратично-интегрируемых вектор-
функций. В самом деле, если Ф t – ортонормированный базис, то выражение (2.16) можно переписать в виде:
|
T |
n |
|
l |
|
2 |
|
|
l2 |
|
ri t CkUl k t |
|
dt min. |
||||
|
|
|||||||
|
0 |
i 1 |
|
k 1 |
|
|
|
CUl |
|
|
|
|
|
|
|
|
k |
Эта задача равносильна следующей: подобрать коэффициенты
CUl , |
k |
|
, |
i |
|
так, чтобы величины |
|
|
|
||
1, l |
1, n |
|
|
|
|||||||
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
T |
|
l |
2 |
(2.17) |
|
|
|
|
|
|
l2i |
ri t CkUi k t |
dt |
||||
|
|
|
|
0 |
|
k 1 |
|
|
|
||
27
принимали наименьшее значение. Такой подход используется в силу того, что выбор CkUi при одном значении i не влияет на выбор их
при других значениях этого индекса.
Если на компоненты вектора управления не наложены ограничения, т. е. имеет место задача безусловной минимизации, то ее решение
определяется зависимостями CkUi |
|
|
T |
|
|
|
t k t dt, i |
|
|
|
|
|
|
|
||||||||||||||||||||
ri |
1, n |
, |
k |
1, l |
. |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
U t |
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Если на компоненты |
|
|
наложены ограничения, |
например |
||||||||||||||||||||||||||||||
Ui max |
|
Ui |
t |
|
0 |
или в общем виде |
|
|
t CU U n, |
t 0, T , то |
||||||||||||||||||||||||
|
|
|
Ф |
|||||||||||||||||||||||||||||||
задача расчета |
CUl , k |
|
, |
|
i |
|
|
|
может быть сформулирована |
|||||||||||||||||||||||||
1, l |
|
1, n |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
как задача математического программирования: |
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
l |
|
|
|
r |
2 |
r |
U |
|
|
|
|
U |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
i |
|
C |
i |
|
min, k 1, l, |
i 1, n. |
|
|
||||||||||||||||||||||
|
|
|
|
C i |
|
2C i C |
k |
|
k |
|
|
|
|
(2.18) |
||||||||||||||||||||
|
|
|
|
k |
k |
|
|
|
|
|
|
|
|
|
U |
|
|
|
|
|||||||||||||||
k 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ck i |
|
|
|
|
|
|
|||||||
l
Ui max CkUi k t 0, t 0, T , i 1, n. (2.19)
k 1
В рассмотренном случае компоненты U t мулой:
l
Ui t Ckui k t , i 1, n.
k 1
определяются фор-
(2.20)
Структурная схема системы управления, U t которой найдены изложенным методом, представлена на рис. 2.1. Заметим, что формулой (2.20) определено оптимальное управление U t , а на структурной схеме представлена система программного правления.
28
Генератор элементов ортонормированного базиса
+
++
…
+
++
Нелинейный объект управления
Рис. 2.1. Структурная схема системы управления
2.3. Синтез регуляторов по методу Колесникова
При аналитическом синтезе законов управления задается функционал качества. Однако при решении многих задач (особенно прикладных) минимизация заданного критерия качества отодвигается на второй план, а предпочтение отдается поиску законов управления, обеспечивающих заданный характер протекания переходных процессов.
При таком подходе интегральный функционал играет роль вспомогательного средства, позволяющего выбрать желаемую экстремаль и формализовать процедуру синтеза оптимальных регуляторов.
Для объектов типа
х(t) f (x,t) (x(t))u(t) |
(2.21) |
29
Колесниковым А. А. предлагается критерий качества строить на основе обобщенного интегрального функционала
|
|
(2.22) |
|
||
J F( , )dt |
||
0 |
|
|
путем выбора соответствующей функции ψ(x) – нелинейной функции, зависящей от управления. Ее выбор определяет требования системы. В общем случае ψ(x) может представлять собой некоторую совокупность нелинейных функций, зависимых от координат состояния и, возможно, управления.
Выбор вида ψ(x) фактически предопределяет требования к динамическим и установившимся режимам синтезируемой системы. Заметим, что в математике многообразие – многомерное обобщение линий и поверхностей без особых точек. Здесь используется термин «притягивающее многообразие». Многообразие ψ(x) = 0 можно интерпретировать как целевое множество (программа движения), на котором синтезируемое оптимальное управление u(x) минимизирует функционал (2.22).
При выборе желаемого «притягивающего многообразия» (программного движения) можно потребовать, чтобы при движении вдоль него к началу координат фазового пространства (x1 = x2 = x3 =...
= xn = 0) минимизировался обобщенный интегральный функционал типа (2.22):
|
|
|
k |
|
2r 1 |
|
2 |
|
2 |
|
2 |
|
|
|
[ |
(m2r 1 |
) |
С |
]dt, (2.23) |
||||||
J1 F(, )dt |
|
|
|
|
|
|||||||
0 |
|
0 |
r 1 |
|
|
|
|
|
|
|
|
|
где ψ(x1, x2,…, xn) – некоторая произвольная непрерывная и дифференцируемая по своим аргументам функция фазовых координат;
m2r 1(r 1,...,k) и С – положительные коэффициенты.
В частном случае, когда r = k = 1, функционал (2.23) упрощается:
|
|
|
2 |
|
2 |
С |
2 |
|
2 |
)dt. |
(2.24) |
|
|
||||||||||
J2 F(, )dt (m1 |
|
|
|
|
|||||||
0 |
|
0 |
|
|
|
|
|
|
|
|
|
Необходимое условие оптимальности: F( , ) F(, ) .
30
