книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdf6.2] НЕПРЕРЫ ВНЫ Е СИСТЕМЫ 181
Теперь можно получить начальное условие у (tQ), исполь зуя уравнение (6.2.12), а потом с помощью (6.2.1) или (6.2.5) в зависимости от ограничений на объем памяти по строить приближение к траектории. Во многих практиче ских задачах идентификации матрица дГ/ду содержит много нулевых элементов, поэтому алгоритмы решения уравне ний (6.2.22) и (6.2.23) можно существенно упростить. Су ществует много вариантов рассматриваемой задачи, в ко торых можно использовать специфику уравнений задачи. Вместо того, чтобы обсуждать эти варианты в рамках общей постановки задачи, рассмотрим один частный случай, в ко тором можно добиться значительного уменьшения объема вычислений.
Предложенный выше алгоритм приводит к серьезным вычислительным трудностям, если система описывается уравнениями высокого порядка. Если рассматривается модель iV-ro порядка, то для того, чтобы из (6.2.22) полу чить Oi+1 (/), необходимо решить 4N2 дифференциальных уравнений. Следует помнить о том, что каждый новый идентифицируемый параметр повышает порядок модели системы по меньшей мере на единицу. Например, систему пятого порядка с пятью неизвестными параметрами можно было бы описать моделью 10-го порядка так, что уравнение (6.2.22) свелось бы к системе 400 дифференциальных уравнений первого порядка. В этом случае трудоем кость процесса вычислений якобиана дТ!ду становится решающей.
Другая трудность состоит в необходимости запомина ния непрерывных наблюдений ъ (t), tf. Дискретные реализации получают с выхода объекта чаще, чем непре рывные. Можно сразу же поставить задачу идентификации как дискретную многоточечную краевую задачу, избежав использования принципа максимума и связанного с этим увеличения размерности. К сожалению, для того, чтобы такая аппроксимация была корректной, необходимо, чтобы входной шум w был пренебрежимо мал, впрочем, это огра ничение не является слишком серьезным и метод может быть достаточно эффективным.
Предположим, что система, как и раньше, описывается системой iVдифференциальных уравнений первого порядка
х (<) = f [х(«)Д]. |
(6.2.28) |
182 |
КВАЗИ ЛИНЕАРИЗАЦИЯ |
1 гЛ . В |
В эту систему по-прежнему входят уравнения для неизвест ных параметров. Сначала предположим, что имеется т ^> N линейных наблюдений с помехой:
z{tj) = |
C{tj)x(tj)+ |
j — 1,2, . . . ,т, (6.2.29) |
где t j ЕЕ U<)> |
//], a v ( t j ) |
— независимые значения шума с |
нулевым средним и дисперсией var {v (г;-)} = Vv (tj). Ос новываясь на этих наблюдениях, желательно найти оценку траектории х (t), t0 -С t <' tj, которая минимизирует сум му средних квадратов невязок, т. е. показатель качества
т |
|
J = 2 II1 (tj) — с (tj) * (tj) low |
(6.2.30) |
3 = 1 |
|
Матрица весов Q может быть произвольной неотрицатель но определенной матрицей, хотя для того, чтобы получить оценку по методу максимума апостериорной вероятности, мы будем часто полагать Q (f;) = Vv (ti). Отметим, что из-за отсутствия входного шума оценка траектории х (t) определяется заданием начального условия х (tQ). Можно считать Q функцией номера итерации г, хотя в книге это не сделано.
Иснова допустим, что начальная оценка траектории х1 (t) известна, необходимо определить новую оценку xi+1(i), которой соответствовало бы меньшее значение функцио нала J. Используя изложенный выше метод с у (t) = х (t)
иf = Г, получим
xi+1 (t) = £2i+1 (t) xm |
(t0) + pi+1 (/). |
(6.2.31) |
Здесь Q1+1 (t) — решение уравнения |
|
|
Q i + l { t ) |
Q i « ( , „ ) = ! , |
( 6 2 _3 2 ) |
a pH1 (t) — решение уравнения |
|
|
Pi+1 (t) = f [x* (t), 11 -----l * (t) - |
Pi+1 (01 (6-2.33) |
|
ox1(t) |
|
|
с начальным условием pi+1 (t0) = 0. Отметим, что на этот раз Q (<) имеет порядок N X N, а не 2N X 2N. Задача
6.2] |
|
|
НЕПРЕРЫ ВНЫ Е |
СИСТЕМЫ |
|
|
183 |
|||
состоит |
в подборе |
такого xi+1 (t.0), |
которое |
минимизирует |
||||||
функционал |
(6.2.30). |
|
(6.2.31) в |
J, получим |
||||||
Если |
подставить x1+1 (t) из |
|||||||||
|
т |
|
|
|
|
|
|
|
|
|
J = |
2 |
и «}) - |
с у,) |
м i i+i (t0) + |
|
т |
fQ((). |
|||
|
3=1 |
|
|
|
|
|
|
|
|
|
Приравняв нулю частную |
производную |
от J |
по xi+1 (t0), |
|||||||
найдем, |
что |
|
|
|
|
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
|
|
{ S & i+1(*i)iT ст (Ь) Q (ti) с ft) |
ft)} i i+i (/„) = |
|
||||||||
£ 7=1 |
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
= S |
[G1+1 № |
C'r(*;•) Q (*i) tz &) - |
C (ti) Pi+1 («;)] • (6.2.34) |
|||||||
i=l |
|
|
|
|
|
|
|
|
|
|
Теперь определим |
|
|
|
|
|
|
|
|||
|
|
|
m |
lfli+1ft)]T CT ft) Q ft) C ft) Q,+1 («,-) (6.2.35) |
||||||
|
M*« = S |
|||||||||
и |
|
|
3=1 |
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
c ft) Pi+1 (^)]. |
|||
Ni+1 = |
2 |
l ^ +1 ft)lT Cr ft) Q ft) [z ft) - |
||||||||
|
|
|
|
|
|
|
|
|
|
(6.2.36) |
В результате уравнение (6.2.34) преобразуется к виду
Mi+V +1 (t0) = |
Ni+\ |
|
|
откуда находим, что |
|
|
|
хш (*„) = [Mi+1]_1 Ni+1. |
(6.2.37) |
||
Зная x1+1 (t0), можно определить |
всю |
траекторию |
xi+1 (t) |
и повторять вычисления, пока очередные приближения не перестанут сильно меняться.
Одна из вычислительных трудностей, связанных с этим методом, состоит в вырождеиности (или плохой обуслов ленности) матрицы Mi+1. Это чаще всего бывает на первых шагах алгоритма, когда очередное приближение к траек тории все еще не является хорошей оценкой решения.
184 |
КВАЗИ Л ИН ЕАРИ ЗАЦ ИЯ |
[ГЛ . 6 |
В некоторых случаях эту трудность можно преодолеть, ис пользуя на первых шагах небольшое число дискретных наблюдений.
Если наблюдения нелинейны, то с помощью квазили неаризации их можно линеаризовать и применить послед ний алгоритм. Рассмотрим нелинейное наблюдение
1 (tj) = h [х (tj), tj] + v (tj). |
(6.2.38) |
Снова предположим, что начальное приближение х* (t) известно. Разложим h [х (tj), tj] в ряд Тейлора в окрест ности х1 (t), тогда с точностью до членов второго порядка малости получим
г (tj) — h [х1 (tj), tj] -f- |
[X1+l (tj)-xi(tj)] |
+ V (tj). |
|
Введем следующие обозначения: |
|
|
|
z' (tj) = z (tj) — h [x{ (tj), tjI + |
Cl (tj) xl (tj), |
(6.2.39) |
|
где |
f t * ( 9 , |
|
|
d h |
t .] |
(6.2.40) |
|
G(tj) = |
aii (tp |
|
|
|
|
|
|
Тогда нелинейное наблюдение можно записать в линеари зованной форме:
ъ' (tj) = С1 (tj) xi+1(tj) + v (tj). |
(6.2.41) |
Таким образом, для решения задачи с нелинейными на блюдениями можно использовать последний алгоритм, если заменить z (tj) на z' (tj) и С (tj) на С1 (tj).
Смысл преобразований состоит в том, что неквадрати ческая функция штрафа
т
J = 2 IIz (tj) — h Iх (Ь)’ Ы Iq(^) |
(6.2.42) |
||
j=i |
|
|
|
заменяется квадратической |
|
|
|
т |
|
dh [x* (tj),tj] |
|
т = 2 IIz (W — h Iх* |
|
|
|
— |
[xI+1№ ) - |
|
|
j=l |
m |
dkl (t.) |
|
|
|
|
|
- x* (W llh = 2 II *' (tj) - C1 (tj) xl+1 (tj) ||Ц>, (6.2.43)
6.2] |
НЕПРЕРЫ ВНЫ Е СИСТЕМЫ |
185 |
к которой и применяется последний алгоритм квазилинеа ризации.
В этом разделе метод квазилинеаризации применяется для решения задач идентификации непрерывных систем. В дальнейшем те же методы распространяются на дискрет ные системы. С точки зрения практических приложений интересные задачи часто оказываются промежуточными
Рис. 6.2.1. Блок-схема системы; пример 6.2.1.
между дискретными и непрерывными. Во всяком случае обычно реализации наблюдаемых сигналов дискретны по времени, а модели систем чаще всего непрерывны.
Пример 6.2.1. Рассмотрим систему, изображенную на рис. 6.2.1. Модель системы имеет вид
х = А (0 х - f u (t),
где из физической природы объекта известно, что
Г x i (f) I |
|
Г |
О |
“I |
X ^ = U s ( * ) J ’ |
“ ^ |
= L s i n |
( 0 , 8 nt) J ’ |
|
0 |
|
1 |
|
|
— 4 |
— |
(а + b s in |
t) |
|
Необходимо выбрать такие значения параметров а и Ь, чтобы отклик модели был близок к отклику реальной ди намической системы. Для решения этой задачи восполь зуемся методом квазилинеаризации. Запишем расширенную
186 |
КВАЗЙЛИЙЕАРЙЗЛЦЙЙ |
[йл. 6 |
систему уравнений:
К= х 2 (О ,
х2 = — 4хх (О — х3 (<) х2 (О + sin (0,8 nt),
Х3 = Xi (г),
i 4 = x6 (0 — % (0,
h = 0.
Линеаризуя эту систему относительно траектории xN для (N -f- 1)-го приближения, получим следующую линейную систему дифференциальных уравнений с переменными коэффициентами:
Y(*) = B(f)Y(f) + r(f),
< |
+1 (0 |
|
|
0 |
|
|
|
|
|||
|
|
|
|
|
(t) £% (1) -f- sin (0 ,8 nt) |
< |
+ 1 (0 |
. |
г (t) = |
0 |
|
^ |
+1 |
(0 |
|
|
0 |
*5N+1 |
(0 |
|
|
0 |
|
0 |
1 |
0 |
0 0 - |
|
- 4 |
— x ^ (t) |
— x % ( t ) |
О |
О |
0 |
0 |
0 |
1 |
0 |
О |
0 |
— 1 |
0 |
1. |
Интервал наблюдения был выбран равным 10 сек. Имеется 10 равноотстоящих измерений отклика реальной системы,
|
10 |
так |
что / = 2 [*i (t) — Xi (<)12Решение быстро сходит- |
ся |
i=i |
к значениям |
хь (0) = й = 3,999989, х4 (0) = £ = 2,000535.
На самом деле параметры объекта имеют следующие зна чения:
а = 4, 000000, Ъ = 2,000000.
6.2] |
НЕПРЕРЫ ВНЫ Е СИСТЕМЫ |
187 |
Сопоставление этих результатов дает возможность судить о точности метода. Отметим, что в этом примере потребова лась большая априорная информация об объекте. Кроме того, переменные коэффициенты должны были удовлетво рять простым дифференциальным уравнениям.
Теперь будут исследованы более общие способы иден тификации нестационарных систем. Система описывается уравнением вида
х = f [x(f),u(<),p(0,<],
которое для небольших интервалов времени можно аппрок симировать уравнением
y = g [y (0 .u (0 .b>*]•
Затем на каждом из этих небольших интервалов вре мени идентифицируется постоянный вектор параметров Ь. Объем вычислений можно уменьшить, используя ре зультаты вычислений для определения текущего значе ния Ь.
Система, изображенная на рис. 6.2.1, была идентифи цирована с использованием такого «следящего» метода. Система описывается следующими уравнениями:
•^1 ~ $2i
х2 — — 4^! — ах2 + sin (0,8 nt).
Параметр а предполагается неизменяющимся для времен ных интервалов продолжительностью 0,1 сек. Соответству ющее дифференциальное уравнение
а = 0
добавляется к основным уравнениям модели, полученная система третьего порядка линеаризуется относительно траектории (xN, aN), что приводит к дифференциальному уравнению для следующего, (N + 1)-го приближения к истинной траектории
z (0 = B(t)z{t) + г (t),
188 КВАЗИ ЛИН ЕАРИ ЗАЦИЯ [ГЛ . 6
где |
■ |
|
|
В |
|
- |
|
|
|
0 |
|||
*(*) = |
*N+1 |
> |
Г (t) = |
хз |
-f |
sin (0,8nt) |
Х2 |
||||||
|
L л/V+l |
J |
|
1 |
0 |
■ |
|
|
~ |
0 |
0 |
||
|
в (0 |
= |
- 4 - |
i N |
|
|
|
|
хз |
0 |
|
||
|
|
|
0 |
0 |
|
Алгоритм квазилинеаризации применяется к этой системе на временных промежутках вида (тДт Д- 0, 1), где г — 0; 0,1; 0,2; ... ; 10. Результаты идентификации сравниваются
Время
Рис. 6.2.2. Оценивание параметра a (t) (-------- истинное значение,
— о — о — квазилинеаризованная оценка).
с истинным значением параметра a(t) на графике, изобра женном на рис. 6.2.2. На графиках рис. 6.2.3 сопоставля ются отклики модели и системы.
Для широкого класса систем параметры обычно ста ционарной природы подвержены внешним случайным возмущениям вроде порывов ветра, колебаний нагрузки и т. п. Для того чтобы учесть эти возмущения, можно вос пользоваться квазилинеаризацией. Рассмотрим линейную систему второго порядка, у которой один параметр чувст вителен к внешним возмущениям. Возмущение появляется
вмомент времени t0. Запись процесса изображена на рис.
6.2.4.С помощью изложенного выше метода слежения по записям реализаций определяются изменения параметра.
6.2] |
НЕПРЕРЫ ВНЫ Е СИСТЕМЫ |
180 |
Рис. 6.2.3. Отклик нестационарной системы (— о — 0 — истинное значение, — х — х оценка).
Рис. 6.2.4. Запись сигналов системы второго порядка со скачко образно меняющимся параметром а.
190 |
КВАЗИЛИНЕАРИЗАЦИЯ |
[ГЛ. 6 |
Получены прекрасные результаты, которые отражены на рис. 6.2.5. Интересно оценить предельные возможности по детектированию резких изменений параметров. Рассмат риваемая система подвержена влиянию резко меняющихся
Рис. 6.2,5. Изменение параметра (-------- |
истинное значение, ооо |
оценка) |
|
Рис. 6.2.6. Исследование резких изменений (-------- |
истинное зна |
чение, ооо оценка). |
|
возмущений и соответствующие изменения параметра опи сываются последовательностью прямоугольных импульсов переменной ширины, изображенных на рис. 6.2.6. Из ри сунка видно, что возмущения, длительность которых сос тавляет около 2 сек., вызывают хорошо заметные измене ния параметра.
