книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие
.pdfОтметим некоторые свойства многомерных передаточных функций [2-10].
1. Для разделимого ядра (2-65) справедливо
к
(2-71)
(свойство разделимости).
2.Если одномерная нелинейная система (НС) описывает
ся многомерной передаточной функцией gh(pi, р*) и ли
нейная система (ЛС) — передаточной функцией /г(р), то многомерная передаточная функция:
а) последовательного соединения «ЛС—НС» равна
к
wk(Pu •■>Pk) = gk(l> l,-, Рк) ■П h (Pi< i-1
6) последовательного соединения «НС—ЛС» равна
Щ(Ръ ... . |
Рк) = gkiP i...... рк) ■Л (Pi + • • • + р„) |
Связь между передаточными функциями wk и дифферен
циальным уравнением установлена только для случая, когда последнее имеет вид (2-66) [2-10, 2-11].
Г л а в а 3
ИДЕНТИФИКАЦИЯ УПРАВЛЯЕМЫХ СИСТЕМ
Чтобы иметь возможность понимать и управлять предметами, необходимо из мерять их количественно.
[У. Том сон ( К ел ьви н )]
Сформулированная во введении задача идентификации как задача экспериментального определения характеристик связи между переменными в этой главе несколько сужается, и рассматривается задача определения характеристик «вход— выход», причем структура их обычно задается заранее.
Дело в том, что методы экспериментального определения структуры связи между переменными (например, структуры дифференциальных уравнений) разработаны недостаточно. Это объясняется тем, что, с одной стороны, в этом часто нет необходимости, так как для многих управляемых систем структура связи известна; с другой стороны, обычно можно выбрать такую структуру, чтобы получаемая модель была сколь угодной точной. Такой универсальной структурой для безынерционных систем е непрерывной зависимостью меж ду переменными (гладких) и без гистерезиса является поли номиальная, аналогичная структуре ряда Тейлора для разло жения непрерывных функций. Для динамических (инерци онных) систем с этой же целью часто применяют разложе ния в ряды по подходящим (т. е. учитывающим специфику данной системы) функциям, обычно ортогональным. Выбор структуры модели или подходящей системы функций для ее аппроксимации основывается на результатах предваритель ного аналитического исследования процессов в объекте, вы явления связей между переменными и ограничений на них, а также на предварительном упрощении получаемых зависи мостей. Эту совокупность приемов, предшествующую полу чению окончательной экспериментальной модели, можно назвать априорной идентификацией. Исторически под
92
собственно идентификацией первоначально понималось ста тистическое определение динамических характеристик си стем по данным их нормального функционирования (экс плуатации). В дальнейшем сюда стали относить также оп ределение статических характеристики и определение харак теристик при подаче на объект специальных пробных сиг налов (активные методы). Оказалось, что идентификация пассивными методами часто является некорректной задачей,
поскольку небольшие ошибки при обработке данных нор мальной эксплуатации могут привести к большим погрешно стям в решении, т. е. в искомых параметрах операторов свя зи. Для регуляризации задачи используют специальные меры, среди которых наиболее эффективны активные методы иден
тификации. Хотя за счет выбора уровня пробных сигналов эксплуатация системы не нарушается, очевидно, такие мето ды применимы лишь для идентификации каналов управле ния.
Из практических задач, сопутствующих идентификации и связанных с упрощением получаемой модели, не рассмат риваются задачи выявления существенных воздействий, оценки степени нелинейности системы и др.
§ 3-1. Априорная идентификация
На практике подход к объекту как «черному ящику» с воздействиями в виде «белых шумов» обычно неоправдан. Очевидно, всякая априорная информация об объекте и воз действиях должна быть максимально использована. В на стоящее время осталось мало систем, механизм процессов в которых был бы полностью неизвестен. Поэтому априорную идентификацию начинают с формулировки законов приро ды, определяющих протекание процессов в системе. К тако вым относятся законы сохранения (массы, энергии, импуль
са) и вариационные принципы (см. эпиграф гл. 2), а также связи между переменными. По своему характеру законы природы приводят к дифференциальным уравнениям отно сительно переменных состояния. Ввиду большой сложности такие уравнения упрощают: линеаризуют в интересующем нас диапазоне изменения переменных; отбрасывают воздей ствия, вызывающие малые эффекты в интересующих нас пе ременных; постоянные эффекты, обусловленные малоизменяющимися переменными, учитывают постоянными (средни ми) коэффициентами, а переменные эффекты, обусловлен
93
ные колебаниями относительно средних значений, нормали зуют и т. д. С учетом действительного характера изменения
переменных и цели |
управления (стабилизация или |
перевод |
в другое состояние) |
далее строят аналитическую |
модель |
объекта, которая может быть статической, если для объекта характерен статический режим функционирования, динами ческой или смешанного типа. Хотя статические модели мо
гут быть получены из динамических, однако на практике в статической модели нас обычно интересуют нелинейные эф фекты (например, в экстремальных системах), в то время как в динамической модели ими часто пренебрегают. Если характер возмущений (динамический и частотный диапазо ны) заранее неизвестен или эффект от возмущений на вы ходе трудно оценить, переходят к предварительному иссле дованию реального объекта, целью которого является уточ нение типа модели и количества учитываемых в ней воздей ствий. Удобно провести следующую классификацию объек тов в режиме нормального функционирования.
Обозначим значительное изменение любой переменной объекта на достаточно большом интервале времени, соизме римом со временем переходных процессов, через 1, а незна чительное — 0 (определения «значительного изменения» и «достаточного времени» даются специалистами, формулиру ющими цель управления и критерий оптимальности). При мем для переменных объекта, которые могут фигурировать в уравнениях связи, порядок записи Z, U, у (здесь у — ска
лярный выход объекта, поскольку выходные переменные можно рассматривать независимо друг от друга, что обосно вано при построении линейных моделей). Например, запись 111 означает, что на данном интервале времени данная вы ходная переменная изменяется значительно при значитель ном изменении хотя бы одного управления и возмущения. Таким образом, по характеру изменения контролируемых переменных объекты можно разделить на следующие восемь классов: 000, 001, ..., 111.
Рассмотрим указанные классы более подробно, имея в виду, что данные предварительного исследования далее учи тываются при выборе метода и схемы идентификации, ко торая в свою очередь является лишь этапом при оптимиза ции системы.
Объекты класса 000 характеризуются незначительным из менением всех переменных (статический режим). Оптималь ное управление объектами этого класса возможно за счет
94
подбора такой совокупности управлений, которая обеспечит новый статический режим, лучший в определенном смысле, чем старый. В связи с этим для данного класса объектов мо гут представить интерес лишь статические характеристики канала управления, имея в виду, что оптимизация таких объектов может быть проведена и без идентификации мето дами планирования экстремальных экспериментов.
Объекты класса 001 характеризуются динамическим ре жимом функционирования и значительным влиянием некон тролируемых возмущений на выход. Требуется идентифика ция канала управления.
Объекты класса 010 характеризуются нечувствительно стью выхода к управлению в данном режиме, за исключе нием случая, когда управление компенсирует неконтролируе мые возмущения и стабилизирует выход (этот случай вы является в режиме стабилизации управления). Нечувстви тельность, которая характерна для экстремальных режимов или насыщения, может быть выявлена при изменении уров ня управления. В этом случае требуется идентификация ста тики канала управления, как и для объектов класса 000.
Объекты класса 011 требуют дополнительного исследо вания влияния неконтролируемых возмущений путем стаби лизации управления. При получении режима 001 требуется идентификация канала управления. Получение режима 000 свидетельствует о незначительном влиянии неконтролируе мых возмущений.
Объекты класса 100 характеризуются статическим режи мом функционирования и незначительным влиянием возму щений. Возможности оптимального управления и идентифи кация, как у класса 000.
Объекты класса 101 характеризуются значительным влия нием возмущений на выход. Для суждения о значимости влияния неконтролируемых возмущений требуется прово дить идентификацию канала контролируемых возмущений. В то же время для оптимизации таких объектов требуется идентификация канала управления. Следовательно, нужна идентификация всех каналов объекта.
Объекты класса 110 требуют дополнительного исследо вания влияния входных воздействий на выход путем стаби лизации управления, как и объекты 010.
Объекты 111 требуют дополнительного исследования влияния входных воздействий, в том числе и неконтролируе
95
мых, на выход. Необходима идентификация всех каналов объекта.
Результаты предварительного исследования позволяют выявить не только'объем идентификации, но и провести вы бор типа системы управления (с управлением программным, по возмущению, с обратной связью или комбинированным).
Идентификация канала управления с учетом заданного критерия оптимальности позволяет уточнить вид оптимиза ции (статической, динамической).
Прежде чем рассмотреть конкретные методы идентифи кации, выясним условия, когда она возможна в принципе. Следуя [3-2], рассмотрим для простоты случай автономной системы без помех измерения:
|
| |
ф + 1 ]= М Й , Х[0]=Х„, * = 0, 1, ... |
|
|
||
|
1 |
щ |
= г в д |
|
|
|
где А, |
Г — матрицы размеров соответственно |
(пХп), |
(qXn), |
|||
X, |
Y -г- вектора соответственно состояния и выхода |
си |
||||
стемы. |
Систему назовем идентифицируемой |
по состоянию |
||||
(или по выходу), |
если можно определить А (или Л и Г) |
по |
||||
средством измерения X (или К). Легко получить |
условия |
идентифицируемости по состоянию. В самом деле, проведем п измерений состояния (при Хо=ЛО) и запишем систему уравнений относительно А:
X(l]=AX[0i],
|
Х [п]= АХ [п- 1]=Л"Я[0]. |
|
|
Система имеет |
единственное |
решение, если |
матрица |
идентифицируемости, в данном случае |
|
||
// = |
1Х[0|:Л[Ц;... |
\Х[п- 1]] = |
|
|
= [Х0;ЛХ0|... |
!Л— Х0] |
(3-1) |
является неособенной, т. е. не имеет линейно-зависимых столбцов (строк). Физически это означает, что начальное условие Х0 должно возбуждать в системе все собственные колебания. Легко показать {3-2], что необходимым и доста точным условием идентифицируемости по выходу является идентифицируемость по состоянию и наблюдаемость.
На практике наибольший интерес представляет иденти фикация неавтономных систем при наличии помех. Необхо димые и достаточные условия идентифицируемости таких
96
систем заключаются в том, чтобы любое входное воздейст вие возбуждало в системе все собственные колебания (одно временно или поочередно), и при этом они могли быть на блюдаемы. Таким образом, помимо управляемости и наблю даемости системы, являющихся внутренними свойствами системы, при идентификации встают условия и к внешним воздействиям. Наибольшие проблемы при идентификации создают помехи измерений и эффекты от неучтенных внеш них воздействий, которые могут быть восприняты как про явление внутренних свойств, которыми данная система не обладает.
§ 3-2. Корреляционный метод
Рассмотрим многомерный объект с входными воздейст виями ( V\ ( t ) , .... v ,( i)) T= V (t) и выходной переменный //(/),
связь между которыми дается оператором /':
у(/) = /ЧУ(т), -
где t — момент времени наблюдения. Переменные K(f), y(t)
в общем случае являются случайными процессами. Требует-
Рис 3-1 К постановке задачи идентификации
ся найти по известным на некотором интервале времени реа
лизациям y (t), V(0 оценку оператора |
F (модель объекта). |
|
О близости F к F можно судить лишь по близости выходов |
||
модели и объекта при заданном V(t) |
(рис. 3-1) |
|
F -*■ F |
при (у(0П /(т), — |
* |
- |
y ( o i m |
|
7—1303 |
97 |
|
Широко применяют бейесовы критерии идентификации в форме условия минимума среднего риска:
М { 1 (у,у))-+ min, |
(3-2) |
А
F
где / — функция потерь.
Алгоритмы идентификации, дающие y(t) при заданном V(t) в соответствии с (3-2), называют бейесовыми решения
ми. К числу указанных относятся:
критерий среднеквадратичной ошибки (СКО)
М {е*\= М Ц у\У -у\У У У , |
(.3-3) |
критерий среднего модуля ошибки
M{\e\)~M{\y\V-y\V\) (3-4)
и другие. На практике нашли также применение критерии среднеквадратичной временной ошибки (СКВО)
|
т |
|
Мт {е*} = lim - L |
Гe*(t)dt, |
(3-5) |
Т-*оо Л |
J |
|
|
- Г |
|
квадратичной взвешенной ошибки, относительной ошибки и
ДР- |
г п |
Показано (3-1J, что все статистические критерии, использу ющие симметричную неубывающую функцию потерь от раз ностимежду выходами объекта и модели, цринормальных воздействиях и помехах приводят к одной и той же опти мальной модели, которая является линейной (даже при не линейном объекте!) и определяется по критерию (3-3) (или по (3-5) для эргодических процессов). Поскольку нормаль ное распределение часто встречается на практике, критерий (3-3) нашел большое применение.
Помимо бейесовых критериев, применяют иные крите рии: максимум функции правдоподобия (обычно условной плотности вероятности р{у\ V), связывающей величину у и
выборочные измерения V), минимаксные критерии и др. Од нако оказывается, что при гауссовых воздействиях оценки, найденные по указанным критериям, совпадают с оценкой по критерию СКО (3-1, 3-2].
98
\r |
|
,, ,v d H;«*} |
n |
приводит |
|
Условие минимума величины |
(3 -3)------- |
— —ч |
|||
|
|
d y |
|
|
|
к выражению для оценки оператора в виде |
|
|
|
||
i( t ) |
= F{V(-.), - |
|
= |
|
|
= |
M{y((}\V(-:), - |
x 3 < T <t ) , |
|
(3-rt) |
где M{y\V) — условное математическое ожидание (регрес
сия) выходной переменной относительно входного воздей ствия. Следовательно, оптимальный оператор модели совпа
дает с оператором регрессии. Получим явное выражение для
/ч
/', если будем искать модель в классе линейных, |
для которых |
|||||||
по принципу суперпозиции можно записать |
|
|
||||||
S (о = Н о л * ) * |
••••м*)} |
Г |
2 |
tr’/(х)>. —* |
< т < |
|
||
= 2 |
t, |
|||||||
|
|
|
I I |
|
|
|
|
|
где Fj —оператор |
/'-го канала модели |
|
(между |
/-ым входом |
||||
и выходом). В этом случае из тождественного |
(З-б) |
выра |
||||||
жения |
|
|
|
|
|
|
|
|
л* {2 (и/(т)> (»)} |
=“ Л* |
(V(^) 11’(■=)) ■»/С®». |
|
г , |
||||
получаем |
|
|
|
|
|
|
|
|
|
Г |
|
|
|
|
|
|
|
1 =| |
(М (1>, (т) • r>,(s)|) |
- |
|
|
||||
|
|
|
|
|
|
|
||
= М {y(t) |
■t>f (s>), |
/ —1, |
— |
. |
г , s < |
t , |
(3-7) |
причем в последнем выражении использовано свойство ком-
А
Мутативности линейных операторов Ft с оператора матема
тического ожидания.
Если процессы t » i ( / ) , ..., v,(t), y(t) имеют нулевое сред
нее, то средние произведения в (3-7) представляют собой корреляционные функции:
Г
2 ^ { Л : у 7(-. |
= |
*), |
|
|
/, I |
|
|
|
|
/ - 1, |
г, |
— *><s < т <t . |
(3-8) |
7*
99
Рассмотрим практически важный случай, когда воздейст вия V \ ( t ) , ..., vr(t) некоррелированы между собой:
Rv.v/Ь, s) = О для / ф t. |
(3-9) |
В этом случае из (3-8) получаем
{Rv; (*, з), — оо <s < t < /} =
= Ryv.(t,s), f = l ........ |
t . |
(3-10) |
Учитывая, что оператор во временной области имеет вид интегрального преобразования (типа свертки), ядром кото рого является импульсная характеристика (см. § 2-3), полу чаем окончательно
t |
|
R u v. ( t , s ) = J w( (tr .)R V;(T ,s)fc, / = 1......... |
r. (3-11) |
—00
Вчастности, для стационарного объекта при эргодических воздействиях, когда корреляционные функции и им пульсная характеристика зависят лишь от разности аргумен
тов ('&=t—s, k = i—т), для нахождения оценок импульсных
характеристик модели получаем известное в теории иденти фикации уравнение Винера—Хопфа
|
00 |
|
|
|
Ryvt (fi) = |
J щ (X) Rv. (0 — X) |
l = |
1, ..., r. |
(3-12) |
|
о |
|
|
|
Если идентифицируемый объект имеет конечное время |
||||
памяти Тп и, следовательно, |
|
|
|
|
y{t) = F{V(x), t - T n <x<t}, |
(3-13) |
|||
то уравнение (3-12) примет вид |
|
|
|
|
|
/V |
|
|
|
|
тп |
|
|
|
RUV{(d) = |
j* w t (X) RV[(0 - X)dX, |
t = |
1........ г, |
(3-14) |
О
Л
где оценка времени памяти Тп для модели должна быть выб-
А
рана из условия Та^ Т п. Уравнения (3-14) решают на вы
100