Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги из ГПНТБ / Егоров С.В. Элементы идентификации и оптимизации управляемых систем учеб. пособие

.pdf
Скачиваний:
5
Добавлен:
24.10.2023
Размер:
9.47 Mб
Скачать

Отметим некоторые свойства многомерных передаточных функций [2-10].

1. Для разделимого ядра (2-65) справедливо

к

(2-71)

(свойство разделимости).

2.Если одномерная нелинейная система (НС) описывает­

ся многомерной передаточной функцией gh(pi, р*) и ли­

нейная система (ЛС) — передаточной функцией /г(р), то многомерная передаточная функция:

а) последовательного соединения «ЛС—НС» равна

к

wk(Pu •■>Pk) = gk(l> l,-, Рк) ■П h (Pi< i-1

6) последовательного соединения «НС—ЛС» равна

Щ(Ръ ... .

Рк) = gkiP i...... рк) ■Л (Pi + • • • + р„)

Связь между передаточными функциями wk и дифферен­

циальным уравнением установлена только для случая, когда последнее имеет вид (2-66) [2-10, 2-11].

Г л а в а 3

ИДЕНТИФИКАЦИЯ УПРАВЛЯЕМЫХ СИСТЕМ

Чтобы иметь возможность понимать и управлять предметами, необходимо из­ мерять их количественно.

[У. Том сон ( К ел ьви н )]

Сформулированная во введении задача идентификации как задача экспериментального определения характеристик связи между переменными в этой главе несколько сужается, и рассматривается задача определения характеристик «вход— выход», причем структура их обычно задается заранее.

Дело в том, что методы экспериментального определения структуры связи между переменными (например, структуры дифференциальных уравнений) разработаны недостаточно. Это объясняется тем, что, с одной стороны, в этом часто нет необходимости, так как для многих управляемых систем структура связи известна; с другой стороны, обычно можно выбрать такую структуру, чтобы получаемая модель была сколь угодной точной. Такой универсальной структурой для безынерционных систем е непрерывной зависимостью меж­ ду переменными (гладких) и без гистерезиса является поли­ номиальная, аналогичная структуре ряда Тейлора для разло­ жения непрерывных функций. Для динамических (инерци­ онных) систем с этой же целью часто применяют разложе­ ния в ряды по подходящим (т. е. учитывающим специфику данной системы) функциям, обычно ортогональным. Выбор структуры модели или подходящей системы функций для ее аппроксимации основывается на результатах предваритель­ ного аналитического исследования процессов в объекте, вы­ явления связей между переменными и ограничений на них, а также на предварительном упрощении получаемых зависи­ мостей. Эту совокупность приемов, предшествующую полу­ чению окончательной экспериментальной модели, можно назвать априорной идентификацией. Исторически под

92

собственно идентификацией первоначально понималось ста­ тистическое определение динамических характеристик си­ стем по данным их нормального функционирования (экс­ плуатации). В дальнейшем сюда стали относить также оп­ ределение статических характеристики и определение харак­ теристик при подаче на объект специальных пробных сиг­ налов (активные методы). Оказалось, что идентификация пассивными методами часто является некорректной задачей,

поскольку небольшие ошибки при обработке данных нор­ мальной эксплуатации могут привести к большим погрешно­ стям в решении, т. е. в искомых параметрах операторов свя­ зи. Для регуляризации задачи используют специальные меры, среди которых наиболее эффективны активные методы иден­

тификации. Хотя за счет выбора уровня пробных сигналов эксплуатация системы не нарушается, очевидно, такие мето­ ды применимы лишь для идентификации каналов управле­ ния.

Из практических задач, сопутствующих идентификации и связанных с упрощением получаемой модели, не рассмат­ риваются задачи выявления существенных воздействий, оценки степени нелинейности системы и др.

§ 3-1. Априорная идентификация

На практике подход к объекту как «черному ящику» с воздействиями в виде «белых шумов» обычно неоправдан. Очевидно, всякая априорная информация об объекте и воз­ действиях должна быть максимально использована. В на­ стоящее время осталось мало систем, механизм процессов в которых был бы полностью неизвестен. Поэтому априорную идентификацию начинают с формулировки законов приро­ ды, определяющих протекание процессов в системе. К тако­ вым относятся законы сохранения (массы, энергии, импуль­

са) и вариационные принципы (см. эпиграф гл. 2), а также связи между переменными. По своему характеру законы природы приводят к дифференциальным уравнениям отно­ сительно переменных состояния. Ввиду большой сложности такие уравнения упрощают: линеаризуют в интересующем нас диапазоне изменения переменных; отбрасывают воздей­ ствия, вызывающие малые эффекты в интересующих нас пе­ ременных; постоянные эффекты, обусловленные малоизменяющимися переменными, учитывают постоянными (средни­ ми) коэффициентами, а переменные эффекты, обусловлен­

93

ные колебаниями относительно средних значений, нормали­ зуют и т. д. С учетом действительного характера изменения

переменных и цели

управления (стабилизация или

перевод

в другое состояние)

далее строят аналитическую

модель

объекта, которая может быть статической, если для объекта характерен статический режим функционирования, динами­ ческой или смешанного типа. Хотя статические модели мо­

гут быть получены из динамических, однако на практике в статической модели нас обычно интересуют нелинейные эф­ фекты (например, в экстремальных системах), в то время как в динамической модели ими часто пренебрегают. Если характер возмущений (динамический и частотный диапазо­ ны) заранее неизвестен или эффект от возмущений на вы­ ходе трудно оценить, переходят к предварительному иссле­ дованию реального объекта, целью которого является уточ­ нение типа модели и количества учитываемых в ней воздей­ ствий. Удобно провести следующую классификацию объек­ тов в режиме нормального функционирования.

Обозначим значительное изменение любой переменной объекта на достаточно большом интервале времени, соизме­ римом со временем переходных процессов, через 1, а незна­ чительное — 0 (определения «значительного изменения» и «достаточного времени» даются специалистами, формулиру­ ющими цель управления и критерий оптимальности). При­ мем для переменных объекта, которые могут фигурировать в уравнениях связи, порядок записи Z, U, у (здесь у — ска­

лярный выход объекта, поскольку выходные переменные можно рассматривать независимо друг от друга, что обосно­ вано при построении линейных моделей). Например, запись 111 означает, что на данном интервале времени данная вы­ ходная переменная изменяется значительно при значитель­ ном изменении хотя бы одного управления и возмущения. Таким образом, по характеру изменения контролируемых переменных объекты можно разделить на следующие восемь классов: 000, 001, ..., 111.

Рассмотрим указанные классы более подробно, имея в виду, что данные предварительного исследования далее учи­ тываются при выборе метода и схемы идентификации, ко­ торая в свою очередь является лишь этапом при оптимиза­ ции системы.

Объекты класса 000 характеризуются незначительным из­ менением всех переменных (статический режим). Оптималь­ ное управление объектами этого класса возможно за счет

94

подбора такой совокупности управлений, которая обеспечит новый статический режим, лучший в определенном смысле, чем старый. В связи с этим для данного класса объектов мо­ гут представить интерес лишь статические характеристики канала управления, имея в виду, что оптимизация таких объектов может быть проведена и без идентификации мето­ дами планирования экстремальных экспериментов.

Объекты класса 001 характеризуются динамическим ре­ жимом функционирования и значительным влиянием некон­ тролируемых возмущений на выход. Требуется идентифика­ ция канала управления.

Объекты класса 010 характеризуются нечувствительно­ стью выхода к управлению в данном режиме, за исключе­ нием случая, когда управление компенсирует неконтролируе­ мые возмущения и стабилизирует выход (этот случай вы­ является в режиме стабилизации управления). Нечувстви­ тельность, которая характерна для экстремальных режимов или насыщения, может быть выявлена при изменении уров­ ня управления. В этом случае требуется идентификация ста­ тики канала управления, как и для объектов класса 000.

Объекты класса 011 требуют дополнительного исследо­ вания влияния неконтролируемых возмущений путем стаби­ лизации управления. При получении режима 001 требуется идентификация канала управления. Получение режима 000 свидетельствует о незначительном влиянии неконтролируе­ мых возмущений.

Объекты класса 100 характеризуются статическим режи­ мом функционирования и незначительным влиянием возму­ щений. Возможности оптимального управления и идентифи­ кация, как у класса 000.

Объекты класса 101 характеризуются значительным влия­ нием возмущений на выход. Для суждения о значимости влияния неконтролируемых возмущений требуется прово­ дить идентификацию канала контролируемых возмущений. В то же время для оптимизации таких объектов требуется идентификация канала управления. Следовательно, нужна идентификация всех каналов объекта.

Объекты класса 110 требуют дополнительного исследо­ вания влияния входных воздействий на выход путем стаби­ лизации управления, как и объекты 010.

Объекты 111 требуют дополнительного исследования влияния входных воздействий, в том числе и неконтролируе­

95

мых, на выход. Необходима идентификация всех каналов объекта.

Результаты предварительного исследования позволяют выявить не только'объем идентификации, но и провести вы­ бор типа системы управления (с управлением программным, по возмущению, с обратной связью или комбинированным).

Идентификация канала управления с учетом заданного критерия оптимальности позволяет уточнить вид оптимиза­ ции (статической, динамической).

Прежде чем рассмотреть конкретные методы идентифи­ кации, выясним условия, когда она возможна в принципе. Следуя [3-2], рассмотрим для простоты случай автономной системы без помех измерения:

 

|

ф + 1 ]= М Й , Х[0]=Х„, * = 0, 1, ...

 

 

 

1

щ

= г в д

 

 

 

где А,

Г — матрицы размеров соответственно

(пХп),

(qXn),

X,

Y -г- вектора соответственно состояния и выхода

си­

стемы.

Систему назовем идентифицируемой

по состоянию

(или по выходу),

если можно определить А (или Л и Г)

по­

средством измерения X (или К). Легко получить

условия

идентифицируемости по состоянию. В самом деле, проведем п измерений состояния (при Хо=ЛО) и запишем систему уравнений относительно А:

X(l]=AX[0i],

 

Х [п]= АХ [п- 1]=Л"Я[0].

 

Система имеет

единственное

решение, если

матрица

идентифицируемости, в данном случае

 

// =

1Х[0|:Л[Ц;...

\Х[п- 1]] =

 

 

= [Х0;ЛХ0|...

!Л— Х0]

(3-1)

является неособенной, т. е. не имеет линейно-зависимых столбцов (строк). Физически это означает, что начальное условие Х0 должно возбуждать в системе все собственные колебания. Легко показать {3-2], что необходимым и доста­ точным условием идентифицируемости по выходу является идентифицируемость по состоянию и наблюдаемость.

На практике наибольший интерес представляет иденти­ фикация неавтономных систем при наличии помех. Необхо­ димые и достаточные условия идентифицируемости таких

96

систем заключаются в том, чтобы любое входное воздейст­ вие возбуждало в системе все собственные колебания (одно­ временно или поочередно), и при этом они могли быть на­ блюдаемы. Таким образом, помимо управляемости и наблю­ даемости системы, являющихся внутренними свойствами системы, при идентификации встают условия и к внешним воздействиям. Наибольшие проблемы при идентификации создают помехи измерений и эффекты от неучтенных внеш­ них воздействий, которые могут быть восприняты как про­ явление внутренних свойств, которыми данная система не обладает.

§ 3-2. Корреляционный метод

Рассмотрим многомерный объект с входными воздейст­ виями ( V\ ( t ) , .... v ,( i)) T= V (t) и выходной переменный //(/),

связь между которыми дается оператором /':

у(/) = /ЧУ(т), -

где t — момент времени наблюдения. Переменные K(f), y(t)

в общем случае являются случайными процессами. Требует-

Рис 3-1 К постановке задачи идентификации

ся найти по известным на некотором интервале времени реа­

лизациям y (t), V(0 оценку оператора

F (модель объекта).

О близости F к F можно судить лишь по близости выходов

модели и объекта при заданном V(t)

(рис. 3-1)

F -*■ F

при (у(0П /(т), —

*

-

y ( o i m

 

7—1303

97

 

Широко применяют бейесовы критерии идентификации в форме условия минимума среднего риска:

М { 1 (у,у))-+ min,

(3-2)

А

F

где / — функция потерь.

Алгоритмы идентификации, дающие y(t) при заданном V(t) в соответствии с (3-2), называют бейесовыми решения­

ми. К числу указанных относятся:

критерий среднеквадратичной ошибки (СКО)

М {е*\= М Ц у\У -у\У У У ,

(.3-3)

критерий среднего модуля ошибки

M{\e\)~M{\y\V-y\V\) (3-4)

и другие. На практике нашли также применение критерии среднеквадратичной временной ошибки (СКВО)

 

т

 

Мт {е*} = lim - L

Гe*(t)dt,

(3-5)

Т-*оо Л

J

 

 

- Г

 

квадратичной взвешенной ошибки, относительной ошибки и

ДР-

г п

Показано (3-1J, что все статистические критерии, использу­ ющие симметричную неубывающую функцию потерь от раз­ ностимежду выходами объекта и модели, цринормальных воздействиях и помехах приводят к одной и той же опти­ мальной модели, которая является линейной (даже при не­ линейном объекте!) и определяется по критерию (3-3) (или по (3-5) для эргодических процессов). Поскольку нормаль­ ное распределение часто встречается на практике, критерий (3-3) нашел большое применение.

Помимо бейесовых критериев, применяют иные крите­ рии: максимум функции правдоподобия (обычно условной плотности вероятности р{у\ V), связывающей величину у и

выборочные измерения V), минимаксные критерии и др. Од­ нако оказывается, что при гауссовых воздействиях оценки, найденные по указанным критериям, совпадают с оценкой по критерию СКО (3-1, 3-2].

98

\r

 

,, ,v d H;«*}

n

приводит

Условие минимума величины

(3 -3)-------

— —ч

 

 

d y

 

 

 

к выражению для оценки оператора в виде

 

 

 

i( t )

= F{V(-.), -

 

=

 

 

=

M{y((}\V(-:), -

x 3 < T <t ) ,

 

(3-rt)

где M{y\V) — условное математическое ожидание (регрес­

сия) выходной переменной относительно входного воздей­ ствия. Следовательно, оптимальный оператор модели совпа­

дает с оператором регрессии. Получим явное выражение для

/', если будем искать модель в классе линейных,

для которых

по принципу суперпозиции можно записать

 

 

S (о = Н о л * ) *

••••м*)}

Г

2

tr’/(х)>. —*

< т <

 

= 2

t,

 

 

 

I I

 

 

 

 

 

где Fj оператор

/'-го канала модели

 

(между

/-ым входом

и выходом). В этом случае из тождественного

(З-б)

выра­

жения

 

 

 

 

 

 

 

 

л* {2 (и/(т)> (»)}

=“ Л*

(V(^) 11’(■=)) ■»/С®».

 

г ,

получаем

 

 

 

 

 

 

 

 

 

Г

 

 

 

 

 

 

 

1 =|

(М (1>, (т) • r>,(s)|)

-

 

 

 

 

 

 

 

 

 

= М {y(t)

t>f (s>),

/ —1,

.

г , s <

t ,

(3-7)

причем в последнем выражении использовано свойство ком-

А

Мутативности линейных операторов Ft с оператора матема­

тического ожидания.

Если процессы t » i ( / ) , ..., v,(t), y(t) имеют нулевое сред­

нее, то средние произведения в (3-7) представляют собой корреляционные функции:

Г

2 ^ { Л : у 7(-.

=

*),

 

/, I

 

 

 

 

/ - 1,

г,

— *><s < т <t .

(3-8)

7*

99

Рассмотрим практически важный случай, когда воздейст­ вия V \ ( t ) , ..., vr(t) некоррелированы между собой:

Rv.v/Ь, s) = О для / ф t.

(3-9)

В этом случае из (3-8) получаем

{Rv; (*, з), — оо <s < t < /} =

= Ryv.(t,s), f = l ........

t .

(3-10)

Учитывая, что оператор во временной области имеет вид интегрального преобразования (типа свертки), ядром кото­ рого является импульсная характеристика (см. § 2-3), полу­ чаем окончательно

t

 

R u v. ( t , s ) = J w( (tr .)R V;(T ,s)fc, / = 1.........

r. (3-11)

00

Вчастности, для стационарного объекта при эргодических воздействиях, когда корреляционные функции и им­ пульсная характеристика зависят лишь от разности аргумен­

тов ('&=t—s, k = i—т), для нахождения оценок импульсных

характеристик модели получаем известное в теории иденти­ фикации уравнение Винера—Хопфа

 

00

 

 

 

Ryvt (fi) =

J щ (X) Rv. (0 — X)

l =

1, ..., r.

(3-12)

 

о

 

 

 

Если идентифицируемый объект имеет конечное время

памяти Тп и, следовательно,

 

 

 

y{t) = F{V(x), t - T n <x<t},

(3-13)

то уравнение (3-12) примет вид

 

 

 

 

/V

 

 

 

 

тп

 

 

 

RUV{(d) =

j* w t (X) RV[(0 - X)dX,

t =

1........ г,

(3-14)

О

Л

где оценка времени памяти Тп для модели должна быть выб-

А

рана из условия Та^ Т п. Уравнения (3-14) решают на вы­

100

Соседние файлы в папке книги из ГПНТБ