книги из ГПНТБ / Сейдж Э.П. Идентификация систем управления
.pdfГ л а в а 1
ВВЕДЕНИЕ
Во многих задачах системотехники, в особенности свя занных с управлением, могут быть выделены четыре взаи модействующих части:
1)определение цели;
2)определение положения системы относительно цели;
3)определение внешних факторов, влияющих на прош лое, настоящее и будущее системы с последующим постро ением модели системы;
4)определение политики управления в соответствии с целью (1), текущим состоянием (2), внешними воздейст виями и моделью системы (3). Часто политика управления на этапе 4) определяется оптимальным образом; эта задача
служит предметом теории оптимального управления. В этой книге мы будем заниматься третьим из перечис
ленных выше этапов общей задачи системотехники. В част ности, мы изучим построение моделей системы по записям
результатов ее функционирования. |
Общая формулировка |
|
этой задачи такова. Наблюдается |
вектор z (t), иска |
|
женный шумом вариант |
вектора |
состояния системы |
х (t), входной сигнал и (() |
и внешнее возмущение w (t), |
|
причем |
|
|
z (0 = h [х (it), u (t), w (t), p (t), v (it), t],
В этой’ модели наблюдений p (t) — неизвестные параметры системы, a v (t) — вектор ошибок измерений. Предпола гается, что вектор состояния описывается стохастичес ким дифференциальным уравнением
dx(t)/dt = f [x(t), u(t), w (t), p (t), t\.
Порядок уравнения, вообще говоря, неизвестен, хотя для большинства схем идентификации порядок модели пред полагается выбранным заранее. Эта общая задача иден тификации схематически изображена на рис. 1.1.
12 |
ВВЕДЕНИ Е |
tl'JI. 1 |
Решение задачи идентификации должно включать оп ределение оценки вектора неизвестных параметров р (/) и размерности вектора f, если она неизвестна. Вектор па раметров р (£) может состоять из коэффициентов системы
w(t) Входной, шум или |
|
v(t) |
Помеха |
|
|
' шум объвнта |
|
|
измерений |
u(t) |
Неизвестный |
^ |
Устройство |
z(t) |
объектили система Xft) |
||||
Известный |
Вектор |
|
наблюдения |
Наблюдаемый |
Входной |
состояния |
1 |
вектор |
|
сиенал |
,L |
|
состояния |
|
Вектор
неизвестных p(t) параметров
Рис. 1.1. Общая задача идентификации.
дифференциальных уравнений, средних значений и дис персий входного шума w (t) и ошибки измерений v (t).
Легко выделить некоторые подклассы этой общей за дачи идентификации, например:
1.Идентификация без помех, когда отсутствуют шумы w (t) и v (t). Это простейший тип задач идентификации, при котором имеется известный вход u (t) и точные наблю дения функции вектора состояния.
2.Модели наблюдений и системы линейны.
3.Входной шум w (t) ненаблюдаем.
Вдальнейшем будут рассмотрены некоторые из этих подклассов.
Определение всех характеристик процесса, модель ко торого нужно построить, не является, вообще говоря, не только возможным, но даже и желательным. Характери стики, знать которые необходимо, определяются целью, поставленной перед системой, допустимой степенью слож ности системы в целом и требованиями к сопутствующим вычислительным процедурам.
При классическом подходе к проектированию систем моделирование осуществлялось лишь один раз в процес се проектирования, и этот этап по-прежнему остается важ ной частью идентификации и моделирования. Во многих
ГЛ. 1] |
ВВЕДЕНИЕ |
13 |
современных системах желательно использовать повтор ную или непрерывную в реальном масштабе времени иден тификацию, чтобы обеспечить возможность оптимальной адаптации системы в условиях неопределенности и изме нения внешних воздействий. Поэтому мы будем здесь изу чать методы идентификации, одинаково применимые как в реальном, так и в измененном масштабе времени, при идентификации вне контура регулирования. Излагаемые ниже вопросы можно разделить на три класса:
1)«классические» методы идентификации,
2)функции штрафа в задачах идентификации,
3)вычислительные методы идентификации.
Глава 2 представляет обзор различных классических методов идентификации. Мы обсудим простую «музейную» задачу идентификации по отклику на синусоидальный сигнал как для элементарного случая линейной системы с постоянными параметрами, так и для значительно более сложного случая линейной, но нестационарной системы.
За обсуждением метода определения весовой функции объекта, основанного на подаче белого шума на вход и вычислении корреляционной функции выходного сигнала со сдвинутым во времени входным, следует приложение уравнений фильтра Калмана к определению весовой функции стационарной линейной системы. Кратко изу чено применение винеровской аналитической теории нели нейных систем, а также критически рассмотрен подход к задаче идентификации, использующий обучающиеся мо дели и оказавшийся весьма популярным при построении моделей для адаптивного управления.
Глава 3 полностью посвящена формулировке функций штрафа для задач идентификации. Рассмотрены, в частно сти, идентификация по методу максимума апостериорной вероятности (байесовский подход к методу максимума правдоподобия) и классические методы оценки максималь ного правдоподобия. При оценивании по методу макси мального правдоподобия максимизируется условная плотность вероятности результатов наблюдений относи тельно некоторых постоянных, но неизвестных парамет ров с помощью оптимального выбора этих параметров. Идентификация по методу максимума апостериорной ве роятности осуществляется максимизацией условной плот ности распределения ш известных случайных параметров
14 |
ВВЕДЕНИ Е |
[ГЛ . t |
относительно наблюдаемого выходного сигнала. Два важ ных метода идентификации — по минимуму дисперсии и с помощью условных математических ожиданий — в этой главе по существу не рассматриваются, поскольку в на стоящее время недостаточно разработаны вычислитель ные методы построения оценок на основе условных мате матических ожиданий. Будет, однако, показано, что оценки состояния по условным математическим ожиданиям сле дуют из метода максимума правдоподобия. В главе 7 продемонстрирована также тесная связь между алгорит мами последовательных приближений при идентификации с помощью условных математических ожиданий и соответ ствующими алгоритмами метода максимума апостериорной вероятности для достаточно широкого класса задач.
В главах 4—7 обсуждаются различные вычислительные методы решения задач идентификации. В главе 4 предла гаются прямые вычислительные методы, основанные на анализе первых и вторых вариаций. Градиентные методы первого и второго порядков, а также метод сопряженного градиента даны в применении к одно- и многошаговым,
атакже непрерывным задачам идентификации.
Вглаве 5 излагается стохастический градиентный ме тод первого порядка или метод стохастической аппрокси мации. Дан углубленный анализ задачи идентификации динамики линейной системы с помощью стохастической аппроксимации.
Вглавах 6 и 7 обсуждаются два прямых вычислитель ных метода решения задач идентификации. Излагаются дискретный и непрерывный методы Ньютона — Рафсона, или методы квазилинеаризации, в применении к различнымзадачам идентификации. В главе 7 изучаются дискрет ные и непрерывные методы инвариантного погружения, порождающие последовательные приближения к решению двухточечной краевой задачи и задач с функциями штрафа пз главы 3.
Обширная библиография современных исследований • по идентификации составляет заключительный раздел книги. Работа с библиографическим указателем облегча ется наличием у каждой включенной в него работы ссыл ки на главу или раздел данной книги, в которой исполь зуется соответствующий материал.
Г л а в а 2
КЛАССИЧЕСКИЕ МЕТОДЫ ИДЕНТИФИКАЦИИ
2.1.ВВЕДЕНИЕ
Вэтой главе рассматривается ряд так называемых «классических» методов идентификации. Слово «класси
ческие», пожалуй, несет оттенок старомодности, в данном случае совершенно непреднамеренный. Напротив, термин «классические» здесь используется в смысле «проверен ные и испытанные» давно используемые методы, в отли чие от сравнительно недавно развитых «современных» ме тодов, составляющих содержание остальных глав книги.
Методы этой главы дали хорошие результаты в приме нении к большому числу практических задач. Основной недостаток этих методов, за исключением метода обучаю щейся модели, заключается в их непрямом подходе к за даче. Это утверждение, по-видимому, нужно пояснить. Классическими методами обычно определяется весовая или передаточная функция системы. В то же время, как правило, наиболее желательно получить основные диф ференциальные уравнения, описывающие систему, а за дача построения модели системы по весовой или переда точной функции далеко не всегда тривиальна, особенно если эти функции получены, как это обычно бывает, в графической форме.
2.2. МЕТОДЫ ОПРЕДЕЛЕНИЯ ВЕСОВОЙ ФУНКЦИИ ИЗ УРАВНЕНИЯ СВЕРТКИ
В этом разделе рассматриваются простые методы опре деления весовой функции стационарной линейной системы. Для простоты мы ограничимся системами с одним входом и одним выходом. Рис. 2.2.1 иллюстрирует эту задачу: по наблюдениям входного и выходного сигналов линейной стационарной системы на конечном промежутке времени 0 < * < Г нужно определить ее весовую функцию h {t).
16 |
КЛАССИЧЕСКИЕ МЕТОДЫ ИДЕНТИФИКАЦИИ |
(Г Л . 2 |
Приведенная формулировка задачи чрезмерно претен циозна и нуждается в некоторых упрощениях, чтобы стать доступной для математического исследования. Мы будем наблюдать входные и выходные сигналы только в N рав номерно распределенных на отрезке [О, Т] с шагом А точ ках фиксации, причем N А = Т. Основываясь на этих данных, мы будем искать приближенные значения весовой функции в указанных точках.
w(t) |
Линейная |
y (tУ |
стационарная |
||
Вход |
система |
Выход |
|
hitI |
|
Рис. 2.2.1. Схема задачи определения весовой функции.
Выходной сигнал системы при входе w (t) и нулевых начальных условиях выражается хорошо известным ин тегралом свертки
f
y(t) — ^h(t — %)w(x)d%. |
(2.2.1) |
о'
Здесь предполагается также, что вход w (т) равен нулю при т < 0. Кроме того, потребуем, чтобы w (0) Ф 0; если это ограничение не выполнено, ему легко удовлетворить соответствующим преобразованием независимой перемен ной t.
Введем теперь аппроксимацию входной функции вре мени w (t), полагая ее равной значению в левой точке фик сации на всем интервале между двумя соседними точками. Следовательно, мы принимаем
и> {t) m w (пА) при пД < t < (га + 1) А. (2.2.2)
Точно так же функцию h (t) примем постоянной между точками фиксации, присвоив ей значение, соответствую щее средней точке интервала:
h(t)xh(^ |
при |
пА |
if <((га -f- 1) Д . |
(2.2.3) |
|
Можно было бы также принять w (t) = |
0,5{ш (пА) + |
||||
+ w [(и + 1)Д]} |
при пА |
t < (п |
1)Д |
или |
исполь |
2.2] МЕТОДЫ ОПРЕДЕЛЕНИЯ ВЕСОВОЙ ФУНКЦИИ 17
зовать ряд других способов аппроксимации. Впрочем, при достаточно малых Д все они приводят к одинаковым отве там. Один из лучших способов проверить, достаточно ли мало Д,— повторить все вычисления для Д' = Д/2. Если не происходит заметных изменений, то Д достаточно мало,
в противном случае следует выбрать Д" = Д72 и |
снова |
||
провести вычисления. |
|
|
и h(t) |
В терминах ступенчатых аппроксимаций w(t) |
|||
интеграл в (2.2.1) при |
t — пА |
приближенно запишется |
|
в виде |
|
|
|
77 — 1 |
|
|
|
7/(пД) = Д |
' |
Д — *д) Ы7(£Д). |
(2.2.4) |
г=0 |
' |
|
|
Обозначив ./V-вектор наблюдений выхода через |
|
||
ут (У) = уТ (Т) |
= [у ( А ) |
у (2Д )... у (NД)] |
(2.2.5) |
и iV-вектор значений весовой функции в точках фиксации через
Ьт (Г) = [ й ( 4 - ) Л ЗА |
|
|
Д |
(2.2.6) |
||
|
|
2 |
|
|
|
|
перепишем уравнение (2.2.4) в виде |
|
|
|
|||
|
у(Г) = Д\УЬ(Г). |
|
|
(2.2.7) |
||
Здесь матрица W определяется равенством |
|
|||||
_ |
w (0) |
0 |
0 |
0 |
. . . 0 -| |
|
|
w (Д) |
w '0) |
0 |
0 |
. . . 0 |
|
w = |
w (2Д) |
w (Д) |
и' (0) 0 |
. . . 0 |
|
|
_w [(N - 1) Д] |
xv [(N — 2) Д] |
|
|
|
|
|
Отметим, что W — левая треугольная матрица.
Теперь задача сведена к определению из уравнения (2.2.7) вектора h значений весовой функции в точках фик
сации. |
Ввиду условия |
w (0) ф 0, как |
легко видеть, |
det VV = |
[w (0)Р Ф 0 и |
W невырождена. |
Поэтому фор |
мально решение уравнения (2.2.7) можно записать в виде
h = W _1y. |
(2.2.8) |
Благодаря левой треугольной форме W выражение для h
18 |
КЛАССИЧЕСКИЕ М ЕТОДЫ ИДЕНТИФИКАЦИИ |
[ГЛ , 2 |
легко переписать в рекуррентном виде |
|
|
|
П—1 |
|
|
|
(2.2.9) |
где |
|
|
|
(2.2.10) |
|
и |
(2.2.11) |
|
|
||
|
Отметим, что в (2.2.9) необходимо оперировать |
с по |
стоянно растущим объемом данных. Для определения hn нужно произвести примерно п умножений и столько же сложений. Поэтому использование этого алгоритма для последовательной идентификации или идентификации в реальном масштабе времени становится невозможным, как только интересующий нас интервал времени пере стает быть достаточно малым. Кроме того, накапливаю щиеся ошибки округления существенно снижают точность метода при возрастании п. Тем не менее эта процедура очень проста и может быть вполне эффективной для многих задач идентификации. Применяя быстрое преобразование Фурье, также удается существенно упростить вычислитель ную процедуру метода решения уравнения свертки. Другим достоинством рассмотренного подхода является возмож ность использовать любые входные сигналы. Поскольку нет необходимости применять специальные тестовые сиг налы, можно использовать реализации, полученные в процессе нормальной эксплуатации системы.
Если входным сигналом является функция единичного скачка, алгоритм (2.2.9) заметно упрощается. В этом слу чае w (гД) = 1 для всех г, и поэтому (2.2.9) принимает вид
П—1
(2.2.12)
Определив величину
п—1
(2.2.13)
2.2! М ЕТОДЫ ОПРЕДЕЛЕНИ Я ВЕСОВОЙ ФУНКЦИИ 19
удается привести это выражение к особо удобному виду
К = - Нп. (2.2.14)
При этом Мп определяется простым рекуррентным соот ношением
Нп = //n-i 4~ hn-1- |
(2.2.15) |
Алгоритм (2.2.14), (2.2.15) записан в простой форме, пред полагающей выполнение двух сложений и одного деле ния (на А) на каждом шаге.
w(t) |
! |
yd У |
.у + /
'
Рис. 2.2.2. Пример 2.2.1.
Пример 2.2.1. Проиллюстрируем применение полу ченных выше результатов на простом примере. Задача показана на рис. 2.2.2; истинная весовая функция объекта равна
h (t) = e~l.
Для идентификации на вход подается единичный скачок,
инетрудно убедиться, что выходной сигнал равен
у(t) = 1 — е_г.
Значения весовой функции были определены в точках ин тервала 0 < if < 1, расположенных с шагом А = 0,1. Точные и приближенные значения h (t) даны в табл. 2.2.1 п демонстрируют отличное совпадение. Разумеется, эта задача очень проста, так что естественно ожидать хоро ших результатов.
Помимо отмеченных выше вычислительных трудностей, применение этого алгоритма наталкивается на дополни тельные осложнения, если измерения выхода сопровож даются заметной помехой. Поскольку каждому измере нию выходного сигнала алгоритм сопоставляет одно зна-
20 |
КЛАССИЧЕСКИЕ МЕТОДЫ ИДЕНТИФИКАЦИИ |
[ГЛ. 2 |
Таблица 2.2.1
Точные и приближенные значения весовой функции
|
|
h { t ) |
|
|
h i t ) |
|
Точные |
Приближен |
t |
Точные |
Приближен |
|
ные |
|
ные |
||
|
значения |
значения |
|
значения |
значения |
0 ,0 5 |
0,951229 |
0,951625 |
0 ,5 5 |
0,576950 |
0,577189 |
0 ,1 5 |
0,860708 |
0,861068 |
0 ,6 5 |
0,522046 |
0,522264 |
0 ,2 5 |
0,778801 |
0,779125 |
0 ,7 5 |
0,472367 |
0,472561 |
0 ,5 5 |
0,704688 |
0,704981 |
0 ,8 5 |
0,427415 |
0,427594 |
0 ,4 5 |
0,637628 |
0,637894 |
0 ,9 5 |
0,386741 |
0,386903 |
чение весовой функции в очередной точке, усреднение помех оказывается невозможным. Для борьбы с шумом мож но провести ряд экспериментов при одинаковых входных сигналах и использовать для определения весовой функ ции усредненные значения выхода. Если повторение вход ного сигнала недоступно, можно усреднить значения ве совой функции, вычисленные для нескольких наборов раз личных входных и зашумленных выходных сигналов. При таком подходе, однако, может заметно возрасти объем вычислений.
Существует еще один метод, применимый при наличии помех на выходе. Правда, он требует усечения весовой функции при некотором конечном значении времени. Ес ли объект асимптотически устойчив, так что h ( t ) - + 0 при t —> сю, то при таком усечении не допускается серьез
ной ошибки. Допустим, что h(t) |
= 0 при t^> |
Т, |
а измере |
|
ния входа и выхода осуществлены для 0 < |
t < |
tf = mA, |
||
причем tf |
Т. |
выше алгоритма налицо |
||
В терминах рассмотренного |
||||
значительный избыток информации, так как достаточно иметь лишь измерения входных и выходных сигналов для
0 < * < Г . |
Эти |
избыточные |
данные |
можно использовать |
|||
для |
улучшения |
оценок |
весовой функции. |
Чтобы пока |
|||
зать, |
как |
это можно сделать, |
перепишем формулу (2.2.7) |
||||
в предположении, что h (t) усечена: |
|
|
|||||
|
|
y(C-) = A\V |
(Г)Ь(Г) + |
у(С). |
(2.2.16) |
||
