Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
i-719273.pdf
Скачиваний:
269
Добавлен:
26.03.2016
Размер:
5.68 Mб
Скачать

4.2. Метод регрессионного анализа

Рассмотрим объекты идентификации, структурная схема которых имеет вид (рис. 4.2).

z

ОУ

v

 

 

u

 

y

F(u,z)

 

 

Рис. 4.2. Структурная схема объекта идентификации

Здесь, как и ранее (см. раздел 3), u – вектор управляющих воздействий размерности m ; z – вектор контролируемых возмущений размерности r ; v – аддитивная помеха; y – выходная переменная, скаляр.

Переменные входных векторов u и z и выходная y – измеряемы и

представляют собой реализации случайных процессов.

Зависимость выходной переменной от входных переменных представим в виде

 

 

 

 

 

 

y aT F(u, z) v ,

 

 

 

 

 

 

 

(4.11)

где aT a

...a

n

– вектор неизвестных параметров (коэффициентов) модели;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(u,z) f0 (u,z),..., fn (u,z)

– вектор заданных (известных) базисных функ-

ций, например f

0

(u,z) 1,

f (u,z) u

z

2

,

f

2

(u,z) sin 2u

2

,

f

3

(u, z) 1/ u2 ,

 

 

 

 

 

 

1

1

 

 

 

 

 

 

2

f4 (u,z) u1 ,

f5 (u,z) exp z1

и т.д.

 

 

 

 

 

 

 

 

 

 

 

 

Для удобства представления данных введем следующие обозначения

 

 

 

 

 

 

x j f j (u,z),

j 0,...,n.

 

 

 

 

 

 

 

(4.12)

Этот этап часто называют линеаризацией переменных.

С учетом (4.12) зависимость (4.11) в развернутом виде будет иметь вид

y a0 x0 a1x1 ... an xn v ,

(4.13)

где x j – линеаризованные переменные (регрессоры); a j

– неизвестные пара-

метры.

Как правило, первый член уравнения (4.13) представляет собой свободный член и поэтому переменную x называют фиктивной переменной.

Зависимость (4.13) линейна относительно неизвестных параметров a j .

182

Результаты наблюдений за входными переменными u, z и выходной y

после линеаризации переменных (4.12) представим в виде входной и выходной матриц наблюдения

 

x

x

x

...

x

 

 

 

 

 

 

n

x

x

x

...

x n

X

 

 

 

 

 

 

...

...

...

...

...

 

 

 

 

 

 

 

 

 

xN

xN

 

 

 

xN

...

xNn N n

 

 

y

 

 

 

 

 

 

 

Y

 

y

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

yN

( N

 

 

 

 

,(4.14)

)

где N – число наблюдений.

 

В матричной форме модель (4.13) с учетом (4.14) примет вид

 

Y Xa V ,

(4.15)

где размерности матриц Y N , X N n , a n , V N .

Матрица X ранга n известна (это результаты наблюдений).

Задача метода регрессионного анализа (МРА) состоит в получении оценок неизвестных параметров а и статистическом анализе полученных ре-

зультатов.

 

 

 

Для

получения оценок используют метод наименьших

квадратов

(МНК). В матричной форме МНК-оценки вычисляют по формуле

 

 

X T

 

(4.16)

 

X X T Y ,

где M X T X – матрица Фишера, симметричная квадратная матрица раз-

мерности

 

– дисперсионная матрица размерности

(n ) (n ) ; C X T X

(n ) (n ) .

Модель регрессионного анализа для линеаризованных переменных

 

= +

+ +

 

.

 

(4.17)

 

 

 

0

0

1

1

 

 

 

 

 

Согласно (4.11) для исходных входных переменных u, z и базисных

функций модель регрессионного анализа имеет вид

 

 

 

 

 

 

=

0

 

, + ,

+ +

( , ).

(4.18)

 

 

0

 

 

1 1

 

 

 

 

 

 

Для проведения статистического анализа полученных результатов не-

обходимо, чтобы были выполнены следующие предпосылки:

 

1)

ошибки наблюдения

V

имели нормальный (гауссовский)

закон

распределения с параметрами

 

 

 

M V V T I

 

 

 

 

 

M V ,

n

,

 

(4.19)

 

 

 

 

 

 

V

 

 

 

 

где – дисперсия помехи; I

n

– единичная матрица;

 

 

 

V

 

 

 

 

 

 

 

 

 

 

2)ошибки регистрации входных переменных u, z пренебрежимо малы по сравнению с помехой v;

3)постулируемая структура модели (4.11) (4.13) соответствует искомой зависимости F(u, z) , т.е. структурно адекватна объекту.

183

При выполнении этих предпосылок вектор Y

имеет нормальное рас-

пределение

 

X

 

 

 

 

,

 

Y ~ N

N

a

,

I

n

(4.20)

 

 

V

 

 

 

а полученные МНК-оценки (4.16) не смещены, состоятельны, асимптотически эффективны и имеют совместный нормальный закон распределения

~ N

 

 

.

(4.21)

n

a, X T X

 

v

 

 

Если же ошибки V не подчиняются нормальному закону распределения, но выполняются условия (4.19), то оценки (4.16) будут наилучшими в классе линейных оценок, несмещенными, состоятельными и асимптотически нормальными [23].

Поскольку дисперсия помехи V , как правило, априори неизвестна, то при выполнении предпосылок МРА можно найти ее оценку

 

 

 

 

 

N

 

 

 

 

S

 

 

 

 

 

2,

 

(4.22)

 

 

 

 

v

N

 

 

 

 

 

 

 

 

n i

 

 

 

 

где

 

 

 

 

 

 

 

 

 

=

+

+ + ,

(4.23)

 

 

0

0

 

1 1

 

 

 

 

предсказанное по уравнению регрессии (4.17) значение выходной переменной для i-ой строки матрицы наблюдения (4.14).

Можно непосредственно выдвинуть гипотезу о значимости всех коэффициентов модели (4.13)

H : a ,

H : a .

Для проверки этой гипотезы рассчитаем

 

 

 

 

 

 

 

 

 

 

 

 

Fнабл

 

 

,

(4.24)

 

 

 

 

 

 

 

 

+1

2

 

 

 

 

 

 

 

 

 

 

и если F

F крит.

, то с вероятностью

P q можно утверждать, что

набл.

q,n,N n

 

 

 

 

 

 

 

 

между переменной y и вектором X , включенным в модель (4.13), нет функциональной зависимости, и, следовательно, весь разброс значений y обу-

словлен действием помехи V .

Если подтверждена значимость всех коэффициентов модели, можно проверить гипотезы относительно отдельных параметров (коэффициентов) модели.

Проверим гипотезу

H : a j a*j , H : a j a*j .

где a*j – заданное значение j -го параметра.

При этом относительно остальных коэффициентов не делается никаких

184

предположений.

Для этого рассчитаем

 

 

 

tнаблj

 

 

 

 

 

 

 

, j , n ,

(4.25)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и если t

набл.j

t крит.

, то нуль-гипотезу отвергаем.

 

 

q / ,N n

 

 

 

 

 

 

Здесь SV SV , c jj – диагональный элемент дисперсионной матрицы

C .

Чаще всего a*j , и тогда гипотеза соответствует проверке параметров на значимость

 

 

H : a j

 

 

,

j , ,...,n ,

(4.26)

 

 

H : a j

,

 

 

 

 

соответственно

 

 

 

 

 

 

 

 

 

 

 

tнаблj

 

 

 

 

, j , ,...,n

(4.27)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и если какое-то t

набл.j

t крит.

 

 

, то j -й параметр признается незначимым,

 

q / ,N n

 

 

 

 

т.е. равным нулю и его следует исключить из модели (4.13). Процесс исключения j -го параметра из модели влечет за собой исключение j -го столбца из

матрицы наблюдения X (4.14) и повторное вычисление для уменьшенного числа параметров МНК-оценок (4.16), поскольку оценки взаимозависимы между собой через дисперсионную матрицу C .

Процедура повторяется до тех пор, пока все параметры не окажутся значимыми.

Интервальная оценка выходной переменной в каждом i -ом опыте матрицы наблюдений X равна

 

 

 

 

 

M y

 

 

 

 

 

 

 

 

 

 

 

 

 

t

q / ,N n

S

X

i

C X T ,i ,...,N , (4.29)

 

 

x

 

...x

i

 

 

V

 

i

где X

i

x

– строка матрицы наблюдений

X ; – предсказанное

 

i

i

in

 

 

 

 

 

 

 

 

значение выходной переменной, рассчитанное по (4.23).

Интервальная оценка для произвольного вектора X m X не принадлежащего матрице наблюдений X .

M y

 

 

 

 

 

 

 

 

 

 

m

t

q / ,N n

S

X

m

C X T

,

(4.30)

 

 

 

V

 

m

 

 

где = 0 0 + 1 1 + 2 2 + + .

Для оценки работоспособности полученной модели (уравнения регрессии) (4.17) вычисляют

S

Fнабл. S y , (4.31)

V

где

185

 

 

 

 

 

 

 

 

N

 

 

 

S y

 

 

 

 

yi y ,

(4.32)

 

 

 

 

 

 

 

 

 

 

 

 

N i

 

 

 

 

 

 

 

N

 

 

 

 

y

 

 

 

yi .

(4.33)

 

 

 

 

 

 

 

 

 

 

N i

 

 

Если F

F крит.

 

, то модель работоспособна.

 

набл.

q,N ,N n

 

 

 

 

 

 

 

 

Рекомендуемое отношение работоспособности модели [15]

 

 

 

Fнабл.

.

(4.34)

 

 

F крит.

 

 

 

 

 

 

 

 

 

 

q,N ,N n

 

 

Соотношения работоспособности не дают ответа на вопрос о структурной адекватности полученной модели объекту.

Если масштабы измерения переменных очень различаются, например, U изменяется в интервале (100 200 кг), а переменная z соответственно в

интервале (0.01 0.2 см), то параметры уравнения регрессии (размерные величины) не всегда могут характеризовать влияние линеаризованной переменной на выходной показатель y . Для сравнительной оценки их влияния на

y целесообразно провести нормирование результатов наблюдений с учетом

(4.32) и (4.33)

 

 

 

 

 

 

 

 

 

 

 

j , n,

i , N ,

(4.35)

xij xij x j ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S j

 

 

 

 

 

 

 

 

 

 

 

 

yi y

 

 

 

 

i , N ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

 

 

 

 

 

,

 

 

 

(4.36)

 

 

 

S y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

x j

 

 

 

 

xij ,

j , n ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S j

 

 

 

 

 

 

 

xij x j

, j , n ,

 

 

 

N

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

S y S y .

В результате нормирования (сравни с (1.24)) результатов эксперимента получим нормированные матрицы наблюдений и соответственно нормированные МНК-оценки

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

T

 

 

= X

X

X

Y ,

(4.37)

 

 

 

 

 

 

 

 

 

 

где матрица

186

= X T X N

несет информацию о взаимной коррелированности линеаризованных менных (выборочные парные коэффициенты корреляции)

 

=

 

 

N

 

j , n,

k ,n,

=

 

x x ,

 

 

 

 

 

ij

ik

 

 

 

 

 

N i

 

 

 

(4.38)

пере-

(4.39)

где = 1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X T

 

 

 

 

 

 

 

 

 

Вектор =

X

несет информацию о взаимной коррелированности

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

j -ой линеаризованной переменной с выходной переменной

 

 

 

 

 

 

 

 

N

 

 

 

 

 

 

 

 

 

 

 

 

 

j , n,

 

 

 

 

 

=

 

N i

xij xi ,

(4.40)

 

 

 

 

 

 

 

 

 

 

Уравнение регрессии для нормированных переменных с учетом (4.37)

примет вид

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

^

 

^

^

 

 

^

 

 

 

 

y b x b x ... bn xn .

(4.41)

Это уравнение не имеет свободного члена.

Для оценки работоспособности данного уравнения рассчитывают выборочный коэффициент множественной корреляции, характеризующей тесноту связи между переменной y и вектором X

 

=

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(4.42)

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

=

 

 

 

 

 

 

.

 

 

 

 

(4.43)

 

 

 

 

2

 

 

 

 

 

 

 

=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Рекомендуемое значение

R . . служит оценкой хорошей рабо-

тоспособности уравнения регрессии.

 

 

 

 

 

 

 

 

Для перехода от нормированных параметров (4.37) к исходным (4.16)

можно воспользоваться соотношением

 

y

x .

(4.44)

= S y ,

j , n,

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

0

 

 

j

 

S j

 

 

 

j 1

 

Если наблюдения в эксперименте неравноценны, т.е. какие-то результаты не очень достоверны, и есть возможность их «взвесить», то для обработки результатов в эксперименте используют взвешенный (обобщенный)

187

МНК

 

(4.45)

= X TWX X TWY ,

где W – симметричная матрица весовых коэффициентов размерности N N . Планирование пассивного эксперимента по сбору данных для МРА за-

висит от свойств исследуемого объекта и вида выбранной модели.

Согласно (4.20) в каждом i -ом эксперименте (наблюдении) случайная величина yi имеет нормальное распределение с одинаковой для всех опытов

дисперсией

и случайные величины y

i

и

y

p

i p в отдельных опытах не

V

 

 

 

 

коррелированны между собой. Следовательно, если объект безинерционный (статический) и на входе действуют случайные процессы u(t) , z(t) , то и на

выходе будем наблюдать случайный процесс y(t) .

Используя результаты разделов 2.8 и 2.9, необходимо оценить время корреляции y случайного процесса y(t) .

Тогда интервал съема данных (интервал квантования) выбирается из

условия

 

T y .

(4.46)

После выбора T необходимо определить длительность эксперимента,

т.е. объем наблюдений N . Здесь следует руководствоваться тем обстоятельством, что входные воздействия u(t) , z(t) должны «пробежать» все свои

возможные значения. Некоторые практические рекомендации по выбору длительности эксперимента приведены в [16].

Процедура эксперимента состоит в одновременном съеме данных u kT0 , z kT0 , y kT , k , ,...,N и представлении их в виде матриц наблю-

дений (4.14).

Если объект исследования динамический, а мы строим статическую модель (4.11), то влияние динамики следует исключить из эксперимента. Самое простое решение, это вести съем данных после окончания переходных процессов в объекте. Причем если это объекты первого рода вида (3.6), то необходимо знать динамику каналов входных воздействий и, кроме того, иметь возможность удерживать на время переходного процесса эти воздействия на постоянном уровне. Это уже активно-пассивный эксперимент и реализовать его можно для относительно простых объектов. Если исследуем объект второго рода типа (3.7) для скалярного выхода q(t) , то динамику выхода

можно заменить звеном чистого транспортного запаздывания Wy ( p) e p y , где y – время переходного процесса в исходном динамическом звене. В этом случае все измерения выходной переменной y kT проводят со сдвигом на время y .

188

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]