
- •Введение
- •1. Постановка задачи регрессионного анализа
- •2. Оценка неизвестных параметров регрессионной модели
- •2.1. Точечная оценка коэффициентов регрессии
- •Таблица 1
- •2.2. Точечная оценка дисперсии
- •3. Статистический анализ результатов
- •Таблица 2
- •3.2. Проверка адекватности регрессионной модели
- •Таблица 3
- •3.3. Проверка работоспособности регрессионной модели
- •4. Решение типовой задачи
- •Таблица 4
- •Таблица 5
- •5. Задача для самостоятельного решения
- •Таблица 6
- •Таблица 7
- •Список рекомендуемой литературы
- •Оглавление
2. ОЦЕНКА НЕИЗВЕСТНЫХ ПАРАМЕТРОВ РЕГРЕССИОННОЙ МОДЕЛИ
2.1. Точечная оценка коэффициентов регрессии
Исходным материалом для получения точечных оценок параметров регрессионной модели (1) являются матрица X и матрица-столбец отклика Y:
|
x |
x |
... |
x |
|
|
|
y |
|
|
|
11 |
12 |
|
1n |
|
|
|
1 |
|
|
X = x21 |
x22 |
... |
x2 n |
, |
Y = |
y2 |
|
, |
||
... |
... |
... |
... |
|
|
|
... |
|
|
|
|
|
xN 2 |
... |
|
|
|
|
|
|
|
xN 1 |
xNn |
|
yN |
|
где xij — значение j-го фактора в i-м опыте; yi — значение отклика в i-м опыте. Численные значения всех базисных функций могут быть представлены в матричной форме следующим образом:
|
f |
f |
... |
f |
|
|
|
10 |
11 |
|
1d |
|
|
F = f20 |
f21 |
... |
f2d |
, |
||
|
|
... |
... |
... |
|
|
... |
|
|
||||
|
fN 0 |
fN1 |
... |
fNd |
|
|
где fij = Fj (xi1, xi2 , ..., xin ) |
— значение j-й базисной функции |
в i-м опыте.
Для определения точечных оценок неизвестных коэффициентов регрессии могут быть использованы различные методы. Наиболее часто применяют метод наименьших квадратов (МНК).
Согласно МНК наилучшими оценками коэффициентов регрессии считают такие значения переменных z0, z1, ..., zd, при которых достигает минимума сумма квадратов отклоне-
7
ний значений отклика yi, от значений yi , полученных с помощью уравнения регрессии
yi = z0 fi0 + z1 fi1 +...+ zd fid ,
т. е. наилучшие оценки определяются из условия минимума функции
Q = |
N |
[y |
i |
− y |
i |
]2 |
= |
N |
y |
i |
−(z |
0 |
f |
i 0 |
+ z |
f |
i1 |
+... + z |
d |
f |
id |
) |
2 . |
|
∑ |
|
|
|
|
∑ |
|
|
1 |
|
|
|
|
|
|||||||||
|
i=1 |
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Если функция Q (z0 , z1 , ..., zd ) имеет локальный минимум при z0 = b0 , z1 = b1 , …, zd = bd , то справедливы равенства
|
|
|
∂ Q |
(b |
, b |
, ..., b |
)= 0 , k = 0, …, d. |
(3) |
|
|
|
|
|||||
0 |
1 |
d |
|
|
||||
|
|
|
∂ zk |
|
|
|
|
|
Учитывая, что |
|
|
|
|
||||
|
∂ Q |
|
|
|
N |
|
|
|
|
(b0 , b1, ..., bd )= −2∑(yi −b0 fi0 −b1 fi1 −... −bd fid ) fik |
, |
||||||
|
|
|||||||
|
∂ zk |
i=1 |
|
|
||||
преобразуем (3) к виду |
|
|
|
|
||||
|
|
|
|
N |
d |
|
N |
|
|
|
|
|
∑∑ fik fijbj = ∑ fik yi . |
(4) |
|||
|
|
|
|
i=1 |
j=0 |
i=1 |
|
Тогда, решая полученную систему линейных алгебраических уравнений, можно определить искомые точечные оценки b0, b1, ..., bd, при которых функция Q (z0 , z1, ..., zd ) достигает своего минимума.
Систему (4) называют системой нормальных уравнений и ее можно представить в матричной форме
(F T F )B = F TY , |
(5) |
где B = (b0 b1 ... bd )T . Матрица F T F — симметрическая матрица порядка d +1. Если выполняется условие 4 регрессион-
8
ного анализа, то эта матрица является невырожденной. Тогда решение уравнения (5) можно записать в виде
B = C (F TY ), |
(6) |
где C = (F T F )−1 .
Пример 1. Исполнительный механизм движется поступательно с постоянной скоростью. Результаты измерения приращения координаты центра масс механизма за время t приведены в табл. 1. Очевидно, что регрессионная модель имеет вид
s =βt +e ,
где s — приращение координаты за время t; e — случайная величина. Требуется найти оценку неизвестного коэффициента регрессии β.
|
Значения s(t) |
Таблица 1 |
||
|
|
|||
|
|
|
|
|
№ опыта |
|
t, с |
|
s, м |
1 |
|
10 |
|
0,103 |
2 |
|
20 |
|
0,183 |
3 |
|
30 |
|
0,309 |
4 |
|
40 |
|
0,422 |
5 |
|
50 |
|
0,487 |
Для рассматриваемой регрессионной модели F0 = t, следовательно, система нормальных уравнений (4) в этом случае имеет вид
N |
N |
∑b ti2 = ∑si ti , |
|
i=1 |
i=1 |
где ti — значение параметра t в i-м опыте; si — значение отклика в i-м опыте. Это позволяет записать формулу для определения оценки неизвестного коэффициента регрессии:
9