
- •Введение
- •1. Постановка задачи регрессионного анализа
- •2. Оценка неизвестных параметров регрессионной модели
- •2.1. Точечная оценка коэффициентов регрессии
- •Таблица 1
- •2.2. Точечная оценка дисперсии
- •3. Статистический анализ результатов
- •Таблица 2
- •3.2. Проверка адекватности регрессионной модели
- •Таблица 3
- •3.3. Проверка работоспособности регрессионной модели
- •4. Решение типовой задачи
- •Таблица 4
- •Таблица 5
- •5. Задача для самостоятельного решения
- •Таблица 6
- •Таблица 7
- •Список рекомендуемой литературы
- •Оглавление
Здесь
|
|
|
1 |
N |
|
|
||
Sост2 |
= |
∑(yi − yi )2 , |
||||||
|
|
|||||||
|
|
|
N − d −1 i=1 |
|
|
|||
|
|
1 |
|
N |
|
1 |
N |
|
Sy2 = |
|
|
∑(yi − y )2 , y = |
∑yi , |
||||
|
|
|
|
|||||
|
N −1 i=1 |
|
N i=1 |
где yi — значения отклика в i-м опыте; yi — значения, предсказанные с помощью уравнения регрессии; y — среднее значение отклика.
Если у модели R2 ≥ 0,75 или SостSy ≤ 0,5 , то это обеспечивает уменьшение ошибки предсказания по крайней мере в 2 раза относительно примитивного предсказания по среднему значению отклика. Сопоставление точечной оценки коэффициента детерминации с R2 = 0,75 является простейшей процедурой, позволяющей получить общее представление о ценности найденной модели. Если число опытов велико по сравнению с числом коэффициентов в уравнении регрессии, то близость R2 к 1 говорит о хорошей точности регрессионной модели.
Дополнительные проверки. Они могут включать в себя выяснение правдоподобности регрессионной модели в соответствии с физикой протекающих в объекте процессов и рассмотрение ряда других вопросов, которые учитывают специфику задачи.
4. РЕШЕНИЕ ТИПОВОЙ ЗАДАЧИ
Механизм, состоящий из подвижной части, пружины и демпфера, соединен с неподвижным основанием. Под действием силы F(t) подвижная часть механизма перемещается по закону x(t), который является одинаковым для всех опытов. Расчетная схема механизма представлена на рис. 3.
19

1 |
2 |
3 |
4 |
b |
|
|
|
s |
|
m |
F(t) |
|
|
||
|
x(t) |
|
|
Рис. 3. Схема механизма: 1 — неподвижное основание механизма; 2 — демпфер; 3 — пружина; 4 — подвижная часть механизма
Пусть y = F(t), где t — определенный момент времени. Тогда y зависит от массы механизма m, коэффициента затухания b демпфера и жесткости s пружины. Результаты измерения y в зависимости от факторов m, b и s представлены в табл. 4 и 5.
Таблица 4
Значения y в зависимости
от массы m, коэффициента затухания b и жесткости s
№ опыта |
m, кг |
b, H c/м |
s, H/м |
y, H |
1 |
50 |
1 |
1 |
62,09 |
2 |
10 |
1 |
1 |
15,36 |
3 |
50 |
5 |
1 |
73,62 |
4 |
10 |
5 |
1 |
28,90 |
5 |
50 |
1 |
3 |
71,92 |
6 |
10 |
1 |
3 |
28,90 |
7 |
50 |
5 |
3 |
80,52 |
8 |
10 |
5 |
3 |
43,85 |
20
Таблица 5
Данные специальной серии опытов по измерению y
№ опыта |
m, кг |
b, H c/м |
s, H/м |
y, H |
1 |
30 |
3 |
2 |
47,17 |
2 |
30 |
3 |
2 |
50,75 |
3 |
30 |
3 |
2 |
51,83 |
4 |
30 |
3 |
2 |
53,93 |
5 |
30 |
3 |
2 |
48,54 |
6 |
30 |
3 |
2 |
50,23 |
7 |
30 |
3 |
2 |
51,95 |
8 |
30 |
3 |
2 |
51,37 |
Используя данные из этих таблиц, установим экспериментальную зависимость y от факторов m, b и s. При этом в качестве первого приближения следует выбрать линейную регрессионную модель вида (2), т. е.
y (m, b, s)=β0 +β1 m +β2 b +β3 s + e , |
(10) |
где β0, β1, β2, β3 — коэффициенты регрессии; 1, m, b, s — ба-
зисные функции (F0 = 1, F1 = m, F2 = b, F3 = s); e — случайная величина.
Чтобы получить точечные оценки параметров регрессионной модели (10), используем данные табл. 4 и составим матрицы X и Y.
|
|
50 |
1 |
1 |
|
|
62,09 |
|
|
|||
|
|
|
10 |
1 |
1 |
|
|
|
15,36 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
50 |
5 |
1 |
|
|
|
73,62 |
|
|
|
|
|
|
10 |
5 |
1 |
|
|
|
28,90 |
|
|
|
X |
= |
|
|
, Y = |
|
|
, |
|||||
|
50 |
1 |
3 |
|
|
71,92 |
|
|||||
|
|
|
|
|||||||||
|
|
|
10 |
1 |
3 |
|
|
|
28,90 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
50 |
5 |
3 |
|
|
|
80,52 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
10 |
5 |
3 |
|
|
|
43,85 |
|
|
|
|
|
|
|
|
|
|
|
21
где xij — значение j-го фактора в i-м опыте, yi — значение отклика в i-м опыте. Численные значения всех базисных функций представим в матричной форме
|
1 |
50 |
1 |
1 |
|
||
|
|
10 |
1 |
1 |
|
|
|
|
1 |
|
|
||||
|
1 |
50 |
5 |
1 |
|
|
|
|
|
10 |
5 |
1 |
|
|
|
F = |
1 |
|
, |
||||
1 |
50 |
1 |
3 |
||||
|
|
||||||
|
|
10 |
1 |
|
|
|
|
|
1 |
3 |
|
||||
|
|
50 |
5 |
|
|
|
|
|
1 |
3 |
|
||||
|
|
10 |
5 |
|
|
|
|
|
1 |
3 |
|
где fij — значение j-й базисной функции Fj в i-м опыте. Чтобы определить точечные оценки b0, b1, b2, b3 коэффи-
циентов регрессии, применим МНК. Для этого найдем
|
|
|
|
|
|
1,1875 |
−0,009375 |
−0,09375 |
−0,25 |
|
C = (F |
T |
F ) |
−1 |
|
|
−0,009375 |
0,0003125 |
0 |
0 |
|
= |
|
|
||||||||
|
|
|
−0,09375 |
0 |
0,03125 |
0 |
. |
|||
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
−0,25 |
0 |
0 |
0,125 |
|
Согласно формуле (6), получаем матрицу искомых то-
чечных оценок |
|
|
|
|
b0 |
|
−1,86 |
|
|
b |
|
1,07 |
|
|
C (F TY )= 1 |
|
= |
3,04 |
. |
b2 |
|
|
||
b3 |
|
5,65 |
|
Кроме точечных оценок коэффициентов βi необходима оценка дисперсии σe2 случайной величины e.
22

Так как вид адекватной модели заранее не известен, то по формуле (8), используя данные специальной серии опытов (см. табл. 5), найдем
2 |
|
|
1 |
8 |
|
1 |
8 |
2 |
2 |
|
Se |
= |
|
|
∑ y j − |
|
∑yi |
= 4, 44 Н , |
|||
8 |
|
|
||||||||
|
|
−1 j=1 |
|
8 i=1 |
|
|
|
где yi — значение отклика в i-м опыте, причем эти значения не используются для получения точечных оценок коэффициентов регрессии.
Затем проведем статистический анализ, состоящий из проверки значимости коэффициентов регрессии, проверки адекватности и работоспособности регрессионной модели.
При проверке значимости коэффициентов регрессионной модели выясним, обусловлено ли отличие bi от нуля чисто случайными обстоятельствами или же это отличие неслучайно и вызвано тем, что в теоретической регрессионной модели действительно присутствует соответствующий коэффициент регрессии. Проверка осуществляется путем вычисления статистик
t |
= b |
S2c |
, |
i |
i |
e i+1 i+1 |
|
где i = 0, 1, 2, 3. Следовательно,
t0 |
= −1,86 |
4,44 1,1875 = −0,81; |
t1 =1,07 |
4,44 0,0003125 = 28,72; |
|
t2 |
= 3,04 |
4,44 0,03125 = 8,16; |
t3 |
= 5,65 |
4,44 0,125 = 7,59. |
Если |ti| ≤ t*, то соответствующий коэффициент регрес-
сии полагаем незначимым и исключаем из регрессионной модели. Критическое значение t* равно значению tν, α/ 2 , ко-
торое является квантилем уровня 1 −α/ 2 распределения
23
Стьюдента, число степеней свободы ν равно 7 и уровень значимости α соответствует 0,05, т. е.
t* = t7, 0,025 = 2,37.
После проверки значимости всех коэффициентов регрессии получим регрессионную модель, содержащую только значимые коэффициенты регрессии β(0), β(1), β(2), т. е.
y (m, b, s)=β(0) m +β(1) b +β(2) s + e ,
где m, b, s — базисные функции (F(0) = m, F(1) = b, F(2) = s). Затем численные значения всех базисных функций пред-
ставим в матричной форме
|
50 |
1 |
1 |
|
|
|
10 |
1 |
1 |
|
|
|
|
|
|||
|
50 |
5 |
1 |
|
|
|
|
|
|||
F = |
10 |
5 |
1 |
|
, |
|
50 |
1 |
3 |
|
|
|
10 |
1 |
3 |
|
|
|
|
|
|||
|
50 |
5 |
3 |
|
|
|
10 |
5 |
3 |
|
|
|
|
|
где fij — значение j-й базисной функции F(j) в i-м опыте. Точечные оценки b(0), b(1), b(2) значимых коэффициентов
регрессии определяем аналогичным образом, т. е.
b(0) (F T F )−1 (F TY )= b(1)
b(2)
|
|
1,05 |
|
|
|
2,89 |
|
|
= |
. |
|
|
|
5, 26 |
|
|
|
|
Тогда уравнение регрессии имеет вид
y = b(0) F(0) +b(1) F(1) +b(2) F(2) . |
(11) |
24
Проверка адекватности регрессионной модели возможна, так как получена точечная оценка Se2 дисперсии σe2 и выполнено условие d +1 = 3 < N = 8 . Для такой проверки используется статистика
|
|
|
|
1 |
8 |
|
|
|
|
|
|
|
|
∑(yi − yi )2 |
|
|
|
|
|
|
2 |
|
8 |
|
|
6,32 |
|
|
|
F = |
Sост |
= |
−3 i=1 |
= |
=1, 42 |
, |
|||
Se2 |
|
|
Se2 |
4, 44 |
|||||
|
|
|
|
|
|
|
где yi — значения, предсказанные с помощью регрессионно-
го уравнения (11).
Критическое значение F* равно значению Fν1 , ν2 , α , кото-
рое является квантилем уровня 0,95 распределения Фишера, ν1 = N −d −1 = 5 и ν2 = 7 — число степеней свободы Se2, т. е.
F* = F5, 7, 0,05 = 3,97.
Так как F не превосходит критического значения F*, то мо-
дель адекватна. Следовательно, для регрессионной модели имеет смысл рассматривать вопрос о ее работоспособности.
Чтобы получить представление о точностных свойствах регрессионной модели, вычислим по формуле (9) точечную оценку коэффициента детерминации
R |
2 |
|
|
8 |
−3 |
|
Sост2 |
|
5 |
6,32 |
|
|
=1 |
− |
|
|
|
|
=1− |
|
|
= 0,99. |
|
|
8 −1 |
2 |
7 |
605,90 |
|||||||
|
|
|
|
|
Sy |
|
|
Найденное значение R2 расположено близко к 1, что свидетельствует о хорошей точности регрессионной модели.
Таким образом, искомая экспериментальная зависимость y от массы механизма m, коэффициента затухания b демпфера и жесткости s пружины имеет вид
y (m, b, s)= b(0)m +b(1)b +b(2)s ,
где b(0) = 1,05 м/с2; b(1) = 2,89 м/с; b(2) = 5,26 м.
25