![](/user_photo/_userpic.png)
Линейные регрессионные модели (96
..pdf![](/html/65386/468/html__zxt7nEfeT.ElKt/htmlconvd-DCPBP811x1.jpg)
Используя формулу (7) для определения Sост2 , получаем искомую точечную оценку
Se2 = 5 1−1 (0,103 −0,1)2 + (0,183 −0,2)2 + (0,309 −0,3)2 +
+(0,422 −0, 4)2 +(0,487 −0,5)2 = 0,00025 м2 .
Замечание. Обычно вид адекватной модели заранее не известен. В этом случае дисперсия σe2 оценивается с использованием повторных опытов при фиксированных значениях факторов. Для этого, например, проводится специальная серия из L опытов при фиксированных значениях факторов, причем результаты этих опытов уже не используются для получения точечных оценок коэффициентов регрессии. Тогда точечную оценку дисперсии σe2 находим по формуле
|
1 |
L |
|
|
|
|
|
Se2 = |
∑(y j − y )2 , |
|
|
|
|
(8) |
|
|
|
|
|
|
|||
|
νe j=1 |
|
|
|
|
|
|
|
|
|
|
1 |
L |
|
|
где νe = L −1 — число степеней свободы Se2 ; y = |
|
∑yi |
— |
||||
|
|
||||||
среднее значение отклика. |
|
L i=1 |
|
|
|||
|
|
|
|
|
|||
2.3. Свойства точечных оценок, полученных |
|
|
|||||
методом наименьших квадратов |
|
|
|
|
|
||
Полученные МНК оценки bi, где i = 0, …, d, |
|
обладают |
|||||
следующими тремя свойствами. |
|
|
|
|
|
||
1. Несмещенность, т. е. M[bi] = βi. |
|
|
|
|
|
||
2. Эффективность, т. е. дисперсия D[b ] = σ2 c |
+1 |
то- |
|||||
|
|
i |
e i+1 i |
|
чечной оценки bi минимальна в классе линейных несмещенных оценок, где ci+1 i+1 — элемент матрицы С, причем кова-
риация случайных величин bi и bj равна σ2e ci +1 j +1 .
11
Свойства 1 и 2 справедливы независимо от вида закона распределения случайной величины e. Если дополнительно предположить, что случайная величина e подчиняется нормальному закону N (0, σe ) , то можно сформулировать еще
одно свойство точечных оценок МНК.
3. Точечные оценки b0, b1, ..., bd подчиняются совместному (d +1) -мерному нормальному закону распределения и
совпадают с оценками, полученными методом максимального правдоподобия.
Пример 3. Определим дисперсию точечной оценки b, полученной МНК в примере 1.
Согласно второму свойству, имеем
|
|
|
|
|
|
D[b] = σ2 c , |
|
|
|
|
|
|
|
|
|
|
|
e |
11 |
|
|
|
|
где |
c11 |
|
N |
−1 |
|
— элемент матрицы С. Тогда, используя |
|||||
= |
∑ti2 |
|
|
||||||||
|
|
i=1 |
|
|
|
|
|
|
|
|
|
числовые данные примера 1, получаем |
|
|
|
|
|||||||
|
|
|
D[b] = |
|
σ2 |
|
|
= |
σ2 |
||
|
|
|
|
e |
|
|
e |
. |
|||
|
|
|
102 +202 +302 + |
402 + |
502 |
5500 |
|||||
|
|
|
|
|
|
|
Таким образом, дисперсия оценки b определена в долях от σe2.
Замечание. Если в примере 1 считать, что допустимо повторное проведение эксперимента и фактор t может изменяться в пределах от 0 до 50 с, то для достижения минимальной дисперсии D[b] следует выбрать t1 = ... = t5 = 50 с.
Тогда при одинаковом количестве опытов
D[b] = |
|
|
σ2 |
= |
|
σ2 |
, |
|
|
e |
|
e |
|||
|
+502 |
+502 +502 +502 |
12500 |
||||
502 |
|
|
что более чем в 2 раза меньше по сравнению с предыдущим вариантом.
12
![](/html/65386/468/html__zxt7nEfeT.ElKt/htmlconvd-DCPBP813x1.jpg)
3. СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЗУЛЬТАТОВ
Статистический анализ позволяет получить ответ на вопрос о пригодности регрессионной модели. Если модель непригодна, то ее необходимо изменить. Это приведет к построению более сложной математической модели и проверке ее пригодности и т. д. до тех пор, пока не будет получена пригодная математическая модель.
Статистический анализ, как правило, проводят в несколько этапов: проверка значимости коэффициентов регрессии; проверка адекватности регрессионной модели; проверка работоспособности регрессионной модели.
3.1. Проверка значимости коэффициентов регрессии
В результате этой проверки выясняется, обусловлено ли отличие bi от нуля чисто случайными обстоятельствами или же это отличие неслучайно и вызвано тем, что в теоретической регрессионной модели действительно присутствует соответствующий коэффициент регрессии, т. е. βi ≠ 0.
Проверка осуществляется путем вычисления статистик
t |
= b |
S2c |
, |
i |
i |
e i+1 i+1 |
|
где i = 0, …, d. Если |ti| не превосходит критического значения t , то соответствующий коэффициент регрессии полага-
ется незначимым и может быть исключен из регрессионной модели.
Критическое значение t равно значению tν, α/ 2 , которое
является квантилем уровня 1 −α/ 2 распределения Стьюдента и зависит от числа степеней свободы ν = νe и уровня значимости α (обычно α = 0,05 ). Значения квантилей tν,γ уровня 1 − γ распределения Стьюдента в зависимости от числа степеней свободы ν и вероятности γ приведены в табл. 2.
13
|
|
|
|
|
|
|
Таблица 2 |
|
Квантили tν,γ уровня 1 – γ распределения Стьюдента |
||||||||
Число |
|
|
Вероятность γ = P{T > tν, γ} |
|
||||
степеней |
|
|
|
|||||
свободы |
|
|
|
|
|
|
|
|
ν |
0,20 |
0,10 |
0,05 |
0,025 |
0,01 |
0,005 |
0,001 |
0,0005 |
1 |
1,38 |
3,08 |
6,31 |
12,71 |
31,82 |
63,66 |
318,31 |
636,62 |
2 |
1,06 |
1,89 |
2,92 |
4,30 |
6,97 |
9,93 |
22,33 |
31,60 |
3 |
0,98 |
1,64 |
2,35 |
3,18 |
4,54 |
5,84 |
10,21 |
12,94 |
4 |
0,94 |
1,53 |
2,13 |
2,78 |
3,75 |
4,60 |
7,17 |
8,61 |
5 |
0,92 |
1,48 |
2,02 |
2,57 |
3,37 |
4,03 |
5,89 |
6,86 |
6 |
0,91 |
1,44 |
1,94 |
2,45 |
3,14 |
3,71 |
5,21 |
5,96 |
7 |
0,90 |
1,42 |
1,90 |
2,37 |
3,00 |
3,50 |
4,78 |
5,41 |
8 |
0,89 |
1,40 |
1,86 |
2,31 |
2,90 |
3,36 |
4,50 |
5,04 |
9 |
0,88 |
1,38 |
1,83 |
2,26 |
2,82 |
3,25 |
4,30 |
4,78 |
10 |
0,88 |
1,37 |
1,81 |
2,23 |
2,76 |
3,17 |
4,14 |
4,59 |
11 |
0,88 |
1,36 |
1,80 |
2,20 |
2,72 |
3,11 |
4,02 |
4,44 |
12 |
0,87 |
1,36 |
1,78 |
2,18 |
2,68 |
3,06 |
3,93 |
4,32 |
13 |
0,87 |
1,35 |
1,77 |
2,16 |
2,65 |
3,01 |
3,85 |
4,22 |
14 |
0,87 |
1,34 |
1,76 |
2,15 |
2,62 |
2,98 |
3,79 |
4,14 |
15 |
0,87 |
1,34 |
1,75 |
2,13 |
2,60 |
2,95 |
3,73 |
4,07 |
16 |
0,86 |
1,34 |
1,75 |
2,12 |
2,58 |
2,92 |
3,69 |
4,02 |
17 |
0,86 |
1,33 |
1,74 |
2,11 |
2,57 |
2,90 |
3,65 |
3,97 |
18 |
0,86 |
1,33 |
1,73 |
2,10 |
2,55 |
2,88 |
3,61 |
3,92 |
19 |
0,86 |
1,33 |
1,73 |
2,09 |
2,54 |
2,86 |
3,58 |
3,88 |
20 |
0,86 |
1,33 |
1,73 |
2,09 |
2,53 |
2,85 |
3,55 |
3,85 |
21 |
0,86 |
1,32 |
1,72 |
2,08 |
2,52 |
2,83 |
3,53 |
3,82 |
22 |
0,86 |
1,32 |
1,72 |
2,07 |
2,51 |
2,82 |
3,50 |
3,79 |
23 |
0,86 |
1,32 |
1,71 |
2,07 |
2,50 |
2,81 |
3,48 |
3,77 |
24 |
0,86 |
1,32 |
1,71 |
2,06 |
2,49 |
2,80 |
3,47 |
3,75 |
25 |
0,86 |
1,32 |
1,71 |
2,06 |
2,48 |
2,79 |
3,45 |
3,73 |
30 |
0,85 |
1,31 |
1,70 |
2,04 |
2,46 |
2,75 |
3,39 |
3,65 |
40 |
0,85 |
1,30 |
1,68 |
2,02 |
2,42 |
2,70 |
3,31 |
3,55 |
60 |
0,85 |
1,30 |
1,67 |
2,00 |
2,39 |
2,66 |
3,23 |
3,46 |
120 |
0,84 |
1,29 |
1,66 |
1,98 |
2,36 |
2,62 |
3,16 |
3,37 |
∞ |
0,84 |
1,28 |
1,64 |
1,96 |
2,33 |
2,58 |
3,09 |
3,29 |
14
Конечным результатом после проверки значимости всех коэффициентов регрессии является регрессионная модель, содержащая лишь значимые коэффициенты β(j), где j = 0, …, d. Причем d +1 ≤ N , где d +1 — общее число значимых коэффициентов регрессии.
3.2. Проверка адекватности регрессионной модели
Такая проверка регрессионной модели имеет своей целью выяснение вопроса о том, правильно ли выбран вид модели. Проверка адекватности регрессионной модели возмож-
на при условии, что d +1 < N и известна точечная оценка Se2
дисперсии случайной величины e.
Если d +1 = N , то проверять адекватность регрессионной модели не имеет смысла, так как в этом случае поверхность, соответствующая уравнению регрессии, проходит точно через все экспериментальные точки.
При проверке адекватности используют статистику
F = Sост2 Se2 .
Если F не превосходит критического значения F*, то модель
адекватна. В противном случае говорят о наличии дополнительного рассеивания, обусловленного несоответствием модели реальному объекту. Тогда необходимо либо усложнить регрессионную модель, либо уменьшить интервалы варьирования факторов.
Критическое значение F* равно значению Fν1 , ν2 , α , кото-
рое является квантилем уровня 1 −α распределения Фишера и зависит от степеней свободы ν1 = N −d −1 , ν2 = νe и уров-
ня значимости α. Значения квантилей Fν1 , ν2 , α уровня 1 −α
распределения Фишера в зависимости от ν1, ν2 и вероятности α = 0,05 приведены в табл. 3.
15
![](/html/65386/468/html__zxt7nEfeT.ElKt/htmlconvd-DCPBP816x1.jpg)
Таблица 3
Квантили уровня 0,95 распределения Фишера в зависимости от ν1 , ν2
ν2 |
|
|
|
|
|
|
|
|
|
ν1 |
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
12 |
15 |
20 |
24 |
30 |
40 |
60 |
120 |
∞ |
||
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
161 |
200 |
216 |
225 |
230 |
234 |
237 |
239 |
241 |
242 |
244 |
246 |
248 |
249 |
250 |
251 |
252 |
253 |
254 |
|
2 |
18,5 |
19,0 |
19,2 |
19,2 |
19,3 |
19,3 |
19,4 |
19,4 |
19,4 |
19,4 |
19,4 |
19,4 |
19, 4 |
19,5 |
19,5 |
19,5 |
19,5 |
19,5 |
19,5 |
|
3 |
10,1 |
9,55 |
9,28 |
9,12 |
9,01 |
8,94 |
8,89 |
8,85 |
8,81 |
8,79 |
8,74 |
8,70 |
8, 66 |
8,64 |
8,62 |
8,59 |
8,57 |
8,55 |
8,53 |
|
4 |
7,71 |
6,94 |
6,59 |
6,39 |
6,26 |
6,16 |
6,09 |
6,04 |
6,00 |
5,96 |
5,91 |
5,86 |
5, 80 |
5,77 |
5,75 |
5,72 |
5,69 |
5,66 |
5,63 |
|
5 |
6,61 |
5,79 |
5,41 |
5,19 |
5,05 |
4,95 |
4,88 |
4,82 |
4,77 |
4,74 |
4,68 |
4,62 |
4, 56 |
4,53 |
4,50 |
4,46 |
4,43 |
4,40 |
4,36 |
|
6 |
5,99 |
5,14 |
4,76 |
4,53 |
4,39 |
4,28 |
4,21 |
4,15 |
4,10 |
4,06 |
4,00 |
3,94 |
3, 87 |
3,84 |
3,81 |
3,77 |
3,74 |
3,70 |
3,67 |
|
7 |
5,59 |
4,74 |
4,35 |
4,12 |
3,97 |
3,87 |
3,79 |
3,73 |
3,68 |
3,64 |
3,57 |
3,51 |
3, 44 |
3,41 |
3,38 |
3,34 |
3,30 |
3,27 |
3,23 |
|
8 |
5,32 |
4,46 |
4,07 |
3,84 |
3,69 |
3,58 |
3,50 |
3,44 |
3,39 |
3,35 |
3,28 |
3,22 |
3, 15 |
3,12 |
3,08 |
3,04 |
3,01 |
2,97 |
2,93 |
|
9 |
5,12 |
4,26 |
3,86 |
3,63 |
3,48 |
3,37 |
3,29 |
3,23 |
3,18 |
3,14 |
3,07 |
3,01 |
2, 94 |
2,90 |
2,86 |
2,83 |
2,79 |
2,75 |
2,71 |
104,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2, 77 2,74 2,70 2,66 2,62 2,58 2,54
114,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2, 65 2,61 2,57 2,53 2,49 2,45 2,40
124,75 3,88 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2, 54 2,51 2,47 2,43 2,38 2,34 2,30
134,67 3,80 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2, 46 2,42 2,38 2,34 2,30 2,25 2,21
144,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2, 39 2,35 2,31 2,27 2,22 2,18 2,13
154,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2, 33 2,29 2,25 2,20 2,16 2,11 2,07
164,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2, 28 2,24 2,19 2,15 2,11 2,06 2,01
174,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2, 23 2,19 2,15 2,10 2,06 2,01 1,96
![](/html/65386/468/html__zxt7nEfeT.ElKt/htmlconvd-DCPBP817x1.jpg)
Окончание табл. 3
ν2 |
|
|
|
|
|
|
|
|
|
ν1 |
|
|
|
|
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
12 |
15 |
20 |
24 |
30 |
40 |
60 |
120 |
∞ |
||
|
184,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2, 19 2,15 2,11 2,06 2,02 1,97 1,92
194,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2, 16 2,11 2,07 2,03 1,98 1,93 1,88
204,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2, 12 2,08 2,04 1,99 1,95 1,90 1,84
214,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2, 10 2,05 2,01 1,96 1,92 1,87 1,81
224,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2, 07 2,03 1,98 1,94 1,89 1,84 1,78
234,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2, 05 2,01 1,96 1,91 1,86 1,81 1,76
244,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2, 03 1,98 1,94 1,89 1,84 1,79 1,73
254,24 3,38 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2, 01 1,96 1,92 1,87 1,82 1,77 1,71
264,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1, 99 1,95 1,90 1,85 1,80 1,75 1,69
274,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1, 97 1,93 1,88 1,84 1,79 1,73 1,67
284,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1, 96 1,91 1,87 1,82 1,77 1,71 1,65
294,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1, 94 1,90 1,85 1,81 1,75 1,70 1,64
304,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1, 93 1,89 1,84 1,79 1,74 1,68 1,62
40 |
4,08 |
3,23 |
2,84 |
2,61 |
2,45 |
2,34 |
2,25 |
2,18 |
2,12 |
2,08 |
2,00 |
1,92 |
1, 84 |
1,79 |
1,74 |
1,69 |
1,64 |
1,58 |
1,51 |
60 |
4,00 |
3,15 |
2,76 |
2,53 |
2,37 |
2,25 |
2,17 |
2,10 |
2,04 |
1,99 |
1,92 |
1,84 |
1, 75 |
1,70 |
1,65 |
1,59 |
1,53 |
1,47 |
1,39 |
120 |
3,92 |
3,07 |
2,68 |
2,45 |
2,29 |
2,17 |
2,09 |
2,02 |
1,96 |
1,91 |
1,83 |
1,75 |
1, 66 |
1,61 |
1,55 |
1,50 |
1,43 |
1,35 |
1,25 |
∞ |
3,84 |
3,00 |
2,60 |
2,37 |
2,21 |
2,10 |
2, 01 |
1,94 |
1,88 |
1,83 |
1,75 |
1,67 |
1,57 |
1,52 |
1,46 |
1,39 |
1,32 |
1,22 |
1,00 |
После проверки адекватности регрессионной модели, содержащей лишь значимые коэффициенты регрессии, имеет смысл рассматривать вопрос о ее работоспособности.
3.3. Проверка работоспособности регрессионной модели
Необходимость такой проверки обусловлена тем, что нередко даже адекватная регрессионная модель на практике оказывается бесполезной, например, в силу своей низкой точности предсказания. Эта проверка может включать в себя несколько различных процедур, описанных ниже.
Исследование остатков. Остатки ei = yi − yi — это раз-
ности между фактически наблюдаемыми значениями yi в i-м опыте и значениями yi , предсказанными с помощью уравне-
ния регрессии
y (x1, x2 , ..., xn )= b(0) F(0) (x1, x2 , ..., xn )+
+b(1) F(1) (x1, x2 , ..., xn )+... +b(d ) F(d ) (x1, x2 , ..., xn ),
где b(0), b(1), ..., b(d) — точечные оценки значимых коэффициентов регрессии β(0), β(1), ..., β(d) соответственно.
Если регрессионная модель подобрана правильно, то остатки содержат информацию о свойствах случайной величины e. Тогда следует выяснить, не противоречат ли эти свойства предположениям, на которых основан весь анализ.
Вычисление точечной оценки коэффициента детерми-
нации. Коэффициент детерминации характеризует точностные свойства регрессионной модели, изменяясь в пределах от 0 до 1. Точечная оценка R2 коэффициента детерминации определяется по формуле
R |
2 |
|
|
N −d −1 |
S ост2 |
|
|||
|
=1 |
− |
|
|
|
|
. |
(9) |
|
|
N −1 |
2 |
|||||||
|
|
|
|
|
Sy |
|
18
Здесь
|
|
|
1 |
N |
|
|
||
Sост2 |
= |
∑( yi − yi )2 , |
||||||
|
|
|||||||
|
|
|
N − d −1 i=1 |
|
|
|||
|
|
1 |
|
N |
|
1 |
N |
|
Sy2 = |
|
|
∑( yi − y)2 , y = |
∑yi , |
||||
|
|
|
|
|||||
|
N −1 i=1 |
|
N i=1 |
где yi — значения отклика в i-м опыте; yi — значения, предсказанные с помощью уравнения регрессии; y — среднее значение отклика.
Если у модели R2 ≥ 0,75 ( SостSy ≤ 0,5 ), то это обеспечивает уменьшение ошибки предсказания по крайней мере в 2 раза относительно примитивного предсказания по среднему значению отклика. Сопоставление точечной оценки коэффициента детерминации с R2 = 0,75 является простейшей процедурой, позволяющей получить общее представление о ценности найденной модели. Если число опытов велико по сравнению с числом коэффициентов в уравнении регрессии, то близость R2 к 1 говорит о хорошей точности регрессионной модели.
Дополнительные проверки. Они могут включать в себя выяснение правдоподобности регрессионной модели в соответствии с физикой протекающих в объекте процессов и рассмотрение ряда других вопросов, которые учитывают специфику задачи.
4. РЕШЕНИЕ ТИПОВОЙ ЗАДАЧИ
Механизм, состоящий из подвижной части, пружины и демпфера, соединен с неподвижным основанием. Под действием силы F(t) подвижная часть механизма перемещается по закону x(t), который является одинаковым для всех опытов. Расчетная схема механизма представлена на рис. 3.
19
![](/html/65386/468/html__zxt7nEfeT.ElKt/htmlconvd-DCPBP820x1.jpg)
1 |
2 |
3 |
4 |
b |
|
|
|
s |
|
m |
F(t) |
|
|
||
|
x(t) |
|
|
Рис. 3. Схема механизма: 1 — неподвижное основание механизма; 2 — демпфер; 3 — пружина; 4 — подвижная часть механизма
Пусть y = F(t), где t — определенный момент времени. Тогда y зависит от массы механизма m, коэффициента затухания b демпфера и жесткости s пружины. Результаты измерения y в зависимости от факторов m, b и s представлены в табл. 4 и 5.
Таблица 4
Значения y в зависимости
от массы m, коэффициента затухания b и жесткости s
№ опыта |
m, кг |
b, H c/м |
s, H/м |
y, H |
1 |
50 |
1 |
1 |
62,09 |
2 |
10 |
1 |
1 |
15,36 |
3 |
50 |
5 |
1 |
73,62 |
4 |
10 |
5 |
1 |
28,90 |
5 |
50 |
1 |
3 |
71,92 |
6 |
10 |
1 |
3 |
28,90 |
7 |
50 |
5 |
3 |
80,52 |
8 |
10 |
5 |
3 |
43,85 |
20