Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Линейные регрессионные модели (96

..pdf
Скачиваний:
4
Добавлен:
15.11.2022
Размер:
280.71 Кб
Скачать

Используя формулу (7) для определения Sост2 , получаем искомую точечную оценку

Se2 = 5 11 (0,103 0,1)2 + (0,183 0,2)2 + (0,309 0,3)2 +

+(0,422 0, 4)2 +(0,487 0,5)2 = 0,00025 м2 .

Замечание. Обычно вид адекватной модели заранее не известен. В этом случае дисперсия σe2 оценивается с использованием повторных опытов при фиксированных значениях факторов. Для этого, например, проводится специальная серия из L опытов при фиксированных значениях факторов, причем результаты этих опытов уже не используются для получения точечных оценок коэффициентов регрессии. Тогда точечную оценку дисперсии σe2 находим по формуле

 

1

L

 

 

 

 

 

Se2 =

(y j y )2 ,

 

 

 

 

(8)

 

 

 

 

 

 

νe j=1

 

 

 

 

 

 

 

 

 

1

L

 

 

где νe = L 1 — число степеней свободы Se2 ; y =

 

yi

 

 

среднее значение отклика.

 

L i=1

 

 

 

 

 

 

 

2.3. Свойства точечных оценок, полученных

 

 

методом наименьших квадратов

 

 

 

 

 

Полученные МНК оценки bi, где i = 0, …, d,

 

обладают

следующими тремя свойствами.

 

 

 

 

 

1. Несмещенность, т. е. M[bi] = βi.

 

 

 

 

 

2. Эффективность, т. е. дисперсия D[b ] = σ2 c

+1

то-

 

 

i

e i+1 i

 

чечной оценки bi минимальна в классе линейных несмещенных оценок, где ci+1 i+1 — элемент матрицы С, причем кова-

риация случайных величин bi и bj равна σ2e ci +1 j +1 .

11

Свойства 1 и 2 справедливы независимо от вида закона распределения случайной величины e. Если дополнительно предположить, что случайная величина e подчиняется нормальному закону N (0, σe ) , то можно сформулировать еще

одно свойство точечных оценок МНК.

3. Точечные оценки b0, b1, ..., bd подчиняются совместному (d +1) -мерному нормальному закону распределения и

совпадают с оценками, полученными методом максимального правдоподобия.

Пример 3. Определим дисперсию точечной оценки b, полученной МНК в примере 1.

Согласно второму свойству, имеем

 

 

 

 

 

 

D[b] = σ2 c ,

 

 

 

 

 

 

 

 

 

 

e

11

 

 

 

 

где

c11

 

N

1

 

— элемент матрицы С. Тогда, используя

=

ti2

 

 

 

 

i=1

 

 

 

 

 

 

 

 

числовые данные примера 1, получаем

 

 

 

 

 

 

 

D[b] =

 

σ2

 

 

=

σ2

 

 

 

 

e

 

 

e

.

 

 

 

102 +202 +302 +

402 +

502

5500

 

 

 

 

 

 

 

Таким образом, дисперсия оценки b определена в долях от σe2.

Замечание. Если в примере 1 считать, что допустимо повторное проведение эксперимента и фактор t может изменяться в пределах от 0 до 50 с, то для достижения минимальной дисперсии D[b] следует выбрать t1 = ... = t5 = 50 с.

Тогда при одинаковом количестве опытов

D[b] =

 

 

σ2

=

 

σ2

,

 

 

e

 

e

 

+502

+502 +502 +502

12500

502

 

 

что более чем в 2 раза меньше по сравнению с предыдущим вариантом.

12

3. СТАТИСТИЧЕСКИЙ АНАЛИЗ РЕЗУЛЬТАТОВ

Статистический анализ позволяет получить ответ на вопрос о пригодности регрессионной модели. Если модель непригодна, то ее необходимо изменить. Это приведет к построению более сложной математической модели и проверке ее пригодности и т. д. до тех пор, пока не будет получена пригодная математическая модель.

Статистический анализ, как правило, проводят в несколько этапов: проверка значимости коэффициентов регрессии; проверка адекватности регрессионной модели; проверка работоспособности регрессионной модели.

3.1. Проверка значимости коэффициентов регрессии

В результате этой проверки выясняется, обусловлено ли отличие bi от нуля чисто случайными обстоятельствами или же это отличие неслучайно и вызвано тем, что в теоретической регрессионной модели действительно присутствует соответствующий коэффициент регрессии, т. е. βi 0.

Проверка осуществляется путем вычисления статистик

t

= b

S2c

,

i

i

e i+1 i+1

 

где i = 0, …, d. Если |ti| не превосходит критического значения t , то соответствующий коэффициент регрессии полага-

ется незначимым и может быть исключен из регрессионной модели.

Критическое значение t равно значению tν, α/ 2 , которое

является квантилем уровня 1 −α/ 2 распределения Стьюдента и зависит от числа степеней свободы ν = νe и уровня значимости α (обычно α = 0,05 ). Значения квантилей tν,γ уровня 1 − γ распределения Стьюдента в зависимости от числа степеней свободы ν и вероятности γ приведены в табл. 2.

13

 

 

 

 

 

 

 

Таблица 2

Квантили tν,γ уровня 1 – γ распределения Стьюдента

Число

 

 

Вероятность γ = P{T > tν, γ}

 

степеней

 

 

 

свободы

 

 

 

 

 

 

 

 

ν

0,20

0,10

0,05

0,025

0,01

0,005

0,001

0,0005

1

1,38

3,08

6,31

12,71

31,82

63,66

318,31

636,62

2

1,06

1,89

2,92

4,30

6,97

9,93

22,33

31,60

3

0,98

1,64

2,35

3,18

4,54

5,84

10,21

12,94

4

0,94

1,53

2,13

2,78

3,75

4,60

7,17

8,61

5

0,92

1,48

2,02

2,57

3,37

4,03

5,89

6,86

6

0,91

1,44

1,94

2,45

3,14

3,71

5,21

5,96

7

0,90

1,42

1,90

2,37

3,00

3,50

4,78

5,41

8

0,89

1,40

1,86

2,31

2,90

3,36

4,50

5,04

9

0,88

1,38

1,83

2,26

2,82

3,25

4,30

4,78

10

0,88

1,37

1,81

2,23

2,76

3,17

4,14

4,59

11

0,88

1,36

1,80

2,20

2,72

3,11

4,02

4,44

12

0,87

1,36

1,78

2,18

2,68

3,06

3,93

4,32

13

0,87

1,35

1,77

2,16

2,65

3,01

3,85

4,22

14

0,87

1,34

1,76

2,15

2,62

2,98

3,79

4,14

15

0,87

1,34

1,75

2,13

2,60

2,95

3,73

4,07

16

0,86

1,34

1,75

2,12

2,58

2,92

3,69

4,02

17

0,86

1,33

1,74

2,11

2,57

2,90

3,65

3,97

18

0,86

1,33

1,73

2,10

2,55

2,88

3,61

3,92

19

0,86

1,33

1,73

2,09

2,54

2,86

3,58

3,88

20

0,86

1,33

1,73

2,09

2,53

2,85

3,55

3,85

21

0,86

1,32

1,72

2,08

2,52

2,83

3,53

3,82

22

0,86

1,32

1,72

2,07

2,51

2,82

3,50

3,79

23

0,86

1,32

1,71

2,07

2,50

2,81

3,48

3,77

24

0,86

1,32

1,71

2,06

2,49

2,80

3,47

3,75

25

0,86

1,32

1,71

2,06

2,48

2,79

3,45

3,73

30

0,85

1,31

1,70

2,04

2,46

2,75

3,39

3,65

40

0,85

1,30

1,68

2,02

2,42

2,70

3,31

3,55

60

0,85

1,30

1,67

2,00

2,39

2,66

3,23

3,46

120

0,84

1,29

1,66

1,98

2,36

2,62

3,16

3,37

0,84

1,28

1,64

1,96

2,33

2,58

3,09

3,29

14

Конечным результатом после проверки значимости всех коэффициентов регрессии является регрессионная модель, содержащая лишь значимые коэффициенты β(j), где j = 0, …, d. Причем d +1 N , где d +1 — общее число значимых коэффициентов регрессии.

3.2. Проверка адекватности регрессионной модели

Такая проверка регрессионной модели имеет своей целью выяснение вопроса о том, правильно ли выбран вид модели. Проверка адекватности регрессионной модели возмож-

на при условии, что d +1 < N и известна точечная оценка Se2

дисперсии случайной величины e.

Если d +1 = N , то проверять адекватность регрессионной модели не имеет смысла, так как в этом случае поверхность, соответствующая уравнению регрессии, проходит точно через все экспериментальные точки.

При проверке адекватности используют статистику

F = Sост2 Se2 .

Если F не превосходит критического значения F*, то модель

адекватна. В противном случае говорят о наличии дополнительного рассеивания, обусловленного несоответствием модели реальному объекту. Тогда необходимо либо усложнить регрессионную модель, либо уменьшить интервалы варьирования факторов.

Критическое значение F* равно значению Fν1 , ν2 , α , кото-

рое является квантилем уровня 1 −α распределения Фишера и зависит от степеней свободы ν1 = N d 1 , ν2 = νe и уров-

ня значимости α. Значения квантилей Fν1 , ν2 , α уровня 1 −α

распределения Фишера в зависимости от ν1, ν2 и вероятности α = 0,05 приведены в табл. 3.

15

Таблица 3

Квантили уровня 0,95 распределения Фишера в зависимости от ν1 , ν2

ν2

 

 

 

 

 

 

 

 

 

ν1

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

12

15

20

24

30

40

60

120

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

161

200

216

225

230

234

237

239

241

242

244

246

248

249

250

251

252

253

254

2

18,5

19,0

19,2

19,2

19,3

19,3

19,4

19,4

19,4

19,4

19,4

19,4

19, 4

19,5

19,5

19,5

19,5

19,5

19,5

3

10,1

9,55

9,28

9,12

9,01

8,94

8,89

8,85

8,81

8,79

8,74

8,70

8, 66

8,64

8,62

8,59

8,57

8,55

8,53

4

7,71

6,94

6,59

6,39

6,26

6,16

6,09

6,04

6,00

5,96

5,91

5,86

5, 80

5,77

5,75

5,72

5,69

5,66

5,63

5

6,61

5,79

5,41

5,19

5,05

4,95

4,88

4,82

4,77

4,74

4,68

4,62

4, 56

4,53

4,50

4,46

4,43

4,40

4,36

6

5,99

5,14

4,76

4,53

4,39

4,28

4,21

4,15

4,10

4,06

4,00

3,94

3, 87

3,84

3,81

3,77

3,74

3,70

3,67

7

5,59

4,74

4,35

4,12

3,97

3,87

3,79

3,73

3,68

3,64

3,57

3,51

3, 44

3,41

3,38

3,34

3,30

3,27

3,23

8

5,32

4,46

4,07

3,84

3,69

3,58

3,50

3,44

3,39

3,35

3,28

3,22

3, 15

3,12

3,08

3,04

3,01

2,97

2,93

9

5,12

4,26

3,86

3,63

3,48

3,37

3,29

3,23

3,18

3,14

3,07

3,01

2, 94

2,90

2,86

2,83

2,79

2,75

2,71

104,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2, 77 2,74 2,70 2,66 2,62 2,58 2,54

114,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2, 65 2,61 2,57 2,53 2,49 2,45 2,40

124,75 3,88 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2, 54 2,51 2,47 2,43 2,38 2,34 2,30

134,67 3,80 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2, 46 2,42 2,38 2,34 2,30 2,25 2,21

144,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2, 39 2,35 2,31 2,27 2,22 2,18 2,13

154,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2, 33 2,29 2,25 2,20 2,16 2,11 2,07

164,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2, 28 2,24 2,19 2,15 2,11 2,06 2,01

174,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2, 23 2,19 2,15 2,10 2,06 2,01 1,96

Окончание табл. 3

ν2

 

 

 

 

 

 

 

 

 

ν1

 

 

 

 

 

 

 

 

 

1

2

3

4

5

6

7

8

9

10

12

15

20

24

30

40

60

120

 

184,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2, 19 2,15 2,11 2,06 2,02 1,97 1,92

194,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2, 16 2,11 2,07 2,03 1,98 1,93 1,88

204,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2, 12 2,08 2,04 1,99 1,95 1,90 1,84

214,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2, 10 2,05 2,01 1,96 1,92 1,87 1,81

224,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2, 07 2,03 1,98 1,94 1,89 1,84 1,78

234,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2, 05 2,01 1,96 1,91 1,86 1,81 1,76

244,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2, 03 1,98 1,94 1,89 1,84 1,79 1,73

254,24 3,38 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2, 01 1,96 1,92 1,87 1,82 1,77 1,71

264,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1, 99 1,95 1,90 1,85 1,80 1,75 1,69

274,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1, 97 1,93 1,88 1,84 1,79 1,73 1,67

284,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1, 96 1,91 1,87 1,82 1,77 1,71 1,65

294,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1, 94 1,90 1,85 1,81 1,75 1,70 1,64

304,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1, 93 1,89 1,84 1,79 1,74 1,68 1,62

40

4,08

3,23

2,84

2,61

2,45

2,34

2,25

2,18

2,12

2,08

2,00

1,92

1, 84

1,79

1,74

1,69

1,64

1,58

1,51

60

4,00

3,15

2,76

2,53

2,37

2,25

2,17

2,10

2,04

1,99

1,92

1,84

1, 75

1,70

1,65

1,59

1,53

1,47

1,39

120

3,92

3,07

2,68

2,45

2,29

2,17

2,09

2,02

1,96

1,91

1,83

1,75

1, 66

1,61

1,55

1,50

1,43

1,35

1,25

3,84

3,00

2,60

2,37

2,21

2,10

2, 01

1,94

1,88

1,83

1,75

1,67

1,57

1,52

1,46

1,39

1,32

1,22

1,00

После проверки адекватности регрессионной модели, содержащей лишь значимые коэффициенты регрессии, имеет смысл рассматривать вопрос о ее работоспособности.

3.3. Проверка работоспособности регрессионной модели

Необходимость такой проверки обусловлена тем, что нередко даже адекватная регрессионная модель на практике оказывается бесполезной, например, в силу своей низкой точности предсказания. Эта проверка может включать в себя несколько различных процедур, описанных ниже.

Исследование остатков. Остатки ei = yi yi — это раз-

ности между фактически наблюдаемыми значениями yi в i-м опыте и значениями yi , предсказанными с помощью уравне-

ния регрессии

y (x1, x2 , ..., xn )= b(0) F(0) (x1, x2 , ..., xn )+

+b(1) F(1) (x1, x2 , ..., xn )+... +b(d ) F(d ) (x1, x2 , ..., xn ),

где b(0), b(1), ..., b(d) — точечные оценки значимых коэффициентов регрессии β(0), β(1), ..., β(d) соответственно.

Если регрессионная модель подобрана правильно, то остатки содержат информацию о свойствах случайной величины e. Тогда следует выяснить, не противоречат ли эти свойства предположениям, на которых основан весь анализ.

Вычисление точечной оценки коэффициента детерми-

нации. Коэффициент детерминации характеризует точностные свойства регрессионной модели, изменяясь в пределах от 0 до 1. Точечная оценка R2 коэффициента детерминации определяется по формуле

R

2

 

 

N d 1

S ост2

 

 

=1

 

 

 

 

.

(9)

 

N 1

2

 

 

 

 

 

Sy

 

18

Здесь

 

 

 

1

N

 

 

Sост2

=

( yi yi )2 ,

 

 

 

 

 

N d 1 i=1

 

 

 

 

1

 

N

 

1

N

Sy2 =

 

 

( yi y)2 , y =

yi ,

 

 

 

 

 

N 1 i=1

 

N i=1

где yi — значения отклика в i-м опыте; yi — значения, предсказанные с помощью уравнения регрессии; y — среднее значение отклика.

Если у модели R2 0,75 ( SостSy 0,5 ), то это обеспечивает уменьшение ошибки предсказания по крайней мере в 2 раза относительно примитивного предсказания по среднему значению отклика. Сопоставление точечной оценки коэффициента детерминации с R2 = 0,75 является простейшей процедурой, позволяющей получить общее представление о ценности найденной модели. Если число опытов велико по сравнению с числом коэффициентов в уравнении регрессии, то близость R2 к 1 говорит о хорошей точности регрессионной модели.

Дополнительные проверки. Они могут включать в себя выяснение правдоподобности регрессионной модели в соответствии с физикой протекающих в объекте процессов и рассмотрение ряда других вопросов, которые учитывают специфику задачи.

4. РЕШЕНИЕ ТИПОВОЙ ЗАДАЧИ

Механизм, состоящий из подвижной части, пружины и демпфера, соединен с неподвижным основанием. Под действием силы F(t) подвижная часть механизма перемещается по закону x(t), который является одинаковым для всех опытов. Расчетная схема механизма представлена на рис. 3.

19

1

2

3

4

b

 

 

 

s

 

m

F(t)

 

 

 

x(t)

 

 

Рис. 3. Схема механизма: 1 — неподвижное основание механизма; 2 — демпфер; 3 — пружина; 4 — подвижная часть механизма

Пусть y = F(t), где t — определенный момент времени. Тогда y зависит от массы механизма m, коэффициента затухания b демпфера и жесткости s пружины. Результаты измерения y в зависимости от факторов m, b и s представлены в табл. 4 и 5.

Таблица 4

Значения y в зависимости

от массы m, коэффициента затухания b и жесткости s

№ опыта

m, кг

b, H c/м

s, H/м

y, H

1

50

1

1

62,09

2

10

1

1

15,36

3

50

5

1

73,62

4

10

5

1

28,90

5

50

1

3

71,92

6

10

1

3

28,90

7

50

5

3

80,52

8

10

5

3

43,85

20

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]