Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лаб практикум часть 2 (последняя версия).doc
Скачиваний:
25
Добавлен:
09.02.2015
Размер:
2.9 Mб
Скачать

Лабораторная работа 3 Линейная регрессия

Цель работы: получить навыки построения регрессионных моделей с помощью системы Maple.

Краткий теоретический материал. Парная регрессия – уравнение связи двух переменных:

,

где – зависимая переменная (результативный признак);

–независимая объясняющая переменная (фактор-признак).

Линейная парная регрессия:, где и− параметры регрессии,− случайная переменная или ошибка.

Построение уравнения регрессии сводится к оценке её параметров. Для этого используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических значенийминимальна, т.е.:

.

Для нахождения оценок параметров регрессии решается следующая система относительно и:

Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным. Проверка значимости уравнения регрессии производится на основе дисперсионного анализа.

Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:

,

где − общая сумма квадратов отклонений;

–сумма квадратов отклонений, обусловленная регрессией («объяснённая» или «факторная»);

–остаточная сумма квадратов отклонений.

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака характеризует коэффициент детерминации, который можно вычислить по формуле:

.

Например, коэффициент детерминации свидетельствует о том, что вариация исследуемой зависимой переменнойна 87,1 % объясняется изменчивостью объясняющей переменной.

Уравнение регрессии значимо на уровне , если фактическое значение– статистики

удовлетворяет условию ,где− табличное значение-критерия Фишера;− число оцениваемых параметров уравнения регрессии (для линейной парной регрессии);− число наблюдений;,.

Задание. Рассматриваются случайные величины X и Y, между которыми существует статистическая зависимость. Случайная ве-личина X считается независимой переменной, Y – зависимой. По заданным в условии результатам измерения аппроксимировать статистическую зависимость подходящей линейной зависимостью. Уравнение прямой найти методом наименьших квадратов. Определить достоверность полученной зависимости.

Вариант 1

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

-1.45

-1.83

-1.25

-1.05

-1.24

-0.99

-0.77

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

-0.50

-0.34

0.08

0.09

0.32

0.99

0.86

Вариант 2

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

-2.17

-1.38

-0.97

-0.5

-0.31

-0.72

-0.31

x

-0.2

-0.1

0.

0.1

0.2

0.3

0.4

y

0.2

0.92

0.99

1.05

1.30

1.41

1.89

Вариант 3

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

0.49

0.63

0.28

0.77

1.3

1.21

1.31

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

1.46

1.91

2.15

2.28

2.43

2.73

2.57

Вариант 4

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

-0.14

0.66

1.40

0.93

1.74

1.76

1.77

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

2.62

2.79

2.74

2.72

3.31

3.50

4.08

Вариант 5

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

2.02

2.07

2.44

2.71

2.96

2.91

3.32

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

3.49

3.46

3.97

4.12

3.94

4.68

4.92

Вариант 6

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

2.32

2.45

2.92

2.54

3.49

3.73

4.11

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

4.94

4.68

4.86

5.61

6.02

5.46

6.59

Вариант 7

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

3.91

3.89

4.70

4.99

4.94

5.48

5.38

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

5.49

5.4

5.71

6.52

6.35

6.52

7.14

Вариант 8

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

3.97

4.81

4.92

5.36

5.82

5.79

6.27

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

6.86

6.21

6.86

7.37

7.53

7.96

8.40

Вариант 9

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

2.26

1.68

1.48

1.27

1.18

1.13

0.65

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

0.74

0.22

0.22

0.02

-0.38

-0.57

-0.92

Вариант 10

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

2.71

2.85

2.34

2.4

1.76

2.16

1.81

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

1.6

1.14

1.35

0.79

0.99

0.27

0.06

Вариант 11

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

4.09

3.64

3.43

3.19

3.10

3.06

2.68

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

2.24

2.26

2.04

1.96

1.19

1.50

1.04

Вариант 12

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

4.59

4.78

4.49

4.20

3.75

3.94

3.54

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

3.62

3

2.78

2.77

2.51

2.48

1.80

Вариант 13

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

5.89

5.34

5.62

5.19

4.75

4.65

4.25

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

4.25

4.23

3.96

3.82

3.56

3.24

2.89

Вариант 14

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

7.69

7.51

7.31

6.95

6.63

6.52

5.65

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

5.61

5.08

4.77

4.50

4.22

3.35

3.87

Вариант 15

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

4.87

4.99

5.07

5.44

5.36

5.43

5.50

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

5.64

5.86

5.79

5.92

6.36

6.08

6.5

Вариант 16

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

-1.46

-1.84

-1.26

-1.06

-1.25

-0.98

-0.78

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

-0.51

-0.35

0.09

0.08

0.33

0.98

0.87

Вариант 17

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

-2.18

-1.39

-0.98

-0.6

-0.32

-0.73

-0.32

x

-0.2

-0.1

0.

0.1

0.2

0.3

0.4

y

0.21

0.93

0.98

1.06

1.31

1.42

1.88

Вариант 18

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

0.48

0.64

0.29

0.78

1.31

1.23

1.32

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

1.47

1.9

2.14

2.29

2.44

2.72

2.56

Вариант 19

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

-0.15

0.67

1.41

0.94

1.75

1.76

1.78

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

2.62

2.79

2.74

2.72

3.31

3.50

4.08

Вариант 20

x

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

-0.3

y

2.02

2.07

2.44

2.71

2.96

2.91

3.32

x

-0.2

-0.1

0

0.1

0.2

0.3

0.4

y

3.49

3.46

3.97

4.12

3.94

4.68

4.92

Вариант 21

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

2.33

2.46

2.91

2.54

3.48

3.74

4.12

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

4.95

4.69

4.86

5.62

6.03

5.45

6.58

Вариант 22

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

3.91

3.89

4.70

4.99

4.94

5.48

5.38

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

5.49

5.4

5.71

6.52

6.35

6.52

7.14

Вариант 23

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

3.97

4.81

4.92

5.36

5.82

5.79

6.27

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

6.86

6.21

6.86

7.37

7.53

7.96

8.40

Вариант 24

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

2.26

1,68

1.48

1.27

1.18

1.13

0.65

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

0.74

0.22

0.22

0.02

-0.38

-0.57

-0.92

Вариант 25

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

2.71

2.85

2.34

2.4

1.76

2.16

1.81

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

1.6

1.14

1.35

0.79

0.99

0.27

0.06

Вариант 26

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

4.09

3.64

3.43

3.19

3.10

3.06

2.68

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

2.24

2.26

2.04

1.96

1.19

1.50

1.04

Вариант 27

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

4.59

4.78

4.49

4.20

3.75

3.94

3.54

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

3.62

3

2.78

2.77

2.51

2.48

1.80

Вариант 28

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

5.89

5.34

5.62

5.19

4.75

4.65

4.25

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

4.25

4.23

3.96

3.82

3.56

3.24

2.89

Вариант 29

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

7.69

7.51

7.31

6.95

6.63

6.52

5.65

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

5.61

5.08

4.77

4.50

4.22

3.35

3.87

Вариант 30

x

-0.11

-0.9

-0.8

-0.7

-0.6

-0.5

-0.4

y

4.87

4.99

5.07

5.44

5.36

5.43

5.50

x

-0.3

-0.2

-0.1

0.

0.1

0.2

0.3

y

5.64

5.86

5.79

5.92

6.36

6.08

6.5

Пример выполнения лабораторной работы

Зададим значения величин и.

> restart:X:=[-0.9,-0.8,-0.7,-0.6,-0.5,-0.4,-0.3,-0.2, -0.1,0,0.1,0.2,0.3,0.4]:

>Y:=[-5.32,-5.62,-5.51,-4.72,-4.68,-4.24,-3.74,-3.46,-2.84,-3.39,-3.08,-2.17,-1.69,-1.33]:

Построим корреляционное поле. Нанесём точки с координатами , на координатную плоскость.

> with(stats): statplots[scatterplot](X,Y,color=black).

Замечание. В версии Maple V R 4 для построения корреляционного поля нужно вызывать функцию с именем scatter 2d.

Методом наименьших квадратов найдём прямую такую, что сумма квадратов отклонений заданных точек от прямой будет наименьшей.

> fit[leastsquare[[x,y]]]([X,Y]);

Результат, полученный на экране монитора:

Для удобства определим найденную зависимость как функцию пользователя с именем :

> F:=unapply(-2.888461538+3.243296703*x,x);

Результат, полученный на экране монитора:

Определим «значимость» полученной нами регрессионной зависимости. Вычислим значение коэффициента детерминации R2. Найдём среднее значение . Обозначим эту величину идентификатором Ysr.

> n:=14:Ysr:=sum(Y[i],'i'=1..n)/n.

Результат, полученный на экране монитора:

Вычислим значения , определяемые уравнением регрессии. Полученное множество значений обозначим идентификатором FL.

> FL:=seq(F(X[i]),i=1..n):

Определим – меру разброса, объяснённого с помощью регрессии, и –меру общего разброса (вариации) переменной :

> SR2:=sum((FL[i]-Ysr)^2,'i'=1..n); S2:=sum((Y[i]-Ysr)^2,'i'=1..n);

Результат, полученный на экране монитора:

Вычислим значение статистического коэффициента детерминации R2:

> R2:=SR2/S2;

Результат, полученный на экране монитора:

По величине коэффициента детерминации заключаем, что вариация исследуемой зависимой переменной на 95.13 % объясняется изменчивостью объясняющей переменнойх.

Определим значимость уравнения регрессии. Найдём Fst –зна-чение F-статистики:

> Fst:=R2*(n-2)/(1-R2);

Результат, полученный на экране монитора:

Найденное значение Fst сравним с критическим значением критерия Фишера. Уровень значимости примем равным 0.05. По таблице определяем, что Fкр=4.747. Так как Fst>Fкр, то уравнение регрессии значимо на уровне 0.05.

Изобразим корреляционное поле и график полученной прямой на одном рисунке:

> k:=statplots[scatterplot](X,Y,color=green):

> l:=plot(F(x),x=-0.9..0.4):

> plots[display]([k,l]);

Результат, полученный на экране монитора: