Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
305
Добавлен:
27.03.2015
Размер:
630.27 Кб
Скачать

Расчеты, выполненные для степенной модели.

,

Приводим к линейному виду:ln= lna+b•lnx. Производим замену:ln= z , ln a=c, ln x=t, z=c+bt

b= , c=

b=0,6145, c=2,1662, z=2,1662+0,6145·t

ln y = 2,1662+0,6145·ln x

= 8,7251•(x^(0,61))

Индекс корреляции:

=0,662

Сила связи заметная.

F-критерий:

F==17,5349

Ошибка аппроксимации:

=1/n •∑ ׀(yi- yт)/yi ׀ •100%, =0,0473•100%=4,7%

Модель является точной

Коэффициент эластичности:

Э==0,6145

Расчеты, выполненные для показательной модели.

,

Приводим к линейному виду.

ln=lna•, ln=lna+x ln b

Производим замену:

ln=z , ln a=c, ln b=d, z=c+dx

d=, c=

d= 0,00659952, c= 4,33049657, z=4,33049657+0,00659952x

=, 4,33049657•e(0,00659952)^x

Индекс корреляции:

= 0,81872531, Сила связи высокая.

F-критерий:

F==20,3316283

Ошибка аппроксимации:

=1/n •∑ ׀(yi- yт)/yi ׀ •100%, = 0,04586123•100%= 4,5%

Модель является точной

Коэфф. эластичности: Э== 0,57250843

Расчеты, выполненные для равносторонней гиперболы.

=a+

Произведем замену:

, =a+bw, b=, a=, b=-7743,59071, а= 226,336462, =(-7743,59071)+226,336462,10/x

Индекс корреляции:

=0,81395595

Сила связи высокая.

F-критерий:

F== 19,6317625

Ошибка аппроксимации:

=1/n •∑ ׀(yi- yт)/yi ׀ •100%, = 0,047462265•100%= 4,7% Модель является удовлетворительной

Коэфф. эластичности: Э= 0,65120909

Постановка задачи

По 20 предприятиям региона изучается зависимость выработки продукции на одного работника (тыс. руб.) от ввода в действие новых основных фондов(% от стоимости фондов на конец года) и от удельного веса рабочих высокой квалификации в общей численности рабочих(%)

Требуется:

  1. Построить линейную модель множественной регрессии. Записать стандартизованное уравнение множественной регрессии. На основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности ранжировать факторы по степени их влияния на результат.

  2. Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их. Проверить наличие мультиколлинеарности.

  3. Найти скорректированный коэффициент множественной детерминации. Сравнить его с нескорректированным (общим) коэффициентом детерминации.

  4. С помощью -критерия Фишера оценить статистическую надежность уравнения регрессии и коэффициента детерминации.

  5. С помощью t-критерия Стьюдента оценить статистическую значимость коэффициентов регрессии.

  6. Доверительные интервалы для статистически значимых коэффициентов регрессии.

  7. Доверительные интервалы для функции регрессии.

  8. Доверительные интервалы для индивидуальных значений зависимой переменной.

Решение и анализ

  1. Построение линейной модели множественной регрессии. Запись стандартизованного уравнения множественной регрессии. Ранжирование факторов по степени их влияния на результат на основе стандартизованных коэффициентов регрессии и средних коэффициентов эластичности.

, ,

y=XB+e,

1 X11 X12 . . . X1m

X= 1 X21 X22 . . . X2m

……………………

1 Xn1 Xn2 . . . Xnm n·x(m+1)

B=(xTx)-1 · xTy

1 1 …. 1 1……X1m n ….

(xTx)= X11 X12 . . . Xn1 · 1……X2m = ….

X1m ……..Xnm 1…….Xnm

20 125,8 453 0,570 -0,025 -0,015

xTx = 125,8 868,9 3120,5 (xTx)-1= -0,025 0,286 -0,078

453 3120,5 11251 -0,015 -0,078 0,022

xTy= =

Таким образом,

В=

Линейная модель множественной регрессии выглядит следующим образом:

= 1,31976 + 1,338086 Х1 + 0,016056 Х2

Рассмотрим стандартизованные коэффициенты регрессии и средние коэффициенты эластичности.

Коэффициент эластичности.

Частный коэффициент эластичности показывает, на сколько % в среднем изменяется признак-результат У с увеличением фактора Хj на 1% от своего среднего уровня, при фиксированном положении других факторов модели.

Экономически это означает, что при увеличении количества вводимых в действие новых основных фондов на 1%, и при неизменном удельном весе рабочих высокой квалификации в общей численности рабочих, выработка продукции на одного работника возрастает на 0,83%.

При увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на 1%, и при неизменном количестве вводимых в действие новых основных фондов, выработка продукции на одного работника возрастает на 0,03%.

Таким образом, фактор - количество вводимых в действие новых основных фондов сильнее всего влияет на выработку продукции на одного работника.

Стандартизованные коэффициенты регрессии (β-коэфф.)

Стандартизованные β-коэффициенты показывают, на какую часть своего среднего квадратного отклонения изменится признак-результат У, с увеличением соответствующего фактора Хj на величину своего среднего квадратного отклонения , при неизменном влиянии прочих факторов модели. Используется для ранжирования факторов по силе влияния на результат. Чем больше βj, тем сильнее влияние.

, =,=,==2,773085

===1,971015

===7,037578

Подставляем найденные значения в формулу

=0,951066, =0,040748

Экономически это означает, что при увеличении количества вводимых в действие новых основных фондов на величину своего среднего кв. отклонения = 1,971015, и при неизменном влиянии удельного веса рабочих высокой квалификации в общей численности рабочих, выработка продукции на одного работника изменится на 0,951066 своего среднего кв. отклонения = 2,773085.

При увеличении удельного веса рабочих высокой квалификации в общей численности рабочих на величину своего среднего кв. отклонения = 7,037578, и при неизменном влиянии вводимых в действие новых основных фондов, выработка продукции на одного работника изменится на 0,040748 своего среднего кв. отклонения = 2,773085. >→ фактор-количество вводимых в действие новых основных фондов сильнее всего влияет на выработку продукции на одного работника.

Запишем уравнение регрессии в стандартном масштабе переменных:

, =0,951066+0,040748

  1. Нахождение коэффициентов парной, частной и множественной корреляции. Их анализ. Проверка наличия мультиколлинеарности. Нахождение коэффициентов парной корреляции

,

=0,9908

=0,9702

=0,9773

Таким образом, получаем матрицу коэффициентов парной корреляции:

 

y

x1

x2

y

1

0,99089

0,970239

x1

0,99089

1

0,977315

x2

0,970239

0,977315

1

Нахождение коэффициентов частной корреляции

Частные коэфф. корреляции характеризуют тесноту связи между результатом и соотв. фактором, при элиминировании (устранении влияния) других факторов, включённых в уравнение регрессии.

,

> , следовательно фактор Х1 (количество вводимых в действие новых основных фондов) оказывает большее влияние на результирующий фактор (выработку продукции на одного работника)

Нахождение коэффициентов множественной корреляции

Δ коэфф. характеризуют вклад каждого фактора в суммарное влияние на результирующий показатель при условии независимости фактора.

Вычислим Δ коэффициенты:

,

Таким образом, фактор Х1 (количество вводимых в действие новых основных фондов) оказывает большее влияние на результирующий фактор (выработку продукции на одного работника).

, ,

Мультиколлинеарность – нестрогая линейная зависимость между факторными признаками.

Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадёжнее результаты множественной регрессии. И наоборот, чем ближе определитель матрицы межфакторной корреляции к 1, тем меньше мультиколлинеарность факторов и надёжнее результаты множественной регрессии.

Рассмотрим матрицу коэфф. парной корреляции:

 

y

x1

x2

y

1

0,99089

0,970239

x1

0,99089

1

0,977315

x2

0,970239

0,977315

1

где рассчитывается по формуле

Определитель матрицы межфакторной корреляции r11=0,044, следовательно, мультиколлинеарность присутствует, что свидетельствует о ненадёжности модели.

r12 =0,977 > 0,7 , что так же свидетельствует о том, что факторы мультиколлинеарны.

Из модели следует исключить один из факторов.

О том, какой фактор исключить из модели при мультиколлинеарности, мы судим по:

1) матрице коэфф. парной корреляции

2) β-коэфф.

3) коэфф. эластичности

> → следует исключить фактор Х2 (удельный вес рабочих высокой квалификации в общей численности рабочих)

β1 > β2 → следует исключить фактор Х2 (удельный вес рабочих высокой квалификации в общей численности рабочих)

>→ следует исключить фактор Х2 (удельный вес рабочих высокой квалификации в общей численности рабочих)

Исключаем фактор Х2 , и получаем новое уравнение регрессии:

= 1,32 + 1,33 Х1

  1. Нахождение скорректированного коэффициента множественной детерминации. Сравнивание его с нескорректированным (общим) коэффициентом детерминации.

Коэффициент детерминации.

, =0,9819

Свидетельствует о том, что вариация исследуемой зависимой переменной У (выработка продукции на одного работника) на 98% объясняется изменчивостью включённых в модель объясняющих переменных – количество вводимых в действие новых основных фондов (% от стоимости фондов на конец года) и удельный вес рабочих высокой квалификации в общей численности рабочих(%)

Скорректированный коэффициент детерминации.

, ,, т.к. число объясняющих переменныхm мало (=2)

Оценка статистической надежности уравнения регрессии и коэффициента детерминации с помощью-критерия Фишера

F- критерий используется для оценки значимости уравнения регрессии в целом.

,=462,1,Fтабл(α;k1,k2)=3,59 , где α=0,05 , k1=m=2, k2=n-m-1=17

F>Fтабл → модель признаётся адекватной и надёжной, т.е. зависимая переменная У (выработка продукции на одного работника) достаточно хорошо описывается включёнными в регрессионную модель переменными.

5. Оценка статистической значимости коэффициентов регрессии с помощью t-критерия Стьюдента.

Критерий Стьюдента используется дл оценки значимости коэфф. регрессии.

Для этого нужно найти стандартные ошибки вычислений параметров модели.

, ,,

, ,,

tтабл(1-α;n-m-1)=2,1098

t1расч> tтабл → модель адекватна и надёжна.

t2расч< tтабл → модель не адекватна и не надёжна.

  1. Доверительные интервалы для статистически значимых коэффициентов регрессии.

,0,881<= β 1<=1,794

,-0,11<= β 2<=0,144 β

Это значит, что статистически-значимый коэфф. регрессии β1 будет находиться в интервале от 0,881 до 1,794, а статистически-значимый коэфф. регрессии β 2 будет находиться в интервале от -0,11 до 0,144

  1. Доверительные интервалы для функции регрессии.

Использование оценочной модели для прогнозирования.

,,Xp=

1

Xp= 5,975

21,517

,,

9,46<=Mx(y)<=9,85

Таким образом, выработка продукции на одного работника ожидается в пределах от 9,46 до 9,85 (тыс.руб)

  1. Доверительные интервалы для индивидуальных значений зависимой переменной.

,

8,78<=Mx(y*)<=10,53

Индивидуальные значения выработки продукции на одного работника ожидаются в пределах от 8,78 до 10,53 (тыс.руб)

Вследствие анализа мультиколлинеарности, мы решили исключить фактор Х2.

Получили новое уравнение регрессии:

= 1,32 + 1,33 Х1 - это однофакторная модель

Рассчитаем для неё ,,F

=0,955, =0,952,F=383,28. Сравним двухфакторной и однофакторной модели:0,979<0,952 → двухфакторная модель лучше

Проверим выполнение предпосылок метода наименьших квадратов (для двухфакторной модели)

Остатки должны удовлетворять условиям Гаусса-Маркова.

Условия:

  1. ei =0

  2. Оценка гетероскедостичности.

D(ei)=const=δ2

Если D – постоянна, то это гомоскедостичность.

Если D – не постоянна, то это гетероскедостичность.

  1. еi независимы между собой, т.е. в ряду остатков отсутствует существенная автокорреляция.

  2. Распределение СВ ei подчиняется нормальному закону распределения.

Проверим выполнение условий Гаусса-Мркова.

1) ∑ ei = -8,88178E-15= 0 - условие выполняется

2) Оценка гетероскедостичности методом Голдфельда.

Упорядочим n наблюдений по мере возрастания переменных Х1 и Х2 (количество вводимых в действие новых основных фондов и удельный вес рабочих высокой квалификации в общей численности рабочих).

Разделим совокупности на 2 группы, и определим по каждой из групп уравнение регрессии.

Вычислим Fнаб.

В числителе должна быть наибольшая сумма квадратов.

Fнаб= илиFнаб=

F1наб = 1,275523, F2наб = 2,2367

Fкр(0,05;9; 9) = 3,43, F1наб < Fкр , значит модель гомоскедостична. F2наб > Fкр , значит модель гетероскедостична.

Проверка независимости остатков (автокорреляции). Ряд СВ называется автокоррелированным, если имеется корреляционная связь между последовательными значениями переменной в этом ряду. Рассчитываем D-статистику.

d = == 2,8398

Найденное значение d=2,83 свидетельствует об отсутствии автокорреляции, и модель признаётся надёжной.

Условие Гаусса-Маркова выполняется.

Проверка подчинения ряда остатков нормальному закону распределения.

Используем RS – критерий.

RS = = 3,6610, a = 3,18, b = 4,49, a < RS < b

Ряд остатков подчинён нормальному закону распределения.Условие Гаусса-Маркова выполняется.Критерий поворотных точек (предназначен для проверки случайности элементов ряда остатков) Р – сумма поворотных точек. Р=17

Если p> [] , то ряд остатков является случайным с вероятностью 95%

Посчитаем правую часть:

=8,47

Р > 8,47, т.е. ряд остатков является случайным.

Приложения

Приложение 1.

Таблица значений F-критерия Фишера (двусторонний)

d.f.2=

= n - k - 1) степени свободы остаточной дисперсии

степени свободы факторной дисперсии – d.f.1 = k

k=1

k=2

k=3

k=4

Уровень значимости, α

0,10

0,05

0,01

0,10

0,05

0,01

0,10

0,05

0,01

0,10

0,05

0,01

1

39,9

161,5

4052

49,5

199,5

5000

53,6

215,72

5403

55,8

224,57

5625

2

8,5

18,5

98,5

9,0

19,0

99,00

9,2

19,16

99,2

19,2

19,25

99,30

3

5,54

10,13

34,1

5,46

9,6

30,82

5,39

9,28

29,5

5,34

9,12

28,71

4

4,54

7,71

21,2

4,32

6,9

18,00

4,19

6,59

16,7

4,11

6,39

15,98

5

4,06

6,61

16,3

3,78

5,79

13,27

3,62

5,41

12,1

3,52

5,19

11,39

6

3,78

5,99

13,8

3,46

5,14

10,92

3,29

4,76

9,8

3,18

4,53

9,15

7

3,59

5,59

12,3

3,26

4,74

9,55

3,07

4,35

8,5

2,96

4,12

7,85

8

3,46

5,32

11,3

3,11

4,46

8,65

2,92

4,07

7,6

2,81

3,84

7,01

9

3,36

5,12

10,6

3,01

4,26

8,02

2,81

3,86

7,0

2,69

3,63

6,42

10

3,29

4,96

10,0

2,92

4,10

7,56

2,73

3,71

6,6

2,61

3,48

5,99

11

3,23

4,84

9,7

2,86

3,98

7,20

2,66

3,59

6,2

2,54

3,36

5,67

12

3,18

4,75

9,3

2,81

3,88

6,93

2,61

3,49

6,0

2,48

3,26

5,41

13

3,14

4,67

9,1

2,76

3,80

6,70

2,56

3,41

5,7

2,43

3,18

5,20

14

3,10

4,60

8,9

2,73

3,74

6,51

2,52

3,34

5,6

2,39

3,11

5,03

15

3,07

4,54

8,7

2,70

3,68

6,36

2,49

3,29

5,4

2,36

3,06

4,89

16

3,05

4,49

8,5

2,67

3,63

6,23

2,46

3,24

5,3

2,33

3,01

4,77

17

3,03

4,45

8,4

2,64

3,59

6,11

2,44

3,20

5,2

2,31

2,96

4,67

18

3,01

4,41

8,3

2,62

3,55

6,01

2,42

3,16

5,1

2,29

2,93

4,58

19

2,99

4,38

8,2

2,61

3,52

5,93

2,40

3,13

5,0

2,27

2,90

4,50

20

2,97

4,35

7,9

2,59

3,49

5,72

2,38

3,10

4,9

2,25

2,87

4,31

21

4,32

8,0

3,47

5,78

3,07

4,9

2,84

4,37

22

2,95

4,30

7,9

2,56

3,44

5,72

2,35

3,05

4,8

2,22

2,82

4,31

23

4,28

7,9

3,42

5,66

3,03

4,8

2,80

4,26

24

2,93

4,26

7,8

2,54

3,40

5,61

2,33

3,01

4,7

2,19

2,78

4,22

25

4,24

7,8

3,38

5,57

2,99

4,7

2,76

4,18

26

2,91

4,22

7,7

25,2

3,37

5,53

2,31

2,98

4,6

2,17

2,73

4,14

30

2,88

4,17

7,56

2,49

3,32

5,39

2,28

2,92

4,5

2,14

2,69

4,02

40

2,84

4,08

7,31

2,44

3,23

5,18

2,23

2,84

4,3

2,09

2,61

3,83

60

2,79

4,00

7,08

2,39

3,15

4,98

2,18

2,76

4,1

2,04

2,53

3,65

80

2,77

8,96

6,96

2,37

3,11

4,88

2,16

2,72

4,0

2,02

2,48

3,56

100

2,76

3,94

6,90

2,36

3,09

4,82

2,14

2,70

3,98

2,00

2,46

3,51

2,71

3,84

6,63

2,30

3,00

4,61

2,08

2,60

3,78

1,94

2,37

3,32

Приложение 2

Таблица критических значений t-статистики Стьюдента

Число степеней свободы, d.f.=n-k-1

Уровень значимости, α (двусторонний)

0,40

0,30

0,20

0,10

0,05

0,02

0,01

1

1,38

1,96

3,08

6,31

12,71

31,82

63,66

2

1,06

1,39

1,89

2,92

4,30

6,97

9,93

3

0,98

1,25

1,64

2,35

3,18

4,54

5,84

4

0,94

1,19

1,53

2,13

2,78

3,75

4,60

5

0,92

1,16

1,48

2,02

2,57

3,37

4,03

6

0,91

1,13

1,44

1,94

2,45

3,14

3,71

7

0,90

1,12

1,42

1,90

2,37

3,00

3,50

8

0,89

1,11

1,40

1,86

2,31

2,90

3,36

9

0,88

1,10

1,38

1,83

2,26

2,82

3,25

10

0,88

1,09

1,37

1,81

2,23

2,76

3,17

11

0,88

1,09

1,36

1,80

2,20

2,72

3,11

12

0,87

1,08

1,36

1,78

2,18

2,68

3,06

13

0,87

1,08

1,35

1,77

2,16

2,65

3,01

14

0,87

1,08

1,35

1,76

2,15

2,62

3,00

15

0,87

1,07

1,34

1,75

2,13

2,60

2,95

16

0,87

1,07

1,34

1,75

2,12

2,58

2,92

17

0,86

1,07

1,33

1,74

2,11

2,57

2,90

18

0,86

1,07

1,33

1,73

2,10

2,55

2,88

19

0,86

1,07

1,33

1,73

2,09

2,54

2,86

20

0,86

1,06

1,33

1,73

2,09

2,53

2,85

21

0,86

1,06

1,32

1,72

2,08

2,52

2,83

22

0,86

1,06

1,32

1,72

2,07

2,51

2,82

23

0,86

1,06

1,32

1,71

2,07

2,50

2,81

24

0,86

1,06

1,32

1,71

2,06

2,49

2,80

25

0,86

1,06

1,32

1,71

2,06

2,49

2,79

26

0,86

1,06

1,32

1,71

2,06

2,48

2,78

27

0,86

1,06

1,31

1,70

2,05

2,47

2,77

28

0,86

1,06

1,31

1,70

2,05

2,47

2,63

29

0,85

1,06

1,31

1,70

2,05

2,46

2,76

30

0,85

1,06

1,31

1,70

2,04

2,46

2,75

40

0,85

1,05

1,30

1,68

2,02

2,42

2,70

60

0,85

1,05

1,30

1,67

2,00

2,39

2,66

120

0,85

1,04

1,30

1,66

1,98

2,36

2,62

0,84

1,036

1,28

1,65

1,96

2,33

2,58

Приложение 3.