Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Вся эконометрика / Вся эконометрика / Эконометрика_Лекции_2011 / Отчет к 1-2 лабе РОССТАТ Лукьянова Е.doc
Скачиваний:
109
Добавлен:
27.03.2015
Размер:
598.02 Кб
Скачать

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение высшего профессионального образования

«Нижегородский государственный университет им Н.И. Лобачевского»

Экономический факультет

лабораторная работа № 1,2

По дисциплине

«Эконометрика»

На тему: «Парный регрессионный анализ»

Вариант 11

Данные из РОССТАТ

Выполнил:

Студент 2 курса

Группы 725

дневногоотделения

Лукьянова Е. М.

дата

личная подпись

ФИО студента

Проверил:

Отметка о зачете:

Шестерикова Н.В.

дата

личная подпись

ФИО преподавателя

Нижний Новгород

2011

Постановка задачи

Требуется:

1.Найти корреляционную зависимость между фактором (х) и результирующим признаком (у). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.

2. На одном графике построить исходные данные и теоретическую прямую.

3. Найти коэффициент вариации.

4. Найти коэффициент корреляции.

5. Найти коэффициент детерминации.

6. Оценить точность модели.

7. Представить схему дисперсионного анализа.

8. Проверить адекватность модели по F-критерию Фишера (α=0,05).

9. Оценить статистическую значимость коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).

10. Найти доверительные интервалы для статистически значимых параметров модели.

11. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

12. Найти доверительный интервал для индивидуальных значений зависимой переменной.

13. Найти коэффициент эластичности.

14. Вычислить остатки; найти остаточную сумму квадратов; оценить дисперсию остатков ; построить график остатков.

15. Проверить выполнение предпосылок МНК.

Исходные данные

Имеются данные о зависимости цены хлеба Y (в руб.) от цены муки X (в руб.) с января 1998 года по январь 2011 года:

 

x-мука

y-хлеб

1998-янв

3,17

5,64

1998-июль

2,91

5,64

1999-янв

3,89

6,83

1999-июль

7,12

9,14

2000-янв

7,87

10,87

2000-июль

8,4

11,87

2001-янв

8,07

12,25

2001-июль

8,72

13,47

2002-янв

8,44

13,77

2002-июль

8,21

14,07

2003-янв

7,94

14,32

2003-июль

9,35

16,36

2004-янв

11,79

19,46

2004-июль

13,74

21,17

2005-янв

13,05

21,65

2005-июль

12,35

21,93

2006-янв

11,93

22,44

2006-июль

12,67

23,83

2007-янв

12,92

25,06

2007-июль

14,73

27,86

2008-янв

17,68

31,3

2008-июль

21,91

38,18

2009-янв

21,34

39,12

2009-июль

20,84

39,52

2010-янв

19,06

39,49

2010-июль

18,11

39,71

2011-янв

20,95

42,58

Анализ данных

Линейная регрессия.

  1. Корреляционная зависимость между фактором х и результирующим признаком y. Параметры уравнения линейной регрессии, экономическая интерпретация коэффициента регрессии.

, где - невязка, ошибка, отклонение точки от прямой,

- теоретическая функция.

Надо найти прямую, которая наилучшим образом описывает точки.

, где - параметры регрессии. Эта функция корреляционная зависимость объёма выпуска продукции от затраты труда

=

- коэффициент выборочной регрессии по.

Коэффициент выборочной регрессии показывает, на сколько единиц в среднем изменяется переменная при увеличении факторана 1 единицу.

- это означает, что при увеличении цены муки х на 1 единицу, цена хлеба возрастет в среднем на 2,03715 единиц.

, а<0, значит, относительное изменение цены муки х происходит быстрее, чем изменение цены хлеба у.

-теоретическая функция.

2) График исходных данных и теоретической прямой.

3) Коэффициент вариации

Коэффициент вариации показывает, какую долю среднего значения случайной величины составляет её средний разброс.

4) Коэффициент корреляции

Линейный коэффициент парной корреляции или коэффициент корреляции используется для оценки тесноты линейной связи между переменными x и y. Он показывает, на сколько величин изменится в среднем результат y, когда фактор x увеличивается на одно .

, >0, значит корреляционная связь между ценой муки и ценой хлеба прямая.

5) Коэффициент детерминации

Коэффициент детерминации используется для оценки качества подбора уравнений линейной регрессии. Коэффициент детерминации характеризует долю дисперсии результативного признака y(цена хлеба), объясняемого регрессией в общей дисперсии результативного признака x(цена муки).

0,9 < R2 < 0,99 , значит сила связи тесная, весьма высокая, уравнение регрессии хорошо подобрано.

6) Оценка точности модели, или оценка аппроксимации.

- средняя ошибка аппроксимации.

Ошибка менее 5-7% свидетельствует о хорошем подборе модели.

При ошибке более 10% следует подумать о выборе другого типа уравнения модели.

Ошибка аппроксимации ,ошибка удовлетворительная.

7) Схема дисперсионного анализа.

n - число наблюдений

m - число параметров при переменной х

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия на одну степень свободы

Общая

n-1

Факторная

m=1

Остаточная

n-m-1

Для линейной регрессии m=1

Компоненты дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия на одну степень свободы

Общая

3590,906

27-1=26

Факторная

3455,93778

m=1

Остаточная

134,96792

27-1-1=25

Двухфакторный дисперсионный анализ без повторений

ИТОГИ

Счет

Сумма

Среднее

Дисперсия

Строка 1

2

8,81

4,405

3,05045

Строка 2

2

8,55

4,275

3,72645

Строка 3

2

10,72

5,36

4,3218

Строка 4

2

16,26

8,13

2,0402

Строка 5

2

18,74

9,37

4,5

Строка 6

2

20,27

10,135

6,02045

Строка 7

2

20,32

10,16

8,7362

Строка 8

2

22,19

11,095

11,28125

Строка 9

2

22,21

11,105

14,20445

Строка 10

2

22,28

11,14

17,1698

Строка 11

2

22,26

11,13

20,3522

Строка 12

2

25,71

12,855

24,57005

Строка 13

2

31,25

15,625

29,41445

Строка 14

2

34,91

17,455

27,60245

Строка 15

2

34,7

17,35

36,98

Строка 16

2

34,28

17,14

45,8882

Строка 17

2

34,37

17,185

55,23005

Строка 18

2

36,5

18,25

62,2728

Строка 19

2

37,98

18,99

73,6898

Строка 20

2

42,59

21,295

86,19845

Строка 21

2

48,98

24,49

92,7522

Строка 22

2

60,09

30,045

132,35645

Строка 23

2

60,46

30,23

158,0642

Строка 24

2

60,36

30,18

174,4712

Строка 25

2

58,55

29,275

208,69245

Строка 26

2

57,82

28,91

233,28

Строка 27

2

63,53

31,765

233,92845

Столбец 1

27

327,16

12,117037

32,02912934

Столбец 2

27

587,53

21,7603704

138,1117575

Дисперсионный анализ

Источник вариации

SS

df

MS

F

P-Значение

F критическое

Строки

3908,286

26

150,318691

7,583351995

9,63972E-07

1,929212675

Столбцы

1255,4174

1

1255,41735

63,33391821

1,95094E-08

4,225201273

Погрешность

515,3771

26

19,8221962

Итого

5679,0804

53

 

 

 

 

8) Проверка адекватности модели по F-критерию Фишера (α=0,05).

Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F-критерия Фишера. Сам критерий заключается в том, что мы проверяем H0 - гипотезу о статистической значимости уравнения регрессии.

Fрасчет определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.

Fтабл – это максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы, т.е. k1 = m, 22 = n-m-1, и уровне значимости α (α=0,05)

Fтабл (0,05; 1; n-2)

Fтабл (0,05; 1; 25)

Fтабл = 4,24169905

Если Fтабл < Fрасч, значит, гипотеза H0 о случайной природе оцениваемых характеристик отклоняется, и признаётся их статистическая значимость и надёжность уравнения регрессии. В противном случае H0 не отклоняется, и признаётся статистическая незначимость и ненадёжность уравнения регрессии.

В нашем случае Fтабл < Fрасч , следовательно признаётся статистическая значимость и надёжность уравнения регрессии.

9) Оценка статистической значимости коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).

Оценка значимости коэффициента регрессии. t – критерий Стьюдента.

Проверим статистическую значимость параметра b.

Гипотеза H0: b=0

H1: b≠0

Рассчитаем t-статистику для коэффициентов.

, где n – число наблюдений

tтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы (k=n-2), и уровне значимости α (α=0,05).

Если tрасч > tтабл , тогда гипотеза H0 отвергается, и признаётся значимость параметров уравнения.

В нашем случае tb > tтабл , следовательно гипотеза H0 отвергается, и признаётся статистическая значимость параметрa b.

Проверим статистическую значимость параметра a.

Гипотеза H0: a=0 H1: b≠0

H1: a≠0

ta > tтабл следовательно гипотеза H0 отклоняется, и признаётся статистическая значимость параметрa a.

Оценка значимости корреляции.

Проверим статистическую значимость коэффициента корреляции.

tr = tb , связь между критерием Стьюдента и Фишера сохраняется.

tr > tтабл , следовательно признаётся статистическая значимость коэффициента корреляции.