
- •Постановка задачи
- •Исходные данные
- •Анализ данных
- •2) График исходных данных и теоретической прямой.
- •10) Доверительные интервалы для статистически значимых параметров модели.
- •15) Проверка выполнения предпосылок мнк.
- •Нелинейная регрессия
- •1) Степенная модель
- •2) Показательная модель
- •3) Равносторонняя гипербола
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение высшего профессионального образования
«Нижегородский государственный университет им Н.И. Лобачевского»
Экономический факультет
лабораторная работа № 1,2
По дисциплине
«Эконометрика»
На тему: «Парный регрессионный анализ»
Вариант 11
Данные из РОССТАТ
|
Выполнил: | |||||||
|
Студент 2 курса | |||||||
|
Группы 725 | |||||||
|
дневногоотделения | |||||||
|
|
|
|
|
Лукьянова Е. М. | |||
|
дата |
личная подпись |
ФИО студента | |||||
|
|
|
| |||||
|
Проверил: | |||||||
|
| |||||||
|
Отметка о зачете: |
|
| |||||
|
|
|
|
|
Шестерикова Н.В. | |||
|
дата |
личная подпись |
ФИО преподавателя |
Нижний Новгород
2011
Постановка задачи
Требуется:
1.Найти корреляционную зависимость между фактором (х) и результирующим признаком (у). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. На одном графике построить исходные данные и теоретическую прямую.
3. Найти коэффициент вариации.
4. Найти коэффициент корреляции.
5. Найти коэффициент детерминации.
6. Оценить точность модели.
7. Представить схему дисперсионного анализа.
8. Проверить адекватность модели по F-критерию Фишера (α=0,05).
9. Оценить статистическую значимость коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
10. Найти доверительные интервалы для статистически значимых параметров модели.
11. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
12. Найти доверительный интервал для индивидуальных значений зависимой переменной.
13. Найти коэффициент эластичности.
14. Вычислить
остатки; найти остаточную сумму квадратов;
оценить дисперсию остатков
;
построить график остатков.
15. Проверить выполнение предпосылок МНК.
Исходные данные
Имеются данные о зависимости цены хлеба Y (в руб.) от цены муки X (в руб.) с января 1998 года по январь 2011 года:
|
x-мука |
y-хлеб |
1998-янв |
3,17 |
5,64 |
1998-июль |
2,91 |
5,64 |
1999-янв |
3,89 |
6,83 |
1999-июль |
7,12 |
9,14 |
2000-янв |
7,87 |
10,87 |
2000-июль |
8,4 |
11,87 |
2001-янв |
8,07 |
12,25 |
2001-июль |
8,72 |
13,47 |
2002-янв |
8,44 |
13,77 |
2002-июль |
8,21 |
14,07 |
2003-янв |
7,94 |
14,32 |
2003-июль |
9,35 |
16,36 |
2004-янв |
11,79 |
19,46 |
2004-июль |
13,74 |
21,17 |
2005-янв |
13,05 |
21,65 |
2005-июль |
12,35 |
21,93 |
2006-янв |
11,93 |
22,44 |
2006-июль |
12,67 |
23,83 |
2007-янв |
12,92 |
25,06 |
2007-июль |
14,73 |
27,86 |
2008-янв |
17,68 |
31,3 |
2008-июль |
21,91 |
38,18 |
2009-янв |
21,34 |
39,12 |
2009-июль |
20,84 |
39,52 |
2010-янв |
19,06 |
39,49 |
2010-июль |
18,11 |
39,71 |
2011-янв |
20,95 |
42,58 |
Анализ данных
Линейная регрессия.
Корреляционная зависимость между фактором х и результирующим признаком y. Параметры уравнения линейной регрессии, экономическая интерпретация коэффициента регрессии.
,
где
- невязка, ошибка, отклонение точки от
прямой,
-
теоретическая функция.
Надо найти прямую, которая наилучшим образом описывает точки.
,
где
-
параметры регрессии. Эта функция
корреляционная зависимость объёма
выпуска продукции от затраты труда
=
-
коэффициент выборочной регрессии
по
.
Коэффициент
выборочной регрессии показывает, на
сколько единиц в среднем изменяется
переменная
при увеличении фактора
на
1 единицу.
-
это означает,
что при увеличении цены муки х на 1
единицу, цена хлеба возрастет в среднем
на 2,03715
единиц.
,
а<0,
значит, относительное изменение цены
муки х происходит быстрее, чем изменение
цены хлеба у.
-теоретическая
функция.
2) График исходных данных и теоретической прямой.
3) Коэффициент вариации
Коэффициент вариации показывает, какую долю среднего значения случайной величины составляет её средний разброс.
4) Коэффициент корреляции
Линейный
коэффициент парной корреляции или
коэффициент корреляции используется
для оценки тесноты линейной связи между
переменными x
и y.
Он показывает, на сколько величин
изменится
в среднем результат y,
когда фактор x
увеличивается на одно
.
,
>0,
значит корреляционная связь между ценой
муки и ценой хлеба прямая.
5) Коэффициент детерминации
Коэффициент детерминации используется для оценки качества подбора уравнений линейной регрессии. Коэффициент детерминации характеризует долю дисперсии результативного признака y(цена хлеба), объясняемого регрессией в общей дисперсии результативного признака x(цена муки).
0,9
< R2
< 0,99 ,
значит сила
связи тесная, весьма высокая, уравнение
регрессии хорошо подобрано.
6) Оценка точности модели, или оценка аппроксимации.
-
средняя ошибка аппроксимации.
Ошибка менее 5-7% свидетельствует о хорошем подборе модели.
При ошибке более 10% следует подумать о выборе другого типа уравнения модели.
Ошибка
аппроксимации
,ошибка
удовлетворительная.
7) Схема дисперсионного анализа.
n - число наблюдений
m - число параметров при переменной х
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Общая |
|
n-1 |
|
Факторная |
|
m=1 |
|
Остаточная |
|
n-m-1 |
|
Для линейной регрессии m=1
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
Общая |
3590,906
|
27-1=26 |
|
Факторная |
3455,93778
|
m=1 |
|
Остаточная |
134,96792
|
27-1-1=25 |
|
Двухфакторный дисперсионный анализ без повторений |
|
|
| |||
|
|
|
|
|
|
|
ИТОГИ |
Счет |
Сумма |
Среднее |
Дисперсия |
|
|
Строка 1 |
2 |
8,81 |
4,405 |
3,05045 |
|
|
Строка 2 |
2 |
8,55 |
4,275 |
3,72645 |
|
|
Строка 3 |
2 |
10,72 |
5,36 |
4,3218 |
|
|
Строка 4 |
2 |
16,26 |
8,13 |
2,0402 |
|
|
Строка 5 |
2 |
18,74 |
9,37 |
4,5 |
|
|
Строка 6 |
2 |
20,27 |
10,135 |
6,02045 |
|
|
Строка 7 |
2 |
20,32 |
10,16 |
8,7362 |
|
|
Строка 8 |
2 |
22,19 |
11,095 |
11,28125 |
|
|
Строка 9 |
2 |
22,21 |
11,105 |
14,20445 |
|
|
Строка 10 |
2 |
22,28 |
11,14 |
17,1698 |
|
|
Строка 11 |
2 |
22,26 |
11,13 |
20,3522 |
|
|
Строка 12 |
2 |
25,71 |
12,855 |
24,57005 |
|
|
Строка 13 |
2 |
31,25 |
15,625 |
29,41445 |
|
|
Строка 14 |
2 |
34,91 |
17,455 |
27,60245 |
|
|
Строка 15 |
2 |
34,7 |
17,35 |
36,98 |
|
|
Строка 16 |
2 |
34,28 |
17,14 |
45,8882 |
|
|
Строка 17 |
2 |
34,37 |
17,185 |
55,23005 |
|
|
Строка 18 |
2 |
36,5 |
18,25 |
62,2728 |
|
|
Строка 19 |
2 |
37,98 |
18,99 |
73,6898 |
|
|
Строка 20 |
2 |
42,59 |
21,295 |
86,19845 |
|
|
Строка 21 |
2 |
48,98 |
24,49 |
92,7522 |
|
|
Строка 22 |
2 |
60,09 |
30,045 |
132,35645 |
|
|
Строка 23 |
2 |
60,46 |
30,23 |
158,0642 |
|
|
Строка 24 |
2 |
60,36 |
30,18 |
174,4712 |
|
|
Строка 25 |
2 |
58,55 |
29,275 |
208,69245 |
|
|
Строка 26 |
2 |
57,82 |
28,91 |
233,28 |
|
|
Строка 27 |
2 |
63,53 |
31,765 |
233,92845 |
|
|
|
|
|
|
|
|
|
Столбец 1 |
27 |
327,16 |
12,117037 |
32,02912934 |
|
|
Столбец 2 |
27 |
587,53 |
21,7603704 |
138,1117575 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
| |
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
Строки |
3908,286 |
26 |
150,318691 |
7,583351995 |
9,63972E-07 |
1,929212675 |
Столбцы |
1255,4174 |
1 |
1255,41735 |
63,33391821 |
1,95094E-08 |
4,225201273 |
Погрешность |
515,3771 |
26 |
19,8221962 |
|
|
|
|
|
|
|
|
|
|
Итого |
5679,0804 |
53 |
|
|
|
|
8) Проверка адекватности модели по F-критерию Фишера (α=0,05).
Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F-критерия Фишера. Сам критерий заключается в том, что мы проверяем H0 - гипотезу о статистической значимости уравнения регрессии.
Fрасчет определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.
Fтабл – это максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы, т.е. k1 = m, 22 = n-m-1, и уровне значимости α (α=0,05)
Fтабл (0,05; 1; n-2)
Fтабл (0,05; 1; 25)
Fтабл = 4,24169905
Если Fтабл < Fрасч, значит, гипотеза H0 о случайной природе оцениваемых характеристик отклоняется, и признаётся их статистическая значимость и надёжность уравнения регрессии. В противном случае H0 не отклоняется, и признаётся статистическая незначимость и ненадёжность уравнения регрессии.
В нашем случае Fтабл < Fрасч , следовательно признаётся статистическая значимость и надёжность уравнения регрессии.
9) Оценка статистической значимости коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
Оценка значимости коэффициента регрессии. t – критерий Стьюдента.
Проверим статистическую значимость параметра b.
Гипотеза H0: b=0
H1: b≠0
Рассчитаем t-статистику для коэффициентов.
,
где n
– число наблюдений
tтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы (k=n-2), и уровне значимости α (α=0,05).
Если tрасч > tтабл , тогда гипотеза H0 отвергается, и признаётся значимость параметров уравнения.
В нашем случае tb > tтабл , следовательно гипотеза H0 отвергается, и признаётся статистическая значимость параметрa b.
Проверим статистическую значимость параметра a.
Гипотеза H0: a=0 H1: b≠0
H1: a≠0
ta > tтабл следовательно гипотеза H0 отклоняется, и признаётся статистическая значимость параметрa a.
Оценка значимости корреляции.
Проверим статистическую значимость коэффициента корреляции.
tr = tb , связь между критерием Стьюдента и Фишера сохраняется.
tr > tтабл , следовательно признаётся статистическая значимость коэффициента корреляции.