- •Постановка задачи
- •Исходные данные
- •Анализ данных
- •2) График исходных данных и теоретической прямой.
- •10) Доверительные интервалы для статистически значимых параметров модели.
- •15) Проверка выполнения предпосылок мнк.
- •Нелинейная регрессия
- •1) Степенная модель
- •2) Показательная модель
- •3) Равносторонняя гипербола
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение высшего профессионального образования
«Нижегородский государственный университет им Н.И. Лобачевского»
Экономический факультет
лабораторная работа № 1,2
По дисциплине
«Эконометрика»
На тему: «Парный регрессионный анализ»
Вариант 11
Данные из РОССТАТ
|
|
Выполнил: | |||||||
|
|
Студент 2 курса | |||||||
|
|
Группы 725 | |||||||
|
|
дневногоотделения | |||||||
|
|
|
|
|
|
Лукьянова Е. М. | |||
|
|
дата |
личная подпись |
ФИО студента | |||||
|
|
|
|
| |||||
|
|
Проверил: | |||||||
|
|
| |||||||
|
|
Отметка о зачете: |
|
| |||||
|
|
|
|
|
|
Шестерикова Н.В. | |||
|
|
дата |
личная подпись |
ФИО преподавателя | |||||
Нижний Новгород
2011
Постановка задачи
Требуется:
1.Найти корреляционную зависимость между фактором (х) и результирующим признаком (у). Найти параметры уравнения линейной регрессии, дать экономическую интерпретацию коэффициента регрессии.
2. На одном графике построить исходные данные и теоретическую прямую.
3. Найти коэффициент вариации.
4. Найти коэффициент корреляции.
5. Найти коэффициент детерминации.
6. Оценить точность модели.
7. Представить схему дисперсионного анализа.
8. Проверить адекватность модели по F-критерию Фишера (α=0,05).
9. Оценить статистическую значимость коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
10. Найти доверительные интервалы для статистически значимых параметров модели.
11. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
12. Найти доверительный интервал для индивидуальных значений зависимой переменной.
13. Найти коэффициент эластичности.
14. Вычислить
остатки; найти остаточную сумму квадратов;
оценить дисперсию остатков
;
построить график остатков.
15. Проверить выполнение предпосылок МНК.
Исходные данные
Имеются данные о зависимости цены хлеба Y (в руб.) от цены муки X (в руб.) с января 1998 года по январь 2011 года:
|
|
x-мука |
y-хлеб |
|
1998-янв |
3,17 |
5,64 |
|
1998-июль |
2,91 |
5,64 |
|
1999-янв |
3,89 |
6,83 |
|
1999-июль |
7,12 |
9,14 |
|
2000-янв |
7,87 |
10,87 |
|
2000-июль |
8,4 |
11,87 |
|
2001-янв |
8,07 |
12,25 |
|
2001-июль |
8,72 |
13,47 |
|
2002-янв |
8,44 |
13,77 |
|
2002-июль |
8,21 |
14,07 |
|
2003-янв |
7,94 |
14,32 |
|
2003-июль |
9,35 |
16,36 |
|
2004-янв |
11,79 |
19,46 |
|
2004-июль |
13,74 |
21,17 |
|
2005-янв |
13,05 |
21,65 |
|
2005-июль |
12,35 |
21,93 |
|
2006-янв |
11,93 |
22,44 |
|
2006-июль |
12,67 |
23,83 |
|
2007-янв |
12,92 |
25,06 |
|
2007-июль |
14,73 |
27,86 |
|
2008-янв |
17,68 |
31,3 |
|
2008-июль |
21,91 |
38,18 |
|
2009-янв |
21,34 |
39,12 |
|
2009-июль |
20,84 |
39,52 |
|
2010-янв |
19,06 |
39,49 |
|
2010-июль |
18,11 |
39,71 |
|
2011-янв |
20,95 |
42,58 |
Анализ данных
Линейная регрессия.
Корреляционная зависимость между фактором х и результирующим признаком y. Параметры уравнения линейной регрессии, экономическая интерпретация коэффициента регрессии.
,
где
- невязка, ошибка, отклонение точки от
прямой,
-
теоретическая функция.
Надо найти прямую, которая наилучшим образом описывает точки.
![]()
,
где
-
параметры регрессии. Эта функция
корреляционная зависимость объёма
выпуска продукции от затраты труда
![]()

![]()
=![]()
-
коэффициент выборочной регрессии
по
.
Коэффициент
выборочной регрессии показывает, на
сколько единиц в среднем изменяется
переменная
при увеличении фактора
на
1 единицу.
-
это означает,
что при увеличении цены муки х на 1
единицу, цена хлеба возрастет в среднем
на 2,03715
единиц.
![]()
![]()
,
а<0,
значит, относительное изменение цены
муки х происходит быстрее, чем изменение
цены хлеба у.
-теоретическая
функция.
2) График исходных данных и теоретической прямой.

3) Коэффициент вариации
Коэффициент вариации показывает, какую долю среднего значения случайной величины составляет её средний разброс.
![]()
![]()
4) Коэффициент корреляции
Линейный
коэффициент парной корреляции или
коэффициент корреляции используется
для оценки тесноты линейной связи между
переменными x
и y.
Он показывает, на сколько величин
изменится
в среднем результат y,
когда фактор x
увеличивается на одно
.
,
>0,
значит корреляционная связь между ценой
муки и ценой хлеба прямая.
5) Коэффициент детерминации
Коэффициент детерминации используется для оценки качества подбора уравнений линейной регрессии. Коэффициент детерминации характеризует долю дисперсии результативного признака y(цена хлеба), объясняемого регрессией в общей дисперсии результативного признака x(цена муки).
0,9
< R2
< 0,99 ,
значит сила
связи тесная, весьма высокая, уравнение
регрессии хорошо подобрано.
6) Оценка точности модели, или оценка аппроксимации.
-
средняя ошибка аппроксимации.
Ошибка менее 5-7% свидетельствует о хорошем подборе модели.
При ошибке более 10% следует подумать о выборе другого типа уравнения модели.
Ошибка
аппроксимации
,ошибка
удовлетворительная.
7) Схема дисперсионного анализа.
![]()
n - число наблюдений
m - число параметров при переменной х
|
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
|
Общая |
|
n-1 |
|
|
Факторная |
|
m=1 |
|
|
Остаточная |
|
n-m-1 |
|
Для линейной регрессии m=1
|
Компоненты дисперсии |
Сумма квадратов |
Число степеней свободы |
Дисперсия на одну степень свободы |
|
Общая |
3590,906
|
27-1=26 |
|
|
Факторная |
3455,93778
|
m=1 |
|
|
Остаточная |
134,96792
|
27-1-1=25 |
|
|
Двухфакторный дисперсионный анализ без повторений |
|
|
| |||
|
|
|
|
|
|
|
|
|
ИТОГИ |
Счет |
Сумма |
Среднее |
Дисперсия |
|
|
|
Строка 1 |
2 |
8,81 |
4,405 |
3,05045 |
|
|
|
Строка 2 |
2 |
8,55 |
4,275 |
3,72645 |
|
|
|
Строка 3 |
2 |
10,72 |
5,36 |
4,3218 |
|
|
|
Строка 4 |
2 |
16,26 |
8,13 |
2,0402 |
|
|
|
Строка 5 |
2 |
18,74 |
9,37 |
4,5 |
|
|
|
Строка 6 |
2 |
20,27 |
10,135 |
6,02045 |
|
|
|
Строка 7 |
2 |
20,32 |
10,16 |
8,7362 |
|
|
|
Строка 8 |
2 |
22,19 |
11,095 |
11,28125 |
|
|
|
Строка 9 |
2 |
22,21 |
11,105 |
14,20445 |
|
|
|
Строка 10 |
2 |
22,28 |
11,14 |
17,1698 |
|
|
|
Строка 11 |
2 |
22,26 |
11,13 |
20,3522 |
|
|
|
Строка 12 |
2 |
25,71 |
12,855 |
24,57005 |
|
|
|
Строка 13 |
2 |
31,25 |
15,625 |
29,41445 |
|
|
|
Строка 14 |
2 |
34,91 |
17,455 |
27,60245 |
|
|
|
Строка 15 |
2 |
34,7 |
17,35 |
36,98 |
|
|
|
Строка 16 |
2 |
34,28 |
17,14 |
45,8882 |
|
|
|
Строка 17 |
2 |
34,37 |
17,185 |
55,23005 |
|
|
|
Строка 18 |
2 |
36,5 |
18,25 |
62,2728 |
|
|
|
Строка 19 |
2 |
37,98 |
18,99 |
73,6898 |
|
|
|
Строка 20 |
2 |
42,59 |
21,295 |
86,19845 |
|
|
|
Строка 21 |
2 |
48,98 |
24,49 |
92,7522 |
|
|
|
Строка 22 |
2 |
60,09 |
30,045 |
132,35645 |
|
|
|
Строка 23 |
2 |
60,46 |
30,23 |
158,0642 |
|
|
|
Строка 24 |
2 |
60,36 |
30,18 |
174,4712 |
|
|
|
Строка 25 |
2 |
58,55 |
29,275 |
208,69245 |
|
|
|
Строка 26 |
2 |
57,82 |
28,91 |
233,28 |
|
|
|
Строка 27 |
2 |
63,53 |
31,765 |
233,92845 |
|
|
|
|
|
|
|
|
|
|
|
Столбец 1 |
27 |
327,16 |
12,117037 |
32,02912934 |
|
|
|
Столбец 2 |
27 |
587,53 |
21,7603704 |
138,1117575 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
| |
|
Источник вариации |
SS |
df |
MS |
F |
P-Значение |
F критическое |
|
Строки |
3908,286 |
26 |
150,318691 |
7,583351995 |
9,63972E-07 |
1,929212675 |
|
Столбцы |
1255,4174 |
1 |
1255,41735 |
63,33391821 |
1,95094E-08 |
4,225201273 |
|
Погрешность |
515,3771 |
26 |
19,8221962 |
|
|
|
|
|
|
|
|
|
|
|
|
Итого |
5679,0804 |
53 |
|
|
|
|
8) Проверка адекватности модели по F-критерию Фишера (α=0,05).
Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F-критерия Фишера. Сам критерий заключается в том, что мы проверяем H0 - гипотезу о статистической значимости уравнения регрессии.
Fрасчет определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы.

Fтабл – это максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы, т.е. k1 = m, 22 = n-m-1, и уровне значимости α (α=0,05)
Fтабл (0,05; 1; n-2)
Fтабл (0,05; 1; 25)
Fтабл = 4,24169905
Если Fтабл < Fрасч, значит, гипотеза H0 о случайной природе оцениваемых характеристик отклоняется, и признаётся их статистическая значимость и надёжность уравнения регрессии. В противном случае H0 не отклоняется, и признаётся статистическая незначимость и ненадёжность уравнения регрессии.
В нашем случае Fтабл < Fрасч , следовательно признаётся статистическая значимость и надёжность уравнения регрессии.
9) Оценка статистической значимости коэффициентов регрессии и корреляции по t-критерию Стьюдента (α=0,05).
Оценка значимости коэффициента регрессии. t – критерий Стьюдента.
Проверим статистическую значимость параметра b.
Гипотеза H0: b=0
H1: b≠0
Рассчитаем t-статистику для коэффициентов.
![]()
,
где n
– число наблюдений

![]()
tтабл – это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы (k=n-2), и уровне значимости α (α=0,05).
![]()
Если tрасч > tтабл , тогда гипотеза H0 отвергается, и признаётся значимость параметров уравнения.
В нашем случае tb > tтабл , следовательно гипотеза H0 отвергается, и признаётся статистическая значимость параметрa b.
Проверим статистическую значимость параметра a.
Гипотеза H0: a=0 H1: b≠0
H1: a≠0
![]()


![]()
ta > tтабл следовательно гипотеза H0 отклоняется, и признаётся статистическая значимость параметрa a.
Оценка значимости корреляции.
Проверим статистическую значимость коэффициента корреляции.
![]()
![]()
![]()
![]()
tr = tb , связь между критерием Стьюдента и Фишера сохраняется.
tr > tтабл , следовательно признаётся статистическая значимость коэффициента корреляции.



