- •Методические указания для самостоятельной работы по дисциплине «Эконометрика»
- •1. Парная регрессия и корреляция
- •1.1. Теоретическая справка
- •1.2. Решение типовой задачи
- •Решение
- •1.3. Решение типовой задачи в msExcel.
- •2. Множественная регрессия и корреляция
- •2.1.Теоретическая справка
- •2.2. Решение типовой задачи
- •Решение
- •2.3. Решение типовой задачи в msExcel
- •Задания для самостоятельной работы Парная регрессия и корреляция
- •Множественная регрессия и корреляция
- •0,05, 0,01 (Двухсторонний).
- •670000, Г. Улан-Удэ, ул. Пушкина, 8
1.2. Решение типовой задачи
Пример. По территориям региона приводятся данные за год.
Таблица 1.2
Номер региона |
Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х |
Среднедневная заработная плата, руб., у |
1 |
78 |
133 |
2 |
82 |
148 |
3 |
87 |
134 |
4 |
79 |
154 |
5 |
89 |
162 |
6 |
106 |
195 |
7 |
67 |
139 |
8 |
88 |
158 |
9 |
73 |
152 |
10 |
87 |
162 |
11 |
76 |
159 |
12 |
115 |
173 |
Требуется:
Построить линейное уравнение парной регрессии у по х.
Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.
Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F -критерия Фишера и t -критерия Стьюдента.
Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x , составляющем 107% от среднего уровня.
Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
На одном графике отложить исходные данные и теоретическую прямую.
Решение
Для расчёта параметров уравнения линейной регрессии необходимо построить таблицу 1.3.
Таблица 1.3
№ |
х |
у |
yx |
x² |
y2 |
ŷx |
y-ŷx |
(у -ŷx)² |
Ai |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
78 |
133 |
10374 |
6084 |
17689 |
148,77 |
-15,77 |
248,70 |
11,86 |
2 |
82 |
148 |
12136 |
6724 |
21904 |
152,45 |
-4,45 |
19,82 |
3,01 |
3 |
87 |
134 |
11658 |
7569 |
17956 |
157,05 |
-23,05 |
531,48 |
17,20 |
4 |
79 |
154 |
12166 |
6241 |
23716 |
149,69 |
4,31 |
18,57 |
2,80 |
5 |
89 |
162 |
14418 |
7921 |
26244 |
158,89 |
3,11 |
9,64 |
1,92 |
6 |
106 |
195 |
20670 |
11236 |
38025 |
174,54 |
20,46 |
418,52 |
10,49 |
7 |
67 |
139 |
9313 |
4489 |
19321 |
138,65 |
0,35 |
0,13 |
0,26 |
8 |
88 |
158 |
13904 |
7744 |
24964 |
157,97 |
0,03 |
0,00 |
0,02 |
9 |
73 |
152 |
11096 |
5329 |
23104 |
144,17 |
7,83 |
61,34 |
5,15 |
10 |
87 |
162 |
14094 |
7569 |
26244 |
157,05 |
4,95 |
24,46 |
3,05 |
11 |
76 |
159 |
12084 |
5776 |
25281 |
146,93 |
12,07 |
145,70 |
7,59 |
12 |
115 |
173 |
19895 |
13225 |
29929 |
182,83 |
-9,83 |
96,55 |
5,68 |
Сумма |
1027 |
1869 |
161808 |
89907 |
294377 |
1869,00 |
0,00 |
1574,92 |
69,03 |
Среднее значение |
85,58 |
155,75 |
13484,00 |
7492,25 |
24531,42 |
155,75 |
0,00 |
131,24 |
5,75 |
Рассчитав столбы 4-6, по формулам (1.5) находим параметры регрессии:
В результате получим уравнение регрессии:
Параметр регрессии позволяет сделать вывод, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневнаязаработная плата возрастает в среднем на 0,92 руб. (или 92 коп.).
После нахождения уравнения регрессии заполняем столбцы 7– 10 0таблицы 1.3.
Тесноту линейной связи оценит коэффициент корреляции (1.6)
Для этого рассчитаем ;
Т.к. значение коэффициента корреляции больше 0,7, то это говорит оналичии весьма тесной линейной связи между признаками.
Коэффициент детерминации:
Это означает, что 52% вариации заработной платы ( y ) объясняется вариацией фактора x – среднедушевого прожиточного минимума.
Качество модели определяет средняя ошибка аппроксимации (1.8):
Качество построенной модели оценивается как хорошее, так как не превышает 10%.
Оценку статистической значимости уравнения регрессии в целом проведем с помощью F -критерия Фишера. Фактическое значение F -критерия по формуле (1.13) составит
Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1=1 и k2=12 - 2 =10 составляет Fтабл= 4,96. Так как Fфакт=10,41> Fтабл= 4,96 , то уравнение регрессии признается статистически значимым.
Оценку статистической значимости параметров регрессии и корреляции проведем с помощью t -статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.
Для этого определим стандартные ошибки(1.15-1.17):
Следовательно,
Табличное значение t -критерия для числа степеней свободы df= n - 2 =12 - 2 =10 и уровня значимости α= 0,05 составит tтабл= 2,23.
Фактические значения t -статистики превосходят табличное значение, поэтому параметры a , b и rxyстатистически значимы.
Рассчитаем доверительные интервалы для параметров регрессии a и b. Для этого определим предельную ошибку для каждого показателя (1.18):
∆а=tтаблma=2,23·24,21 = 53,99 ,
∆b=tтаблmb = 2,23 · 0,28 = 0,62.
Доверительные интервалы
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p =1-α = 0,95 параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.
Полученные оценки уравнения регрессии позволяют использовать его для прогноза.
Если прогнозное значение прожиточного минимума составит: , тогда индивидуальное прогнозное значение заработной платы составит:
ŷ0 = 76,98 + 0,92×91,57 =161,26 руб.
Ошибка прогноза составит:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Доверительный интервал прогноза:
Выполненный прогноз среднемесячной заработной платы является надежным с вероятностью р= 0,95.
Построим на одном графике исходные данные и теоретическую прямую (рис. 1.1).
Рис.1.1