
Контрольная работа.
Задача 1.
По данным 14 наблюдений постройте модель парной линейной регрессии зависимости расходов на продовольственные товары на душу населения (тыс.руб) от денежных доходов на душу населения (млн..руб). Оцените качество построенной модели и рассчитайте прогноз расходов на продовольственные товары, если денежные доходы составляют 130% от их максимального значения
Таблица.
№п/п |
Расходы на продовольственные товары на душу населения , тыс.руб. |
Денежные доходы на душу населения, млн.руб. |
i |
у |
х |
1 |
301,5 |
6,3 |
2 |
284,3 |
7,3 |
3 |
243,1 |
5,1 |
4 |
312,3 |
6,4 |
5 |
329,1 |
9,4 |
6 |
315,8 |
8,8 |
7 |
281,7 |
7,1 |
8 |
282,3 |
6 |
9 |
201,5 |
4,3 |
10 |
367,6 |
9,8 |
11 |
300,0 |
7,3 |
12 |
312,6 |
7,6 |
13 |
328,4 |
8,3 |
14 |
348,3 |
9,2 |
Решение.
С помощью функции РЕГРЕССИЯ построим уравнение регрессии.
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R |
0,906769 |
|
|
|
|
|
|
|
R-квадрат |
0,822231 |
|
|
|
|
|
|
|
Нормированный R-квадрат |
0,807416 |
|
|
|
|
|
|
|
Стандартная ошибка |
18,43758 |
|
|
|
|
|
|
|
Наблюдения |
14 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
|
|
|
Регрессия |
1 |
18868 |
18868 |
55,50316 |
7,73E-06 |
|
|
|
Остаток |
12 |
4079,334 |
339,9445 |
|
|
|
|
|
Итого |
13 |
22947,33 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
129,8434 |
23,44486 |
5,538247 |
0,000128 |
78,76147 |
180,9254 |
78,76147 |
180,9254 |
х |
23,23316 |
3,118526 |
7,450044 |
7,73E-06 |
16,43847 |
30,02784 |
16,43847 |
30,02784 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ВЫВОД ОСТАТКА |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Наблюдение |
Предсказанное у |
Остатки |
|
|
|
|
|
|
1 |
276,2123 |
25,28767 |
|
|
|
|
|
|
2 |
299,4455 |
-15,1455 |
|
|
|
|
|
|
3 |
248,3325 |
-5,23254 |
|
|
|
|
|
|
4 |
278,5356 |
33,76436 |
|
|
|
|
|
|
5 |
348,2351 |
-19,1351 |
|
|
|
|
|
|
6 |
334,2952 |
-18,4952 |
|
|
|
|
|
|
7 |
294,7989 |
-13,0989 |
|
|
|
|
|
|
8 |
269,2424 |
13,05762 |
|
|
|
|
|
|
9 |
229,746 |
-28,246 |
|
|
|
|
|
|
10 |
357,5284 |
10,07162 |
|
|
|
|
|
|
11 |
299,4455 |
0,554515 |
|
|
|
|
|
|
12 |
306,4154 |
6,184568 |
|
|
|
|
|
|
13 |
322,6786 |
5,721358 |
|
|
|
|
|
|
14 |
343,5885 |
4,711517 |
|
|
|
|
|
|
Согласно полученным результатам уравнение регрессии
У(1)= 129,8434+23,233Х, R²=0,822 R= 0,9067
tст (5,53) (7,45) F=55,5
Для оценки значимости параметров регрессии и модели в целом определим tкрит Fкрит и сравним их с расчетными величинами.
F(крит.)=4,75 (при a=0,05 и числе степеней свободы n1= k=1 и n2 = 14-2=12)
Так как F(набл)> F(крит), то модель значима
. По таблице t-распределения Стьюдента определяем tкр - критическое значение t-статистики для анализируемого уравнения
tкр (a=0,05; ν=n-2=14-2=12) =2.1788
так как Так как 5,53>2,1788 |7,45>2,1788, то значимыми являются коэффициенты а1 и а2
Проверим выполнение одной из предпосылок метода наименьших квадратов –постоянство дисперсий остатков уравнения регрессии.
График остатков показывает, что остатки являются гомоскедатичными.
Проверим это предположение с помощью критерия Голдфелда-Квандта.
Проведем сортировку данных по х
у |
х |
201,5 |
4,3 |
243,1 |
5,1 |
282,3 |
6 |
301,5 |
6,3 |
312,3 |
6,4 |
281,7 |
7,1 |
284,3 |
7,3 |
300 |
7,3 |
312,6 |
7,6 |
328,4 |
8,3 |
315,8 |
8,8 |
348,3 |
9,2 |
329,1 |
9,4 |
367,6 |
9,8 |
Первая группа наблюдений (х от 4,3 до 6,4- 5 наблюдений)
Вторая группа наблюдений (х от 8,3 до 9,8-5 наблюдений)
Регрессия первой группы
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R |
0,996969 |
|
|
|
|
|
|
|
R-квадрат |
0,993947 |
|
|
|
|
|
|
|
Нормированный R-квадрат |
0,991929 |
|
|
|
|
|
|
|
Стандартная ошибка |
4,100042 |
|
|
|
|
|
|
|
Наблюдения |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
|
|
|
Регрессия |
1 |
8280,961 |
8280,961 |
492,6111 |
0,0002 |
|
|
|
Остаток |
3 |
50,43103 |
16,81034 |
|
|
|
|
|
Итого |
4 |
8331,392 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
-16,5092 |
12,95543 |
-1,27431 |
0,292307 |
-57,7391 |
24,72078 |
-57,7391 |
24,72078 |
Переменная X 1 |
50,64932 |
2,282031 |
22,19484 |
0,0002 |
43,38688 |
57,91176 |
43,38688 |
57,91176 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессия второй группы наблюдений
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
|
|
|
Множественный R |
0,716904 |
|
|
|
|
|
|
|
R-квадрат |
0,513951 |
|
|
|
|
|
|
|
Нормированный R-квадрат |
0,351934 |
|
|
|
|
|
|
|
Стандартная ошибка |
16,33196 |
|
|
|
|
|
|
|
Наблюдения |
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
||
|
df |
SS |
MS |
F |
Значимость F |
|
|
|
Регрессия |
1 |
846,1336 |
846,1336 |
3,172215 |
0,172932 |
|
|
|
Остаток |
3 |
800,1984 |
266,7328 |
|
|
|
|
|
Итого |
4 |
1646,332 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
Y-пересечение |
107,4445 |
129,5638 |
0,829279 |
0,467767 |
-304,885 |
519,7745 |
-304,885 |
519,7745 |
Переменная X 1 |
25,31818 |
14,21514 |
1,781071 |
0,172932 |
-19,9207 |
70,55711 |
-19,9207 |
70,55711 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вычислим отношение большей остаточной суммы квадратов к меньшей
Fрасч=SS3/SS1=800,1984/50,43101=15,86
Определим Fкрит (α=0,05, 1=5-1-1=3 2=5-1-1=3), Fкрит=9,28
Так как Fкрит< Fрасч, то остатки регрессии не являются гомоскедатичными.
Уравнение регрессии построенной по исходным данным является адекватным, имеет хорошее качество, его можно использовать для прогонозирования. Сделаем прогноз затрат на производство, если объем выпуска будет составлять 130% от максимального значения Х(прогн)=1,3*9,8=12,74 млн.руб.
У(1)= 129,8434+23,233*12,74=425,83 тыс.руб.
Вывод. Уравнение регрессии зависимости расходов на продовольственные товары на душу населения от денежных доходов на душу населения У(1)= 129,8434+23,233Х, данное уравнение является адекватным, имеет хорошее качество. Прогноз расходов на продовольсвенные товары на душу населения, если денежные доходы на душу населения будут составлять 130% от максимального уровня, т.е.12,74 млн.руб Упрогн=425,83 тыс.руб. Анализ остатков по критерию Голдфелда-Квандта выявил отсутствие гетероскедатичности остатков.