Контрольная работа
По дисциплине: Эконометрика
Студента группы: 1ДБ4ЭК-21
Козловского Владимира
Преподаватель: Ковырялова Татьяна Николаевна
Вариант № 10.
Тема: Парная регрессия.
Задача:
x – энерговооруженность на десяти предприятиях (кВт),
у – выпуск готовой продукции на одного рабочего (млн. руб.)
-
x
0.9
1.5
2
2.5
2.8
3
1.2
1.4
y
3.1
5.1
5.9
6.1
7.2
8.1
3.8
5.3
Требуется:
1. Для характеристики y от x построить следующие модели:
— линейную,
— экспоненциальную,
— гиперболическую.
2. Оценить каждую модель, определив:
— индекс корреляции,
— коэффициент детерминации,
— скорректированный коэффициент детерминации,
— F-критерий Фишера,
— t-статистику и p-значения,
— среднюю ошибку аппроксимации.
3. Составить сводную таблицу вычислений, выбрать лучшую модель, дать интерпретацию рассчитанных характеристик.
4. По лучшей модели рассчитать прогнозные значения результативного признака, если прогнозное значение фактора увеличится на 10 % относительно его среднего уровня. Определите доверительный интервал прогноза.
5. На графике отобразить диаграмму рассеяния, график лучшей модельной кривой и прогнозное значение.
Решение:
Построение линейной модели.
Для расчета параметров уравнения линейной регрессии составим расчетную таблицу
|
||||||||
1 |
0,9 |
3,1 |
2,79 |
0,81 |
9,61 |
3,537015 |
-0,437015447 |
0,140973 |
2 |
1,5 |
5,1 |
7,65 |
2,25 |
26,01 |
4,74471 |
0,355290003 |
0,069665 |
3 |
2 |
5,9 |
11,8 |
4 |
34,81 |
5,751122 |
0,148877878 |
0,025234 |
4 |
2,5 |
6,1 |
15,25 |
6,25 |
37,21 |
6,757534 |
-0,657534247 |
0,107792 |
5 |
2,8 |
7,2 |
20,16 |
7,84 |
51,84 |
7,361382 |
-0,161381521 |
0,022414 |
6 |
3 |
8,1 |
24,3 |
9 |
65,61 |
7,763946 |
0,336053629 |
0,041488 |
7 |
1,2 |
3,8 |
4,56 |
1,44 |
14,44 |
4,140863 |
-0,340862722 |
0,089701 |
8 |
1,4 |
5,3 |
7,42 |
1,96 |
28,09 |
4,543428 |
0,756572428 |
0,14275 |
Итого |
15,3 |
44,6 |
93,93 |
33,55 |
267,62 |
44,6 |
|
|
Среднее значение |
1,9125 |
5,575 |
11,74125 |
4,19375 |
33,4525 |
5,575 |
|
|
1,452 |
4,444 |
|
|
|
|
|
|
|
2,107 |
19,753 |
|
|
|
|
|
|
Рассчитаем значение коэффициентов а и b
a = 1,725
b = 2,013
Получаем уравнение регрессии: y = 1,725 + 2,013 · x
При увеличении энерговооруженности на десяти предприятиях на 1 кВт выпуск готовой продукции возрастает на 2,013 млн.руб.
С помощью этого уравнения находим значения ŷx:
ŷ1 = 1,725 + 2,013 · 0,9 = 3,5367
ŷ2 = 1,725 + 2,013 · 1,5 = 4,7445
ŷ3 = 1,725 + 2,013 · 2 = 5,751
ŷ4 = 1,725 + 2,013 · 2,5 = 6,7575
ŷ5 = 1,725 + 2,013 · 2,8 = 7,3614
ŷ6 = 1,725 + 2,013 · 3 = 7,764
ŷ7 = 1,725 + 2,013 · 1,2 = 4,1406
ŷ8 = 1,725 + 2,013 · 1,4 = 4,5432
Далее рассчитываем Аi:
А1 = | -0,437 / 3,1 | · 100% = 0,141
А2 = | 0,355 / 5,1 | · 100% = 0.070
А3 = | 0,149 / 5,9 | · 100% = 0.025
А4 = | -0,658 / 6,1 | · 100% = 0.108
А5 = | -0,161 / 7,2 | · 100% = 0.022
А6 = | 0,336 / 8,1 | · 100% = 0.041
А7 = | -0.341 / 3,8 | · 100% =0,090
А8 = | 0,757 / 5,3 | · 100% = 0,143
Далее рассчитываем коэффициент корреляции и детерминации:
rxy=a1*√ Х2 – X2/√Y2 – Y2 = 0.595
rxy2= 0.354
Следовательно 35,4% вариации выпуска готовой продукции объясняется вариацией энерговооруженностью предприятия.
Определяем среднюю ошибку аппроксимации:
Ā= 1/n∑Ai= 1/10*2.696= 0.2696= 27%
Качество модели плохое, так как Ā превышает 10%.
Проводим оценку значимости с помощью F-критерия Фишера. Фактическое значение F-критерия равно 4,383. Табличное значение F-критерия равно 5,99, при степенях свободы k1=1 и k2=8-2=6. Так как Fфакт=65,188>Fтабл=5,99, то уравнение признается статистически значимым.
Сравнение посчитанных результатов с результатами Microsoft Excel.
Регрессионная статистика |
|
Множественный R |
0,956930351 |
R-квадрат |
0,915715696 |
Нормированный R-квадрат |
0,901668312 |
Стандартная ошибка |
0,516283944 |
Наблюдения |
8 |
Посчитанные результаты
Множественный R- индекс корреляции (для парной регрессии rxy) =0,957
R-квадрат - коэффициент детерминации, =0,916
Стандартная ошибка - стандартная ошибка оценки =0.516
Наблюдения - количество наблюдений, n=8
Дисперсионный анализ |
|
|
|
|
|
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
17,37570533 |
17,37570533 |
65,1876319 |
0,000193339 |
Остаток |
6 |
1,599294666 |
0,266549111 |
|
|
Итого |
7 |
18,975 |
|
|
|
Посчитанные результаты
df - число степеней свободы m=1; n-m-1=6; n-1=7.
F- критерий Фишера = 65.188
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
Y-пересечение |
1,725473623 |
0,510533826 |
3,379743973 |
Переменная X 1 |
2,012824249 |
0,24930056 |
8,073885799 |
Посчитанные результаты
Коэффициенты- коэффициенты уравнения регрессии а=1,725 и b=2.013
Стандартная ошибка - стандартные ошибки коэффициентов уравнения регрессии ma=0.510 и mb=0.249
t-статистика- t-статистика ta=3.380 и tb=8.073
ВЫВОД ОСТАТКА |
||
Наблюдение |
Предсказанное Y |
Остатки |
1 |
4,896509492 |
-1,896509492 |
2 |
4,271892223 |
1,728107777 |
3 |
5,104715248 |
-1,104715248 |
4 |
5,625229639 |
0,374770361 |
5 |
5,312921004 |
-1,312921004 |
6 |
5,833435395 |
2,166564605 |
7 |
6,145744029 |
-0,145744029 |
8 |
6,978567055 |
2,021432945 |
9 |
8,227801592 |
0,772198408 |
10 |
7,603184323 |
-2,603184323 |
Посчитанные результаты
Предсказанное Y – значения результирующего показателя, рассчитанные по построенной модели;
Остатки – разность между фактическими и предсказанными значениями результирующего показателя Y(yi – ŷi).
Yi* |
y-y* |
3,537015 |
-0,437 |
4,74471 |
0,355 |
5,751122 |
0,149 |
6,757534 |
-0,658 |
7,361382 |
-0,161 |
7,763946 |
0,336 |
4,140863 |
-0,341 |
4,543428 |
0,757 |