
- •Пример 3.3.1.
- •Решение
- •Построение модели линейной регрессии, оценивание значимости модели и параметров средствами Excel (инструмент Регрессия в пакетеАнализ данных).1
- •2) Проверим качество уравнения регрессии.
- •3) Проверим значимость параметров модели регрессии ( ).
- •4.Доверительный интервал для прогнозов индивидуальных значений определяется из соотношения:
2) Проверим качество уравнения регрессии.
Качество модели оценивается коэффициентом детерминацииR2.
=1-282327,28/2445684,94=0,885
Величина R2 = 0,885 означает, что фактором среднедушевого дохода можно объяснить 88,5% вариации (разброса) среднедушевых расходов.
Точность модели оценим с помощью средней ошибки аппроксимации (3.3.14) Еотн=4,67%. Точность модели хорошая.
Оценим значимость уравнения регрессии с помощью критерия Фишера.
Расчетное значение F- критерия вычислим по формуле (3.3.15)
Расчетное значение F- критерия Фишера можно найти в таблице Дисперсионный анализ протокола EXCEL.
Уравнение регрессии значимо на уровне α, если расчетное значение F>Fтабл., гдеFтабл. – табличное значение F-критерия Фишера
Табличное
значение F-критерия можно найти с помощью
функции FРАСПОБР2.
Табличное значение F-критерия при α=0.05
при
и
составляет 4,54.
Поскольку F
>F
,
уравнение регрессии следует признать
значимым.
3) Проверим значимость параметров модели регрессии ( ).
Расчетное значение t-
критерия (
)
вычислим по формулам (3.3.16) и (3.3.18),
используя данные таблицы 3.3.4.
где
==
=
137,19
Табличное значение t-критерия при 10%
уровне значимости и степенях свободы
(17-1-1=15) составляет 1,75. Так как |t
|>t
,
то коэффициент
значим.
Оценим значимость коэффициентов полученной модели, используя результаты отчета Excel. Это можно сделать тремя способами.
Коэффициент уравнения регрессии признается значимым в том случае, если:
Наблюдаемое значение t-статистики Стьюдента для этого коэффициента больше, чем критическое(табличное) значение статистики Стьюдента (для заданного уровня значимости, например, и числа степеней свободыdf=n-k-1,где n – это число наблюдений, аk – число факторов в модели);
Р-значениеt-статистики Стьюдента для этого коэффициента меньше, чем уровень значимости, например, ;
Доверительный интервал для этого коэффициента (вычисленный с некоторой доверительной вероятностью, например 95%) не содержит ноль внутри себя, т.е., если нижняя 95% и верхняя 95% границы доверительного интервала имеют одинаковые знаки.
Значимость
коэффициента
проверим по второму и третьему способам,
используя данные таблицы 3.3.5.
Р-значение ( ) = 0,00 < 0,01 < 0,05.
Следовательно, коэффициент ( ) значим при 1%-ном уровне, а тем более при 5%-ном уровне значимости.
Нижняя 95% граница равна 0.68 и верхняя 95%граница равна 1.02, границы доверительного интервала имеют одинаковые знаки, следовательно, коэффициент ( ).
4.Доверительный интервал для прогнозов индивидуальных значений определяется из соотношения:
.
Коэффициент
Стьюдента
для
m=15 степеней свободы (m=n-2) и уровня
значимости 0,05 равен 2,13.
Результаты вычислений приведены в табл. 3.3.5 и на рис. 3.3.1.
|
|
верхняя граница |
нижняя граница |
1 |
303,73 |
2840,86 |
2233,40 |
2 |
304,71 |
2392,14 |
1782,72 |
3 |
311,52 |
2234,88 |
1611,84 |
4 |
300,91 |
2641,67 |
2039,85 |
5 |
340,60 |
1866,97 |
1185,77 |
6 |
304,73 |
2391,32 |
1781,85 |
7 |
302,24 |
2488,28 |
1883,81 |
8 |
300,92 |
2611,93 |
2010,09 |
|
|
верхняя граница |
нижняя граница |
9 |
302,84 |
2804,27 |
2198,59 |
10 |
335,41 |
3409,80 |
2738,99 |
11 |
300,90 |
2630,61 |
2028,81 |
12 |
300,94 |
2605,14 |
2003,27 |
13 |
305,25 |
2892,53 |
2282,04 |
14 |
301,46 |
2722,98 |
2120,06 |
15 |
306,18 |
2350,26 |
1737,89 |
16 |
300,92 |
2648,48 |
2046,64 |
17 |
327,95 |
3313,08 |
2657,18 |
Рис.3.3.1. График исходных данных, результаты моделирования и доверительные интервалы.
4)
Для того, чтобы определить расходы
при доходе 3600 руб. необходимо получить
точечный и интервальный прогноз
аналогично п.2. Для этого следует
подставить значение
равное 3600 в полученную модель
Yпрогноз
= 170,47 +0.85*3600
3230,81.
U(x=3600
,n=17,=0.1)
=
Таким образом,
прогнозное значение
=3230,81
c
вероятностью 90% будет находиться между
верхней границей, равной 3230,81 +265,49=3496,30
и нижней
границей, равной 3230,81 -265,49=2965,32.
Рисунок 3.3.2. График модели парной регрессии зависимости расходов от дохода, точечный и интервальный прогноз при x = 3600.
1Установка и активация надстроек "Пакет анализа" в различных версиях Microsoft Office приводится в подпараграфе 2.4.1
2 В Excel2010название функцииFРАСПОБР изменено на F.ОБР.ПХ.