
2. Множественная зависимость
2.1 Рассмотрим линейную регрессионную модель:
.
где a0,a1,a2 – неизвестные параметры, u – случайное отклонение.
Нахождение оценок неизвестных параметров в модели с тремя переменными х1,х2,у также как и в модели с двумя переменными, основывается на применении метода наименьших квадратов, используя который получаем систему нормальных уравнений
(5)
Обозначим A=(a0,a1,a2)
,
,
,
тогда
,
Следовательно
система (5) примет вид
и
ее можно решить например по правилу
Крамера:
,
(6)
где
-определитель
матрицы XTX
-определитель
матрицы полученной из XTX
заменой i – го столбца на
столбец свободных членов XTY.
|
16 |
82 |
1586 |
|
Δ= |
82 |
454 |
8158 |
= |
|
1586 |
8158 |
166514 |
|
= |
16 |
x |
454 |
x |
166514 |
+ |
82 |
x |
8158 |
x |
1586 |
+ |
|
|
82 |
x |
8158 |
x |
1586 |
- |
1586 |
x |
454 |
x |
1586 |
- |
|
|
8158 |
x |
8158 |
x |
16 |
- |
82 |
x |
82 |
x |
166514 |
= |
5008784 |
|
100,6 |
82 |
1586 |
|
Δa0= |
475,2 |
454 |
8158 |
= |
|
10347,2 |
8158 |
166514 |
|
= |
100,6 |
x |
454 |
x |
166514 |
+ |
475,2 |
x |
8158 |
x |
1586 |
+ |
|
|
82 |
x |
8158 |
x |
10347,2 |
- |
10347,2 |
x |
454 |
x |
1586 |
- |
|
|
8158 |
x |
8158 |
x |
100,6 |
- |
475,2 |
x |
82 |
x |
166514 |
= |
41213969,6 |
|
16 |
100,6 |
1586 |
|
Δa1= |
82 |
475,2 |
8158 |
= |
|
1586 |
10347,2 |
166514 |
|
= |
16 |
x |
475,2 |
x |
166514 |
+ |
82 |
x |
10347,2 |
x |
1586 |
+ |
|
|
100,6 |
x |
8158 |
x |
1586 |
- |
1586 |
x |
475,2 |
x |
1586 |
- |
|
|
10347,2 |
x |
8158 |
x |
16 |
- |
82 |
x |
100,6 |
x |
166514 |
= |
-6187537,6 |
|
16 |
82 |
100,6 |
|
Δa2= |
82 |
454 |
475,2 |
= |
|
1586 |
8158 |
10347,2 |
|
= |
16 |
x |
454 |
x |
10347,2 |
+ |
82 |
x |
8158 |
x |
100,6 |
+ |
|
|
82 |
x |
475,2 |
x |
1586 |
- |
1586 |
x |
454 |
x |
100,6 |
- |
|
|
8158 |
x |
475,2 |
x |
16 |
- |
82 |
x |
82 |
x |
10347,2 |
= |
221840 |
Подставив найденные значения в формулы (6) получим вектор оценок A:
|
8,23 |
А= |
-1,24 |
|
0,04 |
Таким образом
8,23
-1,24
+ 0,04
Проверим адекватность модели.
Гипотеза Н0:R2=0 (т.е. уравнение не значимо)
Коэффициент R2 множественной детерминации определяется по формуле:
(7)
где
- выборочное среднее,
значения у найденные по полученному
уравнению регрессии.
Найдем необходимые значения разностей и занесем их в таблицу:
Табл.7
y |
y(x1,x2) |
e2=(y-y(x1,х2))2 |
(y-M(y))2 |
(ei-ei-1)2 |
10 |
9,39 |
0,3721 |
13,782656 |
|
5,2 |
4,47 |
0,5329 |
1,182656 |
0,0144 |
5,9 |
5,79 |
0,0121 |
0,150156 |
0,3844 |
5,3 |
5,23 |
0,0049 |
0,975156 |
0,0016 |
9,2 |
8,83 |
0,1369 |
8,482656 |
0,09 |
6,1 |
5,79 |
0,0961 |
0,035156 |
0,0036 |
6,4 |
6,03 |
0,1369 |
0,012656 |
0,0036 |
3,1 |
3,31 |
0,0441 |
10,160156 |
0,3364 |
4 |
3,83 |
0,0289 |
5,232656 |
0,1444 |
9,5 |
9,07 |
0,1849 |
10,320156 |
0,0676 |
6,9 |
5,87 |
1,0609 |
0,375156 |
0,36 |
8,8 |
8,19 |
0,3721 |
6,312656 |
0,1764 |
6,1 |
5,87 |
0,0529 |
0,035156 |
0,1444 |
5,1 |
4,75 |
0,1225 |
1,410156 |
0,0144 |
5,9 |
4,39 |
2,2801 |
0,150156 |
1,3456 |
3,1 |
2,63 |
0,2209 |
10,160156 |
1,0816 |
Сумма |
93,44 |
5,6592 |
68,777496 |
4,1684 |
Для данного уравнения имеем
5,6592
68,777496
(5,6592/13)0,5=0,6598
1-5,6592/68,777496=0,918
Рассчитаем F-статистику Фишера:
|
0,918х13 |
=72,76829268>2,763= |
0,082х2 |
Следовательно уравнение регрессии статистически значимо
Коэффициент множественной детерминации R2 равен квадрату коэффициента множественной корреляции. Этот показатель характеризует долю дисперсии, «объясненной» с помощью регрессии в общей дисперсии зависимой переменной.
Проверим статистическую значимость параметров уравнения регрессии. Т.е. проверим гипотезы Н0: a0=0; Н0: a1=0; Н0: a2=0.
Стандартная ошибка
коэффициентов множественной регрессии
определяется по формуле:
Где Zii - диагональные элементы матрицы
|
1,805706 |
-0,142861 |
-0,0102 |
(XТX)(-1)= |
-0,142861 |
0,029713 |
-0,000095 |
|
-0,0102 |
-0,000095 |
0,000108 |
Стандартные ошибки:
CО а0 |
CО а1 |
CО а2 |
0,8866 |
0,1137 |
0,0069 |
t-статистики находим так же как и ранее:
t а0 |
t а1 |
t а2 |
9,283 |
10,906 |
5,797 |
Сравнение с табличным значением t=1,761 позволяет принять альтернативную Н0 гипотезу и значит коэффициенты статистически значимы.
2.3. Точечный прогноз
это значение
8,23
-1,24
+ 0,04
,
где
- вектор независимых переменных, для
которых определяется прогноз. В нашем
случае х1р=3; х2р=
165.
Доверительный интервал среднего значения цены для уравнения множественной регрессии, находится по формуле:
где
-соответственно
верхняя и нижняя границы доверительного
интервала,
-
вектор независимых переменных, для
которого определяется интервал,
-
квантиль распределения Стъюдента, (1-α)
–доверительная вероятность, (n-3)
– число степеней свободы.
,
,
где
- матрица обратная к
она находится по формуле
,
-
присоединенная матрица, алгебраическое
дополнение
,
–минор элемента, стоящего на пересечении
i-й строки и j-го
столбца матрицы. Определитель
5008784
|
|
|
|
1,805706 |
-0,142861 |
-0,0102 |
|
1 |
|
|
3 |
165 |
x |
-0,142861 |
0,029713 |
-0,000095 |
x |
3 |
=0,6904 |
|
|
|
|
-0,0102 |
-0,000095 |
0,000108 |
|
165 |
|
S=0,6598.
Пусть (1-α)=0,95,
тогда
,
11,11±0,5482
Результаты оформим в виде таблицы:
Табл.8
Xp |
Точечный прогноз |
Интервальный прогноз |
||
|
|
ун |
ув |
|
(1;3;165) |
11,11 |
0,5482 |
10,139 |
12,081 |