17-11-2015_11-58-24 / Эконометрика (электронный конспект)
.pdfОбозначим:
n |
|
|
|
|
|
|
|
|
|
TSS = ∑(Yt −Y |
)2 , |
(total sum of squares, полная сумма квадратов), |
(45) |
|
|||||
t =1 |
|
|
|
|
|
|
|
|
|
n |
|
ˆ |
2 |
, |
(error sum of squares, остаточная сумма квадратов) |
(46) |
|
||
|
|
|
|||||||
ESS = ∑(Yt −Yi ) |
|
|
|||||||
i=1 |
|
|
|
|
|
|
|
|
|
n |
ˆ |
|
|
|
2 |
, |
(regression sum of squares, объясненная сумма квадратов) |
(47) |
|
|
|
|
|||||||
RSS = ∑(Yt −Y ) |
|
t=1
Внашем примере:
n |
|
|
|
|
|
|
|
|
|
TSS = ∑(Yt |
|
|
|
)2 |
= 2746 , |
|
|||
−Y |
|
||||||||
t =1 |
|
|
|
|
|
|
|
|
|
n |
|
|
|
ˆ |
|
|
|
||
ESS = ∑(Yt |
−Yi ) |
|
= 383,88 |
|
|||||
i=1 |
|
|
|
|
|
|
|
|
|
n |
ˆ |
|
|
|
|
|
2 |
|
|
|
−Y ) |
= 2362.1 |
|
||||||
RSS = ∑(Yt |
|
|
|||||||
t =1 |
|
|
|
|
|
|
|
|
|
Несложно показать, что |
|
||||||||
TSS = ESS + RSS |
|
|
(48) |
||||||
Обозначим: |
|
|
|
|
|
|
|
|
|
R2 =1− |
ESS |
= RSS |
(49) |
||||||
|
TSS |
|
|
TSS |
|
(50)
Если R2 = 0 , то это означает, что регрессия не улучшает качество предсказания по сравнению с тривиальным предсказанием Yˆt =Y . Равенство R2 =1 означает точную подгонку: все точки наблюдений лежат на регрессионной прямой.
Чем ближе значение R2 к 1, тем лучше качество подгонки.
Интервальные оценки коэффициентов регрессии |
|
|
||||
Напомним, что статистики ta = |
a −α |
и |
tb = |
b −β |
имеют распределение Стъюдента с |
|
s(a | X ) |
s(b | X ) |
|||||
|
|
|
|
числом степеней свободы n − 2 .
11
Следовательно, в силу (44), |
|
|||||
P −t (ρ,n − 2)≤ |
|
a −α |
≤ t (ρ,n − 2) =1−ρ |
(51) |
||
|
s(a | X ) |
|||||
|
|
|
|
|||
P −t (ρ,n − 2)≤ |
|
b −β |
|
≤ t (ρ,n − 2) =1−ρ, |
(52) |
|
s(b | X ) |
||||||
|
|
|
где t (ρ,n − 2) – двусторонняя квантиль распределения Стъюдента для уровня значимости ρ и числа степеней свободы n − 2 .
Из (51), (52) в результате несложных алгебраических преобразований имеем:
P |
{ |
a −t |
( |
ρ,n − 2 |
) |
s(a | X ) ≤ α ≤ a +t |
( |
ρ,n − 2 |
) |
s(a | X ) |
|
=1−ρ |
(53) |
||||||
|
|
|
|
|
|
|
|
|
} |
|
|
||||||||
P b −t |
( |
ρ,n − 2 |
) |
s(b | X ) ≤ β ≤ b +t |
( |
ρ,n − 2 |
) |
s(b | X ) |
=1−ρ |
(54) |
|||||||||
|
{ |
|
|
|
|
|
|
|
|
} |
|
|
|
||||||
Эти соотношения определяют доверительные интервалы: |
|
||||||||||||||||||
a −t (ρ,n − 2)s(a | X ), |
a +t (ρ,n − 2)s(a | X ) , |
|
|
|
(55) |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
b −t (ρ,n − 2)s(b | X ), |
b +t (ρ,n − 2)s(b | X ) , |
|
|
|
(56) |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в которые с вероятностью 1−ρ попадают коэффициенты регрессии α и β. Напомним, что в условиях нашего примера:
a = -1,2651, b = 0,7991, |
|
|||
|
|
|
|
|
s(a | X ) = |
|
12,3168 |
||
Var (a | X ) = |
||||
|
|
|
|
|
s(b | X ) = |
|
0,1857 |
||
Var (b | X ) = |
ρ = 0,05 , t (ρ,n − 2)= 3,1824 .
Подставив эти значения в выражения (55), (56), получим следующие доверительные интервалы для коэффициентов регрессии α и β:
[-40,47; 37,94],
[0,2072; 1,3910].
Достаточно большая длина этих доверительных интервалов (и, следовательно, низкая точность оценок коэффициентов регрессии) объясняется малым количеством наблюдений.
Доверительные интервалы для зависимой переменной
Будем считать, что при s = n +1 в соответствии с зависимостью (1), имеет место равенство:
Ys = α +βXs + εs |
(57) |
и для εs выполняются основные гипотезы линейной регрессии:
12
1)E[εs | X , Xs ]= 0 ;
2)Var[εs | X , Xs ]= E ε2s | X , Xs = σ2 ;
3)Cov[εt ,εs | X , Xs ]= E[εtεs | X , Xs ]= 0 при t ≠ s – некоррелированность ошибок для разных
(58)
Yˆs находится в соответствии с формулой (2):
(59)
(При этом реальное значение Ys может не быть известным.)
Пусть, например, в условиях нашего примера Xs = 74 .
ˆ |
|
|
|
Тогда Ys = a +bXs = -1,2651+0,7991 74 = 57,87 . |
|
||
Заметим, что |
|
|
|
ˆ |
|
= E[a +bXs | X , Xs ]= E[a | X ]+ E[b | X ]Xs = α +βXs . (60) |
|
E Ys | X , Xs |
|
||
|
|
ˆ |
является несмещенной оценкой величины |
В силу (58), (60), прогнозное значение Ys = a +bXs |
E[Ys | X , Xs ].
Для получения доверительных интервалов ниже будем считать, что условное распределение случайной величины εs нормально (при фиксированных значениях случайных величин X и
Xs ).
Тогда в силу формулы (59) из того, что условные распределения оценок a и b нормальны,
вытекает, что условное распределение прогноза Yˆ |
также нормально. |
||
|
|
s |
|
При этом в силу (60): |
|
|
|
ˆ |
|
(61) |
|
E Ys | X , Xs = α +βXs |
|
13
|
ˆ |
| X , X |
|
|
= E |
|
|
|
|
ˆ |
|
|
|
ˆ |
| X |
, X |
|
|
|
|
2 |
| X , |
X |
|
} |
= E |
(a +bX |
|
)−( |
α +βX |
|
) |
|
2 |
| X , X |
s} |
= |
|||||||||||||||||||||||||||||||||
Var Y |
s |
|
|
( |
Y − E Y |
s |
) |
|
s |
s |
s |
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
s |
|
|
|
|
|
|
|
|
|
|
s |
|
|
|
s |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
{ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
{ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
} |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
= E |
|
(a −α)+(b −β)X |
s |
2 | X |
, |
X |
s |
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
|
{ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
s} |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
= E |
{( |
a |
−α |
2 |
| X , X |
|
s |
} |
|
+ E |
|
|
b −β |
) |
X |
s |
2 |
| |
X , X |
+ |
2E |
{( |
a −α |
)( |
b |
−β |
) |
X |
s |
| X , X |
s |
} |
= |
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
{ ( |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
=Var (a | X , Xs )+Var (b | X , Xs )Xs2 + 2Cov(a,b | X , Xs )Xs |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||
Итак, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Var |
ˆ |
|
|
|
|
|
=Var (a | |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
+ 2Cov(a,b | X , |
Xs )Xs |
|
|
|
|
|
(62) |
|
|
||||||||||||||||||||||||||
Ys |
| X , Xs |
X , Xs )+Var (b | X , Xs )Xs |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Подставим формулы (24)-(26) в (62), получим: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
Var |
ˆ |
|
|
|
|
|
=Var (a | |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
+ 2Cov(a,b | X , |
Xs )Xs |
= |
|
|
|
|
|
|
|||||||||||||||||||||||||||
Ys |
| X , Xs |
X , Xs )+Var (b | X , Xs )Xs |
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
∑Xt2 |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
= σ2 |
|
|
|
|
|
|
|
+ σ2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
2 |
− 2σ2 |
|
|
|
|
X |
|
|
X |
|
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
n∑(Xt − X |
)2 |
|
|
∑(Xt − X |
)2 |
|
|
s |
∑(Xt − X |
)2 |
s |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
1 |
|
(X |
− Xs )2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
= σ2 |
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
n |
|
∑(Xt − X |
)2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
Итак, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
ˆ |
|
|
|
|
|
|
|
|
|
2 |
1 |
|
|
|
(X |
− Xs )2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
Var |
Ys |
| X , Xs |
= σ |
|
|
|
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
(63) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
n |
|
∑(Xt − X ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
Подставив вместо |
|
|
|
σ2 |
|
ее выборочную несмещенную оценку |
|
s2 , получим несмещенную |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
оценку для Var Ys |
|
| X , Xs : |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
ˆ |
|
|
|
|
|
|
|
|
2 |
1 |
|
|
|
(X |
− Xs )2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
Var |
Ys |
| X , Xs |
= s |
|
|
|
|
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
. |
|
|
|
|
|
|
|
|
(64) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
n |
∑(Xt − X ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
В условиях нашего примера: |
|
s =11,31, n = 5 , |
Xs = 74 , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
ˆ |
|
|
|
|
|
|
|
|
2 |
1 |
|
|
|
(X |
− Xs )2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
Var |
Ys |
| X , Xs |
= s |
|
|
|
|
|
|
|
|
+ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
= 31,99 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
n |
∑(Xt − X ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
Обозначим: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
ˆ |
|
|
X , Xs )= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
ˆ |
| |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(65) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
s(Ys | |
Var |
Ys |
|
X , Xs |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
В условиях нашего примера: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
ˆ |
| |
|
|
|
|
|
|
|
= |
|
5,656 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
s(Ys | X , Xs )= |
Var |
Ys |
|
X , Xs |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Можно доказать, что статистика
14
|
ˆ |
) |
|
|
|
|
|
|
t = |
Ys −(α +βXs |
|
|
(66) |
|
|||
ˆ |
|
|
|
|
|
|||
|
s(Ys | X , Xs ) |
|
|
|
|
|
|
|
имеет распределение Стъюдента с числом степеней свободы n − 2 . |
|
|||||||
Следовательно, при уровне значимости ρ: |
|
|
||||||
|
|
|
|
ˆ |
) |
|
|
|
|
|
|
Ys −(α +βXs |
|
|
|
||
P −t (ρ,n − 2)≤ |
|
|
|
|
≤ t (ρ,n − 2) |
=1−ρ, |
(67) |
|
|
|
ˆ |
|
|||||
|
|
|
|
s(Ys | X , Xs ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
где t (ρ,n − 2) – двусторонняя квантиль распределения Стъюдента для уровня значимости ρ
и числа степеней свободы n − 2 . |
|
|
|
|
|
||||
Из (67) в результате несложных алгебраических преобразований имеем: |
|
||||||||
{ |
ˆ |
|
ˆ |
|
ˆ |
ˆ |
} |
|
|
|
|
|
X , Xs ) =1−ρ |
(68) |
|||||
P Ys −t (ρ,n − 2)s(Ys | X , Xs ) |
≤ α +βXs ≤Ys +t (ρ,n − 2)s(Ys | |
||||||||
Это |
соотношения |
определяет |
доверительный |
интервал для |
ожидаемого |
значения |
|||
E[Ys | X , Xs ]= α +βXs : |
|
|
|
|
|
|
|||
ˆ |
|
ˆ |
| X , Xs ), |
ˆ |
ˆ |
|
|
(69) |
|
Ys |
−t (ρ,n − 2)s(Ys |
Ys +t (ρ,n − 2)s(Ys | X , |
Xs ) , |
|
|
||||
в который с вероятностью 1−ρ попадает E[Ys | X , Xs ]. |
|
|
|
||||||
В условиях нашего примера: |
Xs |
= 74 , Yˆs = 57,87 , |
ρ = 0,05 , t (ρ,n − 2)= 3,1824 . |
|
Следовательно, 95%-й доверительный интервал для E[Ys | X , Xs ]:
[39,87; 75,87].
Доверительный интервал для Ys |
|
|
|
|
|
|
|
||||||||||||||||
Будем считать, что значение Ys |
|
не известно. |
|
||||||||||||||||||||
Из равенств (58), (61): |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(70) |
|
|
E Ys |
−Ys | |
X , Xs = 0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Используя формулы (2), (57), можно показать, что |
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
ˆ |
|
|
|
|
1 |
|
|
(X − Xs ) |
|
|
|
|||||||||||
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
||||||||||
Var Ys −Ys | X , Xs |
= σ |
|
1+ |
|
+ |
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
(71) |
|||
|
n |
|
∑(Xt − X ) |
||||||||||||||||||||
Следовательно, |
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
||
|
ˆ |
|
|
|
|
1 |
|
|
(X − Xs ) |
|
|
|
|||||||||||
|
|
2 |
|
|
|
|
|
|
|
|
|
||||||||||||
Var Ys −Ys | X , Xs |
= s |
|
|
1+ |
|
+ |
|
|
|
|
|
|
|
|
|
|
2 |
|
(72) |
||||
|
|
n |
∑(Xt − X ) |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
является несмещенной оценкой для Var Ys −Yˆs | X , Xs . В условиях нашего примера:
15
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
ˆ |
|
|
|
1 |
|
(X − Xs ) |
|
|
||||||
|
|
2 |
|
|
|
|
|
|
|||||||
Var Ys −Ys | X , Xs |
= s |
|
1+ |
|
+ |
|
|
|
|
|
2 |
|
=159,95 |
||
|
n |
∑(Xt − X ) |
|||||||||||||
|
|
|
|
|
|
|
|
|
|
Обозначим:
|
ˆ |
|
|
|
ˆ |
|
|
s(Ys −Ys | X , Xs )= |
Var Ys −Y |
| X , Xs |
|
||||
В условиях нашего примера: |
|
|
|
||||
|
ˆ |
|
|
|
|
|
|
|
|
|
|
ˆ |
|
=12,65 |
|
s(Ys −Ys | X , Xs )= |
Var Ys −Y |
| X , Xs |
|||||
Можно показать, что величина |
|
||||||
|
|
ˆ |
|
|
|
|
|
t = |
|
Ys −Ys |
|
|
|
|
|
s(Ys |
ˆ |
|
|
|
|
|
|
|
−Ys | X , Xs ) |
|
|
|
|
|
(73)
(74)
имеет распределение Стъюдента с числом степеней свободы n − 2 . |
|
||||||||||
Следовательно, при уровне значимости ρ: |
|
|
|
|
|||||||
|
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
Ys −Ys |
|
|
|
|
|
|
|
P −t (ρ,n − 2)≤ |
|
|
|
|
≤ t (ρ,n − 2) =1−ρ , |
|
(75) |
|
|||
s(Ys |
ˆ |
Xs ) |
|
|
|||||||
|
|
|
−Ys | X , |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
где t (ρ,n − 2) |
– двусторонняя квантиль распределения Стъюдента для уровня значимости ρ |
||||||||||
и числа степеней свободы n − 2 . |
|
|
|
|
|
||||||
Из (75) в результате несложных алгебраических преобразований имеем: |
|
||||||||||
{ |
ˆ |
|
|
ˆ |
|
|
ˆ |
|
ˆ |
} |
(76) |
P Ys −t (ρ,n − 2)s(Ys |
−Ys | X , |
Xs )≤Ys ≤Ys +t (ρ,n − 2)s(Ys −Ys | X , Xs ) =1−ρ |
|||||||||
Это соотношения определяет доверительный интервал для значения Ys : |
|
||||||||||
ˆ |
|
|
|
ˆ |
|
|
ˆ |
ˆ |
|
, |
(77) |
Ys |
−t (ρ,n − 2)s(Ys −Ys | X , Xs ), Ys +t (ρ,n |
− 2)s(Ys −Ys | X , |
Xs ) |
||||||||
в который с вероятностью 1−ρ попадает Ys . |
|
|
|
||||||||
В условиях нашего примера: |
Xs = 74 , Yˆs = 57,87 , ρ = 0,05 , t (ρ,n − 2)= 3,1824 . |
|
|||||||||
Следовательно, 95%-й доверительный интервал для Ys : |
|
|
|
||||||||
[17,62; 98,12] |
|
|
|
|
|
|
|
|
|
|
16
3. Модель множественной регрессии
Основные гипотезы 1) Спецификация модели
m |
|
|
|
|
yt = ∑βi Xti + εt , |
t = |
1,n |
, |
(1) |
i=1 |
|
|
|
|
Xti – объясняющие (независимые) |
переменные, Yt – объясняемая (зависимая) перемен- |
|||
ная, εt – случайное отклонение, βi |
– коэффициенты регрессии. |
Отметим, что εt |
и Yt |
– случайные величины, Xti может быть как случайной, так и неслу- |
чайной (детерминированной) величиной. |
||
Отметим, что уравнение (1) охватывает также случай, когда: |
||
m |
|
|
yt = β0 + ∑βi Xti |
+ εt |
(2) |
i=1
Вэтом случае можно считать, что
m |
m |
|
yt = β0 Xt 0 + ∑βi Xti + εt = ∑βi Xti + εt , |
(3) |
|
i=1 |
i=0 |
|
где Xt 0 =1.
Следовательно, не уменьшая общности, можно считать, что уравнение регрессии задано формулой (1).
Обозначим:
Y = |
Y1 |
|
X11, , X1m |
|
, |
β = |
β1 |
|
, |
ε = |
ε1 |
|
(4) |
|
, X = .................. |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Yn |
Xn1, , Xnm |
|
|
βm |
|
|
εn |
|
|
С помощью этих обозначений запишем уравнения регрессии (1) в матричном виде:
Y = Xβ+ ε |
|
|
(5) |
||
Пример |
|
|
|
|
|
|
|
|
|
|
|
t |
|
Y |
X1 |
X2 |
|
1 |
|
6 |
41 |
58 |
|
2 |
|
12 |
55 |
36 |
|
3 |
|
10 |
46 |
34 |
|
4 |
|
7 |
32 |
15 |
|
5 |
|
3 |
31 |
87 |
|
Будем считать, что спецификация модели:
17
Yt = β1 +β2 Xt 2 +β3 Xt3 + εt |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Тогда: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
1 |
|
41 |
|
58 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
36 |
|
|
|
|
|
|
|
β1 |
|
|
|
|
12 |
|
1 55 |
|
|
|
|
|
|
|
|
|
|||||||
Y |
|
|
, |
|
|
|
|
|
|
, |
|
|
|
|
|
|
|
|
|
= 10 |
|
X = 1 46 34 |
|
|
|
|
β = β2 |
|
|
||||||||||
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
|
|
|
||
|
7 |
|
|
1 32 |
|
|
|
|
|
|
|
|
β3 |
|
|
||||
|
3 |
|
|
1 |
|
31 |
|
87 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2) |
E[ε| X ]= 0 |
|
|
|
|
|
|
|
|
|
|
|
|
(6) |
|
||||
3) Var[ε| X ]= σ2In |
|
|
|
|
|
|
|
|
|
|
|
|
(7) |
|
|||||
Напомним, что Var |
[ |
ε| X |
] |
= cov |
( |
ε |
,ε |
s |
| X |
|
– матрица размером n ×n |
||||||||
|
|
|
|
|
|
|
|
|
t |
|
|
) ts |
|
||||||
Следовательно, равенство (7) означает, что |
|
||||||||||||||||||
т.е. Var[εt |
|
|
2 |
|
= σ |
2 |
, не зависит от t (гомоскедастичность); |
||||||||||||
| X ]= E εt | X |
|
|
|||||||||||||||||
Cov[εt ,εs | X ]= E[εtεs | X ]= 0 |
|
при |
|
s ≠ t – |
некоррелированность ошибок для разных |
наблюдений (отсутствие автокорреляции ошибок).
Дополнительная гипотеза:
4) εt – (условно) нормально распределенная случайная величина Тогда:
ε| X N (0,σ2 In ) |
(8) |
||
В этом случае модель называется нормальной линейной регрессионной. |
|||
Оценка параметров. |
|
||
Метод наименьших квадратов. |
|
||
Обозначим: |
|
||
ˆ |
m |
|
|
= ∑bi Xti |
(9) |
||
Yt |
|||
|
i=1 |
|
|
Yˆ |
– прогнозное значение объясняемой переменной, b – некоторые оценки коэффициен- |
||
t |
|
i |
тов регрессии βi .
Отметим, что Yˆt зависит от значений коэффициентов bi . Обозначив
18
|
|
|
ˆ |
|
|
|
b |
|
|
ˆ |
|
Y |
|
|
|
|
|||
= |
|
1 |
, |
b = |
1 |
|
(10) |
||
Y |
|
|
|
||||||
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
b |
|
|
|
|
|
Yn |
|
|
m |
|
|
запишем формулы (2) в матричном виде:
ˆ |
|
|
|
|
(11) |
Y = Xb |
|
|
|
|
|
Обозначим: |
|
|
|
|
|
n |
2 |
n |
m |
|
2 |
F(b) = ∑ Yˆt −Yt |
|
= ∑ ∑bi Xti −Yt |
(12) |
||
t =1 |
|
t =1 |
i=1 |
|
|
сумму квадратов отклонений прогнозных значений от реальных значений объясняемой переменной.
Метод наименьших квадратов состоит в нахождении таких значений a и b , при которых F(b) минимально:
F(b) → min . |
(13) |
Запишем необходимые условия экстремума задачи (13):
|
∂F |
|
n |
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
= |
2∑ ∑bi |
Xti −Yt Xtj |
= 0 , j =1,m |
(14) |
|||||
|
∂bj |
||||||||||
|
|
t =1 |
i=1 |
|
|
|
|
|
|
|
|
Систему уравнений (14) приведем к виду: |
|
||||||||||
|
m |
|
n |
|
n |
|
|
|
|
|
|
|
j =1,m |
(15) |
|||||||||
∑bi |
∑Xti Xtj |
= ∑Yt Xtj , |
|||||||||
|
i=1 |
t =1 |
|
t =1 |
|
|
|
|
|
|
Запишем эту систему линейных уравнений в матричном виде:
(16)
Отметим, что X T X – симметричная квадратная матрица размером m ×m . В нашем примере:
|
|
|
|
|
|
|
|
|
1 |
41 |
58 |
|
|
|
|
|
|
|
|
1 |
1 |
1 |
1 |
1 |
|
|
55 |
36 |
|
|
5 |
205 |
230 |
|
|
|
|
1 |
|
|||||||||||
X |
T |
X |
|
55 |
46 |
32 |
|
× |
|
46 |
34 |
|
|
|
8807 |
|
|
= 41 |
31 |
1 |
|
= 205 |
9099 |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
36 |
34 |
15 |
|
1 |
32 |
15 |
230 |
9099 |
|||||
|
|
|
58 |
87 |
|
|
13610 |
|||||||||
|
|
|
|
|
|
|
|
|
1 |
31 |
87 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Будем считать, что матрица X T X не вырождена с вероятностью 1: |
||||||||||||||||
P{det (X T X )= 0}= 0 |
|
|
|
|
|
|
|
(17) |
|
|
19
С учетом (17) из (16) имеем: |
|
b = (X T X )−1 X TY . |
(18) |
Формула (18) дает МНК-оценку для вектора коэффициентов регрессии β.
Отметим, что формула (18) обобщает формулы (2.9), (2.10), полученные для случая парной регрессии.
В нашем примере:
|
|
|
|
|
|
|
|
5 |
|
205 |
230 |
−1 |
6,6886 |
-0,1258 |
-0,0289 |
|
|
|
|
|
|
|||||
(X |
T |
X ) |
−1 |
= |
|
|
|
|
8807 |
9099 |
|
|
|
0,0027 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
205 |
|
= -0,1258 |
|
0,0003 |
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
230 |
9099 |
|
|
|
|
0,0003 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
13610 |
-0,0289 |
|
0,0004 |
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6,6886 |
-0,1258 |
-0,0289 |
1 |
1 |
1 |
1 |
1 |
|
|
|
-0,5475 |
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
12 |
||||||||||||||
b = (X |
T |
X ) |
−1 |
X |
T |
|
|
|
0,0027 |
|
|
|
55 |
46 |
32 |
|
× |
|
|
|
|
|||||
|
|
|
|
Y = -0,1258 |
0,0003 |
× 41 |
31 |
10 |
|
= 0,2634 |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0,0003 |
|
36 |
34 |
15 |
|
7 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
-0,0289 |
0,0004 |
58 |
87 |
|
-0,0577 |
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
Итак, в нашем примере:
-0,5475 b = 0,2634
-0,0577
|
1 |
41 |
58 |
|
|
|
|
6,9077 |
|||
|
|
55 |
36 |
|
-0,5475 |
|
|
|
|
|
|
|
1 |
|
|
11,8651 |
|||||||
ˆ |
|
|
|
|
|
|
|
|
|
|
|
Y = Xb = |
46 |
34 |
× 0,2634 |
|
= |
9,6095 |
|||||
1 |
|
|
|
||||||||
|
|
|
|
|
|
|
|
||||
|
1 |
32 |
15 |
|
|
|
7,0174 |
||||
|
-0,0577 |
|
|
||||||||
|
1 |
31 |
87 |
|
|
|
|
|
2,6003 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Итак,
|
|
6,9077 |
|
|
|
|
|
|
|
ˆ |
11,8651 |
|
||
|
9,6095 |
|
|
|
Y |
= |
|
|
|
|
|
7,0174 |
|
|
|
|
2,6003 |
|
|
|
|
|
|
|
Свойства оценок МНК |
|
|||
Несмещенность |
|
|||
Прежде всего, заметим, что в силу (5) и (6): |
|
|||
E[Y | X ]= Xβ. |
(19) |
20