Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

17-11-2015_11-58-24 / Эконометрика (электронный конспект)

.pdf
Скачиваний:
57
Добавлен:
20.02.2016
Размер:
1.05 Mб
Скачать
Поскольку, как следует из (48),
0 R2 1
Статистику R2 называют коэффициентом детерминации. В условиях нашего примера:
R2 =1383,882746 = 0,8602
RSS TSS ,

Обозначим:

n

 

 

 

 

 

 

 

 

 

TSS = (Yt Y

)2 ,

(total sum of squares, полная сумма квадратов),

(45)

 

t =1

 

 

 

 

 

 

 

 

 

n

 

ˆ

2

,

(error sum of squares, остаточная сумма квадратов)

(46)

 

 

 

 

ESS = (Yt Yi )

 

 

i=1

 

 

 

 

 

 

 

 

 

n

ˆ

 

 

 

2

,

(regression sum of squares, объясненная сумма квадратов)

(47)

 

 

 

RSS = (Yt Y )

 

t=1

Внашем примере:

n

 

 

 

 

 

 

 

 

 

TSS = (Yt

 

 

 

)2

= 2746 ,

 

Y

 

t =1

 

 

 

 

 

 

 

 

n

 

 

 

ˆ

 

 

 

ESS = (Yt

Yi )

 

= 383,88

 

i=1

 

 

 

 

 

 

 

 

n

ˆ

 

 

 

 

 

2

 

 

 

Y )

= 2362.1

 

RSS = (Yt

 

 

t =1

 

 

 

 

 

 

 

 

Несложно показать, что

 

TSS = ESS + RSS

 

 

(48)

Обозначим:

 

 

 

 

 

 

 

 

R2 =1

ESS

= RSS

(49)

 

TSS

 

 

TSS

 

(50)

Если R2 = 0 , то это означает, что регрессия не улучшает качество предсказания по сравнению с тривиальным предсказанием Yˆt =Y . Равенство R2 =1 означает точную подгонку: все точки наблюдений лежат на регрессионной прямой.

Чем ближе значение R2 к 1, тем лучше качество подгонки.

Интервальные оценки коэффициентов регрессии

 

 

Напомним, что статистики ta =

a −α

и

tb =

b −β

имеют распределение Стъюдента с

s(a | X )

s(b | X )

 

 

 

 

числом степеней свободы n 2 .

11

Следовательно, в силу (44),

 

P t (ρ,n 2)

 

a −α

t (ρ,n 2) =1−ρ

(51)

 

s(a | X )

 

 

 

 

P t (ρ,n 2)

 

b −β

 

t (ρ,n 2) =1−ρ,

(52)

s(b | X )

 

 

 

где t (ρ,n 2) – двусторонняя квантиль распределения Стъюдента для уровня значимости ρ и числа степеней свободы n 2 .

Из (51), (52) в результате несложных алгебраических преобразований имеем:

P

{

a t

(

ρ,n 2

)

s(a | X ) ≤ α ≤ a +t

(

ρ,n 2

)

s(a | X )

 

=1−ρ

(53)

 

 

 

 

 

 

 

 

 

}

 

 

P b t

(

ρ,n 2

)

s(b | X ) ≤ β ≤ b +t

(

ρ,n 2

)

s(b | X )

=1−ρ

(54)

 

{

 

 

 

 

 

 

 

 

}

 

 

 

Эти соотношения определяют доверительные интервалы:

 

a t (ρ,n 2)s(a | X ),

a +t (ρ,n 2)s(a | X ) ,

 

 

 

(55)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b t (ρ,n 2)s(b | X ),

b +t (ρ,n 2)s(b | X ) ,

 

 

 

(56)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в которые с вероятностью 1−ρ попадают коэффициенты регрессии α и β. Напомним, что в условиях нашего примера:

a = -1,2651, b = 0,7991,

 

 

 

 

 

 

s(a | X ) =

 

12,3168

Var (a | X ) =

 

 

 

 

s(b | X ) =

 

0,1857

Var (b | X ) =

ρ = 0,05 , t (ρ,n 2)= 3,1824 .

Подставив эти значения в выражения (55), (56), получим следующие доверительные интервалы для коэффициентов регрессии α и β:

[-40,47; 37,94],

[0,2072; 1,3910].

Достаточно большая длина этих доверительных интервалов (и, следовательно, низкая точность оценок коэффициентов регрессии) объясняется малым количеством наблюдений.

Доверительные интервалы для зависимой переменной

Будем считать, что при s = n +1 в соответствии с зависимостью (1), имеет место равенство:

Ys = α +βXs + εs

(57)

и для εs выполняются основные гипотезы линейной регрессии:

12

В силу гипотезы (1):
E[Ys | X , Xs ]= α +βXs
Прогнозное значение
Yˆs = a +bXs
наблюдений (отсутствие автокорреляции ошибок).

1)E[εs | X , Xs ]= 0 ;

2)Var[εs | X , Xs ]= E ε2s | X , Xs = σ2 ;

3)Cov[εt ,εs | X , Xs ]= E[εtεs | X , Xs ]= 0 при t s – некоррелированность ошибок для разных

(58)

Yˆs находится в соответствии с формулой (2):

(59)

(При этом реальное значение Ys может не быть известным.)

Пусть, например, в условиях нашего примера Xs = 74 .

ˆ

 

 

 

Тогда Ys = a +bXs = -1,2651+0,7991 74 = 57,87 .

 

Заметим, что

 

 

ˆ

 

= E[a +bXs | X , Xs ]= E[a | X ]+ E[b | X ]Xs = α +βXs . (60)

E Ys | X , Xs

 

 

 

ˆ

является несмещенной оценкой величины

В силу (58), (60), прогнозное значение Ys = a +bXs

E[Ys | X , Xs ].

Для получения доверительных интервалов ниже будем считать, что условное распределение случайной величины εs нормально (при фиксированных значениях случайных величин X и

Xs ).

Тогда в силу формулы (59) из того, что условные распределения оценок a и b нормальны,

вытекает, что условное распределение прогноза Yˆ

также нормально.

 

 

s

 

При этом в силу (60):

 

 

ˆ

 

(61)

 

E Ys | X , Xs = α +βXs

 

13

 

ˆ

| X , X

 

 

= E

 

 

 

 

ˆ

 

 

 

ˆ

| X

, X

 

 

 

 

2

| X ,

X

 

}

= E

(a +bX

 

)(

α +βX

 

)

 

2

| X , X

s}

=

Var Y

s

 

 

(

Y E Y

s

)

 

s

s

s

 

 

 

s

 

 

 

 

 

 

 

 

 

 

s

 

 

 

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

 

 

 

 

 

 

 

 

 

 

 

 

 

 

}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= E

 

(a −α)+(b −β)X

s

2 | X

,

X

s

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

{

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s}

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= E

{(

a

−α

2

| X , X

 

s

}

 

+ E

 

 

b −β

)

X

s

2

|

X , X

+

2E

{(

a −α

)(

b

−β

)

X

s

| X , X

s

}

=

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

{ (

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=Var (a | X , Xs )+Var (b | X , Xs )Xs2 + 2Cov(a,b | X , Xs )Xs

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var

ˆ

 

 

 

 

 

=Var (a |

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

+ 2Cov(a,b | X ,

Xs )Xs

 

 

 

 

 

(62)

 

 

Ys

| X , Xs

X , Xs )+Var (b | X , Xs )Xs

 

 

 

 

 

 

 

Подставим формулы (24)-(26) в (62), получим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var

ˆ

 

 

 

 

 

=Var (a |

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

+ 2Cov(a,b | X ,

Xs )Xs

=

 

 

 

 

 

 

Ys

| X , Xs

X , Xs )+Var (b | X , Xs )Xs

 

 

 

 

 

 

 

 

 

Xt2

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= σ2

 

 

 

 

 

 

 

+ σ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

2

2σ2

 

 

 

 

X

 

 

X

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

n(Xt X

)2

 

 

(Xt X

)2

 

 

s

(Xt X

)2

s

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

(X

Xs )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= σ2

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

(Xt X

)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

2

1

 

 

 

(X

Xs )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var

Ys

| X , Xs

= σ

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

(63)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

(Xt X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставив вместо

 

 

 

σ2

 

ее выборочную несмещенную оценку

 

s2 , получим несмещенную

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

оценку для Var Ys

 

| X , Xs :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

2

1

 

 

 

(X

Xs )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var

Ys

| X , Xs

= s

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

.

 

 

 

 

 

 

 

 

(64)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

(Xt X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В условиях нашего примера:

 

s =11,31, n = 5 ,

Xs = 74 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

2

1

 

 

 

(X

Xs )2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var

Ys

| X , Xs

= s

 

 

 

 

 

 

 

 

+

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

= 31,99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

(Xt X )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

X , Xs )=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

|

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(65)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s(Ys |

Var

Ys

 

X , Xs

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В условиях нашего примера:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

|

 

 

 

 

 

 

 

=

 

5,656

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s(Ys | X , Xs )=

Var

Ys

 

X , Xs

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Можно доказать, что статистика

14

 

ˆ

)

 

 

 

 

 

t =

Ys (α +βXs

 

 

(66)

 

ˆ

 

 

 

 

 

 

s(Ys | X , Xs )

 

 

 

 

 

 

 

имеет распределение Стъюдента с числом степеней свободы n 2 .

 

Следовательно, при уровне значимости ρ:

 

 

 

 

 

 

ˆ

)

 

 

 

 

 

 

Ys (α +βXs

 

 

 

P t (ρ,n 2)

 

 

 

 

t (ρ,n 2)

=1−ρ,

(67)

 

 

ˆ

 

 

 

 

 

s(Ys | X , Xs )

 

 

 

 

 

 

 

 

 

 

 

 

 

где t (ρ,n 2) – двусторонняя квантиль распределения Стъюдента для уровня значимости ρ

и числа степеней свободы n 2 .

 

 

 

 

 

Из (67) в результате несложных алгебраических преобразований имеем:

 

{

ˆ

 

ˆ

 

ˆ

ˆ

}

 

 

 

 

 

X , Xs ) =1−ρ

(68)

P Ys t (ρ,n 2)s(Ys | X , Xs )

≤ α +βXs Ys +t (ρ,n 2)s(Ys |

Это

соотношения

определяет

доверительный

интервал для

ожидаемого

значения

E[Ys | X , Xs ]= α +βXs :

 

 

 

 

 

 

ˆ

 

ˆ

| X , Xs ),

ˆ

ˆ

 

 

(69)

 

Ys

t (ρ,n 2)s(Ys

Ys +t (ρ,n 2)s(Ys | X ,

Xs ) ,

 

 

в который с вероятностью 1−ρ попадает E[Ys | X , Xs ].

 

 

 

В условиях нашего примера:

Xs

= 74 , Yˆs = 57,87 ,

ρ = 0,05 , t (ρ,n 2)= 3,1824 .

 

Следовательно, 95%-й доверительный интервал для E[Ys | X , Xs ]:

[39,87; 75,87].

Доверительный интервал для Ys

 

 

 

 

 

 

 

Будем считать, что значение Ys

 

не известно.

 

Из равенств (58), (61):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(70)

 

E Ys

Ys |

X , Xs = 0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используя формулы (2), (57), можно показать, что

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

ˆ

 

 

 

 

1

 

 

(X Xs )

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

Var Ys Ys | X , Xs

= σ

 

1+

 

+

 

 

 

 

 

 

 

 

 

 

 

2

 

 

(71)

 

n

 

(Xt X )

Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

ˆ

 

 

 

 

1

 

 

(X Xs )

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

Var Ys Ys | X , Xs

= s

 

 

1+

 

+

 

 

 

 

 

 

 

 

 

 

2

 

(72)

 

 

n

(Xt X )

 

 

 

 

 

 

 

 

 

 

 

 

является несмещенной оценкой для Var Ys Yˆs | X , Xs . В условиях нашего примера:

15

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

ˆ

 

 

 

1

 

(X Xs )

 

 

 

 

2

 

 

 

 

 

 

Var Ys Ys | X , Xs

= s

 

1+

 

+

 

 

 

 

 

2

 

=159,95

 

n

(Xt X )

 

 

 

 

 

 

 

 

 

 

Обозначим:

 

ˆ

 

 

 

ˆ

 

 

s(Ys Ys | X , Xs )=

Var Ys Y

| X , Xs

 

В условиях нашего примера:

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

ˆ

 

=12,65

s(Ys Ys | X , Xs )=

Var Ys Y

| X , Xs

Можно показать, что величина

 

 

 

ˆ

 

 

 

 

 

t =

 

Ys Ys

 

 

 

 

 

s(Ys

ˆ

 

 

 

 

 

 

Ys | X , Xs )

 

 

 

 

 

(73)

(74)

имеет распределение Стъюдента с числом степеней свободы n 2 .

 

Следовательно, при уровне значимости ρ:

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

Ys Ys

 

 

 

 

 

 

 

P t (ρ,n 2)

 

 

 

 

t (ρ,n 2) =1−ρ ,

 

(75)

 

s(Ys

ˆ

Xs )

 

 

 

 

 

Ys | X ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где t (ρ,n 2)

– двусторонняя квантиль распределения Стъюдента для уровня значимости ρ

и числа степеней свободы n 2 .

 

 

 

 

 

Из (75) в результате несложных алгебраических преобразований имеем:

 

{

ˆ

 

 

ˆ

 

 

ˆ

 

ˆ

}

(76)

P Ys t (ρ,n 2)s(Ys

Ys | X ,

Xs )Ys Ys +t (ρ,n 2)s(Ys Ys | X , Xs ) =1−ρ

Это соотношения определяет доверительный интервал для значения Ys :

 

ˆ

 

 

 

ˆ

 

 

ˆ

ˆ

 

,

(77)

Ys

t (ρ,n 2)s(Ys Ys | X , Xs ), Ys +t (ρ,n

2)s(Ys Ys | X ,

Xs )

в который с вероятностью 1−ρ попадает Ys .

 

 

 

В условиях нашего примера:

Xs = 74 , Yˆs = 57,87 , ρ = 0,05 , t (ρ,n 2)= 3,1824 .

 

Следовательно, 95%-й доверительный интервал для Ys :

 

 

 

[17,62; 98,12]

 

 

 

 

 

 

 

 

 

 

16

3. Модель множественной регрессии

Основные гипотезы 1) Спецификация модели

m

 

 

 

 

yt = βi Xti + εt ,

t =

1,n

,

(1)

i=1

 

 

 

 

Xti – объясняющие (независимые)

переменные, Yt – объясняемая (зависимая) перемен-

ная, εt – случайное отклонение, βi

– коэффициенты регрессии.

Отметим, что εt

и Yt

– случайные величины, Xti может быть как случайной, так и неслу-

чайной (детерминированной) величиной.

Отметим, что уравнение (1) охватывает также случай, когда:

m

 

 

yt = β0 + βi Xti

+ εt

(2)

i=1

Вэтом случае можно считать, что

m

m

 

yt = β0 Xt 0 + βi Xti + εt = βi Xti + εt ,

(3)

i=1

i=0

 

где Xt 0 =1.

Следовательно, не уменьшая общности, можно считать, что уравнение регрессии задано формулой (1).

Обозначим:

Y =

Y1

 

X11, , X1m

 

,

β =

β1

 

,

ε =

ε1

 

(4)

 

, X = ..................

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yn

Xn1, , Xnm

 

 

βm

 

 

εn

 

 

С помощью этих обозначений запишем уравнения регрессии (1) в матричном виде:

Y = Xβ+ ε

 

 

(5)

Пример

 

 

 

 

 

 

 

 

 

t

 

Y

X1

X2

 

1

 

6

41

58

 

2

 

12

55

36

 

3

 

10

46

34

 

4

 

7

32

15

 

5

 

3

31

87

 

Будем считать, что спецификация модели:

17

Yt = β1 2 Xt 2 3 Xt3 + εt

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

1

 

41

 

58

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

 

 

 

 

 

 

 

β1

 

 

 

12

 

1 55

 

 

 

 

 

 

 

 

 

Y

 

 

,

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

= 10

 

X = 1 46 34

 

 

 

 

β = β2

 

 

 

 

 

 

 

 

 

15

 

 

 

 

 

 

 

 

 

 

 

7

 

 

1 32

 

 

 

 

 

 

 

 

β3

 

 

 

3

 

 

1

 

31

 

87

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)

E[ε| X ]= 0

 

 

 

 

 

 

 

 

 

 

 

 

(6)

 

3) Var[ε| X ]= σ2In

 

 

 

 

 

 

 

 

 

 

 

 

(7)

 

Напомним, что Var

[

ε| X

]

= cov

(

ε

,ε

s

| X

 

– матрица размером n ×n

 

 

 

 

 

 

 

 

 

t

 

 

) ts

 

Следовательно, равенство (7) означает, что

 

т.е. Var[εt

 

 

2

 

= σ

2

, не зависит от t (гомоскедастичность);

| X ]= E εt | X

 

 

Cov[εt ,εs | X ]= E[εtεs | X ]= 0

 

при

 

s t

некоррелированность ошибок для разных

наблюдений (отсутствие автокорреляции ошибок).

Дополнительная гипотеза:

4) εt – (условно) нормально распределенная случайная величина Тогда:

ε| X N (0,σ2 In )

(8)

В этом случае модель называется нормальной линейной регрессионной.

Оценка параметров.

 

Метод наименьших квадратов.

 

Обозначим:

 

ˆ

m

 

= bi Xti

(9)

Yt

 

i=1

 

Yˆ

– прогнозное значение объясняемой переменной, b – некоторые оценки коэффициен-

t

 

i

тов регрессии βi .

Отметим, что Yˆt зависит от значений коэффициентов bi . Обозначив

18

(X T X )b = X TY

 

 

 

ˆ

 

 

 

b

 

 

ˆ

 

Y

 

 

 

 

=

 

1

,

b =

1

 

(10)

Y

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

b

 

 

 

 

Yn

 

 

m

 

 

запишем формулы (2) в матричном виде:

ˆ

 

 

 

 

(11)

Y = Xb

 

 

 

 

Обозначим:

 

 

 

 

 

n

2

n

m

 

2

F(b) = Yˆt Yt

 

= ∑ ∑bi Xti Yt

(12)

t =1

 

t =1

i=1

 

 

сумму квадратов отклонений прогнозных значений от реальных значений объясняемой переменной.

Метод наименьших квадратов состоит в нахождении таких значений a и b , при которых F(b) минимально:

F(b) min .

(13)

Запишем необходимые условия экстремума задачи (13):

 

F

 

n

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

2∑ ∑bi

Xti Yt Xtj

= 0 , j =1,m

(14)

 

bj

 

 

t =1

i=1

 

 

 

 

 

 

 

Систему уравнений (14) приведем к виду:

 

 

m

 

n

 

n

 

 

 

 

 

 

 

j =1,m

(15)

bi

Xti Xtj

= Yt Xtj ,

 

i=1

t =1

 

t =1

 

 

 

 

 

 

Запишем эту систему линейных уравнений в матричном виде:

(16)

Отметим, что X T X – симметричная квадратная матрица размером m ×m . В нашем примере:

 

 

 

 

 

 

 

 

 

1

41

58

 

 

 

 

 

 

 

1

1

1

1

1

 

 

55

36

 

 

5

205

230

 

 

 

 

1

 

X

T

X

 

55

46

32

 

×

 

46

34

 

 

 

8807

 

 

= 41

31

1

 

= 205

9099

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

36

34

15

 

1

32

15

230

9099

 

 

 

58

87

 

 

13610

 

 

 

 

 

 

 

 

 

1

31

87

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Будем считать, что матрица X T X не вырождена с вероятностью 1:

P{det (X T X )= 0}= 0

 

 

 

 

 

 

 

(17)

 

 

19

С учетом (17) из (16) имеем:

 

b = (X T X )1 X TY .

(18)

Формула (18) дает МНК-оценку для вектора коэффициентов регрессии β.

Отметим, что формула (18) обобщает формулы (2.9), (2.10), полученные для случая парной регрессии.

В нашем примере:

 

 

 

 

 

 

 

 

5

 

205

230

1

6,6886

-0,1258

-0,0289

 

 

 

 

 

 

(X

T

X )

1

=

 

 

 

 

8807

9099

 

 

 

0,0027

 

 

 

 

 

 

 

 

 

 

 

 

205

 

= -0,1258

 

0,0003

 

 

 

 

 

 

 

 

 

 

 

 

 

 

230

9099

 

 

 

 

0,0003

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13610

-0,0289

 

0,0004

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6,6886

-0,1258

-0,0289

1

1

1

1

1

 

 

 

-0,5475

 

 

 

 

 

 

 

 

 

 

 

 

 

12

b = (X

T

X )

1

X

T

 

 

 

0,0027

 

 

 

55

46

32

 

×

 

 

 

 

 

 

 

 

Y = -0,1258

0,0003

× 41

31

10

 

= 0,2634

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,0003

 

36

34

15

 

7

 

 

 

 

 

 

 

 

 

 

 

 

-0,0289

0,0004

58

87

 

-0,0577

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

Итак, в нашем примере:

-0,5475 b = 0,2634

-0,0577

 

1

41

58

 

 

 

 

6,9077

 

 

55

36

 

-0,5475

 

 

 

 

 

 

1

 

 

11,8651

ˆ

 

 

 

 

 

 

 

 

 

 

Y = Xb =

46

34

× 0,2634

 

=

9,6095

1

 

 

 

 

 

 

 

 

 

 

 

 

1

32

15

 

 

 

7,0174

 

-0,0577

 

 

 

1

31

87

 

 

 

 

 

2,6003

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

 

 

6,9077

 

 

 

 

 

 

ˆ

11,8651

 

 

9,6095

 

 

Y

=

 

 

 

 

7,0174

 

 

 

 

2,6003

 

 

 

 

 

 

Свойства оценок МНК

 

Несмещенность

 

Прежде всего, заметим, что в силу (5) и (6):

 

E[Y | X ]= Xβ.

(19)

20

Соседние файлы в папке 17-11-2015_11-58-24