Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

17-11-2015_11-58-24 / Эконометрика (электронный конспект)

.pdf
Скачиваний:
57
Добавлен:
20.02.2016
Размер:
1.05 Mб
Скачать

Рассмотрим случай, когда нулевая гипотеза имеет вид:

j 0 ,

j J ,

(65)

где

J

– некоторое

подмножество значений множества

коэффициентов i .

 

I 1,2,

, m

индекса

В этом случае матрица H

будет состоять из строк, в которых j-я компонента равна 1, а

остальные – нули. Вектор b

состоит из нулей.

 

Например, в случае модели:

 

 

yt 1xt1 2 xt 2 3 xt3 4 xt 4

5 xt5 t

(66)

и нулевой гипотезы:

 

 

 

 

 

1

3

 

матрица

0 H

и вектор

r

равны:

(67)

1

0

0

0

0

 

0

H

0

1

0

 

,

r

0

0

 

0

В рассматриваемом нами случае F-статистику (59) можно найти также следующим способом.

Наряду с исходной «длинной» моделью:

 

 

m

 

 

 

y

 

x

 

t

t

 

i

ti

 

 

 

i 1

 

 

 

рассмотрим «короткую» модель:

yt i xti t i I \ J

(68)

(69)

Например, в случае «длинной» модели (66) и нулевой гипотезы (67) «короткая» модель (69)

имеет вид:

 

 

 

 

 

 

yt 2 xt 2 4 xt 4 5 xt 5

t

 

 

 

 

(70)

Обозначим через ESS1

2

остаточную сумму квадратов и коэффициент детерминации для

и R1

«длинной» регрессии, а через

ESS

2

и R2

– эти же величины для короткой регрессии.

 

 

 

 

2

 

Можно показать, что для F-статистики (59) справедливы формулы:

 

ESS

 

ESS

n m

 

R

2

R

2

F

 

 

 

 

 

2

1

 

1

 

2

 

 

 

 

 

 

ESS

q

 

1 R

2

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

n m q

.

(71)

Напомним, что количество степеней свободы F-статистики равно (q, n m) , где q – число равенств в нулевой гипотезе.

Доверительная область для коэффициентов регрессии.

31

Рассмотрим случай, когда H Im .

 

Тогда равенство (58)

примет вид:

 

Заменив H на Im и r

на в формуле

F b T X T X b

s2m

r

(59), получим:

(72)

В силу (62)

(1 ) -доверительная область для вектора

T

X

 

X b s

mF

;m, n m

b

T

 

 

2

 

 

 

 

 

 

c

 

и является эллипсоидом в m-мерном пространстве.

Доверительные интервалы для зависимой переменной

задается условием:

(73)

Пусть Xn 1 Xn 1,1,

, Xn 1,m .

Например,

 

 

 

Xn 1 1

62

23 .

 

Будем считать, что в соответствии Yn 1 Xn 1 n 1

и для n 1

выполняются основные

1)

E n 1 | X , Xn 1 0

;

 

 

2)

 

2

;

 

Var n 1 | X , Xn 1

 

3)

Cov t , n 1 | X , Xn 1

0

t 1,

с зависимостью (5), имеет место равенство:

(74)

гипотезы линейной регрессии:

n .

В силу гипотезы (1):

 

 

 

 

 

E Yn 1 | X , Xn 1 Xn 1

 

 

 

(75)

 

ˆ

находится в соответствии с формулой (11):

Прогнозное значение Yn 1

ˆ

 

 

 

(76)

 

Yn 1 X n 1b

 

 

 

 

В условиях нашего примера при Xn 1 1 62

23 :

 

 

-0,5475

 

 

 

ˆ

23

 

 

14,4592

 

Yn 1 X n 1b 1 62

0,2634

 

 

 

 

-0,0577

 

 

 

 

 

 

 

 

 

(При этом реальное значение Yn 1

может не известно.)

32

Заметим, что

ˆ

| X , X

 

E X

b | X , X

 

 

E Y

n 1

n 1

n 1

 

 

n 1

 

X

n 1

E b | X

 

 

X

n 1

.

(77)

ˆ

В силу (20), (75), (76), прогнозное значение Yn 1 X n 1b является несмещенной оценкой величины E Yn 1 | X , Xn 1 ..

Для получения доверительных интервалов ниже будем считать, что условное распределение

случайной величины

n 1

нормально (при фиксированных значениях случайных величин X и

X n 1 ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Тогда в силу формулы (76)

из того, что условное распределение оценки

b

нормально,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

также нормально.

 

 

вытекает, что условное распределение прогноза Ys

 

 

При этом в силу (63):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

|

X , X

 

 

X

 

 

 

 

(78)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E Y

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

E

 

ˆ

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

| X , X

 

 

 

 

 

 

 

 

|

X , X

 

 

| X , X

 

 

 

 

 

 

 

 

 

Var Y

 

 

 

n 1

 

Y

 

E Y

 

 

 

n 1

 

 

n 1

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

E

 

X

 

 

b

 

|

X , X

 

 

 

E

 

 

X

 

 

 

b b

 

X

 

 

 

|

X , X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

T

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

n 1

 

X

 

 

 

 

X

 

 

E b b

|

X , X

 

X

 

 

 

 

X

 

Var

b | X , X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

T

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

n 1

 

 

n 1

 

 

 

 

 

 

 

n 1

 

n 1

 

 

 

Итак,

ˆ

 

 

 

 

 

 

 

 

Var b | X , X

 

 

X

 

 

Var Y

| X , X

 

 

X

 

 

 

 

T

(79)

n 1

 

 

n 1

n 1

n 1

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

Подставив формулу (24) в (79), получим:

 

 

ˆ

| X , X n 1

 

 

 

2

X n 1 X

T

X

1

 

 

T

 

 

(80)

 

 

 

 

 

 

 

Var Yn 1

 

 

 

 

 

 

X n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Подставив вместо

2

 

 

ее выборочную несмещенную оценку

 

 

 

ˆ

 

|

X , X n 1

 

 

:

 

 

 

 

 

 

 

 

 

 

оценку для Var Yn 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

| X , Xn 1

 

s

2

X n 1

X

T

X

1

 

 

T

 

 

 

(81)

 

 

 

 

 

 

 

Var Yn 1

 

 

 

 

 

 

X n 1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В условиях нашего примера:

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

| X , X

 

 

s

2

X

 

X

T

X

1

X

T

 

0,7557

 

 

 

 

 

 

 

Var Y

n 1

 

 

n 1

 

 

 

 

n 1

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s

2

 

, получим несмещенную

Обозначим:

 

 

 

 

ˆ

| X , X n 1

 

ˆ

 

(82)

s Yn 1

Var Yn 1

| X , X n 1

В нашем случае:

 

 

 

ˆ

| X , X n 1

 

ˆ

 

0,8693

s Yn 1

Var Yn 1

| X , X n 1

33

Можно доказать, что статистика

 

 

ˆ

X

 

 

 

t

Y

 

 

 

n 1

 

n 1

 

 

 

 

 

s

ˆ

| X , X

 

 

Y

n 1

 

 

n 1

 

 

(83)

имеет распределение Стъюдента с числом степеней свободы Следовательно, при уровне значимости :

n

m

.

 

 

 

 

ˆ

X

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

1 ,

(84)

P t , n m

 

 

n 1

 

n 1

 

t , n m

 

 

 

 

 

 

 

 

 

 

s

ˆ

| X , X

 

 

 

 

 

 

 

Y

n 1

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

t , n m – двусторонняя квантиль распределения Стъюдента для уровня значимости

и числа степеней свободы

n m .

 

 

 

Из (84) в результате несложных алгебраических преобразований имеем:

 

ˆ P Yn

Это

E Yn

 

ˆ

| X , X

 

X

 

ˆ

 

ˆ

 

| X , X

 

 

1

1

t , n m s Y

n 1

Y

t ,n m s Y

 

n 1

n 1

 

 

 

n 1

n 1

 

n 1

 

 

 

 

соотношение определяет

доверительный

интервал

для

ожидаемого

1

| X , Xn 1 Xn 1 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(85)

значения

 

ˆ

t , n m s

 

ˆ

| X , X

 

ˆ

 

 

ˆ

|

X ,

Y

 

Y

 

, Y

t ,n m s Y

 

n 1

 

 

n 1

 

n 1

n 1

 

 

n 1

 

 

 

 

 

 

 

 

в который с вероятностью 1

попадает

E Yn 1 | X ,

Xn 1

.

В нашем случае 95%-й доверительный интервал для

E Yn 1

X n 1

 

 

 

| X , X

n

 

 

,

1

 

 

:

(86)

10,7189;

18,1995

.

Доверительный интервал для Yn 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Будем считать, что значение Yn 1

 

не известно.

 

 

 

 

 

 

 

 

 

 

Из равенств (75), (77):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(87)

 

 

 

 

E Yn 1

Yn 1 | X , Xn 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Используя формулу (24), получим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

Y

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

E

 

X

 

 

b

 

 

 

 

2

 

 

 

 

 

Var

 

 

 

| X , X

 

 

 

 

 

 

 

 

 

|

X , X

 

 

Y

 

n 1

 

n 1

 

 

 

 

 

n 1

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

1

 

 

 

 

 

 

E

X

n 1

b b T X T

 

 

2X

n 1

b

 

n 1

2

 

 

| X , X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

n 1

 

 

n 1

 

X

Var b | X , X

n

1

X T

 

Var

n 1

 

|

X , X

n

1

 

 

 

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

T

X

1

 

 

 

T

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X n 1 X

 

 

 

X n 1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Var

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

T

X

1

 

 

T

 

 

 

 

 

 

 

 

 

(88)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yn 1

Yn 1

| X , X n 1

 

 

X n 1 X

 

 

 

X n 1

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно,

34

 

 

ˆ

 

 

 

 

2

 

 

 

 

 

 

T

 

 

1

 

T

 

 

 

 

Var Y

Y

 

| X , X

 

s

 

 

X

 

X

 

X

 

X

 

1

 

 

 

 

n1

n1

 

 

n1

 

 

 

 

n1

 

 

 

 

 

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

является несмещенной оценкой для

 

 

 

 

 

ˆ

| X , X n 1

 

.

Var Yn 1 Yn 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В нашем случае:

 

 

 

2

 

 

 

 

 

 

T

 

 

 

 

T

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

Var Y

Y

 

| X , X

 

s

 

 

X

 

X

 

X

 

X

 

1

1,3330

 

 

n1

n1

 

 

n1

 

 

 

 

n1

 

 

 

 

 

n1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Обозначим:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s Y

 

ˆ

| X , X

 

 

 

 

 

 

 

 

ˆ

| X , X

 

 

 

 

 

 

Y

n1

Var Y

 

Y

n1

 

 

 

 

n1

 

n1

 

 

 

 

 

 

n1

 

 

 

 

 

 

 

 

 

 

В нашем случае:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s Y

 

ˆ

| X , X

 

 

 

 

 

 

 

 

ˆ

| X , X

 

 

1,1546

 

 

Y

n1

Var Y

 

Y

n1

 

 

n1

 

n1

 

 

 

 

 

 

n1

 

 

 

 

 

 

 

 

 

 

(89)

(90)

Можно показать, что величина

 

 

 

 

Y

 

ˆ

 

 

 

t

 

 

 

Y

 

 

 

 

 

 

n 1

 

n 1

 

 

 

 

 

 

 

 

s

Y

ˆ

 

|

X , X

 

 

Y

 

n 1

 

 

n 1

n 1

 

 

имеет распределение Стъюдента с числом степеней свободы Следовательно, при уровне значимости :

n

m

.

(91)

 

 

 

ˆ

 

 

 

 

 

 

Yn 1 Yn 1

 

 

 

 

P t , n m

 

 

 

t , n m

1 ,

(92)

ˆ

 

 

 

 

 

 

 

 

 

s Yn 1 Yn 1 | X , X n 1

 

 

 

 

 

 

 

 

 

 

где

t , n m – двусторонняя квантиль распределения Стъюдента для уровня значимости

и числа степеней свободы

n m .

 

 

 

 

Из (92) в результате несложных алгебраических преобразований имеем:

 

ˆ

t , n m s

 

Y

ˆ

| X , X

n 1

Y

ˆ

t ,n m s

 

Y

ˆ

P Y

Y

Y

Y

n 1

 

n 1

n 1

 

n 1

n 1

 

n 1

n

Это соотношения определяет доверительный интервал для значения Yn 1 :

 

ˆ

t , n m s

 

Y

ˆ

| X , X

n 1

,

ˆ

t ,n m s

 

Y

ˆ

| X , X

 

Y

Y

Y

Y

 

 

n 1

 

n 1

n 1

 

 

n 1

 

n 1

n 1

 

n 1

 

 

 

 

 

 

в который с вероятностью 1

попадает Yn 1 .

В нашем случае доверительный интервал для значения Yn 1 :

9,4915; 19,4269 .

1

 

 

 

 

 

| X , X

n 1

 

1

 

 

 

 

 

 

 

(93)

,

(94)

35

4. Спецификация эконометрической модели

Метод оптимального выбора объясняющих переменных

Заметим, что R2 возрастает при добавлении еще одного регрессора, что не всегда означает улучшение качества модели. Чтобы устранить этот эффект, используется скорректированный

R2 :

 

 

 

 

 

 

 

 

 

 

R2

=1ESS

n 1

.

 

 

 

(1)

 

 

 

 

 

 

 

 

 

a

TSS n m

 

 

 

 

 

 

 

 

 

 

 

В нашем случае:

 

 

 

 

 

R2

=1ESS

n 1

= 0,9531

 

 

 

 

 

 

 

 

 

 

 

 

a

TSS n m

 

 

 

 

 

 

 

 

 

 

 

Отметим, что

 

 

 

 

 

 

 

 

 

 

Ra2

=1(1R2 )

n 1

,

 

 

(2)

 

 

n m

 

 

 

 

Наилучшей считается модель с наибольшим R2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

Строятся модели вида:

 

 

 

 

 

 

Yt = βj Xtj + εt ,

 

 

 

 

 

 

j J

 

 

 

 

 

где

J J ,

J ={1,2, ,m}.

 

 

 

 

 

 

Алгоритм выбора J .

 

 

 

 

 

1-й шаг

 

 

 

 

 

 

 

 

 

 

Рассматриваются модели вида:

 

 

 

 

 

Yt = βl Xtl

 

 

 

 

 

 

 

 

 

 

при всевозможных l J .

 

 

 

 

 

Находится независимая переменная X

l

, для которой R2

максимально.

 

 

 

 

 

 

 

 

 

 

 

a

 

Обозначим индекс этой переменной через l .

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

Обозначим:

 

 

 

 

 

 

 

 

 

 

J1 ={l1 },

 

 

 

 

 

 

 

 

 

 

J = J1

 

 

 

 

 

 

 

 

 

 

Обозначим через R2 (1) значение показателя

R2

для оптимальной модели, полученной на

 

 

 

 

 

 

 

a

 

 

a

 

 

первом шаге. k шаг

Рассматриваются модели вида:

Yt = βj Xtj l Xl + εt j Jk1

36

при всевозможных l J \ Jk 1 .

Находится независимая переменная Xl , для которой Ra2 максимально.

Обозначим индекс этой переменной через lk .

Обозначим: Jk = Jk 1 {lk }

Обозначим через R2 (k) значение показателя R2 для оптимальной модели, полученной на

 

a

a

данном шаге.

 

 

Далее сравнивается R2 (k) c

R2 (k 1) .

 

a

a

В случае R2 (k) > R2 (k 1) :

 

a

a

 

1) модель Jk

считается лучшей, чем модель Jk 1 , и полагается J = Jk ;

2) если k < n

(т.е. не все переменные включены в модель Jk ), осуществляется переход к

следующему шагу (т.е. значение k увеличивается на единицу)

3) если k = n , то на этом заканчивается процесс выбора оптимальной модели; в этом случае все переменные включены в оптимальную модель.

В случае Ra2 (k) Ra2 (k 1) , оптимальной считается модель Jk 1 и на этом заканчивается процесс выбора оптимальной модели.

Пример 5 Данные о рыночной цене коттеджей, а также об их площади, вместимости гаража и

количестве комнат приведены в табл. 3. Требуется построить линейную регрессионную модель для оценки рыночной стоимости коттеджей.

НаблюденияПлощадь

Гараж

Спальни

Цена

 

 

 

 

 

1

1

0

2

65

 

 

 

 

 

2

1,1

0

2

73

 

 

 

 

 

3

1,15

1

2

85

 

 

 

 

 

4

1,4

0

3

87

 

 

 

 

 

5

1,7

1

3

98

 

 

 

 

 

6

1,8

1

4

105

 

 

 

 

 

7

1,9

0

3

95

 

 

 

 

 

8

1,9

1

4

125

 

 

 

 

 

37

9

2,1

2

4

125

 

 

 

 

 

10

2,1

2

4

137

 

 

 

 

 

11

2,3

2

4

150

 

 

 

 

 

1-й шаг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Строим модели: Y = β

0

X

l

+ ε

,

l 1,

2, 3

, и для них находим R2 .

 

 

 

t

 

 

l

 

 

t

 

 

{

 

 

}

a

 

l

Ra2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

0,8554

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

0,7317

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

0,7703

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Максимальное значение R2

на 1-м шаге 0,8554 при l =1.

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

Итак, l =1, J

= 1

, R2

(1)

= 0,8554

 

 

 

 

 

1

1

{ }

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

На первом шаге выбрана модель:

 

 

 

 

 

 

 

 

Yt = β0 1 X1 + εt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и полагается J = J

=

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

{ }

 

 

 

 

 

 

 

 

 

 

 

 

 

2-й шаг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Строим модели: Y = β

0

X

1

X

l

+ ε

,

l

{

2, 3 , и для них находим

R2 .

 

 

t

 

 

1

 

 

l

 

t

 

 

}

a

l

Ra2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

0,9239

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

0,8466

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Максимальное значение R2

на 2-м шаге 0,9239 при l = 2 .

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

Итак, l = 2 , J = 1,

2

 

,

R2 (2) = 0,9239

 

 

 

 

2

2

{

 

}

 

 

a

 

 

 

 

 

 

 

 

 

 

 

Сравниваем R2

(2) и

R2 (1) .

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку Ra2 (2) > Ra2 (1) , модель J2 ={1, 2} лучше модели J1 ={1}.

Следовательно, на втором шаге выбирается модель J2 ={1, 2}:

Yt = β0 1 X1 2 X2 + εt

и полагается J = J2 ={1, 2}

38

3-й шаг

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Строим модель: Y = β

0

X

1

2

X

2

X

3

+ ε

t

и для нее находим

R2

 

 

 

 

 

 

 

 

 

t

 

 

 

 

1

 

 

 

 

 

 

3

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l

 

 

Ra2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

0,9179

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Значение R2

на 2-м шаге 0,9179 при l = 3 .

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак, l = 3,

J

=

 

1,

2, 3

,

 

 

R2 (3) =

0,9179

 

 

 

 

 

 

 

3

 

 

2

 

 

{

 

 

}

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Сравниваем R2

(3) и

R2 (2) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку

R2 (3) > R2 (2) ,

модель,

 

полученная на 2-м шаге,

считается лучше модели,

 

 

 

 

a

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

полученной на 3-м шаге.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, в качестве оптимальной выбирается модель J = J = 1,

2 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

{

}

Yt = β0 1 X1 2 X2 + εt .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Методы выбора вида зависимости

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В общем случае регрессионная модель имеет вид:

 

 

 

Yt = f (Xt

)+ εt ,

 

 

 

 

t =

 

 

 

 

 

 

(3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Xt = (Xt1, , Xtm ).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Функция f (Xt )

 

не обязательно линейна относительно Xt , и зависит от вектора параметров

β = (β1, ,βs ). Следовательно,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Yt = f (Xt ,β)+ εt

,

 

 

 

 

 

 

 

 

 

 

 

 

t =

 

 

 

 

 

 

(4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,n

 

 

 

 

 

 

 

Заметим, что часто число параметров βi

совпадает с числом объясняющих факторов Xi , т.е.

s = m . (Если s = m +1, можно считать, что Xti

=1.)

 

 

 

Для получения

оценок

b = (b1, ,bs )

коэффициентов β = (β1, ,βs )

можно использовать

МНК:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

,b)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(5)

 

 

 

 

 

 

 

 

 

 

 

 

Yt = f (Xt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

ˆ

 

 

)

2

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F(b) =

 

 

Y

=

f

(

X

,b)

Y

 

2

min

 

(6)

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

( t

 

t

 

 

 

 

 

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t =1

 

 

 

 

 

 

t =1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Затем можно рассчитать скорректированный коэффициент детерминации в соответствии с формулой (1):

R2 =1ESS

n 1

(7)

a

TSS n s

 

39

и на основе этого коэффициента выбрать оптимальный вид модели и произвести оптимальный отбор значимых объясняющих факторов. (Вначале рассмотреть несколько видов функции f (Xt ), для них произвести оптимальный отбор объясняющих факторов, и

выбрать вид функции f (Xt ) с наибольшим Ra2 .)

Отметим, что одним из способов решения оптимизационной задачи (6) является использование условий первого порядка:

F (b) = 2

n

f (X

,b)Y

f

(X

,b)= 0 ,

i =

 

(8)

1,s

 

 

bi

t

t

bi

t

 

 

 

 

t =1

 

 

 

 

 

 

 

 

т.е. решение системы вообще говоря нелинейных уравнений (8).

Сведение нелинейной регрессии к линейной Часто представляется возможным свести нелинейную регрессию вида:

Yt f (Xt )

(9)

к линейной.

 

Логарифмическая (лог-линейная) модель Пусть исходная модель – показательная:

 

 

 

 

 

m

 

 

 

Yt ≈ γXtiβi

(10)

 

 

 

 

 

i=1

 

 

 

Экономический смысл.

Из (10):

 

 

 

 

Y

βi

Y

(11)

 

 

Xi

 

Xi

 

 

 

 

Отсюда:

 

 

 

β

 

Y

 

Xi

.

(12)

i

 

 

 

 

 

 

 

 

Xi

Y

 

В силу (12) βi

– эластичность фактора Y по фактору Xi , т.е. βi показывает процентное

изменение Y при увеличении Xi в расчете на 1%.

Следовательно, модель (10) целесообразно использовать, если есть основания полагать, что эластичности βi постоянны, т.е. при равных относительных изменениях фактора Xi относительные изменения фактора Y также (приблизительно) равны.

Прологарифмировав соотношение (10), получим:

40

Соседние файлы в папке 17-11-2015_11-58-24