Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика_Практикум

.pdf
Скачиваний:
80
Добавлен:
01.06.2015
Размер:
820.09 Кб
Скачать

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Для нашей задачи получим следующие результаты:

ВЫВОД ИТОГОВ

 

 

 

 

 

 

 

 

 

 

 

 

 

Регрессионная статистика

 

 

 

 

 

Множественный

 

 

 

 

 

 

R

0,982587

 

 

 

 

 

R-квадрат

0,965477

 

 

 

 

 

Нормированный

 

 

 

 

 

 

R-квадрат

0,959723

 

 

 

 

 

Стандартная

 

 

 

 

 

 

ошибка

0,632372

 

 

 

 

 

Наблюдения

8

 

 

 

 

 

Дисперсионный анализ

 

 

 

 

 

 

 

 

 

 

Значимость

 

 

df

SS

MS

F

F

 

Регрессия

1

67,1006339

67,10063391

167,7959049

1,3028E-05

 

Остаток

6

2,39936609

0,399894348

 

 

 

Итого

7

69,5

 

 

 

 

 

 

 

 

 

 

 

 

Коэффи-

Стандартная

 

 

 

 

 

циенты

ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Y-пересечение

-2,047544

1,01293453

-2,021397745

0,089726523

-4,52610691

0,431019745

Переменная X 1

0,922345

0,07120376

12,95360586

1,30283E-05

0,74811602

1,096574943

ВЫВОД

 

 

 

 

 

 

ОСТАТКА

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Предсказан-

 

 

 

 

 

Наблюдение

ное Y

Остатки

 

 

 

 

1

7,175911

-0,17591125

 

 

 

 

2

9,020602

-1,02060222

 

 

 

 

3

8,098257

-0,09825674

 

 

 

 

4

9,020602

0,97939778

 

 

 

 

5

10,86529

0,13470681

 

 

 

 

6

11,78764

0,21236133

 

 

 

 

7

13,63233

0,36767036

 

 

 

 

8

16,39937

-0,39936609

 

 

 

 

Вывод: Таким образом, уравнение линейной зависимости расходов на конечное потребление от располагаемого дохода, т.е. уравнение линейной регрессии, имеет вид:

y 2,0475 0,9223 x .

Проинтерпретируем построенное уравнение регрессии.

Коэффициент регрессии b 0,9223 показывает, на какую величину из-

менятся расходы на конечное потребление, если совокупный доход возрастёт

21

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

на одну единицу. Например, если совокупный доход вырастет на 1000 у.е., то расходы на конечное потребление увеличатся на 922,3 у.е.

Свободный член уравнения a 2,0475 определяет прогнозируемое значение расходов на конечное потребление при величине совокупного дохода, равной нулю.

5) Проведём анализ общего качества полученного уравнения.

Самым простым способом оценить качество полученного уравнения является графический способ. Строим линию регрессии на корреляционном поле.

В MS Excel линия тренда может быть добавлена в график. Для этого: А) Выделите область построения диаграммы; в главном меню выберите

Диаграмма\Добавить линию тренда.

Б) В появившемся диалоговом окне выберите вид линии тренда Линейная. В качестве дополнительной информации на диаграмме можно отобразить уравнение регрессии и величину достоверности аппроксимации R^2 (коэффициент детерминации), установив соответствующие флажки на закладке Параметры. Нажмите на кнопку ОК.

Тогда график будет иметь вид:

 

 

 

.потребление

20

y = 0,9223x - 2,0475

 

 

18

 

 

 

R2 = 0,9655

 

 

 

16

 

 

 

 

 

14

 

 

 

 

 

12

 

 

 

 

 

конеч

10

 

 

 

 

 

8

 

 

 

 

 

на

6

 

 

 

 

 

расходы

4

 

 

 

 

 

2

 

 

 

 

 

0

 

 

 

 

 

 

0

5

10

15

20

25

 

 

 

совокупный доход

 

 

Вывод: Анализ графика показывает, что уравнение достаточно точно описывает исследуемую зависимость, т.е. разброс точек, представляющих исходные данные, вокруг линии регрессии невелик.

Для анализа общего качества оценённой зависимости на количественном уровне используют коэффициент детерминации R2 (который в случае парной регрессии равен квадрату коэффициента линейной корреляции).

В предыдущем пункте 4) при использовании инструмента анализа РЕГРЕССИЯ были получены следующие значения коэффициентов детерминации без поправки и с поправкой на число степеней свободы:

22

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Коэффициент без поправки равен: R2 r 2 0,98262 0,9655.

Скорректированный (нормированный) коэффициент детерминации:

R2 0,9597 .

Вывод: Значение рассчитанного коэффициента детерминации близко к 1, это свидетельствует о достаточно высоком качестве построенного уравнения. Около 96 % разброса зависимой переменной объясняется с помощью данного уравнения.

6) Оценим значимость уравнения регрессии в целом.

Оценка значимости уравнения проводится с помощью F–критерия (или F–статистики) Фишера.

Величина F–критерия: F 167,7959 (см. вывод результатов пакета анализа РЕГРЕССИЯ).

F–критерий служит для проверки нулевой гипотезы H0 о том, что

R2 0 и, следовательно, фактор х не оказывает влияния на результат.

Найдём табличное критическое значение F–критерия. Для этого в Excel можно воспользоваться встроенной функцией FРАСПОБР:

А) Выделите пустую ячейку, в которую будет выведено критическое значение F–распределения ( Fкр ).

Б) Активизируйте Мастер функций (в главном меню выберите Встав-

ка\Функция).

В) Выберите категорию Статистические – функция FРАСПОБР – нажмите ОК.

Г) Заполните аргументы функции: Вероятность – уровень значимости .

Степень свободы 1 – число объясняющих переменных (факторов независимого признака х) k1 m .

Степень свободы 2 – число, равное k2 n m 1.

Нажмите ОК.

Замечание. В случае парной регрессии k1 1, k2 n 2.

Д) В выделенной ячейке появится значение Fкр .

Зададим уровень значимости 0,05 , тогда для k1 1, k2 8 2 6

имеем: Fкр (1;6) 5,987378 .

23

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Т.к. Fнабл . 167 ,7959 Fкрит . 13 ,745 , то H0 можно отклонить и сделать вывод о существенности статистической связи между y и x.

Замечание. В п. 4) была получена значимость F–критерия, равная 1,30283E-05 = 0,000013. Этот уровень значимости меньше, чем 0,001 (и

тем более меньше, чем 0,05 ). Следовательно, коэффициент детермина-

ции значимо отличается от нуля.

Вывод. Уравнение в целом является статистически значимым.

7) Проверим значимость коэффициентов уравнения зависимости рас-

ходов на конечное потребление от располагаемого дохода.

Значения t–статистик оценок коэффициентов равны:

tb 12,954 ,

ta 2,0214 .

Они служат для проверки нулевых гипотез о том, что истинное значение коэффициента регрессии b или свободного члена a равно нулю:

Н 0 : 0 ( 0) .

Альтернативные гипотезы имеют вид: Н1 : 0 ( 0) .

Находим табличное критическое значение t–критерия. Для этого в Excel можно воспользоваться встроенной функцией СТЬЮДРАСПОБР( ; ):

Выберем уровень значимости 0,05, при заданном числе степеней свободы п 2 6 получим критическое значение tкр (0,05;6) 2,445.

Т.к. tb 12,95 tкр 2,445, то нулевая гипотеза должна быть отклонена,

коэффициент b является статистически значимым.

Т.к. ta 2,0214 tкр 2,445, то нулевая гипотеза не может быть откло-

нена. Коэффициент а статистически незначим.

Замечание. В п. 4) было получено Р–значение коэффициента а, равное 0,089726523. Этот уровень значимости больше, чем 0,05. Следовательно,

нулевая гипотеза для оценки коэффициента а не может быть отвергнута.

Для коэффициента регрессии b Р–значение равно 1,30283Е 05 0,000013 0,05. Коэффициент b является статистически

значимым Вывод. Таким образом в итоге проведения тестов можно сделать вывод

о значимости отличия от нуля оценки коэффициента регрессии b, одновременно можно предложить исключить свободный член а из уравнения регрессии, т.е. рекомендуется оценить новое уравнение в виде у bx.

Замечание. Новое уравнение имеет вид: у 0,782 x, R2 0,942 .

8) Проверим предпосылки МНК.

Следующим этапом оценивания качества построенного уравнения является проверка предпосылок, лежащих в основе метода расчёта параметров МНК. Для проверки каждой из предпосылок применения МНК имеются спе-

24

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

циальные тесты. Реализация многих из этих тестов предполагает значительный объём исходных данных, поэтому мы проверим третью предпосылку –

отсутствие автокорреляции первого порядка ошибок регрессии.

Эта проверка может быть осуществлена двумя способами:

А) Графический.

Заключается в построении графика зависимости остатков (ошибок регрессии) от времени и визуальном определении наличия или отсутствия автокорреляции.

Построим график поведения ошибок регрессии во времени. Используем для этого Мастер диаграмм в MS Excel и столбец остатки, который был получен при использовании инструмента анализа РЕГРЕССИЯ в п. 4).

 

 

 

График поведения остатков во времени

 

 

 

 

1,5

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

e

0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

остатки

0

 

 

 

 

 

 

 

 

 

0

1

2

3

4

5

6

7

8

9

-0,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-1

 

 

 

 

 

 

 

 

 

 

-1,5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

время t

 

 

 

 

Вывод. Анализ графика не позволяет выявить закономерность поведения ошибок. То есть можно предположить, что ошибки распределены независимо (автокорреляция отсутствует).

Б) Использование статистики Дарбина-Уотсона DW.

Проверка отсутствия автокорреляции первого порядка ошибок регрессии проводится с помощью расчёта и анализа значения коэффициента Дар- бина-Уотсона:

 

n

 

 

2

 

ei

ei 1

DW

i 2

 

 

 

.

 

n

 

 

ei2

i 1

Для расчётов воспользуемся результатами инструмента анализа РЕГРЕССИЯ в п. 4). Для расчёта числителя используем столбец Остатки. Результаты

25

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Вывод остатка выглядели следующим образом:

 

А

 

В

С

23

ВЫВОД ОСТАТКА

 

 

 

24

Наблюдение

 

Предсказанное Y

Остатки

25

 

1

7,175911252

-0,17591125

26

 

2

9,020602219

-1,02060222

27

 

3

8,098256735

-0,09825674

28

 

4

9,020602219

0,97939778

29

 

5

10,86529319

0,13470681

30

 

6

11,78763867

0,21236133

31

 

7

13,63232964

0,36767036

32

 

8

16,39936609

-0,39936609

Вручную сформируем дополнительный столбец D. Для этого:

Для первого наблюдения в ячейку D25 поставьте прочерк.

Для второго наблюдения в ячейке D26 создайте формулу:

=(С26-С25)^2:

 

А

 

В

С

D

23

ВЫВОД ОСТАТКА

 

 

 

 

24

Наблюдение

 

Предсказанное Y

Остатки

 

25

 

1

7,175911252

-0,17591125

-

26

 

2

9,020602219

-1,02060222

=(С26-С25)^2

27

 

3

8,098256735

-0,09825674

 

28

 

4

9,020602219

0,97939778

 

29

 

5

10,86529319

0,13470681

 

30

 

6

11,78763867

0,21236133

 

31

 

7

13,63232964

0,36767036

 

32

 

8

16,39936609

-0,39936609

 

Нажмите Enter.

Для остальных ячеек D27 – D32 «протяните» результат ячейки D26. В результате получим:

 

А

 

В

С

D

23

ВЫВОД ОСТАТКА

 

 

 

 

24

Наблюдение

 

Предсказанное Y

Остатки

 

25

 

1

7,175911252

-0,17591125

-

26

 

2

9,020602219

-1,02060222

0,713502829

27

 

3

8,098256735

-0,09825674

0,850721191

28

 

4

9,020602219

0,97939778

1,161339257

29

 

5

10,86529319

0,13470681

0,713502829

30

 

6

11,78763867

0,21236133

0,006030224

31

 

7

13,63232964

0,36767036

0,024120896

32

 

8

16,39936609

-0,39936609

0,588344916

В ячейке D33 активизируйте встроенную функцию Автосумма одним из способов:

А) в главном меню выберите Вставка\Функция – категория Математические - СУММ;

Б) на панели инструментов Стандартная щёлкните по кнопке Авто-

сумма.

26

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Получим

 

 

 

А

 

В

С

D

23

 

ВЫВОД ОСТАТКА

 

 

 

24

 

Наблюдение

 

Предсказанное Y

Остатки

 

25

 

 

 

1

7,175911252

-0,17591125

-

26

 

 

 

2

9,020602219

-1,02060222

0,713502829

27

 

 

 

3

8,098256735

-0,09825674

0,850721191

28

 

 

 

4

9,020602219

0,97939778

1,161339257

29

 

 

 

5

10,86529319

0,13470681

0,713502829

30

 

 

 

6

11,78763867

0,21236133

0,006030224

31

 

 

 

7

13,63232964

0,36767036

0,024120896

32

 

 

 

8

16,39936609

-0,39936609

0,588344916

33

 

 

 

 

 

 

4,057562142

 

 

n

ei 1 2

 

 

 

 

 

Т.о. ei

4,0576 .

 

 

 

 

i 2

 

 

 

 

 

Знаменатель формулы статистики Дарбина–Уотстна представляет собой остаточную сумму квадратов отклонений. Она находится в таблице дис-

n

 

 

персионного анализа, в столбце SS в строке Остаток: ei

2

2,3994

i 1

 

 

Тогда DW 4,0576 1,69 . 2,3994

Статистика Дарбина-Уотсона применяется для проверки нулевой гипотезы H0 об отсутствии автокорреляции остатков. Альтернативные гипотезы

H1 и H1* состоят, соответственно, в наличии положительной или отрица-

тельной автокорреляции в остатках. Далее по специальным таблицам определяются критические значения критерия Дарбина-Уотсона dL (- нижняя граница признания положительной автокорреляции) и dU (-верхняя граница признания отсутствия положительной автокорреляции) для заданного числа наблюдений n =8, числа независимых переменных модели m=1 и уровня значимости =0,05.

dL =0,76; dU =1,33 (Приложение 3).

По этим значениям числовой промежуток 0; 4 разбивают на пять от-

резков.

 

Положительная

?

Отсутствие

?

 

Отрицательная

 

 

автокорреляция

автокорреляции

 

автокорреляция

 

 

 

 

 

 

 

 

 

 

 

 

 

0

dl

du

2

 

4 du

 

4 dl

 

4

DW

 

 

 

 

 

 

 

 

 

Вывод. Т.к. du

DW 4 du (1,33 DW 1,69 2,67)

автокорреляция

отсутствует с вероятностью 1 =0,95.

27

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

Замечание. Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу H0 .

9) Общий вывод по построенной модели:

Уравнение линейной зависимости расходов на конечное потребление от величины располагаемого дохода приведём вместе с показателями его качества:

y 2,0475 0,9223 x

Sa,b [0,0712] [1,0129] ta,b ( 2,024) (12,95)

R2 0,9597; F 167,7959; DW 1,69

Коэффициент детерминации R2 свидетельствует о высокой доле объяснённой дисперсии (около 96 %) зависимой переменной и о высокой степени приближения исходных данных к построенному уравнению.

Величина F – критерия свидетельствует о значимости уравнения в целом, то есть о наличии значимой статистической связи между переменными.

Значения t – статистик для оценок коэффициентов уравнения могут свидетельствовать о значимом отличии от нуля коэффициента регрессии b и о возможности исключения из уравнения свободного члена а.

Статистика Дарбина-Уотсона позволяет принять гипотезу об отсутствии автокорреляции первого порядка ошибок регрессии и может свидетельствовать об отсутствии зависимости между ними.

Общим итогом анализа качества построенного уравнения может стать вывод о его хорошем качестве и возможности переоценки на тех же данных с исключением из него свободного члена.

10) Так как полученное уравнение регрессии имеет хорошее качество, то его можно использовать для построения прогнозов.

Спрогнозируем значение расходов на конечное потребление, если прогнозное значение совокупного дохода составит 21,5 у.е.

Для прогноза значения зависимой переменной у при заданном значе-

нии х объясняющей переменной можно воспользоваться статистической функцией в MS Excel ПРЕДСКАЗ. Для этого:

активизируйте Мастер функций (в главном меню Встав-

ка/Функция);

выберите статистическую функцию ПРЕДСКАЗ;

заполните аргументы функции:

х – прогнозное значение независимой переменной (в нашем случае

х=21,5),

28

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

известные_значения_у – диапазон, содержащий значения зависимой переменной, известные_значения_х – диапазон, содержащий значения независимой переменной.

Нажмите ОК.

В выбранной ячейке получим значение уˆ 17,78288 17,78.

Замечание. Аналогичные результаты можно получить, воспользовавшись статистической функцией ТЕНДЕНЦИЯ.

Рассчитаем 95%-й доверительный интервал для данного предсказания по формуле:

 

 

 

 

 

 

yˆ Syˆ

tкрит y yˆ Syˆ tкрит.

Для этого вычислим стандартную ошибку прогноза:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S y

S 1

1

 

(xр

х

)2

 

.

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i(xк )

 

 

 

n (х х)

 

 

Где n 8 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ei2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S

S

2

 

 

 

0,3999 0,6324 – значение стандартной ошибки.

 

 

 

 

n 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим среднее значение совокупного дохода, используя статистическую функцию СРЗНАЧ (см. Семинар 1). Получим: х 13,875.

n

Для вычисления СКО (xi x)2 воспользуемся встроенной статисти-

i 1

ческой функцией КВАДРОТКЛ:

в главном меню выберите Вставка/Функция;

выберите статистическую функцию КВАДРОТКЛ;

заполните аргументы функции:

Число 1 – диапазон, содержащий значения независимой переменной х.

Нажмите ОК

n

В результате получим: (xi x)2 78,875.

i 1

Подставим найденные значения в формулу стандартной ошибки прогноза:

S y

S

1

 

(x

р

х

)2

 

 

 

1

(21,5 13,875)

2

 

0,863.

1

 

 

 

 

 

 

 

 

 

0,6324

1

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

i(21,5)

 

 

n

 

(х х)

 

 

 

8

78,875

 

 

 

Критическое значение распределения Стьюдента tкр (0,05;6) 2,445.

Тогда границы доверительного интервала:

17,783 0,863 2,445 y 17,783 0,863 2,445 15,673 y 19,893.

Вывод. Интервал, в котором будет сосредоточено не менее 95% возможных значений расходов на конечное потребление при неограниченно

29

Generated by Foxit PDF Creator © Foxit Software

http://www.foxitsoftware.com For evaluation only.

большом числе наблюдений и уровне совокупного дохода хр 21,5 , имеет вид: (15,673; 19,893).

Задачи:

1. Имеются данные газеты «Из рук в руки» о стоимости однокомнатных квартир на вторичном рынке жилья в Ново-Савиновском районе г.Казани на 01.11.2010 г.

n

y

x

1

1430

34

2

2400

45,5

3

1800

39

4

1500

35,8

5

1550

38,3

6

1630

32,9

7

1600

34,1

8

1750

35,7

9

1210

30

10

1400

33

11

1450

38,9

12

1550

38

13

1380

35,6

14

1330

32

15

1890

40

16

2300

46

17

1650

33,6

18

1550

40

19

1640

36

20

1650

38

21

1480

33

22

1500

35

23

1460

34,4

24

1575

35

25

1550

38

26

1430

35

27

1435

33

28

1460

32,8

29

1498

34

30

1550

38

31

2100

48

32

1850

41

33

1350

31,2

34

1400

35,9

35

1390

30

36

1500

36

37

1550

38

38

1460

33

39

1900

40

40

1550

38,9

n - № п/п.

y – цена, тыс.руб.

x – общий метраж, кв.м.

Требуется:

1)Сформулировать гипотезу о направлении связи.

2)Построить поле корреляции.

3)Оценить тесноту связи с помощью показателя ковариации и коэффициента корреляции.

4)Рассчитать параметры уравнения линейной регрессии (Y от Х).

5)Оценить общее качество полученного уравнения.

6)Рассчитать F- статистику.

7)Проверить значимость коэффициентов уравнения.

8)Проверить гипотезу об отсутствии автокорреляции.

9)Оформить вывод.

10)Спрогнозировать цену квартиры общей площадью 37 кв.м. Рассчитать 95%-й доверительный интервал для данного предсказания.

30