Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
метЭконометрикаПлетнев_ред2.doc
Скачиваний:
16
Добавлен:
19.09.2019
Размер:
5.54 Mб
Скачать

Список литературы

              1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. Учебник для вузов. – М.ЮНИТИ, 1998. –с. 907 – 950

              2. Бородич С.А. Эконометрика: Учебное пособие. – Мн.: Новое знание, 2001. – с. 346 – 369

              3. Доугерти К. Введение в эконометрику: Пер. с англ. – М.: ИНФРА-М, 1999. – с. 322 – 366

              4. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. Проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2002. – с. 224 – 242

              5. Практикум по эконометрике: Учебное пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002. – с. 106 – 136

              6. Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2002. – с. 177 -255

Пример проведения эконометрического исследования

Задание 1. По представленным в таблице данным провести регрессионный анализ зависимости прироста сбережений населения от различных факторов.

Таблица 1

Исходные статистические данные

№п/п

месяц

Прирост денежных доходов населения, млрд. руб.

Прирост сбережений, млрд.руб.

Ставка по кредиту

1

янв. 

 ---

 ---

17,9

2

февр.

49,5

49,2

15,9

3

март

36,3

49,4

15,8

4

апр.

68,7

98,2

18,3

5

май

-75,0

34,7

17,7

6

июнь

53,0

81,2

15,2

7

июль

31,2

74,0

16,0

8

авг.

0,1

64,6

14,9

9

сен.

-18,9

46,0

13,4

10

окт.

39,8

57,8

13,7

11

ноя.

9,6

65,5

14,7

12

дек.

162,4

124,0

15,0

сумма

356,7

744,6

170,6

среднее

32,4

67,7

15,5

  1. Построение описательной экономической модели. Из экономической теории мы знаем, что денежные доходы населения влияют на величину сбережений. Также на величину сбережений влияет и процентная ставка. Однако нам дана информация только о приростах сбережений и доходов. Поэтому мы предполагаем, что на величину прироста сбережений влияют прирост денежных доходов и ставка по кредиту.

  2. Исходя из сделанного предположения строим эконометрическую модель, которая относится к классу факторных статических моделей:

y=f(x1,x2)

где x1 – прирост денежных доходов (объясняющая переменная)

x2 – ставка по кредиту (объясняющая переменная)

y – прирост сбережений (зависимая переменная)

Чтобы убедиться в том, что выбор объясняющих переменных оправдан, оценим связь между признаками количественно, для этого заполним матрицу корреляций (расчет выполнен по формуле 2.4):

Таблица 2.

Матрица корреляций между исходными статистическими признаками

x1

x2

y

x1

1

-0,08

0,86

x2

-0,08

1

0,10

y

0,86

0,10

1

Анализируя матрицу корреляций, можем сделать вывод о наличии сильной положительной связи между приростами денежных доходов и сбережений. В то же время связь между ставкой процента и сбережениями практически не прослеживается. Поэтому модифицируем модель к виду парной регрессии:

y=f(x1)

Для выбора функциональной формы модели проанализируем корреляционное поле:

Рис. 1 Корреляционное поле (x1 – прирост денежных доходов; y – прирост сбережений)

Визуальный анализ показывает, что для построения модели вполне подойдет линейная функция:

y=α0 + α1x1 + ε

  1. Оценка параметров модели. Проведем оценку параметров модели при помощи различных способов.

    1. Метод средних. Предположим, что изменение сбережений обусловлено только изменением денежных доходов (т.е. α0 = 0). Тогда оценка a1 неизвестного параметра α1 определится по формуле (3.5):

модель принимает вид: y=2,09x1+e

    1. Метод проб. В августе прирост денежных доходов был практически нулевым, при этом прирост сбережений составил 64,6 млрд. руб. Можно предположить, что это значение характеризует нулевой уровень зависимой переменной, т.е. ее значение, обусловленное действием прочих факторов. Тогда по формуле (3.6) рассчитаем оценку параметра α1:

в этом случае уравнение регрессии примет вид:

y=64,6+0,10x1+e

    1. Метод выбранных точек. Проанализируем корреляционное поле и выберем точки, которые ближе всех лежат в предполагаемой прямой линии, описывающей модель. Это будут точки «сентябрь» (–18,9;46,0) и «декабрь» (162,4;124,0).

Рассчитаем параметры модели по формулам (3.7) и (3.8):

уравнение регрессии выглядит следующим образом:

y=54,2+0,43x1+e

    1. Метод наименьших квадратов. Для применения этого метода составим вспомогательную таблицу:

№п/п

x

y

x2

xy

1

февр.

49,5

49,2

2450,3

2434,5

2

март

36,3

49,4

1317,7

1792,9

3

апр.

68,7

98,2

4719,7

6749,3

4

май

-75,0

34,7

5625,0

-2602,5

5

июнь

53,0

81,2

2809,0

4301,6

6

июль

31,2

74,0

973,4

2308,0

7

авг.

0,1

64,6

0,0

6,5

8

сен.

-18,9

46,0

357,2

-870,0

9

окт.

39,8

57,8

1584,0

2299,2

10

ноя.

9,6

65,5

92,2

628,6

11

дек.

162,4

124,0

26373,8

20143,4

 

сумма

356,7

744,6

46302,3

37191,5

 

среднее

32,4

67,7

4209,3

3381,0

Составим систему для расчета значений параметров:

Решив эту систему, получаем значения

a0 = 55,5

a1 = 0,38

Линия регрессии описывается уравнением: y=55,5+0,38x1+e

Сведем полученные результаты в таблицу:

Таблица 3

Уравнения регрессий, полученные при помощи разных методов

п/п

Метод расчета

Уравнение регрессии

1.

Метод средних

y=2,09x1+e

2.

Метод проб

y=64,6+0,10x1+e

3.

Метод выбранных точек

y=54,2+0,43x1+e

4.

Метод наименьших квадратов

y=55,5+0,38x1+e

Покажем на графике различие между полученными линиями регрессии:

Рис. 2 Линии регрессии, полученные при помощи различных методов

  1. Проверка качества построенной модели. Выполним оценку качества поэтапно.

    1. Оценку адекватности модели в целом проведем для каждой из выбранных моделей:

Таблица 4.

Предварительные расчеты для вычисления дисперсий случайных отклонений

№п/п

x1

y

e2

МС

МП

МВТ

МНК

МС

МП

МВТ

МНК

1

49,5

49,2

103,3

69,3

75,5

74,1

2931,4

405,3

690,6

620,9

2

36,3

49,4

75,8

68,1

69,8

69,1

695,8

348,3

415,7

390,0

3

68,7

98,2

143,4

71,1

83,7

81,3

2039,3

734,5

210,9

286,7

4

-75,0

34,7

-156,6

57,5

21,9

27,3

36577,2

518,0

164,0

54,2

5

53,0

81,2

110,6

69,6

77,0

75,4

868,4

132,6

17,6

33,0

6

31,2

74,0

65,1

67,6

67,6

67,2

78,3

41,0

40,8

45,5

7

0,1

64,6

0,2

64,6

54,2

55,5

4145,2

0,0

107,8

81,9

8

-18,9

46,0

-39,5

62,8

46,0

48,4

7307,4

281,2

0,0

5,6

9

39,8

57,8

83,1

68,4

71,3

70,5

640,5

112,8

182,7

161,0

10

9,6

65,5

20,0

65,5

58,3

59,1

2064,6

0,0

51,6

40,5

11

162,4

124,0

339,0

80,1

124,0

116,5

46203,6

1933,8

0,0

56,7

сум.

356,7

744,6

744,6

744,6

749,3

744,6

103551,6

4507,5

1881,7

1776,1

ср.

32,4

67,7

67,7

67,7

68,1

67,7

9413,8

409,8

171,1

161,5

Примечание:

МС – метод средних

МП – метод проб

МВТ – метод выбранных точек

МНК – метод наименьших квадратов

На основе таблицы для каждой модели по формуле (3.25) рассчитаем значение дисперсий случайного остатка, а по формуле (3.26) – значения коэффициента детерминации. Результат запишем в таблицу:

Таблица 5

Оценка адекватности моделей парной регрессии

п/п

Метод расчета

Дисперсия случайного остатка (s2e)

Коэффициент детерминации (R2)

1.

Метод средних

10355,2

-14,509

2.

Метод проб

450,8

0,325

3.

Метод выбранных точек

188,2

0,718

4.

Метод наименьших квадратов

177,6

0,734

Как видно из таблицы, наилучшее качество имеет модель, построенная по методу наименьших квадратов.

Следующие этапы оценки качества проведем только для этой модели.

Для нее расчетное значение F-критерия равно:

, а соответствующее критическое значение (приложение 3) – F0,05;1;9 = 5,117. Поскольку расчетное значение больше критического, то модель признается статистически значимой.

    1. Вычислим дисперсии оценок коэффициентов регрессии. Для этого воспользуемся формулами (3.30) и (3.31):

Стандартные ошибки коэффициентов регрессии будут равны:

    1. Оценим статистическую значимость коэффициентов регрессии. Для этого рассчитаем t-статистику для каждого коэффициента (см. формулу 3.27):

Сравним с критическими значениями, взятыми из таблицы (приложение 2):

Таблица 6

Критические значения t-статистики

п/п

α (уровень значимости)

1.

0,1

2,26

2.

0,05

2,69

3.

0,01

3,69

Можно сделать вывод, что коэффициенты регрессии статистически значимы при 1 %-м уровне значимости.

    1. Оценим доверительные интервалы для коэффициентов регрессии при разных уровнях значимости. Для этого воспользуемся формулами (3.33) и (3.34). Результат расчета занесем в таблицу:

Таблица 7

Доверительные интервалы для коэффициентов регрессии при различных уровнях значимости

п/п

Уровень значимости

Коэффициент

Доверительный интервал

1.

0,1

a0

(45,0;66,0)

2.

a1

(0,21;0,54)

3.

0,05

a0

(43,1;68,0)

4.

a1

(0,18;0,57)

5.

0,01

a0

(38,4;72,6)

6.

a1

(0,11;0,64)

    1. Рассчитаем доверительные интервалы для зависимой переменной. Для этого воспользуемся формулами (3.35) – для расчета доверительного интервала для среднего значения и (3.36) – для расчета доверительного интервала для индивидуальных значений. Результаты расчета для 5 %-го уровня значимости представлены в таблице и на графиках:

Таблица 8

Доверительные интервалы для зависимой переменной (уровень значимости – 5%)

п/п

x

y

доверительный интервал

для среднего значения

для индивидуального значения

нижний предел

верхний предел

нижний предел

верхний предел

1

-75

35

27,3

4,06

50,61

-15,35

70,02

2

-18,9

46

48,4

33,80

63,02

9,76

87,06

3

0,1

65

55,5

43,10

67,99

17,66

93,43

4

9,6

65

59,1

47,47

70,76

21,48

96,74

5

31,2

74

67,2

56,43

78,02

29,85

104,60

6

36,3

49

69,1

58,33

79,96

31,76

106,52

7

39,8

58

70,5

59,58

81,34

33,06

107,86

8

49,5

49

74,1

62,82

85,38

36,58

111,62

9

53

81

75,4

63,93

86,90

37,83

113,00

10

68,7

98

81,3

68,47

94,15

43,29

119,33

11

162,4

124

116,5

89,32

143,69

71,57

161,45

сумм.

357

745

745

Рис. 3. Доверительные интервалы для среднего значения зависимой переменной. Уровень значимости – 5 %.

Рис. 4. Доверительные интервалы для индивидуального значения зависимой переменной. Уровень значимости – 5 %

  1. Коэффициент детерминации R2 достаточно высок (0,73), расчетное значение F-статистики для R2 (24,83) более чем в 4 раза больше критического (5,117), следовательно может использоваться на практике. В то же время существование необъясненной дисперсии предполагает возможность улучшить качество модели путем введения еще одной переменной.

  2. Как показал расчет, устойчивой связи между изменением сбережений и процентной ставкой нет. Оценим силу связи между приростными величинами: изменением сбережений и изменением процентной ставки (табл. 9):

Таблица 9

Расчет прироста процентных ставок

№п/п

месяц

Ставка по кредиту, %

Прирост ставки по кредиту, %

1

янв. 

17,9

 ---

2

февр.

15,9

-2,0

3

март

15,8

-0,1

4

апр.

18,3

2,5

5

май

17,7

-0,6

6

июнь

15,2

-2,5

7

июль

16,0

0,8

8

авг.

14,9

-1,1

9

сен.

13,4

-1,5

10

окт.

13,7

0,3

11

ноя.

14,7

1,0

12

дек.

15,0

0,3

сумма

170,6

-2,9

среднее

15,5

-0,3

Обозначим прирост ставки по кредиту через . Матрица корреляций в этом случае будет иметь вид:

Таблица 10

Матрица корреляций между выбранными статистическими признаками

x1

y

x1

1

0,23

0,86

-0,08

1

0,10

y

0,86

0,41

1

Переменная коррелирует и с y , и с x1. Для того, чтобы добавить переменную в модель, необходимо убедиться в том, что нет мультиколлинеарности между объясняющими переменными. Для этого оценим качество регрессии . По методу наименьших квадратов получаем (проверьте!):

При этом качество модели характеризуется R2=0,053. Рассчитываем по формуле (4.10) F-критерий:

Критическое значение F-критерия при 5% уровне значимости меньше фактического (F0,05;1;9 = 5,117), следовательно, делаем вывод об отсутствии мультиколлинеарности.

Добавляем в модель переменную . Общий вид модели:

y=α0 + α1x1 + α2 +ε

7. Для получения оценок по методу наименьших квадратов выполняем предварительные расчеты (какие расчеты необходимы?), составляем и решаем систему:

Результат ее решения:

a0=57,3

a1=0,353

a2=3,9

модель будет иметь вид:

y=57,3 + 0,353 x1 + 3,9 e

8. Оценим качество построенной модели.

8.1 Расчет коэффициента детерминации. Построим вспомогательную таблицу:

Таблица 11

Оценка качества множественной модели линейной регрессии

 

№п/п

x1

y

e

e2

1

февр.

49,5

49,2

-2,0

66,93

-17,74

314,87

2

март

36,3

49,4

-0,1

69,70

-20,30

412,20

3

апр.

68,7

98,2

2,5

91,31

6,94

48,10

4

май

-75,0

34,7

-0,6

28,43

6,27

39,34

5

июнь

53,0

81,2

-2,5

66,21

14,95

223,64

6

июль

31,2

74,0

0,8

71,41

2,56

6,56

7

авг.

0,1

64,6

-1,1

53,00

11,59

134,42

8

сен.

-18,9

46,0

-1,5

44,72

1,31

1,72

9

окт.

39,8

57,8

0,3

72,50

-14,73

216,86

10

ноя.

9,6

65,5

1,0

64,57

0,91

0,83

11

дек.

162,4

124,0

0,3

115,80

8,24

67,86

 

сумма

356,7

744,6

-2,9

744,6

 

1466,4

 

среднее

32,4

67,7

-0,3

67,7

 

133,3

На основе таблицы рассчитываем коэффициент детерминации R2 = 0,780 (см. формулу 3.22)

Скорректированный коэффициент детерминации равен 0,725 (см. формулу (4.6))

Проверим статистическую значимость коэффициента детерминации:

F0,01;2;8 = 8,65 < Fрасч, коэффициент детерминации значим на однопроцентном уровне.

Определим, насколько существенно улучшилась модель (см. формулу 4.10)

Расчетное значение оказывается меньше теоретического при пятипроцентном уровне значимости: F0,05;1;9 = 5,117, что говорит о том, что модель существенно не улучшилась, и переменная является лишней или вредной.

8.2 Расчет дисперсий оценок коэффициентов и определение их статистической значимости, расчет доверительных интервалов. Для выполнения расчета ошибок коэффициентов необходимо использовать формулы, выделенные для самостоятельно изучения (см. тему 4). Расчет статистической значимости коэффициентов и доверительных интервалов выполнен по аналогии в парной регрессией (см. тему 3). Результат расчета представлен в таблице:

Таблица 12

Интервальная оценка коэффициентов

коэф­фици­ент

значе­ние

ошибка коэффициента

интервальная оценка

s2

s

t-статистика

размер интервала

нижняя граница

верхняя граница

a0

57,26

4,90

24,04

11,68

9,61

47,65

66,88

a1

0,35

0,07

0,006

4,73

0,15

0,21

0,50

a2

3,911

3,01

9,054

1,30

5,90

-1,989

9,811

Сравнивая фактические значения t-статистики для коэффициентов (табл. 12) с критическими значениями (табл. 13), можно сделать вывод, что коэффициент перед a2 статистически незначим. С другой стороны, значения коэффициентов a0 и a1 практически не изменились, следовательно переменная является лишней, и ее не следует добавлять в модель.

Таблица 13

Критические значения t-статистики

п/п

α (уровень значимости)

1.

0,1

2,31

2.

0,05

2,75

3.

0,01

3,83

Исключаем лишнюю переменную из модели, и в дальнейшем будем рассматривать парную линейную модель.

9. Проверим модель на наличие гетероскедастичности. Для этого используем метод графического анализа остатков и метод расчета рангового коэффициента Спирмена.

Поле корреляции между независимой переменной и квадратом случайной ошибки выглядит следующим образом (рис. 5)

Рис. 5 Графический анализ остатков – гетероскедастичность не обнаружена

По внешнему виду корреляционного поля нельзя сделать однозначный вывод о наличии (отсутствии автокорреляции). Необходимо проведение тестов. Рассчитаем ранговый коэффициент Спирмена. Для этого построим вспомогательную таблицу:

Таблица 14

Расчет коэффициента Спирмена

№п/п

 

X

e2

Ранг по x

Ранг по e2

d

d2

1

февр.

49,5

620,9

8

1

7

49

2

март

36,3

390,0

6

2

4

16

3

апр.

68,7

286,7

10

11

-1

1

4

май

-75,0

54,2

1

8

-7

49

5

июнь

53,0

33,0

9

5

4

16

6

июль

31,2

45,5

5

7

-2

4

7

авг.

0,1

81,9

3

10

-7

49

8

сен.

-18,9

5,6

2

4

-2

4

9

окт.

39,8

161,0

7

3

4

16

10

ноя.

9,6

40,5

4

6

-2

4

11

дек.

162,4

56,7

11

9

2

4

 

сумма

356,7

212

 

среднее

32,4

Ранговый коэффициент Спирмена равен:

оценим статистическую значимость коэффициента Спирмена:

Критическое значение при пятипроцентном уровне значимости равно 2,69 (см. табл.6), что больше расчетного, следовательно, коэффициент Спирмена статистически незначим, и гетероскедастичность отсутствует.

! Самостоятельно убедитесь в отсутствии гетероскедастичности при помощи остальных тестов (Парка, Глейзера, Голдфельда-Квандта и Уайта)!

  1. Проверим модель на наличие автокорреляции.

    1. Построим корреляционные поля (рис. 6 и 7). По их визуальному анализу нельзя сделать однозначный вывод о наличии или отсутствии автокорреляции.

Рис. 6. Анализ автокорреляции

Рис. 7. Анализ автокорреляции (продолжение)

    1. Проанализируем выборку по методу рядов.

Фактическое число рядов равно 4:

Таблица 15

Определение количества рядов

№п/п

1

2

3

4

5

6

7

8

9

10

11

месяц

февр.

март

апр.

май

июнь

июль

авг.

сен.

окт.

ноя.

дек.

et

-24,9

-19,7

16,9

7,4

5,7

6,7

9,0

-2,4

-12,7

6,4

7,5

ряд

1

2

3

4

Критические значения для n1 = 5+2 = 7 и n2 = 2+2 = 4 равны (приложение 5):

нижняя граница – 2

верхняя граница – не определена (больше 9)

Поскольку фактическое число радов расположено между нижней и верхней границами, то делаем вывод об отсутствии автокорреляции.

    1. Рассчитаем критерий Дарбина-Уотсона. Для этого построим вспомогательную таблицу:

Таблица 16

№п/п

 

x

et

et2

et-1

etet-1

(etet-1)2

1

фев.

49,5

-24,9

-

-

-

-

2

март

36,3

-19,7

390,04

-24,9

5,2

26,72

3

апр.

68,7

16,9

286,66

-19,7

36,7

1345,45

4

май

-75,0

7,4

54,24

16,9

-9,6

91,51

5

июнь

53,0

5,7

33,02

7,4

-1,6

2,62

6

июль

31,2

6,7

45,54

5,7

1,0

1,00

7

авг.

0,1

9,0

81,86

6,7

2,3

5,29

8

сен.

-18,9

-2,4

5,64

9,0

-11,4

130,48

9

окт.

39,8

-12,7

160,96

-2,4

-10,3

106,33

10

ноя.

9,6

6,4

40,49

-12,7

19,1

362,92

11

дек.

162,4

7,5

56,67

6,4

1,2

1,36

 

сумма

356,7

0,0

1155,1

-7,5

32,4

2073,7

Критерий Дарбина-Уотсона определим по формуле:

Сравнивая полученное значение с критическими:

Таблица 17

dlow

dhigh

0.927

1.324

определяем, что dhigh < DW < 4-dhigh (1,324 < 1,795 < 2,676), можно сделать вывод об отсутствии автокорреляции.

Таким образом, полученные оценки коэффициентов регрессионного уравнения действительно являются несмещенными, эффективными и состоятельными, а само уравнение может использоваться для моделирования и прогнозирования динамики сбережений.