- •Министерство науки и образования российской федерации
- •Тема 1. Предмет, метод и задачи ЭконометрикИ 6
- •Тема 2. Линейные однофакторные регрессионные
- •Тема 3. Линейная модель множественной
- •Тема 4. Нелинейные модели регрессии и их
- •4.6. Практический блок 56
- •4.7. Самостоятельная работа студентов 61
- •Тема 5. Оценка качества эконометрических
- •Тема 6. Временные ряды 112
- •Тема 7. Задачи экономического анализа, решаемые на основе эконометрических моделей 135
- •Тема 8. Системы эконометрических уравнений 167
- •Введение
- •1.2. Соотношения между экономическими переменными.
- •Регрессионные модели как инструмент анализа и прогнозирования экономических явлений.
- •Практический блок
- •Самостоятельная работа студентов Рекомендуемые темы рефератов
- •Литература для самостоятельной работы
- •Интернет-ресурсы:
- •Тема 2. Линейные однофакторные регрессионные модели эконометрики
- •2.7. Практический блок 22
- •2.8. Самостоятельная работа студентов 31
- •2.1. Определения. Линейная регрессионная модель для случая одной факторной переменной
- •Метод наименьших квадратов (мнк).
- •2.3. Свойства оценок мнк.
- •2.4.Регрессия по эмпирическим (выборочным) данным и теоретическая регрессия.
- •Таким образом, получено уравнение регрессии
- •2.5. Экономическая интерпретация параметров линейного уравнения регрессии.
- •2.6. Измерение и интерпретация случайной составляющей.
- •Практический блок Примеры
- •Контрольные вопросы
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •Тема 3. Линейная модель множественной регрессии
- •3.6. Практический блок 42
- •3.7 Самостоятельная работа студентов 49
- •3.1. Отбор факторов при построении множественной регрессии.
- •3.2. Линейная регрессионная модель со многими переменными.
- •3.3. Оценка и интерпретация параметров.
- •3.4. Описание связей между макроэкономическими переменными.
- •3.5. Формирование регрессионных моделей на компьютере с помощью ппп Excel
- •3.5.1. Однофакторная регрессия.
- •3.5.2. Многофакторная регрессия.
- •Практический блок Примеры
- •Контрольные вопросы
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •Тема 4. Нелинейные модели регрессии и их линеаризация
- •4.6. Практический блок 56
- •4.7. Самостоятельная работа студентов 61
- •4.1. Общие понятия
- •4.2. Мультипликативные модели регрессии и их линеаризация.
- •4.3. Гиперболическая и логарифмическая регрессии. Полиномиальная и кусочно-полиномиальная регрессия.
- •4.4. Экспоненциальная и степенная однофакторная регрессии.
- •Формирование нелинейных однофакторных регрессионных моделей на компьютере с помощью ппп Excel
- •Практический блок Пример
- •Контрольные вопросы
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •5.8. Практический блок 97
- •5.9. Самостоятельная работа студентов 111
- •5.1. Доверительные интервалы для коэффициентов: реальные статистические данные
- •5.2. Проверка статистических гипотез о значениях коэффициентов
- •5.3. Проверка значимости параметров линейной регрессии и подбор модели с использованием f-критериев
- •5.4. Проверка значимости и подбор модели с использованием коэффициентов детерминации. Информационные критерии
- •Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.
- •5.6. Обобщенный метод наименьших квадратов. Метод Главных Компонент.
- •5.7.Прогнозирование. Доверительный интервал прогноза.
- •Практический блок
- •Контрольные вопросы
- •Задания и задачи
- •3. Имеются данные о рынке строящегося жилья в Санкт-Петербурге (по состоянию на декабрь 2006 г.).
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •6 . Временные ряды.
- •6.6. Практический блок 123
- •6.7. Самостоятельная работа студентов 134
- •6.1. Характеристики временных рядов. Выявление тренда в динамических рядах экономических показателей.
- •Моделирование сезонных и циклических колебаний.
- •6.3. Статистика Дарбина-Уотсона.
- •6.4. Динамические эконометрические модели
- •6.5. Интерпретация параметров моделей с распределенным лагом
- •Практический блок Пример.
- •Задания и задачи
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •7.Задачи экономического анализа, решаемые на основе регрессионных эконометрических моделей
- •7.3. Практический блок 148
- •7.4. Самостоятельная работа студентов 166
- •7.1. Измерение тесноты связи между результативным и факторными признаками.
- •Анализ влияния отдельных факторных признаков на результативный признак.
- •Практический блок Пример
- •Контрольные вопросы
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •8. Системы эконометрических уравнений.
- •8.4. Практический блок 172
- •8.5. Самостоятельная работа студентов 181
- •8.1. Структура систем эконометрических уравнений
- •8.2. Проблема идентификации
- •Методы решения систем эконометрических уравнений
- •Практический блок
- •Самостоятельная работа студентов Литература для самостоятельной работы
- •Методические рекомендации
- •1. Методические рекомендации по изучению теоретического материала.
- •2. Методические рекомендации по решению практических задач.
- •3. Методические рекомендации по выполнению контрольных работ.
- •4. Требования к критериям оценки выполнения практических заданий, контрольных работ.
- •Вопросы для подготовки к зачету
- •Контрольные задания
- •Глоссарий
- •Список рекомендуемой литературы
- •Предметный указатель
- •Приложения
Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.
Итак, при исследовании остатков i должно проверяться наличие следующих пяти предпосылок МНК:
случайный характер остатков;
нулевая средняя величина остатков, не зависящая от хi;
гомоскедастичность – дисперсия каждого отклонения i одинакова для всех значений хi;
отсутствие автокорреляции остатков – значения остатков i распределены независимо друг от друга;
остатки подчиняются нормальному распределению.
Если распределение случайных остатков i не соответствует некоторым предпосылкам МНК, то следует корректировать модель.
В случае нарушения первых двух предпосылок необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии.
Пятая предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью критериев t, F. Однако и при нарушении пятой предпосылки МНК оценки регрессии обладают достаточной состоятельностью.
Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.
Если не соблюдается гомоскедастичность, то имеет место гетероскедастичность. Наличие гетероскедастичности может привести к смещенности оценок коэффициентов регрессии, а также к уменьшению их эффективности. Вследствие вышесказанного все выводы, получаемые на основе соответствующих t- и F-статистик, а также интервальные оценки будут ненадежными. Следовательно, статистические выводы, получаемые при стандартных проверках качества оценок, могут быть ошибочными и приводить к неверным заключениям по построенной модели. Вполне вероятно, что стандартные ошибки коэффициентов будут занижены, а следовательно, t-статистики будут завышены. Это может привести к признанию статистически значимыми коэффициентов, таковыми на самом деле не являющихся. В этом случае рекомендуется применять обобщенный метод наименьших квадратов, который заключается в том, что при минимизации суммы квадратов отклонений (5) отдельные ее слагаемые взвешиваются: наблюдениям с большей дисперсией придается пропорционально меньший вес. Чтобы убедиться в гетероскедастичности остатков и, следовательно, в необходимости использования обобщенного МНК, обычно не ограничиваются визуальной проверкой гетероскедастичности, а проводят ее эмпирическое подтверждение, в частности, используют метод Гольдфельда – Квандта. Проиллюстрируем его на примере (табл.5.3).
Поступления налогов в бюджет (yi – млн.руб.) в зависимости
от численности работающих (хi – тыс.чел). Таблица 5.3
-
№ п/п
хi
yi
ŷх
i
1
2
3
4
5
1
3
4,4
-1,0
5,4
2
6
8,1
2,5
5,6
3
8
12,9
4,9
8,0
4
18
20,8
16,6
4,2
5
20
15,5
19,0
-3,5
6
23
28,8
22,5
6,3
7
39
37,5
41,4
-3,9
8
49
48,7
53,2
-4,5
9
60
68,6
66,1
2,5
10
74
104,6
82,6
22,0
11
79
90,5
88,5
2,0
12
95
88,3
107,4
-19,1
13
106
132,4
120,4
12,0
14
112
122,0
127,4
-5,4
15
115
99,1
131,0
-31,9
16
125
114,2
142,7
-28,5
17
132
150,6
151,0
-0,4
18
149
156,1
171,0
-14,9
19
157
209,5
180,5
29,0
20
282
342,9
327,8
15,1
итого
1652
1855,5
1855,5
0,0
По выборочным данным строим уравнение регрессии
ŷх = – 4,565 + 1,178х.
Теоретические значения ŷх и отклонения от них фактических значений i приведены в четвертой и пятой колонке табл.5.3. Очевидно, что остаточные величины i обнаруживают тенденцию к росту по мере увеличения х и у. Этот вывод подтверждается и по критерию Гольдфельда – Квандта. Для его применения необходимо выполнить следующие шаги:
упорядочить n наблюдений по мере возрастания переменной х (выполнено);
исключить из рассмотрения k центральных наблюдений (рекомендовано при n=60 принимать k=16, при n=30 принимать k=8, при n=20 принимать k=4), в данном случае исключаем строки 9–12;
разделить совокупность на две группы (по ń=(n – k):2=8 наблюдений соответственно с малыми и большими значениями фактора х) и определить по каждой из групп уравнения регрессии (результаты в табл.5.4.);
определить остаточные суммы квадратов для первой (S1) и второй (S2) групп и найти их отношение R=S2:S1. Чем больше величина R превышает табличное значение F–критерия с ń –2 степенями свободы (приложение 2), тем более нарушена предпосылка о равенстве дисперсий остаточных величин, т.е. наблюдается гетероскедастичность остатков.
Таблица 5.4.
-
№ п/п
хi
yi
ŷх
i
i2
1
3
4,4
5,7
–1,3
1,69
2
6
8,1
8,5
–0,4
0,16
3
8
12,9
10,3
2,6
6,76
4
18
20,8
19,6
1,2
1,44
5
20
15,5
21,4
–5,9
34,81
6
23
28,8
24,2
4,6
21,16
7
39
37,5
38,9
–1,4
1,96
8
49
48,7
48,1
0,6
0,36
Уравнение регрессии: ŷх = 2,978 + 0,921х. Сумма S1=68,34
13
106
132,4
110,7
21,7
470,89
14
112
122,0
118,7
3,3
10,89
15
115
99,1
122,7
–23,6
556,96
16
125
114,2
136,1
–21,9
479,61
17
132
150,6
145,4
5,2
27,04
18
149
156,1
168,2
–12,1
146,41
19
157
209,5
178,9
30,6
936,36
20
282
342,9
346,1
–3,2
10,24
Уравнение регрессии: ŷх = 31,142 + 1,338х. Сумма S2 =2638,4
Величина R=2638,4 : 68,34=38.6 существенно превышает табличное значение F-критерия 4,28 при 5%-ном и 8,47 при 1%-ном уровне значимости для числа степеней свободы 8 – 2 = 6, подтверждая тем самым наличие гетероскедастичности.
Нарушение четвертой предпосылки МНК – автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Среди основных причин, вызывающих появление автокорреляции, можно выделить ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.
Ошибки спецификации. Неучет в модели какой-либо важной объясняющей переменной либо неправильный выбор формы зависимости обычно приводит к системным отклонениям точек наблюдений от линии регрессии, что может обусловить автокорреляцию.
Инерция. Многие экономические показатели (например, инфляция, безработица, ВНП и т.п.) обладают определенной цикличностью, связанной с волнообразностью деловой активности. Действительно, экономический подъем приводит к росту занятости, сокращению инфляции, увеличению ВНП и т.д. Этот рост продолжается до тех пор, пока изменение конъюнктуры рынка и ряда экономических характеристик не приведет к замедлению роста, затем остановке и движению вспять рассматриваемых показателей. В любом случае эта трансформация происходит не мгновенно, а обладает определенной инертностью.
Эффект паутины. Во многих производственных и других сферах экономические показатели реагируют на изменение экономических условий с запаздыванием (временным лагом). Например, предложение сельскохозяйственной продукции реагирует на изменение цены с запаздыванием (равным периоду созревания урожая). Большая цена сельскохозяйственной продукции в прошедшем году вызовет (скорее всего) ее перепроизводство в текущем году, а следовательно, цена на нее снизится и т.д.
Сглаживание данных. Зачастую данные по некоторому продолжительному временному периоду получают усреднением данных по составляющим его подинтервалам. Это может привести к определенному сглаживанию колебаний, которые имелись внутри рассматриваемого периода, что в свою очередь может послужить причиной автокорреляции.
Последствия автокорреляции во многом сходны с последствиями гетероскедастичности. Среди них при применении МНК обычно выделяются следующие.
Оценки параметров, оставаясь линейными и несмещенными, перестают быть эффективными. Следовательно, они перестают обладать свойствами наилучших линейных несмещенных оценок.
Дисперсии оценок являются смешенными. Часто дисперсии, вычисленные по стандартным формулам, являются заниженными, что влечет за собой увеличение t-статистик. Это может привести к признанию статистически значимыми объясняющие переменные, которые в действительности таковыми могут не являться.
Оценка дисперсии регрессии является смещенной оценкой истинного значения дисперсии, во многих случаях занижая его.
В силу вышесказанного выводы по t- и F-статистикам, определяющим значимость коэффициентов регрессии и коэффициента детерминации, возможно, будут неверными. Вследствие этого ухудшаются прогнозные качества модели.
Для обнаружения автокорреляции необходимо наблюдения упорядочить по значению фактора х (как в предыдущем примере) и составить ряды с текущими и предыдущими остатками. Коэффициент корреляции rij между i и j, где i – остатки текущих наблюдений, j – остатки предыдущих наблюдений (например, j=i–1) определяется по обычной формуле линейного коэффициента корреляции (2.1).Рассмотрим расчет коэффициента корреляции между i и j, взяв в качестве примера данные из табл.5.3 и перенеся их в табл. 5.5 (n=19).
Таблица 5.5.
-
№ п/п
i
i-1
ii-1
1
5,6
5,4
30.24
2
8,0
5,6
44.8
3
4,2
8,0
33.6
4
–3,5
4,2
–14.7
5
6,3
–3,5
–22.05
6
–3,9
6,3
–24.57
7
–4,5
–3,9
17.55
8
2,5
–4,5
–11.25
9
22,0
2,5
55
10
2,0
22,0
44
11
–19,1
2,0
–38.2
12
12,0
–19,1
–229.2
13
–5,4
12,0
–64.8
14
–31,9
–5,4
172.26
15
–28,5
–31,9
909.15
16
–0,4
–28,5
11.4
17
–14,9
–0,4
5.96
18
29,0
–14,9
–432.1
19
15,1
29,0
435
итого
–5.3998
–15.1031
922.09
среднее
–0,2842
–0,7949
48.5311
σi =15.1347, σj =14,7663 и в соответствие с (2.1)
rij =(48,5311 – (–0,2842)(–0,7949))/15,1347/14,7663=0,2161,
что при 17 степенях свободы явно незначимо и демонстрирует отсутствие автокорреляции остатков.
Автокорреляция остатков может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака. Во-вторых, причину следует искать в формулировке модели, которая может не включать существенный фактор, влияние которого отражается в остатках, вследствие чего они оказываются автокоррелированными. Очень часто этим фактором является фактор времени, поэтому проблема автокорреляции остатков весьма актуальна при исследовании динамических рядов, что мы рассмотрим в соответствующем разделе.