- •В.А. Балаш, о.С. Балаш, а.И. Землянухин Эконометрика
- •Авторы:
- •Рецензенты:
- •Введение
- •Модели.
- •Типы моделей.
- •1.3. Типы данных.
- •1. Парная линейная регрессия
- •Р ис. 1.3. Поле корреляции
- •Множественное линейное уравнение регрессии
- •3. Эконометрические модели с переменной структурой. Фиктивные переменные
- •Данные по производительности работников
- •4. Тест Чоу
- •Решение
- •5. Сравнение «длинной» и «короткой» регрессии
- •Данные по странам
- •6. Гетероскедастичность
- •6.1. Тесты на гетероскедастичность
- •Тест Голдфелда-Квандта (Goldfeld-Quandt).
- •.Тест Бреуша-Пагана (Breus-Pagan).
- •.Тест Вайта (White).
- •6.1.1. Тест Голдфелда-Квандта (Goldfeld-Quandt)
- •6.1.2. Тест Бреуша-Пагана (Breus-Pagan)
- •6.1.3. Тест Вайта (White)
- •6.2. Коррекция на гетероскедастичность
- •Задачи для самостоятельного решения
- •Приложения
- •Основные экономические показатели за 2000г. Для 266 компаний сша
- •Распределение Фишера-Снедекора
- •Закон распределения Стьюдента (t- распределение)
6. Гетероскедастичность
В рассмотренной ранее регрессионной модели, которую часто называют классической, предполагается, что случайные составляющие ei имеют постоянную дисперсию и не коррелируют друг с другом, то есть ковариационная матрица случайного вектора имеет вид v(e)= s2In.
Это условие известно как гомоскедастичность, что означает «одинаковый разброс» (рис. 6.1).
Рис. 6.1. Модель с гомоскедастичным случайным членом
Если ошибки не являются гомоскедастичными, то имеет место гетероскедастичность, что означает «неодинаковый разброс».
Гетероскедастичность может принимать разные формы, например, непостоянство дисперсии или автокорреляция.
На рисунке 6.2 представлен пример, когда ошибки не коррелированны, но имеют неодинаковую дисперсию.
Рис. 6.2. Модель с гетероскедастичным случайным членом
При гомоскедастичности коэффициенты регрессии, полученные методом наименьших квадратов (МНК), имеют наименьшую дисперсию среди всех несмещенных оценок, являющихся линейными функциями от наблюдений y.
Если имеет место гетероскедастичность, то:
оценки МНК, которые мы использовали до сих пор, неэффективны. Можно найти другие оценки, которые имеют меньшую дисперсию и являются несмещенными;
стандартные ошибки, рассчитанные по обычной формуле (МНК), будут не верны. Они вычисляются на основе предположения, что распределение случайного члена гомоскедастично. Вполне вероятно, что стандартные ошибки будут занижены, а, следовательно, t -статистики – завышены и будет получено неправильное представление о точности уравнения регрессии.
6.1. Тесты на гетероскедастичность
Тесты на гетероскедастичность предназначены для ситуации, когда ошибки не коррелированны, но дисперсия ошибок не постоянна.
Проверяется
основная гипотеза Н0:
(модель гомоскедастична) против
альтернативной гипотезы
Н1:
(модель гетероскедастична).
Наиболее часто используют:
Тест Голдфелда-Квандта (Goldfeld-Quandt).
.Тест Бреуша-Пагана (Breus-Pagan).
.Тест Вайта (White).
6.1.1. Тест Голдфелда-Квандта (Goldfeld-Quandt)
Предполагается, что стандартные отклонения ошибки пропорционально значениям одной из независимых переменных.
Этапы тестирования:
Упорядочивают наблюдения по величине x.
Выборку разбивают на три части.
Рассчитывают регрессию для первой трети выборки, находят QIост.
Рассчитывают регрессию для последней трети выборки, находят QIIост.
Находят
Fнабл= QIIост /QIост. (6.1)
Если
,
то имеет место гетероскедастичность.
Необходимо
учитывать, что если в модели более одной
объясняющей переменной, то число
наблюдений
должно быть больше, чем k
+1, где k - число
объясняющих переменных.
Пример 6.1
По данным таблицы 5.1 проверить гипотезу о гомоскедастичности, используя тест Гольфрельда-Квандта.
Решение
Упорядочим выборку по той переменной, по которой есть подозрение на гетероскедастичность, например, по х1. Для этого необходимо выделить весь массив переменной, в командной строке курсором выбрать «Данные», затем «Сортировка». Появится окно «Сортировка диапазона» (рис.6.3). Необходимо отметить «Сортировать по возрастанию», нажать ОК. В результате ваши данные отсортируются по возрастанию данных переменной х1.
Рис. 6.3. Окно «Сортировка диапазона»
Разобьем 25 наблюдений приблизительно на 3 части.
Построим регрессию для первых 9 наблюдений (рис. 6.4) и для последних 9 переменных (рис.6.5). Для каждой регрессии найдем Qост.
Рис. 6.4. Регрессия по первым 9 наблюдениям
Рис. 6.5. Регрессия по последним 9 наблюдениям
Найдем статистику (6.1):
.
Так как
то гипотеза о гомоскедастичности не отвергается.
Следует заметить, что переменная Х1 гомоскедастична, но это не значит, что по всем остальным переменным модель может быть гетероскедастичной. Поэтому необходима дальнейшая проверка по остальным переменным.
