Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка_лаб_ Эконометрия.doc
Скачиваний:
25
Добавлен:
20.11.2019
Размер:
9 Mб
Скачать

4.3. Проверка предпосылки гомоскедастичности возмущений. Обобщенный метод наименьших квадратов оценки параметров модели с гетероскедастичными остатками (задание 3.3).

4.3.1. Теоретические замечания. Одной из предпосылок МНК является условие постоянства дисперсий случайных отклонений .

для . (4.19)

Свойство постоянства дисперсии в наблюдениях называется гомоскедастичностью. В этом случае ковариационная матрица отклонений имеет вид:

Невыполнимость условия (4.19) называется гетероскедастичностью (непостоянство дисперсий отклонений). В этом случае для и:

(4.20)

Последствия применения МНК при наличии гетероскедастичности следующие.

  1. Оценки коэффициентов по-прежнему остаются несмещёнными и состоятельными, но не эффективными (т.е. они не будут иметь наименьшую дисперсию по сравнению с оценками данного параметра, полученными другими методами), они не будут даже асимптотически устойчивыми.

  2. Дисперсии оценок будут рассчитываться со смещением.

  3. Выводы на основе - и - статистик ненадёжные.

Наиболее распространёнными методами проверки наличия гетероскедастичности являются: графический анализ остатков, критерий , параметрический тест Гольдфельда-Квандта, непараметрический тест Гольдфельда-Квандта, тест Глейсера.

Графический анализ остатков используется на предварительном этапе. По корреляционному полю или графику остатков по факторным признакам делается предположение о наличии или отсутствии гетероскедастичности.

Критерий используется при большом количестве значений совокупности наблюдений . Он состоит из следующих шагов.

1. Входные данные зависимой переменной разбивают на групп с номерами .

2. Для каждой группы наблюдений рассчитывается сумма квадратов отклонений:

, (4.21)

где:

, (4.22)

– число наблюдений в r-й группе.

3. Вычисляют сумму квадратов отклонений в целом для совокупности наблюдений:

(4.23)

  1. Вычисляют параметр :

. (4.24)

5. Вычисляют критерий:

. (4.25)

Полученное значение критерия сравнивают с табличным значением - распределения со степенью свободы и уровнем значимости . Если , то с достоверностью 95% делают вывод о наличии гетерескедастичности остатков модели.

Тест Гольдфельда-Квандта применяется в случае, если предполагается, что дисперсия остатков возрастает пропорционально квадрату одной из независимых переменных , которая подозревается на гетероскедастичность. Если априори тяжело определить такую , то делают проверку по каждой переменной и в каждом случае применяют тест Гольдфельда-Квандта. При этом предполагается, что случайная составляющая распределена нормально. Таким способом можно проранжировать все переменные по подозрению на гетероскедастичность.

Чтобы обнаружить наличие гетероскедастичности по тесту Гольдфельда-Квандта, необходимо выполнить следующие шаги.

  1. Упорядочить наблюдений по мере возрастания переменной .

  2. Исключить средних наблюдений из общего количества наблюдений. Оптимальное значение определяется по формуле:

.

Примечание. Можно брать приближённо равным четверти наблюдений. Если наблюдений мало, то ничего не исключают, а только разбивают наблюдаемые значения на две подгруппы.

  1. Разделить совокупность на две группы (соответственно, с малыми и большими значениями выбранного фактора) и по каждой из групп определить уравнение регрессии .

  2. Определить остаточную сумму квадратов для первой и второй регрессии .

  3. Вычислить отношение:

или . (4.26)

В числителе должна быть бóльшая сумма квадратов.

Полученное значение статистики сравнивают с табличным значением при степенях свободы , и уровнем значимости . Если , то с достоверностью 95% делают вывод о наличии гетерескедастичности остатков модели.

Если сделан вывод о наличии гетерескедастичности остатков модели, то для оценки параметров модели нужно применить обобщенный МНК (ОМНК). Для применения ОМНК нужно определить матрицу преобразований (где ):

(4.27)

Для этой матрицы значения вычисляются в зависимости от гипотезы, которая выдвинута относительно изменения дисперсии остатков:

, то , , (4.28)

, то , , (4.29)

, то , , (4.30)

где – номер выбранной независимой переменной ,

– номер наблюдения.

При наличии гетероскедастичности для оценки параметров модели целесообразно использовать обобщённый метод наименьших квадратов (метод Эйткена), оператор оценивания которого имеет вид:

, (4.31)

или

, где . (4.32)

При таком оценивании вектор дает несмещённые оценки параметров модели, которая имеет наименьшую дисперсию.

Примечание. Отметим, что явления гетероскедастичности можно предусмотрительно избежать на этапе сбора данных. Например, если вы анализируете данные по торговым предприятиям города, то данные по крупным магазинам (супермаркетам, универмагам с площадью более 500 ), средним (с площадью меньше 500 и больше 50 ) и мелким (ларьки и магазины с площадью не более 50 ) лучше (если это не противоречит экономической постановке задаче) выделить в разные выборки и анализировать отдельно.

4.3.2. Организация данных и расчетов на листе MS Excel. Для проверки выполнения условия гомоскедастичности для трехфакторной модели: (рис. 4.10.) сначала проведем графический анализ остатков. Для этого при вводе параметров функции «Регрессия» нужно отметить поле «График остатков». В результате при выводе отчета функции «Регрессия» будут выведены графики остатков (рис. 4.10, 4.11).

Рис. 4.10. Графики остатков по переменным и .

Рис. 4.11. График остатков по переменной .

Анализируя данные графики сложно сделать вывод, о гетероскедастичности остатков и переменной, которая является причиной этого явления. Выполним проверку гетероскедастичности модели по критерию (рис. 4.12, табл. 4.3).

Рис. 4.12. Проверка гетероскедастичности модели по критерию .

На основании проведенных расчетов делаем вывод, что наблюдается гетероскедастичность остатков модели так как .

Так как априори тяжело определить какая из объясняющих переменных является причиной гетероскедастичности, поэтому сделаем проверку по каждой переменной с помощью теста Гольдфельда-Квандта.

Для этого упорядочим массив значений результативного и факторных признаков в ячейках по переменной (рис. 4.13, табл. 4.3). Определим количество наблюдений, которое надо отбросить: . Положим , чтобы оставшееся число наблюдений было четным. На следующем шаге построим модели линейной регрессии по первым и последним девяти наблюдениям при помощи функции «Регрессия».

Таблица 4.3.

Реализация в MS Excel формул при проверке гетероскедастичности возмущений модели по критерию (рис. 4.12)

адрес ячейки

формула

реализация в MS Excel

сортировка по возрастанию

=ДИСПР(G2:G9)

=G10*$F$9

=G10^(F9/2)

=СУММ(G11:I11)

=(J11/J13)^(J13/2)

=ПРОИЗВЕД(G12:H12)/J12

=-2*LN(G13)

=ХИ2ОБР(0,05;2)

Для вычисления значения статистики по формуле (4.26) разделим значение суммы квадратов отклонений по первой модели (ячейка отчета функции «Регрессия») на сумму квадратов отклонений по второй модели (ячейка функции «Регрессия»). В результате получим . Затем определим табличное значение статистики при уровне значимости и степенях свободы : .

Рис. 4.13. Проверка гетероскедастичности модели критерию Гольфельда-Квандта (по переменной ).

Таблица 4.4.