Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика / Модуль 6.doc
Скачиваний:
107
Добавлен:
29.03.2016
Размер:
155.65 Кб
Скачать

Лабораторная № 6.1

В таблице представлены данные о среднедушевых сбережениях (y) и доходах (x) вnсемьях. Сравнить точность оценок параметров 1) при соблюдении исходных предпосылок классической регрессионной модели и 2) гетероскедастичности случайных регрессионных остатков.

№ семьи (i)

1

2

3

4

5

6

7

8

9

10

yi (млн. руб.)

0,3

0,1

2,2

0,9

4

1,7

5,8

2,5

7,5

3

xi(млн. руб.)

1

2

3

4

5

6

7

8

9

10

Решение

Представим данные графически. На рис.6.2 представлены наблюдения, а также график линейного уравнения регрессии =a0+a1xi+ei, i=1…n.Пользуясь функцией ЛИНЕЙН(), оценим коэффициентыa0 и a1, а также определим0и1.

Тогда оценка уравнения регрессии имеет вид: =-0,21+0,545xi

(1,25) (0,20)

  1. Перейдем к построению регрессии в предположении гетероскедастичности случайных регрессионных остатков. На графике хорошо видно, что с увеличением доходов размах отклонений сбережений уот линии регрессиирастет пропорциональнох, что свидетельствует о гетероскедастичности случайных остатков, то естьи уравнение регрессии имеет вид: i=a0+a1xi+ei xi.

Оценим уравнение i /xi =a/11 /xi +a/0+ei

Для этого преобразуем переменные:

ŷ/xi

0,3

0,05

0,73

0,23

0,8

0,28

0,83

0,31

0,8

0,3

1 /xi

1

0,5

0,33

0,25

0,2

0,17

0,143

0,13

0,11

0,1

Теперь оценим линейную регрессию относительно новых переменных:

i / xi =-0,3671 /xi +0,574

Окончательно уравнение регрессии можно записать:

i=-0,367 + 0,574xi.

(0,36) (0,14)

Второе уравнение имеет более точные оценки 0/=0,36<0=1,25 и1/=0,14<1=0,20.

6.3. Автокорреляция остатков

Близкое к единице значение коэффициента детерминации R2 еще не свидетельство высокого качества уравнения регрессии.

Пример

Рассмотрим рис. 6.3. На нем показана зависимость реального объема потребления(CONS,млрд-долл., 1982 г.) от численности населения(РОР,млн.) в США за 1931-1990 гг., а также линия оцененного по этим данным уравнения парной линейной регрессии. Формула этого уравнения следующая:

CONS=-1817,3 + 16,7РОР

Стандартные ошибки свободного члена и коэффициента регрессии равны, соответственно, 84,7 и 0,46; их t-статистики - (-21,4 и 36,8). По абсолютной величинеt-статистики намного превышают 3, и это свидетельствует о высокой надежности оцененных коэффициентов. Коэффициент детерминацииR2уравнения равен 0,96, то есть объяснено 96% дисперсии объема потребления. И в то же время уже по рисунку видно, что оцененная регрессия не очень хороша: зависимость величинРОР иCONSявно нелинейна.

Рис. 6.3. График зависимости реального объема потребления (СОNS, млрд. долл., 1982 г.) от численности населения (РОР, млн.) в США в 1931-1990 гг.

Если использовать проведенную прямую, скажем, для прогнозирования дальнейшей динамики потребления, результат будет неудовлетворительным. Существо вопроса здесь понятно - в течение рассматриваемого периода значительно вырос объем потребления в расчете на душу населения. Численность населения США росла во времени почти линейно (то есть с постоянными годовыми приростами), а объем потребления - по экспоненте (то есть с примерно постоянным темпом). Это ясно и без уравнения линейной регрессии, но мы специально оценили его для иллюстрации.

Как же можно выразить формально неудовлетворительность полученного уравнения регрессии? Можно видеть, что не выполнены необходимые предпосылки об отклонениях от линии регрессии еi. Эти величины явно не являются взаимно независимыми, и дисперсия их не постоянна. Нарушения исходных предпосылок не только свидетельствуют о неточной спецификации уравнения регрессии, но и делают неточными полученные оценки коэффициентов регрессии и их стандартных ошибок. Поэтомуследующий этап проверки качества уравнения регрессии - проверка некоторых важных свойств, выполнение которых предполагалось при оценивании уравнения регрессии.

Приступая к оценке линейного уравнения регрессии, мы предполагали, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой случайны, независимы между собой и имеют нулевое среднее и постоянную дисперсию. Так ли это на самом деле? Если нет, то наш анализ статистической значимости коэффициентов регрессии неточениоценки этих коэффициентов не обладают таким и желательными свойствами, как несмещенность, состоятельность и эффективность.

Попытаемся ответить на вопрос, в каких случаях отклонения не обладают предполагавшимися свойствами. Во-первых, если в действительностиисследуемая взаимосвязь нелинейна. Мы видим, например, на рис. 6.3, что в этом случае отклонения от линии регрессии не случайно распределены вокруг нее, а обладают определенной закономерностью. Эта закономерность, в частности, выражается и одинаковом, как правило, знаке каждых двух соседних отклонении. Это может являться следствием нелинейного характера связи переменных, либовоздействием какого-то фактора, не включенного в уравнение регрессии. Величина такого неучтенного фактора может менять свою динамику в рассматриваемый период, отклоняясь в достаточно длительные промежутки времени в ту или иную сторону от своего среднего значения. Это, очевидно, может служить причиной длительных устойчивых отклонений зависимой переменной от линии регрессии. Обе указанные причины свидетельствуют о том, что существует возможность улучшить уравнение регрессии путем оценивания какой-то новой нелинейной формулы или включения некоторой новой объясняющей переменной.

Зависимость, показанная на рис. 6.3, очевидно, нелинейна. Но это - крайний случай. Далеко не всегда бывает столь же очевидно, что отклонения от регрессионной прямой имеют неслучайный, закономерный характер. Для оценки степени такой неслучайности необходимо ввести количественную меру.

Итак, одним из основных предполагаемых свойств отклонений еiзначенийyiот регрессионной формулыу=+хявляется их статистическая независимость между собой. Поскольку значенияеiостаются неизвестными ввиду неизвестности истинных значенийи, то проверяется статистическая независимость их аналогов - отклоненийеi. При этомпроверяется обычно их некоррелированность (являющаяся необходимым, но недостаточным атрибутом независимости), причем некоррелированность не любых, а соседних величин еi, иными словами проверяется отсутствиеавтокорреляции первого порядка. Соседними можно считать соседние во времени (в случае временных рядов) или по возрастанию переменнойх(в случае перекрестных выборок) значенияеi. Для этих величин можно рассчитать, например, коэффициент корреляции (называемыйкоэффициентом автокорреляции первого порядка):

(6. 0)

При наличии автокорреляции первого порядка матрицу ковариаций можно представить в виде:

, (6. 0)

где - коэффициент корреляции междуiиi-1.

Соседние файлы в папке Эконометрика