
- •Модуль 6. Обобщенный метод наименьших квадратов
- •6.1. Обобщенный метод наименьших квадратов
- •6.2. Гетероскедастичность. Взвешенный метод наименьших квадратов (Weighted Least Squares, wls)
- •Лабораторная № 6.1
- •Решение
- •6.3. Автокорреляция остатков
- •Конец примера
- •6.3.1. Статистика Дарбина - Уотсона
- •6.3.2. Применение статистики Дарбина-Уотсона для проверки гипотезы об отсутствии автокорреляции остатков
- •Пример 6.2.
- •Конец примера
- •6. Вопросы
Лабораторная № 6.1
В таблице представлены данные о среднедушевых сбережениях (y) и доходах (x) вnсемьях. Сравнить точность оценок параметров 1) при соблюдении исходных предпосылок классической регрессионной модели и 2) гетероскедастичности случайных регрессионных остатков.
№ семьи (i) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
yi (млн. руб.) |
0,3 |
0,1 |
2,2 |
0,9 |
4 |
1,7 |
5,8 |
2,5 |
7,5 |
3 |
x |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Решение
Представим данные графически. На рис.6.2
представлены наблюдения, а также график
линейного уравнения регрессии
=a0+a1xi+ei,
i=1…n.Пользуясь
функцией ЛИНЕЙН(), оценим коэффициентыa0 и
a1, а также
определим0и1.
Тогда оценка уравнения регрессии имеет
вид:
=-0,21+0,545xi
(1,25) (0,20)
Перейдем к построению регрессии в предположении гетероскедастичности случайных регрессионных остатков. На графике хорошо видно, что с увеличением доходов размах отклонений сбережений уот линии регрессии
растет пропорциональнох, что свидетельствует о гетероскедастичности случайных остатков, то есть
и уравнение регрессии имеет вид:
=a0+a1xi+ei xi.
Оценим уравнение
/xi
=a/11
/xi
+a/0+ei
Для этого преобразуем переменные:
ŷ/xi |
0,3 |
0,05 |
0,733333 |
0,225 |
0,8 |
0,283333 |
0,828571 |
0,3125 |
0,833333 |
0,3 |
1 /xi |
1 |
0,5 |
0,333333 |
0,25 |
0,2 |
0,166667 |
0,142857 |
0,125 |
0,111111 |
0,1 |
Теперь оценим линейную регрессию относительно новых переменных:
/xi
=-0,3671
/xi
+0,574
Окончательно уравнение регрессии можно записать:
=-0,367+0,574xi.
(0,36) (0,14)
Второе уравнение имеет более точные оценки 0/=0,36<0=1,25 и1/=0,14<1=0,20.
6.3. Автокорреляция остатков
Близкое к единице значение коэффициента детерминации R2 еще не свидетельство высокого качества уравнения регрессии.
Пример
Рассмотрим рис. 6.3. На нем показана зависимость реального объема потребления(CONS,млрд-долл., 1982 г.) от численности населения(РОР,млн.) в США за 1931-1990 гг., а также линия оцененного по этим данным уравнения парной линейной регрессии. Формула этого уравнения следующая:
CONS=-1817,3 + 16,7РОР
Стандартные ошибки свободного члена и коэффициента регрессии равны, соответственно, 84,7 и 0,46; их t-статистики - (-21,4 и 36,8). По абсолютной величинеt-статистики намного превышают 3, и это свидетельствует о высокой надежности оцененных коэффициентов. Коэффициент детерминацииR2уравнения равен 0,96, то есть объяснено 96% дисперсии объема потребления. И в то же время уже по рисунку видно, что оцененная регрессия не очень хороша: зависимость величинРОР иCONSявно нелинейна.
Рис. 6.3. График зависимости реального объема потребления (СОNS, млрд. долл., 1982 г.) от численности населения (РОР, млн.) в США в 1931-1990 гг.
Если использовать проведенную прямую, скажем, для прогнозирования дальнейшей динамики потребления, результат будет неудовлетворительным. Существо вопроса здесь понятно - в течение рассматриваемого периода значительно вырос объем потребления в расчете на душу населения. Численность населения США росла во времени почти линейно (то есть с постоянными годовыми приростами), а объем потребления - по экспоненте (то есть с примерно постоянным темпом). Это ясно и без уравнения линейной регрессии, но мы специально оценили его для иллюстрации.