- •Модуль 6. Обобщенный метод наименьших квадратов
- •6.1. Обобщенный метод наименьших квадратов
- •6.2. Гетероскедастичность. Взвешенный метод наименьших квадратов (Weighted Least Squares, wls)
- •Лабораторная № 6.1
- •Решение
- •6.3. Автокорреляция остатков
- •Конец примера
- •6.3.1. Статистика Дарбина - Уотсона
- •6.3.2. Применение статистики Дарбина-Уотсона для проверки гипотезы об отсутствии автокорреляции остатков
- •Пример 6.2.
- •Конец примера
- •6. Вопросы
Лабораторная № 6.1
В таблице представлены данные о среднедушевых сбережениях (y) и доходах (x) вnсемьях. Сравнить точность оценок параметров 1) при соблюдении исходных предпосылок классической регрессионной модели и 2) гетероскедастичности случайных регрессионных остатков.
№ семьи (i) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
yi (млн. руб.) |
0,3 |
0,1 |
2,2 |
0,9 |
4 |
1,7 |
5,8 |
2,5 |
7,5 |
3 |
xi(млн. руб.) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Решение
Представим данные графически. На рис.6.2 представлены наблюдения, а также график линейного уравнения регрессии =a0+a1xi+ei, i=1…n.Пользуясь функцией ЛИНЕЙН(), оценим коэффициентыa0 и a1, а также определим0и1.
Тогда оценка уравнения регрессии имеет вид: =-0,21+0,545xi
(1,25) (0,20)
Перейдем к построению регрессии в предположении гетероскедастичности случайных регрессионных остатков. На графике хорошо видно, что с увеличением доходов размах отклонений сбережений уот линии регрессии растет пропорциональнох, что свидетельствует о гетероскедастичности случайных остатков, то естьи уравнение регрессии имеет вид: =a0+a1xi+ei xi.
Оценим уравнение /xi =a/11 /xi +a/0+ei
Для этого преобразуем переменные:
ŷ/xi |
0,3 |
0,05 |
0,733333 |
0,225 |
0,8 |
0,283333 |
0,828571 |
0,3125 |
0,833333 |
0,3 |
1 /xi |
1 |
0,5 |
0,333333 |
0,25 |
0,2 |
0,166667 |
0,142857 |
0,125 |
0,111111 |
0,1 |
Теперь оценим линейную регрессию относительно новых переменных:
/xi =-0,3671 /xi +0,574
Окончательно уравнение регрессии можно записать:
=-0,367+0,574xi.
(0,36) (0,14)
Второе уравнение имеет более точные оценки 0/=0,36<0=1,25 и1/=0,14<1=0,20.
6.3. Автокорреляция остатков
Близкое к единице значение коэффициента детерминации R2 еще не свидетельство высокого качества уравнения регрессии.
Пример
Рассмотрим рис. 6.3. На нем показана зависимость реального объема потребления(CONS,млрд-долл., 1982 г.) от численности населения(РОР,млн.) в США за 1931-1990 гг., а также линия оцененного по этим данным уравнения парной линейной регрессии. Формула этого уравнения следующая:
CONS=-1817,3 + 16,7РОР
Стандартные ошибки свободного члена и коэффициента регрессии равны, соответственно, 84,7 и 0,46; их t-статистики - (-21,4 и 36,8). По абсолютной величинеt-статистики намного превышают 3, и это свидетельствует о высокой надежности оцененных коэффициентов. Коэффициент детерминацииR2уравнения равен 0,96, то есть объяснено 96% дисперсии объема потребления. И в то же время уже по рисунку видно, что оцененная регрессия не очень хороша: зависимость величинРОР иCONSявно нелинейна.
Рис. 6.3. График зависимости реального объема потребления (СОNS, млрд. долл., 1982 г.) от численности населения (РОР, млн.) в США в 1931-1990 гг.
Если использовать проведенную прямую, скажем, для прогнозирования дальнейшей динамики потребления, результат будет неудовлетворительным. Существо вопроса здесь понятно - в течение рассматриваемого периода значительно вырос объем потребления в расчете на душу населения. Численность населения США росла во времени почти линейно (то есть с постоянными годовыми приростами), а объем потребления - по экспоненте (то есть с примерно постоянным темпом). Это ясно и без уравнения линейной регрессии, но мы специально оценили его для иллюстрации.