- •Содержание
- •Введение
- •1 Парная линейная регрессия
- •Суть регрессионного анализа
- •Парная линейная регрессия
- •1.3 Проверка качества уравнения регрессии
- •Интервальные оценки коэффициентов линейного уравнения регрессии
- •Доверительные интервалы для зависимой переменной
- •2 Множественная линейная регрессия
- •2.1 Определение параметров уравнения регрессии
- •2.2 Расчет коэффициентов множественной линейной регрессии
- •2.3 Анализ качества эмпирического уравнения множественной линейной регрессии
- •3 Нелинейная регрессия
- •3.1 Логарифмические (лог-линейные) модели
- •3.2 Полулогарифмические модели
- •3.3 Обратная модель
- •3.4 Показательная модель
- •3.5 Выбор формы модели
- •4 Гетероскедастичность
- •4.1 Суть гетероскедастичности
- •4.2 Обнаружение гетероскедастичности
- •1. Графический анализ остатков
- •2. Тест ранговой корреляции Спирмена
- •3. Тест Голдфелда-Квандта
- •4.3 Методы смягчения проблемы гетероскедастичности
- •1. Дисперсии отклонений известны (метод взвешенных наименьших квадратов)
- •2. Дисперсии отклонений неизвестны
- •5 Автокорреляция
- •5.1 Суть и причины автокорреляции
- •5.2 Обнаружение автокорреляции
- •1. Графический метод
- •2. Критерий Дарбина-Уотсона
- •5.3 Методы устранения автокорреляции
- •1. Определение на основе статистики Дарбина-Уотсона
- •2. Метод Хилдрета-Лу
- •3. Метод первых разностей
- •6 Фиктивные переменные в регрессионных моделях
- •6.1 Необходимость использования фиктивных переменных
- •6.2 Модели ковариационного анализа
- •1. Модели ковариационного анализа при наличии у фиктивной переменной двух альтернатив
- •2. Модели ковариационного анализа при наличии у качественных переменных более двух альтернатив
- •3. Регрессия с одной количественной и двумя качественными переменными
- •6.3 Сравнение двух регрессий
- •6.4 Использование фиктивных переменных в сезонном анализе
- •7 Динамические модели
- •7.1 Временные ряды. Лаги в экономических моделях
- •7.2 Оценка моделей с лагами в независимых переменных
- •1. Метод последовательного увеличения количества лагов
- •2. Метод геометрической прогрессии (метод Койка)
- •7.3 Авторегрессионные модели
- •1. Модель адаптивных ожиданий
- •2. Модель частичной корректировки
- •7.4 Прогнозирование с помощью временных рядов
- •8 Системы одновременных уравнений
- •8.1 Необходимость использования систем уравнений
- •1. Модель «спрос-предложение»
- •2. Кейнсианская модель формирования доходов
- •3. Модели is-lm
- •8.2 Составляющие системы уравнений
- •8.3 Косвенный метод наименьших квадратов (кмнк)
- •8.4 Проблема идентификации
- •8.5 Оценка систем уравнений
- •1. Мнк для рекурсивных моделей
- •2. Двухшаговый метод наименьших квадратов
- •Список рекомендуемой литературы
- •Приложения
1. Дисперсии отклонений известны (метод взвешенных наименьших квадратов)
Данный метод применяется при известных для каждого наблюдения значениях . В этом случае можно устранить гетероскедастичность, разделив каждое наблюдаемое значение на соответствующее ему значение дисперсии. В этом суть метода взвешенных наименьших квадратов (ВМНК).
Для простоты рассмотрим взвешенный метод наименьших квадратов на примере парной регрессии:
(4.5)
Разделим
обе части (4.5) на известное
:
(4.6)
Обозначив:
,
,
,
,
получим уравнение регрессии без
свободного члена, но с дополнительной
объясняющей переменной
и с «преобразованным» отклонением
,
для которого выполняется условие
гомоскедастичности:
.
(4.7)
Таким образом, ВМНК включает в себя следующие этапы:
Значения каждой пары наблюдений
делят на известную величину
.
Тем самым наблюдениям с наименьшими
дисперсиями придаются наибольшие
«веса», а с максимальными дисперсиями
– наименьшие «веса». Это увеличивает
вероятность получения более точных
оценок.По методу наименьших квадратов для преобразованных значений
строится уравнение регрессии без
свободного члена с гарантированными
качествами оценок.
2. Дисперсии отклонений неизвестны
Для применения ВМНК необходимо знать фактические значения дисперсий . На практике такие значения известны очень редко. Следовательно, чтобы применить ВМНК, необходимо сделать реалистические предположения о значениях .
-
Может оказаться целесообразным
предположить, что дисперсии
отклонений
пропорциональны значениям
,
что отражено на рисунке 4.3.
Рис. 4.3
В
этом случае
(
–
коэффициент пропорциональности). Тогда
уравнение (4.5) преобразуется делением
его левой и правой части на
:
(4.8)
При
этом для случайных отклонений
выполняется условие гомоскедастичности.
Оценив для (4.8) коэффициенты
и
,
затем возвращаются к исходному уравнению
регрессии (4.5).
Если
в уравнении регрессии присутствуют
несколько объясняющих переменных, можно
поступить следующим образом. Вместо
конкретной объясняющей переменной
используются значения, рассчитанные
по эмпирическому уравнению регрессии:
.
В этом случае получают следующую
регрессию:
(4.9)
-
Можно сделать предположение о том, что
дисперсии
отклонений
пропорциональны значениям
,
что отражено на рисунке 4.4.
Рис. 4.4
В этом случае необходимо преобразовать (4.5) делением на к виду:
.
(4.10)
При
этом для случайных отклонений
выполняется условие гомоскедастичности.
Оценив для (4.10) коэффициенты
и
,
затем возвращаются к исходному уравнению
регрессии (4.5).
Для применения описанных выше методов весьма значимы знания об истинных значениях дисперсий отклонений , либо предположения, какими эти дисперсии могут быть. На практике рекомендуется применять несколько методов определения гетероскедастичности и способов ее корректировки.
Пример. Исследуем зависимость между доходом (Х) домохозяйства и его расходом (Y) на продукты питания. Выборочные данные по 40 домохозяйствам представлены в таблице 4.1.
Таблица 4.1
X |
Y |
|
X |
Y |
|
X |
Y |
|
X |
Y |
25,5 |
14,5 |
|
42,5 |
14,9 |
|
61,0 |
10,9 |
|
79,2 |
19,8 |
26,5 |
11,3 |
|
44,2 |
11,6 |
|
61,7 |
16,1 |
|
81,5 |
21,2 |
27,2 |
14,7 |
|
44,8 |
21,5 |
|
62,5 |
10,5 |
|
82,4 |
29,0 |
29,6 |
10,2 |
|
45,5 |
10,8 |
|
64,7 |
10,6 |
|
82,8 |
17,3 |
35,7 |
13,5 |
|
45,5 |
13,8 |
|
69,7 |
29,0 |
|
83,0 |
23,5 |
38,6 |
9,9 |
|
48,3 |
16,0 |
|
71,2 |
8,2 |
|
85,9 |
22,0 |
39,0 |
12,4 |
|
49,5 |
18,2 |
|
73,8 |
14,3 |
|
86,4 |
18,3 |
39,3 |
8,6 |
|
52,3 |
19,1 |
|
74,7 |
21,8 |
|
86,9 |
13,7 |
40,0 |
10,3 |
|
55,7 |
16,3 |
|
75,8 |
26,1 |
|
88,3 |
14,5 |
41,9 |
13,9 |
|
59,0 |
17,5 |
|
76,9 |
20,0 |
|
89,0 |
27,3 |
Построим эмпирическое уравнение регрессии и проведем анализ модели на наличие гетероскедастичности.
По
(1.11) определим коэффициенты эмпирического
уравнения регрессии:
,
.
Следовательно, уравнение имеет вид:
.
Определим
отклонения
(где
),
,
ранги
и
.
Рассчитанные
величины представим в таблице
4.2.
Таблица 4.2
|
|
|
|
|
|
|
|
|
X |
Y |
|
|
|
Ранг Х |
Ранг (абсол. вел.) |
|
|
25,5 |
14,5 |
11,120 |
3,380 |
11,4244 |
1 |
25 |
-33 |
1089 |
26,5 |
11,3 |
11,280 |
0,020 |
0,0004 |
2 |
1 |
-17 |
289 |
27,2 |
14,7 |
11,392 |
3,308 |
10,9429 |
3 |
23 |
-30 |
900 |
29,6 |
10,2 |
11,776 |
-1,576 |
2,4838 |
4 |
15 |
-11 |
121 |
35,7 |
13,5 |
12,752 |
0,748 |
0,5595 |
5 |
7 |
-19 |
361 |
38,6 |
9,9 |
13,216 |
-3,316 |
10,9959 |
6 |
24 |
-4 |
16 |
39,0 |
12,4 |
13,280 |
-0,880 |
0,7744 |
7 |
9 |
-9 |
81 |
39,3 |
8,6 |
13,328 |
-4,728 |
22,3540 |
8 |
29 |
1 |
1 |
40,0 |
10,3 |
13,440 |
-3,140 |
9,8596 |
9 |
20 |
-2 |
4 |
41,9 |
13,9 |
13,744 |
0,156 |
0,0243 |
10 |
3 |
-11 |
121 |
42,5 |
14,9 |
13,840 |
1,060 |
1,1236 |
11 |
11 |
-15 |
225 |
44,2 |
11,6 |
14,112 |
-2,512 |
6,3101 |
12 |
16 |
-2 |
4 |
44,8 |
21,5 |
14,208 |
7,292 |
53,1733 |
13 |
37 |
-25 |
625 |
45,5 |
10,8 |
14,320 |
-3,520 |
12,3904 |
14 |
26 |
5 |
25 |
45,5 |
13,8 |
14,320 |
-0,520 |
0,2704 |
15 |
5 |
-4 |
16 |
48,3 |
16,0 |
14,768 |
1,232 |
1,5178 |
16 |
14 |
-13 |
169 |
49,5 |
18,2 |
14,960 |
3,240 |
10,4976 |
17 |
22 |
-15 |
225 |
52,3 |
19,1 |
15,408 |
3,692 |
13,6309 |
18 |
27 |
-17 |
289 |
55,7 |
16,3 |
15,952 |
0,348 |
0,1211 |
19 |
4 |
-3 |
9 |
59,0 |
17,5 |
16,480 |
1,020 |
1,0404 |
20 |
10 |
-5 |
25 |
61,0 |
10,9 |
16,800 |
-5,900 |
34,8100 |
21 |
30 |
15 |
225 |
61,7 |
16,1 |
16,912 |
-0,812 |
0,6593 |
22 |
8 |
5 |
25 |
62,5 |
10,5 |
17,040 |
-6,540 |
42,7716 |
23 |
32 |
18 |
324 |
64,7 |
10,6 |
17,392 |
-6,792 |
46,1313 |
24 |
34 |
21 |
441 |
69,7 |
29,0 |
18,192 |
10,808 |
116,8129 |
25 |
40 |
-15 |
225 |
71,2 |
8,2 |
18,432 |
-10,232 |
104,6938 |
26 |
39 |
25 |
625 |
73,8 |
14,3 |
18,848 |
-4,548 |
20,6843 |
27 |
28 |
19 |
361 |
74,7 |
21,8 |
18,992 |
2,808 |
7,8849 |
28 |
18 |
-2 |
4 |
75,8 |
26,1 |
19,168 |
6,932 |
48,0526 |
29 |
35 |
-8 |
64 |
76,9 |
20,0 |
19,344 |
0,656 |
0,4303 |
30 |
6 |
7 |
49 |
79,2 |
19,8 |
19,712 |
0,088 |
0,0077 |
31 |
2 |
11 |
121 |
81,5 |
21,2 |
20,080 |
1,120 |
1,2544 |
32 |
12 |
5 |
25 |
82,4 |
29,0 |
20,224 |
8,776 |
77,0182 |
33 |
38 |
-6 |
36 |
82,8 |
17,3 |
20,288 |
-2,988 |
8,9281 |
34 |
19 |
22 |
484 |
83,0 |
23,5 |
20,320 |
3,180 |
10,1124 |
35 |
21 |
4 |
16 |
85,9 |
22,0 |
20,784 |
1,216 |
1,4787 |
36 |
13 |
8 |
64 |
86,4 |
18,3 |
20,864 |
-2,564 |
6,5741 |
37 |
17 |
24 |
576 |
86,9 |
13,7 |
20,944 |
-7,244 |
52,4755 |
38 |
36 |
36 |
1296 |
8
Продолжение
табл. 4.2 |
14,5 |
21,168 |
-6,668 |
44,4622 |
39 |
33 |
35 |
1225 |
89,0 |
27,3 |
21,280 |
6,020 |
36,2404 |
40 |
31 |
4 |
16 |
П
роанализируем
графически остатки, представив зависимость
от
(рис. 4.5).
Рис. 4.5
Изучая график, можно обнаружить, что с увеличением возрастает разброс значений , что свидетельствует о наличии гетероскедастичности.
Применим для обнаружения гетероскедастичности тест ранговой корреляции Спирмена. Для этого рассчитаем по (4.1) коэффициент ранговой корреляции:
Рассчитаем -статистику:
.
Из
приложения 1 определим критическое
значение
-статистики
для числа степеней свободы
и уровня значимости
:
.
Так как рассчитанное значение
-статистики
превышает критическое, определенное
по приложению 1, то гипотеза об отсутствии
гетероскедастичности отклоняется с
уровнем значимости
.
Проверим гипотезу об отсутствии гетероскедастичности с помощью теста Голдфелда-Квандта. Для этого разобьем ряд на три подвыборки размерности 14, 12, 14.
Определим дисперсии отклонений для первой и третьей подвыборок:
и
.
Определим
значение
-статистики.
.
Из
приложения 2 определим критическое
значение
-статистики
для числа степеней свободы
и уровня значимости
:
.
Так как рассчитанное значение
-статистики
превышает критическое, определенное
по приложению 2, то гипотеза об отсутствии
гетероскедастичности отклоняется с
уровнем значимости
.
Следовательно, по всем трем тестам гетероскедастичность в данной модели присутствует.
