
- •2. Линейная парная регрессия
- •3. Основные предпосылки регрессионной модели
- •4. Точность уравнения линейной регрессии
- •5. Оценка значимости уравнения регрессии
- •6. Нелинейная регрессия
- •7. Множественная линейная регрессия
- •8. Оценка значимости отдельных факторов множественной регрессии
- •9. Фиктивные переменные в множественной регрессии
- •10. Системы эконометрических уравнений
- •11. Косвенный метод наименьших квадратов
- •12. Временные ряды. Общие понятия
- •13. Методы выделения тенденции временного ряда. Кривые роста.
- •14. Выделение циклической составляющей временного ряда
- •15. Экспоненциальное сглаживание
- •16. Выявление структурных изменений временного ряда
- •17. Оценка соблюдения условий применимости мнк
- •19. Взвешенный и обобщенный мнк
- •21. Оценка взаимосвязи двух временных рядов
- •22. Динамические эконометрические модели
17. Оценка соблюдения условий применимости мнк
В моделях ВР, а также ранее рассмотренных регрессионных моделях присутствуют случайные составляющие ε. Лишь при наличии определенных свойств этой составляющей оценки параметров моделей являются несмещенными, эффективными и состоятельными (см. раздел 3). Исследовать свойства случайной составляющей становится возможным только после построения модели. Эти исследования заключаются в проверке:
Е[ε] = 0, т.е. нулевого значении среднего случайной величины ε;
независимости ε от величины результирующего признака Y;
независимости ε от времени t или факторов xi, i=1,2,..p. (гомоскедастичность);
отсутствие автокорреляции остатков.
В принципе еще требуется проверка на нормальность закона распределения СВ ε, но ее, как правило, не проводят, ввиду малосущественности последствий несоблюдения этого. Обычно предварительную проверку осуществляют визуально по графикам соответствующих зависимостей. По расположению значений εi в горизонтальной полосе на рисунке 17.1 и их «симметрии» относительно оси абцисс можно предположить о соблюдении первых двух условий в данном случае. Впрочем, можно воспользоваться формальной процедурой оценки значимости отличия от нуля коэффициентов
Рис.17.1. «Правильное» поведение Рис. 17.2. Увеличение ошибки с ростом фактора
остатков регрессионной модели ε = b0 + b1 Y. Если интервалы возможных значений, построенных с помощью критерия Стьюдента, для b0 и b1, будут содержать ноль, условия соблюдены.
Проверка по п.3 производится аналогично, но по оси абсцисс откладываются факторы или время. Визуальная оценка не очень надежна, в связи с чем разработан ряд формальных процедур для выявления гетероскедастичности. Например, тесты Уайта, Голдфельда-Квандта. В последнем исходные данные объемом n упорядочиваются по величине фактора, от которого предположительно зависит величина ошибки, причем зависимость эта носит монотонный характер. Далее выборка разделяется на три непересекающихся части, обычно одинаковые по объему m, т.е. 3m = n. Формулируется гипотеза о равенстве дисперсий ошибок в первой и последней частях выборки. Если критериальная статистика
окажется больше α-квантиля стандартного F-распределения с (m-p) степенями свободы, где р – число параметров регрессии, оцениваемые по выборке, то гипотеза отклоняется и тем самым признается наличие гетероскедастичности.
В таблице 17.1 приведены данные по фонду оплаты труда в зависимости от числа работающих на предприятии. Линейная регрессионная модель, найденная с помощью обычного МНК, имеет вид
Y = -0,314 + 1,11x
и показана на рисунке 17.2 сплошной линией. Там же нанесены в виде точек исходные значения результирующего признака. Визуально просматривается увеличение величины отклонений последнего от линии регрессии по мере увеличения значения фактора.
Табл.17.1
№ п/п |
Число работ. x |
ФОТ тыс.$ y |
Y |
ε |
1 |
3 |
4.4 |
2.787 |
-1.61 |
2 |
6 |
8.1 |
6.123 |
-1.98 |
3 |
8 |
12.9 |
8.346 |
-4.55 |
4 |
18 |
20.8 |
19.46 |
-1.34 |
5 |
20 |
15.5 |
21.69 |
6.188 |
6 |
23 |
28.8 |
25.02 |
-3.78 |
7 |
39 |
37.5 |
42.81 |
5.313 |
8 |
49 |
48.7 |
53.93 |
5.232 |
9 |
60 |
68.8 |
66.16 |
-2.64 |
10 |
74 |
104.6 |
81.73 |
-22.9 |
11 |
79 |
90.5 |
87.29 |
-3.21 |
12 |
95 |
88.3 |
105.1 |
16.78 |
13 |
106 |
132.4 |
117.3 |
-15.1 |
14 |
112 |
122 |
124 |
1.978 |
15 |
115 |
99.1 |
127.3 |
28.21 |
16 |
125 |
114.2 |
138.4 |
24.23 |
17 |
132 |
150.6 |
146.2 |
-4.39 |
18 |
149 |
156.1 |
165.1 |
9.016 |
19 |
157 |
209.5 |
174 |
-35.5 |

Тогда модель парной линейной регрессии принимает вид
yi
= B0 +B1
хi +
ε
(17.1)
Разделив исходные значения уi,
xi
на
,
получаем новое уравнение регрессии
,
Остаточная сумма квадратов (ОСК) приобретает вид
,
т.е. каждое слагаемое имеет, как говорят
математики, свой вес. Соответственно
МНК получает приставку взвешенный.
Наиболее важные аспекты взвешенного
МНК обсуждаются в следующем разделе.
В реальных моделях коэффициенты Ki
привязывают к величине какого либо
фактора. В рассматриваемом примере
можно предположить Ki
= x 2.
Тогда регрессия становится нелинейной
,
но с остатками отвечающими требованиям МНК.
Для проверки отсутствия автокорреляции остатков разработан ряд тестов, среди которых наибольшую известность получил критерий Дарбина – Уотсона. Он определяется как
По величине объема выборки определяются три смежных интервала на числовой оси. В зависимости от того, в какой из этих интервалов попадает значение DW, делается вывод об отсутствии автокорреляции либо о наличии таковой, причем с указанием знака. Фактически он использует проверку значимости отличия от нуля коэффициента корреляции 1-го порядка. Более эффективным представляется тест Бреуша – Годфри, где исследуется значимость параметров регрессии
Et = b1εt-1 + b2εt-2 + ... (17.2)
Например, дан временной ряд курса ценной бумаги за 8 недель
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
yt |
213 |
171 |
291 |
309 |
317 |
362 |
351 |
361 |
Yt |
207 |
232 |
258 |
284 |
310 |
335 |
361 |
387 |
εt |
6 |
-61 |
33 |
25 |
7 |
27 |
-10 |
-26 |
Линейная тенденция получился в виде Yt = 181,3 + 25,7 t. Регрессия остатков (17.2) до 3-го лага включительно Et = 0,56 εt-1 – 0,12 εt-2 – 0,01 εt-3. Проверка значимости по частному критерию Фишера показала значимость b1 = 0,56 и незначимость остальных коэффициентов. Следовательно, имеет место автокорреляция остатков 1-го порядка и полученное уравнение для тенденции ненадежно! Оценка параметров модели при наличии автокорреляции остатков изложены в следующем разделе 20.