
- •3.Анализ качества эконометрической модели
- •А. Статистическая составляющая анализа качества модели
- •1. Ошибки являются случайными величинами.
- •2. Математическое ожидание случайных величин равно нулю для всех I.
- •3. Дисперсия случайных величин одинакова для всех I.
- •4. Значения случайных величин статистически независимы между собой.
- •5. Значения случайной величины и значения переменной независимы между собой.
- •6. Регрессионная модель специфицирована правильно.
- •7. Случайные величины распределены нормально с нулевым математическим ожиданием и постоянной дисперсией .
- •Б. Содержательная составляющая анализа качества модели
- •4.Прогнозирование по моделям парной линейной регрессии
- •5.Модель множественной регрессии
- •6.Множественная линейная регрессия
- •7.Направления совершенствования линейной регрессионной модели
- •8.Эконометрический метод
4. Значения случайных величин статистически независимы между собой.
Это гипотеза о некоррелированности ошибок для разных наблюдений.
Предположение 4
утверждает, что любое i-тое значение
случайной величины
не влияет на любое j-тое значение
(ij), иначе
говоря, корреляция между
и
(ij)
отсутствует.
В случае, когда это условие не выполняется, говорят об автокорреляции остатков регрессии, а полученная формула регрессии считается обычно неудовлетворительной.
Это условие часто нарушается, когда наши данные являются временными рядами.
Предположение 4 дает возможность изучать систематическое влияние (если оно есть) Х на Y без учета влияния других факторов, выраженных случайной величиной . Если это не так, то мы будем иметь более сложную зависимость.
Проиллюстрируем
на простом примере, что происходит в
случае нарушения предположения 4.
Предположим, что в регрессионной модели
случайные величины
и
имеют
положительную корреляцию. Тогда
будет зависеть не только от
,
но и от
,
поскольку значение
некоторым образом определяет величину
.
Статистическая независимость ошибок между собой является одним из основных предполагаемых свойств ошибок. При этом проверяется обычно их некоррелированность (являющаяся необходимым, но недостаточным атрибутом независимости), причем некоррелированность не любых, а соседних величин.
Некоррелированность отклонений от линии регрессии позволяет проверить DW-статистика (статистика Дарбина-Уотсона).
5. Значения случайной величины и значения переменной независимы между собой.
Это условие предполагает отсутствие корреляции между случайной величиной и объясняющей переменной Х. В противном случае Х изменяется с изменением и сложно проследить влияние Х на Y.
6. Регрессионная модель специфицирована правильно.
Как отмечалось ранее, эконометрическое исследование начинается со спецификации модели, которая должна быть адекватной изучаемому экономическому процессу. Ранее также отмечалось, что спецификация модели – это наше представление о механизме зависимости переменных (например, от ) и сам выбор объясняющей переменной Х. Теперь уточним вопросы, решаемые при спецификации модели.
При спецификации модели возникает несколько важных вопросов, а именно:
какие переменные необходимо включать в модель;
какова функциональная форма связи переменных модели;
является ли модель линейной по параметрам и по переменным, или нет;
какие возможные предположения относительно , и можно сделать в модели?
Это чрезвычайно важные вопросы, т.к., например, исключая из модели важные переменные, или выбирая неправильную функциональную форму связи, или делая неправильные предположения относительно переменных модели, мы ставим под сомнение правильность интерпретации оцененной регрессии.
Чтобы дать представление о важности предположения 6, представим, что для массива наблюдений, изображенного на рис.3.5, мы можем выбрать две разные модели, отражающие связь между Y и X:
; (3.11)
. (3.12)
Регрессионная модель (3.11) является линейной и по параметрам и по переменным, в то время как модель (3.12) является линейной по параметрам (т.е. моделью линейной регрессии по нашему определению), но нелинейной по переменной Х.
Рис.3.5. Линейная и нелинейная модели
Если в действительности
«правильной» является модель (3.12), а мы
выбрали модель (3.11), то, как показано на
рис.3.5, модель (3.11) даст неправильное
представление об Y по значениям Х:
между точками А и В для любого
модель (3.11) будет переоценивать
действительное математическое ожидание
Y, и в тоже время будет недооценивать
математическое ожидание Y слева от
А и справа от В).
Этот условный пример является образцом того, что называется неправильной спецификацией, или ошибкой спецификации, которая заключается в выборе неправильной функциональной формы связи: на рис.3.5 реальная взаимосвязь величин Х и Y описывается нелинейной функцией (2), и какую бы мы ни провели прямую линию (например, 1), отклонения точек наблюдений от нее будут существенными и неслучайными.