- •Тема 3. Прогноз. Сравнение моделей Точечный и интервальный прогноз
- •Отбор множества объясняющих переменных
- •Проблема мультиколлинеарности факторов в регрессионных моделях
- •Показатели силы связи для множественной регрессии
- •Фиктивные переменные
- •Скорректированный коэффициент детерминации как критерий выбора модели
Тема 3. Прогноз. Сравнение моделей Точечный и интервальный прогноз
Как оценить значение зависимой переменной у для некоторого значения объясняющей переменной (регрессора)?
Точечный прогноз заключается в получении
прогнозного значения
,
которое определяется путем подстановки
в уравнение регрессии
соответствующего прогнозного
значения X*:
.
Вероятность реализации точечного прогноза практически равна нулю, поэтому рассчитывается доверительный интервал прогноза с большей надежностью.
Интервальный прогноз заключается в построении доверительного интервала прогноза, т.е. нижней и верхней – минимально и максимально возможных границ интервала, содержащего точную величину для прогнозного значения с заданной вероятностью, т.е.:
уmin < < уmax.
Доверительные интервалы прогноза определяются по следующим формулам:
,
где
–
стандартная ошибка предсказаний для
парной регрессии.
Так как коэффициент регрессии в эконометрических исследованиях имеет четкую экономическую интерпретацию, то доверительные границы интервала для коэффициента регрессии не должны содержать противоречивых результатов, например, -10b40 – такого рода запись указывает на то, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже ноль, чего быть не может. Тогда параметр принимается равным нулю.
Отбор множества объясняющих переменных
Если неявно предполагается, что обуславливающее множество регрессоров модели не исчерпывается теми, что уже включены в модель, то возможно, что множество объясняющих переменных специфицировано неправильно. Это означает, что исключенные переменные существенны, т.е. имеют в теоретической модели ненулевые регрессионные коэффициенты. Возникают два вопроса: что случится, если из модели исключена существенная переменная, и что случится, что в модель включена несущественная переменная?
Включение в уравнение множественной регрессии того или иного набора факторов связано, прежде всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями.
Факторы, включаемые в регрессионную модель, должны отвечать следующим требованиям:
1) должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность;
2) не должны быть интеркоррелированы и
тем более находиться в точной функциональной
связи друг с другом. Включение в модель
факторов с высокой интеркорреляцией,
когда
для
зависимости
может привести к нежелательным
последствиям – оценки коэффициентов
могут оказаться ненадежными.
Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный признак и параметры уравнения регрессии оказываются неинтерпретируемыми.
Включаемые в регрессионную модель
факторы должны объяснить вариацию
независимой переменной. Если строится
модель с набором р факторов, то для
нее рассчитывается показатель детерминации
,
который фиксирует долю объясненной
вариации результативного признака за
счет рассматриваемых в регрессии р
факторов. Влияние других не учтенных
в модели факторов оценивается как 1–
с соответствующей остаточной дисперсией.
При дополнительном включении в регрессию
р+1 фактора коэффициент детерминации
должен возрастать, а остаточная дисперсия
– уменьшаться.
Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним.
Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметров регрессии по t-критерию Стьюдента.
Отбор факторов обычно осуществляется в две стадии:
1) факторы подбираются исходя из сущности проблемы;
2) на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.
Коэффициенты интеркорреляции позволяют
исключать из модели дублирующие факторы.
Считается, что две переменные коллинеарны,
т.е. находятся между собой в линейной
зависимости, если
,
значит один из них следует исключить.
Предпочтение отдается не фактору, более
тесно связанному с результатом, а тому
фактору, который при достаточно тесной
связи с результатом имеет наименьшую
тесноту связи с другими факторами.
Вопрос включения несущественных переменных менее проблематичен, так как в подобном случае будет оцениваться нулевой вектор оценок.
Таким образом, включение в модель насколько возможно большого числа переменных не является хорошей стратегией, в то время как включение слишком малого числа переменных приводит к возможному смещению оценок.
