
- •3.Анализ качества эконометрической модели
- •А. Статистическая составляющая анализа качества модели
- •1. Ошибки являются случайными величинами.
- •2. Математическое ожидание случайных величин равно нулю для всех I.
- •3. Дисперсия случайных величин одинакова для всех I.
- •4. Значения случайных величин статистически независимы между собой.
- •5. Значения случайной величины и значения переменной независимы между собой.
- •6. Регрессионная модель специфицирована правильно.
- •7. Случайные величины распределены нормально с нулевым математическим ожиданием и постоянной дисперсией .
- •Б. Содержательная составляющая анализа качества модели
- •4.Прогнозирование по моделям парной линейной регрессии
- •5.Модель множественной регрессии
- •6.Множественная линейная регрессия
- •7.Направления совершенствования линейной регрессионной модели
- •8.Эконометрический метод
7. Случайные величины распределены нормально с нулевым математическим ожиданием и постоянной дисперсией .
Свойства оценок (несмещенность, состоятельность и эффективность) не зависят от конкретного вида распределения величин . Тем не менее, обычно предполагается, что они распределены нормально. Эта предпосылка необходима:
для проверки статистической значимости сделанных оценок;
для построения доверительных интервалов для параметров и для зависимой переменной Y.
Дело в том, что t-статистики распределены по закону Стьюдента, если выборка взята из генеральной совокупности с нормальным распределением ошибок.
Выводы.
Итак, приступая к оценке линейного уравнения регрессии с двумя переменными, мы предполагаем, что реальная взаимосвязь переменных линейна, а отклонения от регрессионной прямой случайны, независимы между собой и имеют нулевое среднее значение и постоянную дисперсию. Если это не так, то наш анализ статистической значимости МНК-оценок параметров регрессии неточен, а сами МНК-оценки этих параметров не обладают такими желательными свойствами, как несмещенность, состоятельность и эффективность.
Попытаемся ответить на вопрос, в каких случаях остатки регрессии (остатки регрессии – это наблюдаемые значения ошибок ) не обладают предполагавшимися свойствами.
Мы видим, например, на рис.3.5, что в этом случае отклонения от линии регрессии (1) не случайно распределены вокруг нее, а обладают определенной закономерностью. Эта закономерность, в частности, выражается в одинаковом, как правило, знаке каждых двух соседних отклонений. Это может являться:
следствием нелинейного характера связи переменных;
воздействием какого-то фактора, не включенного в уравнение регрессии. Величина такого неучтенного фактора может менять свою динамику в рассматриваемый период, отклоняясь в достаточно длительные промежутки времени в ту или иную сторону от своего среднего значения. Это, очевидно, может служить причиной длительных устойчивых отклонений зависимой переменной от линии регрессии.
Обе указанные причины свидетельствуют о том, что существует возможность улучшить уравнение регрессии путем оценивания какой-то новой нелинейной формулы или включения некоторой новой объясняющей переменной.
Б. Содержательная составляющая анализа качества модели
Под содержательной составляющей анализа качества понимается рассмотрение экономического смысла оцененного уравнения регрессии:
действительно ли значимыми оказались объясняющие переменные, важные с точки зрения теории;
положительны или отрицательны оценки параметров, показывающие направление воздействия этих объясняющих переменных;
попали ли оценки параметров регрессии в предполагаемые из теоретических соображений интервалы.
Например, в модели
Кейнса, описывающей зависимость частного
потребления “С” от располагаемого
дохода “
”
(поговорка: «Каков приход – таков
расход»):
,
предполагается, что
величина автономного потребления
;
предельная склонность к потреблению
и
.
4.Прогнозирование по моделям парной линейной регрессии
Пусть мы построили выборочную линейную регрессионную модель с двумя переменными и оценили параметры методом наименьших квадратов. Если наша модель адекватна, то мы можем находить прогнозные значения зависимой переменной Y исходя из построенной выборочной модели. При этом мы можем получить два типа прогнозов: точечные и интервальные (рис.3.6).
Точечный прогноз
– это оценка истинного отдельного
значения зависимой переменной
для прогнозного значения
по построенной выборочной модели:
. (3.13)
Точечный прогноз дает значение зависимой переменной для соответствующего значения объясняющей переменной по построенной выборочной модели.
Рис.3.6. Графическая интерпретация точечного и интервального прогноза по модели парной линейной регрессии
При этом истинное
значение
для прогнозного значения
будет равно
, (3.14)
где
-
ненаблюдаемое значение случайной
величины в (n+1) периоде.
Истинное значение
Y мы найти не можем, а можем лишь
оценить его с помощью прогноза. Поэтому
прогнозное значение
является оценкой истинного отдельного
значения
.
Таким образом, по нашей выборочной модели мы легко можем находить прогнозное значение зависимой переменной. Уточним, что такое прогнозное значение будет точечным.
Исходя из полученного точечного прогноза, мы можем построить доверительный интервал для истинного отдельного значения зависимой переменной, т.е. построить интервал, в который с определенной заданной вероятностью попадает действительное значение зависимой переменной. Такой доверительный интервал при заданном уровне возможной ошибки ·100% для будет находиться по формуле
(3.15)
где
;
-
оценка стандартной ошибки оценивания;
n - количество наблюдений в выборке;
-
прогнозное значение Х;
-
наблюдаемые значения Х;
-
среднее по выборке значение Х.
Таким образом, формула (3.15) дает нам доверительный интервал для истинного отдельного значения зависимой переменной.
Интервальный прогноз – это доверительный интервал для истинного отдельного прогнозного значения зависимой переменной при заданном уровне возможной ошибки ·100%.
Как видно из (3.15),
доверительный интервал прогноза
минимальный при
и увеличивается нелинейно по мере того,
как
удаляется от своего среднего по выборке
значения
.
Считается, что период прогнозирования должен быть по крайней мере в 3 раза короче, чем тот период, для которого было оценено уравнение регрессии.
На практике более важным является построение доверительного интервала для математического ожидания , т.е. построение доверительного интервала для
, (3.16)
т.к., собственно говоря, нет большого смысла прогнозировать точное значение , учитывая случайный характер .
В этом случае
формула (3.15) несколько модифицируется
и доверительный интервал для
при ·100%
уровне возможной ошибки имеет вид:
(3.17)