- •Эконометрика Конспект лекций для студентов Содержание
- •Раздел 1. Основы регрессионного анализа 3
- •Раздел 2. Множественная регрессия 16
- •Раздел 1. Основы регрессионного анализа
- •1.1. Предмет и цель исследований эконометрики. Основные понятия
- •1.1.1. Сущность и история возникновения эконометрики
- •1.1.2. Основные понятия эконометрики
- •1.1.3. Эконометрические модели
- •1.1.4. Парная линейная регрессия
- •1.2. Оценка параметров парной линейной регрессии. Метод наименьших квадратов (мнк).
- •1.2.1. Мнк для парной линейной регрессии
- •1.2.2. Условия Гаусса-Маркова (предпосылки мнк)
- •Теорема Гаусса-Маркова.
- •1.2.3. Коэффициенты корреляции и детерминации
- •1.3. Оценка существенности уравнения регрессии и его параметров. Прогнозирование в линейной регрессии
- •1.3.1. Оценка значимости по критериям Фишера и Стьюдента
- •1.3.2. Прогнозирование в линейной регрессии
- •1.3.3. Ошибки аппроксимации
- •Раздел 2. Множественная регрессия
- •2.1. Отбор факторов и выбор формы уравнения множественной регрессии
- •2.1.1. Требования к отбору факторов
- •2.1.2. Фиктивные переменные
- •2.1.3. Ошибки спецификации
- •2.2. Традиционный метод наименьших квадратов для множественной регрессии. Частная и множественная корреляция
- •2.2.1. Мнк для множественной регрессии
- •2.2.2. Частные уравнения, частная корреляция
- •2.2.3. Коэффициенты множественной корреляции и детерминации
- •2.2.4. Оценка значимости уравнения множественной регрессии
- •2.3. Нелинейная регрессия. Линеаризация нелинейной регрессии
- •2.3.1. Виды нелинейной регрессии
- •2.3.2. Линеаризация
- •2.3.3. Критерий Чоу
- •2.3.4. Метод наименьших квадратов для нелинейных регрессионных моделей
- •2.3.5. Корреляция для нелинейной регрессии. Коэффициенты эластичности
- •2.3.6. Оценка существенности нелинейной регрессии
1.3. Оценка существенности уравнения регрессии и его параметров. Прогнозирование в линейной регрессии
1.3.1. Оценка значимости по критериям Фишера и Стьюдента
После выбора уравнения линейной регрессии и оценки его параметров проводится оценка статистической значимости как уравнения в целом, так и отдельных его параметров.
Оценка значимости уравнения регрессии в целом осуществляется с помощью критерия Фишера, который называют также F-критерием. При этом выдвигается нулевая гипотеза (Н0): коэффициент регрессии равен нулю (b = 0), следовательно, фактор х не оказывает влияния на результат у и линия регрессии параллельна оси абсцисс.
Перед тем как приступить к расчету критерия Фишера, проведем анализ дисперсии. Общую сумму квадратов отклонений у от можно разложить на сумму квадратов отклонений, объясненную регрессией и сумму квадратов отклонений, не объясненную регрессией:
где Σ(y - )2 - общая сумма квадратов отклонений значений результата от среднего по выборке; Σ(yx - )2 - сумма квадратов отклонений, объясненная регрессией; Σ(y - ух)2 - сумма квадратов отклонений, не объясненная регрессией, или остаточная сумма квадратов отклонений.
Общая сумма квадратов отклонений результативного признака у от среднего значения определяется влиянием различных причин. Условно всю совокупность причин можно разделить на две группы: изучаемый фактор х и прочие, случайные и не включаемые в модель факторы. Если фактор х не оказывает влияния на результат, то линия регрессии на графике параллельна оси абсцисс и = yх. Тогда вся дисперсия результативного признака обусловлена воздействием прочих факторов и общая сумма квадратов отклонений совпадает с остаточной:
Σ(y - )2 = Σ(y - ух)2,
Если же прочие факторы не влияют на результат, то у связан с х функционально и остаточная сумма квадратов равна нулю. В этом случае сумма квадратов отклонений, объясненная регрессией, совпадает с общей суммой квадратов:
Σ(y - )2 = Σ(yx - )2
Поскольку не все точки поля корреляции лежат на линии регрессии, то всегда имеет место их разброс, обусловленный как влиянием фактора х, (регрессией у по х), так и действием прочих причин (необъясненная вариация). Пригодность линии регрессии для прогноза зависит от того, какая часть общей вариации признака у приходится на объясненную вариацию. Очевидно, что если сумма квадратов отклонений, обусловленная регрессией, будет больше остаточной суммы квадратов, то уравнение регрессии статистически значимо и фактор х оказывает существенное воздействие на результат у. Это равносильно тому, что коэффициент детерминации R2 будет приближаться к единице.
Любая сумма квадратов отклонений связана с числом степеней свободы df, т.е. с числом свободы независимого варьирования признака.
Для общей суммы квадратов Σ(y - )2 требуется (п-1) независимых отклонений, ибо в совокупности из п единиц после расчета среднего уровня свободно варьируют лишь (п-1) число отклонений.
При заданном наборе переменных у и х расчетное значение ух является в линейной регрессии функцией только одного параметра - коэффициента регрессии b. Таким образом, факторная сумма квадратов отклонений имеет число степеней свободы, равное единице. Число степеней свободы остаточной суммы квадратов при линейной регрессии составляет (п-2).
Существует равенство между числами степеней свободы общей, факторной и остаточной сумм квадратов. Запишем два равенства:
Σ(y - )2 = Σ(yx - )2 + Σ(y - ух)2,
n – 1 = 1 + (n – 2)
Разделив каждую сумму квадратов на соответствующее ей число степеней свободы, получим дисперсии на одну степень свободы:
Так как эти дисперсии рассчитаны на одну степень свободы, их можно сравнивать между собой. Критерий Фишера позволяет проверить нулевую гипотезу Н0 о том, что факторная и остаточная дисперсии на одну степень свободы равны между собой (Dфакт=Dост). Критерий Фишера рассчитывается по следующей формуле:
Если гипотеза Н0 подтверждается, то факторная и остаточная дисперсии одинаковы, и уравнение регрессии незначимо. Чтобы отвергнуть нулевую гипотезу и подтвердить значимость уравнения регрессии в целом, факторная дисперсия на одну степень свободы должна превышать остаточную дисперсию на одну степень свободы в несколько раз. Существуют специальные таблицы критических значений Фишера при различных уровнях надежности и степенях свободы. В них содержатся максимальные значения отношений дисперсий, при которых нулевая гипотеза подтверждается. Значение критерия Фишера для конкретного случая сравнивается с табличным, и на основе этого гипотеза Н0 принимается или отвергается.
Если Fфакт > Fтабл , тогда гипотеза Н0 отклоняется и делается вывод, что связь между у и х существенна и уравнение регрессии статистически значимо. Если Fфакт ≤ Fтабл , тогда гипотеза Н0 принимается и делается вывод, что уравнение регрессии статистически незначимо, так как существует риск (при заданном уровне надежности) сделать неправильный вывод о наличии связи между х и у.
Между критерием Фишера и коэффициентом детерминации существует связь, которая выражается следующей формулой для парной линейной регрессии:
В линейной регрессии часто оценивается не только значимость уравнения регрессии в целом, но и значимость его отдельных параметров, а также коэффициента корреляции.
Для того чтобы осуществить такую оценку, необходимо для всех параметров рассчитывать стандартные ошибки (та , тb , тr):
Теперь нужно рассчитать критерии Стьюдента ta, tb, tr·. Для параметров а, b и коэффициента корреляции r критерий Стьюдента определяет соотношение между самим параметром и его ошибкой:
Фактические значения критерия Стьюдента сравниваются с табличными при определенном уровне надежности α и числе степеней свободы df= (п-2). По результатам этого сравнения принимаются или отвергаются нулевые гипотезы о несущественности параметров или коэффициента корреляции. Если фактическое значение критерия Стьюдента по модулю больше табличного, тогда гипотеза о несущественности отвергается. Подтверждение существенности коэффициента регрессии равнозначно подтверждению существенности уравнения регрессии в целом.
В парной линейной регрессии между критерием Фишера, критериями Стьюдента коэффициентов регрессии и корреляции существует связь.
F = tb2 = tr2
На основании полученной связи можно сделать вывод, что статистическая незначимость коэффициента регрессии или коэффициента корреляции влечет за собой незначимость уравнения регрессии в целом, либо, наоборот, незначимость уравнения регрессии подразумевает несущественность указанных коэффициентов.
На основе стандартных ошибок параметров и табличных значений критерия Стьюдента можно рассчитать доверительные интервалы:
γa = a ± Δa
γb = b ± Δb
где Δa = tтабл·та - предельная ошибка параметра а; Δb = tтабл·тb - предельная ошибка коэффициента регрессии b.
Поскольку коэффициент регрессии имеет четкую экономическую интерпретацию, то доверительные границы интервала для него не должны содержать противоречивых результатов. Например, такая запись, как -5≤ b ≤ 10, указывает, что истинное значение коэффициента регрессии одновременно содержит положительные и отрицательные величины и даже нуль, а этого не может быть. Следовательно, связь между данными нельзя выразить такой моделью (в частности, парной линейной регрессией), должна подбираться другая модель.
