- •Предмет эконометрики
- •Этапы эконометрического анализа
- •Классификация эконометрических моделей
- •Информационная база эконометриики
- •Обработка информационных данных
- •Модель линейной регрессии
- •Подбор параметров прямой регрессии по методу наименьших квадратов (мнк)
- •Свойства линейной регрессии
- •Проверка линейной регрессии на адекватность
- •Коэффициент детерминации.
- •Проверка с помощью критерия Фишера.
- •Прогноз на основании линейной регрессии Понятие о доверительном интервале
- •Алгоритм нахождения полуширины доверительного интервала.
- •Многофакторная регрессия
- •Анализ факторов на мультиколлинеарность
- •Последствия мультиколлинеарности
- •Нахождение регрессионной модели
- •Прогноз на основании линейной модели
- •Матричная запись многофакторной регрессии
- •Нелинейная модель
- •Алгоритм решения нелинейных экономических задач
- •Понятие об эластичности экономических моделей
- •Коэффициент эластичности для многомерных моделей.
Свойства линейной регрессии
1. Видно, что прямая
регрессии всегда проходит через центр
рассеивания корреляционного поля, т.е.
через точку (
).
2. Из выражения
следует, что угловой коэффициент b1
выражается через коэффициент корреляции
rxy и среднее квадратичное отклонение
фактора и отклика, т.е. знак b1
совпадает со знаком коэффициента
корреляции (т.к.
всегда).
Если rxy>0, то b1>0, связь между х и у – прямая, т.е. с ростом х у возрастает.
Если rxy<0, то b1<0, связь между х и у обратная.
Проверка линейной регрессии на адекватность
После того, как была построена модель линейной регрессии y=b0+b1x, необходимо проверить ее на адекватность, т.е. проверить, соответствует ли построенная модель действительности.
Прежде,
чем рассматривать адекватность модели,
рассмотрим вариацию (разброс) зависимого
показателя Y вокруг своего среднего
значения. Отклонение равно
.
При этом можно без изменения формулы
записать:
,
где
- расчетные значения. Т.е. вариацию
зависимого показателя Y вокруг своего
среднего значения можно разделить на
два слагаемых:
- вариация расчетных значений вокруг
среднего;
- вариация расчетных значений вокруг
фактичных.
Обозначим:
,
с числом степеней свободы
- вариация, объясняемая регрессией.
,
с числом степеней свободы
- остатки, необъясненный разброс.
,
с числом степеней свободы
- общая вариация.
Тогда
можно записать:
Коэффициент детерминации.
Для
анализа общего качества оцененной
линейной регрессии обычно используют
коэффициент детерминации:
,
.
.В числителе стоит сумма квадратов отклонений линии регрессии от среднего значения, в знаменателе – сумма квадратов отклонений исходных данных от среднего значения. Значит, чем меньше разница между этими величинами, тем больше дробь, тем ближе значение коэффициента детерминации к 1.
Величина
показывает, на сколько процентов (
)
разброс данных объясняется линейной
регрессией, а какая
– случайными ошибками.
Использование в качестве меры адекватности не дает четких критериев проверки на адекватность, особенно для выборок малых объемов.
Проверка с помощью критерия Фишера.
Выдвигаем гипотезу,
что b1=0. Т.е. уравнение регрессии
будет иметь вид
.
Для проверки этой гипотезы сравниваются между собой величины:
и
.
Т.е.
вычисляем дисперсию остатков
и дисперсию расчетных данных
,
взятых с регрессионной прямой.
Вычисляем k1, k2 – количество степеней свободы для статистик MSR и MSE. Число степеней свободы k1 равно числу независимых факторов в модели, k2=n- k1-1 (n- объем выборки).
Отношение введенных
величин представляет собой наблюдаемое
значение критерия Фишера со степенями
свободы k1, k2.
.
Переход от случая, когда мы можем признать Fнабл.=0, а следовательно b1=0 и зависимость у от х отсутствует, к случаю, когда следует признать Fнабл.0 b10 есть зависимость у от х, производят, сравнивая Fнабл с теоретически вычисленным критическим значением для критерия Фишера Fкр.
Рассчитывают точку Fкр, при некотором уровне значимости и степенями свободы k1, k2. Уровень значимости – вероятность совершить ошибку.
Итак, сравним Fнабл. с Fкр. и обнаружим, что Fнабл< Fкр. - делаем заключение b1=0 у от х не зависит линейная регрессия неадекватна.
Если же Fнабл. > Fкр, то гипотеза Н0 отвергается, значит b10 у зависит от х линейная регрессия адекватна (с гарантией (1-)100%).
Иногда в ППП одновременно с вычислением наблюдаемого значения критерия, вычисляется его значимось , т.е. вероятность совершить ошибку. Если это значение переобразовать в проценты, (100%), и полученное значение меньше 5%, то модель считается адекватной.
