
- •1)Основные причины наличия в регрессионной модели случайного отклонения.
- •2)Основные этапы регрессионного анализа.
- •3)Спецификация модели, каким образом она осуществляется?
- •4)Стандартная ошибка регрессии Sxy.
- •5)Различие между теоретическим и эмпирическим уравнениями регрессии.
- •10)Доверительный интервал для предсказания индивидуальных значений зависимой переменной.
- •11)Каким образом определяется модель множественной линейной регрессии?
- •12)Предпосылки мнк. Каковы последствия их невыполнимости?
- •1°. Математическое ожидание случайного отклонения равно нулю для всех наблюдений:
- •4°. Случайное отклонение должно быть независимо от объясняющих переменных.
- •13)Характеристика коэффициентов уравнения регрессии.
- •14)Суть мнк для построения множественного линейного уравнения регрессии.
- •15)Статистическая значимость коэффициентов регрессии.
- •16)Интервальные оценки коэффициентов регрессии
- •17)Коэффициент детерминации r2. Отличие скорректированного коэффициента детерминации от обычного.
- •18)Анализ статистической значимости коэффициента детерминации r2.
- •19)Как используется f-статистика в регрессионном анализе?(Ответ в предыдущем вопросе)
- •20)Проверка общего качества уравнения регрессию
- •21)Автокорреляцией остатков и ее виды.
- •22)Статистика Дарбина–Уотсона. Формула расчета. Суть показателя.
- •28)Определениие мультиколлинеарности. Признаки наличия мультиколлинеарности.
- •29)Методы проверки наличия мультиколлиниарности. Показатель vif – «фактор инфляции вариации»
- •30)Методы устранения мультиколлинеарности.
- •31)Гетероскедастичность. Последствия гетероскедастичности.
- •32)Методы смягчения гетероскедастичности
- •33)Автокорреляция. Основные причины автокорреляции.
- •34)Последствия автокорреляции. Основные методы обнаружения автокорреляции.
- •35)Спецификация модели
- •36)Основные признаки качественной регрессионной модели.
- •37)Основные виды ошибок спецификации.
- •1. Отбрасывание значимой переменной
- •2. Добавление незначимой переменной
- •38)Обнаружение и корректировка ошибок спецификации
- •39)Проблемы спецификации
- •40)Необходимость использования фиктивных переменных в регрессионных уравнениях
- •41)Использование фиктивных переменных для сезонного анализа
18)Анализ статистической значимости коэффициента детерминации r2.
на практике чаще вместо указанной гипотезы проверяют тесно связанную с ней гипотезу о статистической значимости коэффициента детерминации R2:
Для проверки данной гипотезы используется следующая F-статистика:
(6.38)
Величина
F
при
выполнении предпосылок МНК и при
справедливости
Но
имеет
распределение Фишера, аналогичное
распределению
F-статистики
(6.37). Действительно, разделив числитель
и знаменатель дроби в (6.37) на общую сумму
квадратов отклонений
,
мы
получим формулу
(6.38);
Из
(6.38) очевидно, что показатели F
и
R2
равны
или не равны
нулю одновременно. Если F
= 0,
то R2
=
0, и линия регрессии Y
=
является наилучшей по МНК, и, следовательно,
величина Y
линейно
не зависит от
.
Для
проверки
нулевой гипотезы
при заданном уровне значимости
по таблицам критических точек распределения
Фишера
находится критическое значение
.
Нулевая
гипотеза отклоняется, если Fнабл
> Fкр,
Это
равносильно тому, что
R2
> 0,
т.е. R
статистически
значим.
Анализ статистики F позволяет сделать вывод о том, что для принятия гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии коэффициент детерминации R2 не должен существенно отличаться от нуля. Его критическое значение уменьшается при росте числа наблюдений и может стать сколь угодно малым.
Пусть,
например, при оценке регрессии с двумя
объясняющими переменными
по 30 наблюдениям R2
= 0,65. Тогда Fнабл=
.
По
таблицам критических точек распределения
Фишера найдем .
=3,36;
=
5,49. = 25,07 > Fкр
как при 5% -м, так и при 1%-м
уровне значимости, то нулевая гипотеза
в обоих
случаях
отклоняется.
Если
в той же ситуации
,
то
.
Предположение о незначимости
связи отвергается и здесь.
Отметим,
что в случае парной регрессии проверка
нулевой гипотезы
для F-статистики
равносильна проверке нулевой гипотезы
для t-статистики
коэффициента
корреляции.
В этом случае F-статистика равна квадрату t-статистики. Самостоятельную значимость коэффициент R2 приобретает в случае множественной линейной регрессии.
19)Как используется f-статистика в регрессионном анализе?(Ответ в предыдущем вопросе)
20)Проверка общего качества уравнения регрессию
После проверки значимости каждого коэффициента регресси обычно проверяется общее качество уравнения регресси. Для этой цели, как в случае парной регрессии, используется коэффициент детерминации R, который в общем случае рассчитывается по формуле:
Как
отмечалось, в общем случае
Чем ближе этот коэффициент к единице,
тем больше уравнение регрессии объясняет
поведение У. Поэтому естественно желание
построить регрессию с наибольшим
.
Добавление новой объясняющей переменной никогда не уменьшает значение коэффициента детерминации, т.е. она может лишь дополнить, но никак не сократить информацию, объясняющую поведение зависимой переменной. Это уменьшает (в худшем случае не увеличивает) область неопределенности в поведении У.
Иногда при расчете коэффициента детерминации для получения несмещенных оценок в числителе и знаменателе вычитаемой из единицы дроби делается поправка на число степеней свободы. Вводится так называемый скорректированный (исправленный) коэффициент детерминации:
Коэффициент детерминации увеличивается при добавлении новой объясняющей переменной тогда и только тогда, когда t-статистика для этой переменной по модулю больше единицы. Поэтому добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Обычно проводятся данные как по КД, так и по СКД, являющиеся суммарными мерами общего качества уравнения регрессии. Но не следует абсолютизировать значимость КД. Существует достаточно примеров неправильно специфицированных моделей, имеющих высокие КД, поэтому КД в настоящее время рассматривается лишь как один из ряда показателей, который нужно проанализировать, чтобы уточнить насколько хорошо нами были подобраны факторы для строящейся модели.