
- •Эконометрическая модель.
- •Измерения в экономике. Шкалы измерений.
- •Случайные события и случайные переменные. Распределение случайных величин.
- •Статистические характеристики случайных величин и их свойства.
- •Основные функции распределения.
- •Оценки статистических характеристик и их желательные свойства. (нету)
- •Проверка статистических гипотез.
- •Критерий и критическая область.
- •Мощность статистического критерия. Уровень значимости.
- •Модель линейной регрессии.
- •Свойства оценок параметров, полученных методом наименьших квадратов. Условия Гаусса – Маркова.
- •Коэффициент детерминации и его свойства.
- •Предположение о нормальном распределении случайной ошибки в рамках классической линейной регрессии и его следствия.
- •Прогнозирование по регрессионной модели и его точность. Доверительные и интервалы прогноза (с лекции)
- •Ковариационная матрица оценок коэффициентов регрессии.
- •19. Проверка значимости коэффициентов и адекватности регрессии для множественной линейной регрессионной модели.
- •20. Коэффициент множественной детерминации. Скорректированный коэффициент детерминации.
- •21. Проблемы спецификации регрессионной модели. Пошаговая регрессия.
- •22. Замещающие переменные. Фиктивные переменные.
- •Методы борьбы с мультиколлинеарностью.
- •Линеаризация регрессионных моделей путем логарифмических преобразований.
20. Коэффициент множественной детерминации. Скорректированный коэффициент детерминации.
Коэффициент множественной детерминации характеризует, насколько процентов построенная модель регрессии объясняет разброс значений результативной переменной относительно ее среднего значения.
Коэффициент множественной детерминации рассчитывается как квадрат коэффициента множественной корреляции: R2(y, x1 …xi ) = ∑Biстанд * r (yxi) Чем больше значение коэффициента множественной детерминации, тем лучше модель регрессии описывает анализируемую взаимосвязь между переменными.
Коэффициент множественной детерминации можно также рассчитать на основании теоремы о разложении сумм квадратов.
Сумма квадратов разностей между значениями результативной переменной и ее средним значением по выборке может быть представлена следующим образом:
∑ (yi – yср)2 =∑(yi - yi˜)2 +∑( yi˜ - yср)2
∑ (yi – yср)2 — общая сумма квадратов модели множественной регрессии с п переменными
∑(yi - yi˜)2 — сумма квадратов остатков модели множественной регрессии с п переменными
∑( yi˜ - yср)2 — сумма квадратов объясненной регрессии модели множественной регрессии с n переменными
Коэффициент множественной детерминации, рассчитанный через теорему о разложении сумм квадратов: R2(y, x1 …xi ) = 1- ESS/TSS
Скорректированный коэффициент детерминации
Иногда его также называют «исправленным» коэффициентом R2, хотя это определение не означает, по мнению многих, что такой коэффициент улучшен по сравнению с обычным, в нём учитывается количество факторных переменных.
Как
отмечалось выше, при добавлении
объясняющей переменной к уравнению
регрессии коэффициент R2
никогда
не уменьшается, а обычно увеличивается.
Скорректированный коэффициент R2,
который
обычно обозначают
,
обеспечивает
компенсацию для такого автоматического
сдвига вверх путем
наложения «штрафа» за увеличение числа
независимых переменных. Этот коэффициент
определяется следующим образом:
где
k
— число
независимых переменных. По мере роста
k
увеличивается
отношение
k/(n
— k—
1)
и, следовательно, возрастает размер
корректировки коэффициента
R2
в
сторону уменьшения.
21. Проблемы спецификации регрессионной модели. Пошаговая регрессия.
Под спецификацией понимается проблема выбора наиболее важных факторных переменных при построении модели регрессии. Свойства оценок коэффициентов регрессии в значительной мере зависят от правильности спецификации модели. Результаты неправильной спецификации переменных в уравнении могут быть в обобщенном виде выражены следующим образом.
Если опущена переменная, которая должна быть включена, то оценки коэффициентов регрессии, вообще говоря, хотя и не всегда, оказываются смещенными. Стандартные ошибки коэффициентов и соответствующие t-тесты в целом становятся некорректными.
Если включена переменная, которая не должна присутствовать в уравнении, то оценки коэффициентов регрессии будут несмещенными, однако, вообще говоря (хотя и не всегда), — неэффективными. Стандартные ошибки будут в целом корректны, но из-за неэффективности регрессионных оценок они будут излишне большими.
Цель пошаговой регрессии состоит в отборе из большого количества предикатов (предсказаний) небольшой подгруппы переменных, которые вносят наибольший вклад в вариацию зависимой переменной. Обычно этот процесс выполняет автоматизированная процедура, которая вводит или выводит предикаты из уравнения регрессии по очереди, основываясь на серии F-тестов, t-тестов или других подходах. Подходы:
Прямая пошаговая регрессия - Вначале уравнение регрессии не содержит предикатов. Они вводятся по одному, если удовлетворяют определенному критерию. В основе порядка введения включаемых переменных лежит вклад переменной в объясняемую вариацию.
исключение переменной
Обратная пошаговая регрессия - Вначале все предикаты входят в уравнение регрессии. Затем по очереди выводятся из уравнения исходя из их соответствия критерию.
Пошаговый подход - На каждой стадии прямое включение осуществляют одновременно с исключением переменных, которые больше не удовлетворяют конкретному критерию.
Алгоритм - последовательно включаются факторы в уравнение регрессии и после проверяется их значимость. Факторы поочередно вводятся в уравнение так называемым "прямым методом". При проверке значимости введенного фактора определяется, насколько уменьшается сумма квадратов остатков и увеличивается величина множественного коэффициента корреляции. Одновременно используется и обратный метод, т.е. исключение факторов, ставших незначимыми на основе t-критерия Стьюдента. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффициентов регрессии, не уменьшая значительно суммы квадратов остатков и не увеличивая их значения. Если при включении в модель соответствующего факторного признака величина множественного коэффициента корреляции увеличивается, а коэффициент регрессии не изменяется (или меняется несущественно), то данный признак существен и его включение в уравнение регрессии необходимо.