- •Тема 4. Множественная регрессия и корреляция
- •Множественный корелляционно-регрессионный анализ
- •Отбор факторов для включения в уравнение регрессии
- •3. Традиционный метод наименьших квадратов для множественной линейной регрессии. Натуральная и стандартизированная форма модели множественной линейной регрессии
- •Множественная корреляция
- •Понятие частного коэффициента корреляции
- •6. Показатели силы связи в модели множественной регрессии
Множественная корреляция
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.
Коэффициент детерминации показывает долю вариации результативного признака, находящегося под воздействием факторных признаков, т.е. определяет, какая доля вариации признака у учтена в модели и обусловлена влиянием на него факторов, включенных в модель:
.
Множественный коэффициент корреляции может быть найден как корень квадратный из коэффициента детерминации. Чем ближе коэффициент корреляции к единице, тем теснее связь между результатом и всеми факторами и уравнение регрессии лучше описывает фактические данные. Если множественный коэффициент корреляции близок к нулю, то уравнение регрессии плохо описывает фактические данные, и факторы оказывают слабое влияние на результат. Этот коэффициент в отличие от парного коэффициента корреляции не может быть использован для интерпретации направления связи.
Значение коэффициента множественной корреляции больше или равно величине максимально коэффициента парной корреляции:
.
Для линейной множественной регрессии коэффициент множественной корреляции может быть рассчитан по следующей формуле:
.
Соответственно множественный коэффициент детерминации:
.
Существует еще одна формула для расчета множественного коэффициента корреляции для линейной регрессии:
,
где - определитель полной матрицы линейных парных коэффициентов корреляции (т.е. включающей парные линейные коэффициенты корреляции факторов с результатом и между собой):
;
- определитель матрицы линейных парных коэффициентов корреляции факторов между собой:
.
Рассчитывается также скорректированный коэффициент детерминации:
,
где n – число наблюдений;
m – число параметров уравнения регрессии без учета свободного члена (для линейной регрессии, например, это число равно числу факторов, включенных в модель).
Скорректированный коэффициент детерминации применяется для решения двух задач: оценки реальной тесноты связи между результатом и факторами и сравнения моделей с разным числом параметров. В первом случае обращают внимание на близость скорректированного и нескорректированного коэффициентов детерминации. Если эти показатели велики и различаются незначительно, модель считается хорошей.
При сравнении разных моделей предпочтение при прочих равных условиях отдается той, у которой больше скорректированный коэффициент детерминации.
Следует отметить, что область применения скорректированного коэффициента детерминации ограничивается только этими задачами. Его нельзя использовать в формулах, где применяется обычный коэффициент детерминации. Скорректированный коэффициент детерминации нельзя интерпретировать как долю вариации результата, объясненную вариацией факторов, включенных в модель регрессии.
Для проверки существенности коэффициента множественной корреляции используют F-критерий Фишера, который определяется по формуле:
,
где R2 – множественный коэффициент детерминации;
m – число параметров при факторах х в уравнении множественной регрессии (в парной регрессии m=1).
Полученное значение F-критерия сравнивается с табличным при определенном уровне значимости и m и n-m-1 степенях свободы. Если расчетное значение F-критерия больше табличного, уравнение множественной регрессии признается значимым.