- •Мультиколлинеарность факторов
- •Лекция 6. Частные уравнения регрессии. Множественная корреляция. Частная корреляция. Оценка надежности результатов множественной регрессии и корреляции. Предпосылки метода наименьших квадратов (мнк).
- •Множественная регрессия. Множественная корреляция.
- •Максимальный парный индекс корреляции
- •Частная корреляция.
- •Лекция 7. Регрессионные модели с переменной структурой. Фиктивные переменные во множественной регрессии.
- •Тест ранговой корреляции Спирмена.
- •Обобщенный метод наименьших квадратов.
Частная корреляция.
Ранжирование факторов множественной регрессии проводится как через стандартизованные коэффициенты регрессии (β – коэффициенты), так и через частные коэффициенты корреляции – для линейных связей. При нелинейной взаимосвязи исследуемых признаков эту функцию выполняют частные индексы детерминации. Частные показатели используются для факторов: целесообразность включения фактора доказывается величиной показателя частной корреляции.
Частные коэффициенты (или индексы) корреляции. Характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнения регрессии.
Показатели частной корреляции представляют соотношение сокращения остаточной дисперсии за счет дополнительного включения в анализ нового фактора к остаточной дисперсии, имевшей место до введения его в модель.
Пример. Зависимость объема продукции y от затрат продукта x1 характеризуется уравнением
Подставив в это уравнение фактические значения x1, найдем теоретические величины объема продукции и остаточную дисперсию
Включив в уравнение дополнительный фактор x2 – техническую оснащенность производства, получим уравнение регрессии вида
Для этого уравнения остаточная дисперсия, естественно, меньше. Чем больше факторов включено в модель, тем меньше величина остаточной дисперсии. Сокращение остаточной дисперсии за счет дополнительного включения фактора x2 составляет
Чем больше доля этого сокращения в остаточной вариации до введения дополнительного фактора, т.е. в , тем теснее связь между y и x2 при постоянном действии фактора x1.
Индекс частной корреляции
показывает в "чистом" виде тесноту связи y с x2,
- y с x1.
Если предположить, что , то для примера
Более сильное влияние на объем продукции y оказывает техническая оснащенность предприятия x2.
Другая формула коэффициентов (индексов) частной корреляции первого порядка:
Составление коэффициентов частной корреляции разного порядка по мере увеличения числа включаемых факторов показывает процесс "очищения" зависимости результативного признака с используемым фактором.
Пример. y – себестоимость добычи угля,
x1 – объем добычи.
парный коэффициент корреляции характеризует тесную обратную связь признаков. Если x2 – уровень производительности труда, то при постоянном x2 частный коэффициент корреляции этой зависимости показывает хотя и достаточную, но уже заметно менее тесную связь себестоимости и объема добычи. Если x3 – размер основных фондов, то, закрепив x2 и x3, получим, что теснота связи рассматриваемых признаков оказывается еще более низкой, т.е.
В практических исследованиях предпочтение отдают показателям частной корреляции самого высокого порядка т.к. именно они являются дополнениями к уравнению множественной регрессии.
В общем виде при наличии p факторов для уравнения
y=a+b1x1+b2x2+…+bpxp+ε
коэффициент частной корреляции, измеряющий влияние на y фактора xi при неизменном уровне других факторов, можно определить по формуле
,
где - множественный коэффициент детерминации всего комплекса p факторов с результатом.
- тот же показатель детерминации, но без введения в модель фактора xi.
Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключантся.
Так, - первого порядка
- нулевого порядка
- второго порядка.
Коэффициенты частной корреляции более высоких порядков через коэффициенты низких порядков определяются по формуле
Так, при двух факторах и i=1 формула примет вид:
При i=2 и двух факторах
Для уравнения регрессии с тремя факторами y=a+b1x1+b2x2+b3x3+ε возможно вычисление трех коэффициентов второго порядка:
Например, при i=1
Оценка надежности результатов множественной регрессии и корреляции.
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F-критерия Фишера:
где Дфакт – факторная сумма КО на одну df;
Дост – остаточная сумма КО на одну df;
R2 – коэффициент (индекс) множественной детерминации;
m – число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов);
n – число наблюдений.
Расчеты оформляются в таблицу результатов дисперсионного анализа:
Источники вариации, y |
Число df |
Сумма КО, S |
Дисперсия на одну df, S2 |
Fфакт |
Fтабл α=0,05, k1, k2 |
Общая |
n-1 |
|
- |
- |
- |
Факторная |
m |
|
|
Fфакт |
Fтабл |
Остаточная |
n-m-1 |
|
|
- |
- |
где
Если Fфакт>Fтабл, уравнение статистически значимо.
При наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость оодного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой оценки включения фактора в модель служит частный F-критерий, т.е.
оценивает значимость влияния фактора xp после включения в модель факторов x1, x2, …, xp-1.
Е
xi
т
xi
включение фактора xi не увеличивает существенно долю объясненной вариации признака y, значит, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.
Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена по формулам:
или
где bi – коэффициент чистой регрессии при факторе xi;
- средняя квадратическая ошибка коэффициента регрессии bi.