- •Ргр2 Корреляционно-регрессионный анализ
- •1. Исследование парной корреляции
- •1.1. Определяется характер связи
- •1.2. Оценка связи между количественными признаками
- •А) Расчет линейного коэффициента корреляции выполняется следующим образом:
- •Б) Оценка значимости коэффициента корреляции по t-критерию Стьюдента:
- •В) Расчет коэффициента детерминации
- •2. Формирование модели парной регрессии
- •2.1 Исследование графически зависимости двух признаков
- •2.2. Расчет параметров уравнения
- •2.3. Оценка коэффициентов уравнения регрессии
- •2.4. Расчет характеристик модели
- •3. Формирование модели множественной регрессии
- •3.1. Отбор значимых факторов
- •3.2. Анализ и способы снижения мультиколлинеарности факторов
- •3.3. Проверка коэффициентов регрессии на статистическую значимость.
- •3.4. Анализ точек исходной совокупности на аномальность
- •3.5. Оценка влияния факторных признаков на результативный признак
- •Оценка адекватности модели множественной регрессии
- •3.7. Проверка выполнения предпосылок множественного регрессионного анализа
3. Формирование модели множественной регрессии
После нахождения модели парной регрессии определяется уравнение( модель) множественной регрессии.
Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии.
Уравнение множественной регрессии характеризует среднее изменение c изменением факторных признаков.
Аналитическое
выражение связи между результативными
признаком
и факторными признаками
-
есть функция:
,
где
- теоретическое значение результативного признака, полученное в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
- факторные признаки.
Практика построения многофакторных моделей взаимосвязи показывает, что реально существующие зависимости между социально-экономическими явлениями можно описать, используя, пять типов моделей: линейную, степенную, показательную, параболическую и гиперболическую.
Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводят к линейным путем линеаризации.
В связи с трудоемкостью работ рекомендуется проводить нахождение параметров уравнения (модели) множественной регрессии, а также самой модели множественной регрессии с помощью программ Microsoft Excel и программы статистической графики Statgraphics Plus for Windows.
3.1. Отбор значимых факторов
Для
анализа тесноты взаимосвязи х
и
у
используют
значения коэффициента
парной корреляции между фактором и
функцией -
.
Величина
,
определяется
на ЭВМ и представляется в корреляционной
матрице вида. Таблица 7
Корреляционная матрица
№ переменной |
|
|
|
… |
|
|
|
1 |
|
|
… |
|
|
|
|
1 |
|
… |
|
|
|
|
|
1 |
… |
|
|
… |
… |
... |
… |
1 |
… |
… |
|
|
|
|
… |
1 |
|
|
|
|
|
… |
|
1 |
Факторы, для которых
= 0, т. е. не
связанные с у,
подлежат
исключению в первую очередь. Факторы,
имеющие наименьшее значение
,
могут
быть потенциально исключены из модели.
Вопрос
об их окончательном исключении решается
в ходе анализа других
статистических характеристик.
3.2. Анализ и способы снижения мультиколлинеарности факторов
Здесь
производится анализ значений коэффициентов
парной корреляции
(или
)
между факторами
и
.
Мультиколлинеарность - попарная корреляционная зависимость между факторами.
Мультиколлинеарная
зависимость присутствует, если
коэффициент парной корреляции
.
Отрицательное воздействие мультиколлинеарности состоит в следующем:
1) усложняется процедура выбора главных факторов;
2) искажается смысл коэффициента множественной корреляции (он предполагает независимость факторов);
3) усложняются вычисления при построении самой модели;
4) снижается точность оценки параметров регрессии, искажается оценка дисперсии.
Следствием снижения точности является ненадежность коэффициентов регрессии и отчасти неприемлемость их использования для интерпретации как меры воздействия соответствующей объясняющей переменной на зависимую переменную.
Оценки коэффициента становятся очень чувствительными к выборочным наблюдениям. Небольшое увеличение объема выборки может привести к очень сильным сдвигам в значениях оценок. Кроме того, стандартные ошибки оценок входят в формулы критерия значимости, поэтому применение самих критериев становится также ненадежным. Из сказанного ясно, что исследователь должен пытаться установить стохастическую мультиколлинеарность и по возможности устранить ее.
Для измерения мультиколлинеарности можно использовать коэффициент множественной детерминации:
,
где
-
коэффициент множественной
корреляции.
При
отсутствии мультиколлинеарности
факторов
,
где
-
коэффициент парной
детерминации (обозначим через
),
вычисляемый по формуле
где
-
коэффициент парной
корреляции между j-м
фактором (
)
и зависимой переменной у.
При наличии
мультиколлинеарности соотношение
не соблюдается.
Поэтому в качестве меры мультиколлинеарности
используется
следующая разность:
Чем меньше эта
разность, тем меньше мультиколлинеарность.
Для устранения мультиколлинеарности
используется метод исключения
переменных.
Этот метод
заключается в том, что высоко
коррелированные
объясняющие переменные (факторы)
устраняются из регрессии и она
заново оценивается. Отбор переменных,
подлежащих
исключению, производится с помощью
коэффициентов парной корреляции.
Опыт показывает, что если
,
то одну из переменных
можно исключить, но какую переменную
исключить из
анализа, решают исходя из управляемости
факторов на уровне предприятия.
Обычно в модели
оставляют тот фактор, на который можно
разработать мероприятие, обеспечивающее
улучшение значения этого фактора
в планируемом году.
Если между факторами
нет предпочтений на уровне предприятия,
то применима методика отбора главных
факторов рассмотренная выше. Из двух
факторов исключается из модели фактор,
имеющий наименьшее значение
.
