
- •Классификация связей в статистике. Порядок изучения статистической связи.
- •Количественные критерии оценки тесноты связи Таблица 1
- •Корреляционно-регрессионный анализ
- •Парная корреляция и построение однофакторной модели
- •Линейный коэффициент корреляции.
- •Оценка существенности связи. Принятие решений на основе уравнения регрессии
- •Методы изучения связи социальных явлений
- •Коэффициент ассоциации и контингенции.
- •Многофакторный корреляционно-регрессионный анализ
- •Оценка влияния факторов на результативный признак
- •Показатели тесноты связи множественной корреляции
Многофакторный корреляционно-регрессионный анализ
Задача многофакторного корреляционно-регрессионного анализа заключается:
1) в изучении факторов, которые оказывают влияние на исследуемый показатель и отборе наиболее значимых;
2) в определении степени влияния каждого фактора на результативный признак путем построения модели — уравнения множественной регрессии. Уравнение множественной регрессии позволяет установить, в каком направлении и на какую величину изменится результативный показатель при изменении каждого фактора входящего в модель;
3) в количественной оценке тесноты связи между результативным признаком и факторными.
Математически
задача состоит в нахождении функции
От правильного выбора функции регрессии зависят результаты теоретического анализа и возможность их применения на практике.
Построение моделей множественной регрессии включает следующие этапы:
выбор формы связи (уравнения регрессии) путем перебора нескольких аналитических функций;
отбор значимых факторных признаков (опирается на сравнение частных коэффициентов эластичности, -коэффициентов, -частных коэффициентов детерминации );
обеспечение достаточного объема совокупности для получения несмещенных оценок (их количество должно быть в несколько раз больше, чем число факторов, включаемых в модель. На каждый фактор должно приходиться, как минимум, 5-6 наблюдений.
Сложность выбора функции состоит в том, что результативный признак с разными факторами может находиться в различных формах связи— прямолинейных и криволинейных. Эмпирическое обоснование типа функции с помощью графиков парных связей практически непригодно для множественной корреляции и регрессии.
Выбор формы уравнения множественной регрессии основывается на теоретическом анализе изучаемого явления.
Практика многофакторного регрессионного анализа социально-экономических явлений показывает, что для описания их взаимосвязей можно использовать пять типов моделей:
линейная
степенная
показательная
параболическая
гиперболическая
Чаще всего останавливаются на линейных моделях. Это объясняется тем, что параметры линейных уравнений легко интерпретируются, а сами модели просты и удобны для экономического анализа.
Проблема отбора факторных признаков для построения моделей взаимосвязи может быть решена используя сравнительный анализ частных коэффициентов эластичности Эi, -коэффициентов и частных коэффициентов детерминации i.
Рассмотрим принципы анализа степени влияния факторов на примере, когда в уравнение регрессии были включены пять факторов (табл. 1).
Если сопоставить значения коэффициентов эластичности (графы 2 и 5 табл. 1), то можно видеть, что главным фактором изменения результативного показателя является фактор х5; при его изменении на 1% у возрастает на 79,5%. Вторым по силе влияния на результативный показатель является фактор х1 и т.д. (графа 5).
Сравнение значений j позволяет сделать вывод, что наибольший вклад в изменение результативного признака вносят факторы х5, х4 и х1 (графа 6 табл. 1)
Сопоставление значений коэффициентов j, позволяет сделать вывод, что наибольшую долю влияния имеет фактор х5: роль этого фактора в вариации результативного показателя составляет 52,5% общего влияния пяти факторов на результативный показатель. Доля влияния других факторов значительно уступает доле влияния фактора х5. Следовательно, наибольшие возможности в изменении результативного показателя связаны с изменением фактора х5, затем х1 и далее х4..
Таблица 1
Факторы |
Значения коэффициентов |
Ранг факторов по величине коэффициентов |
Средний ранг |
||||
Эj |
j |
j |
Эj |
j |
j |
||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
X1 |
0,173 |
0,204 |
0,162 |
2 |
3 |
2 |
2 |
X2 |
0,133 |
0,114 |
0,076 |
4 |
5 |
5 |
5 |
X3 |
0,108 |
0,144 |
0,104 |
5 |
4 |
4 |
4 |
X4 |
0,158 |
0,253 |
0.,133 |
3 |
2 |
3 |
3 |
X5 |
0,795 |
0,732 |
0,525 |
1 |
1 |
1 |
1 |
Также часто используется метод пошаговой регрессии, состоящий в последовательном включении факторов в модель и оценке их значимости. Факторы поочередно вводятся в уравнение. При введении фактора определяется, насколько увеличивается величина множественного коэффициента корреляции R. Если при включении в модель фактора xi величина R увеличивается, а коэффициент регрессии аi не изменяется или меняется незначительно, то данный фактор существенен и его включение в модель необходимо. Одновременно используется и обратный метод, т.е. исключение факторов, ставших незначимыми на основе t-критерия Стьюдента.
Наличие между двумя факторами весьма тесной линейной связи (линейный коэффициент корреляции г превышает по абсолютной величине 0,85) называется коллинеарностью, а между несколькими факторами — мультиколлинеарностью.
Причины возникновения мультиколлинеарности между признаками состоят, во-первых, в том, что анализируемые признаки характеризуют одну и ту же сторону явления или процесса (например, уставной фонд и численность работников характеризуют размер предприятия) и включать их в модель одновременно не целесообразно; во-вторых, факторные признаки являются составными элементами друг друга, дублируют друг друга или их суммарное значение дает постоянную величину (например, энерговооруженность и фондовооруженность, удельный вес заемных и собственных средств).
Если в модель включены мультиколлинеарные факторы, то уравнение регрессии будет неадекватно отражать реальные взаимосвязи, будут искажены величины параметров модели (завышены) и затруднена экономическая интерпретация коэффициентов регрессии и корреляции.
Поэтому при построении модели исключают один из коллинеарных факторов исходя из качественного и логического анализа.
В уравнении множественной регрессии в линейной форме параметры а1, а2, аз, ..., аn — коэффициенты регрессии, показывают степень влияния соответствующих факторов на результативный признак при закреплении остальных факторов на среднем уровне, т.е. насколько изменится у при увеличении соответствующего фактора xi на 1 пункт его единицы изменения;
параметр а0 — свободный член, экономического смысла не имеет.
Параметры уравнения множественной регрессии, как и парной, рассчитываются методом наименьших квадратов на основе решения системы нормальных уравнений. Для линейного уравнения регрессии с п факторами строится система из (n+1) нормальных уравнений:
Поскольку коэффициенты регрессии между собой несопоставимы (факторы имеют разные единицы измерения), то нельзя сравнивать силу влияния каждого фактора на результативный признак на основании коэффициентов регрессии.