
- •1. Корреляционный анализ социально-экономических явлений
- •1.1. Направления возникновения корреляционной связи
- •1.2. Основные приемы изучения взаимосвязей
- •1.3. Оценка направления и тесноты линейной связи
- •1.4. Оценка достоверности коэффициента корреляции
- •1.5. Множественная линейная корреляция
- •Частная линейная корреляция
- •1.7. Эмпирическое и теоретическое корреляционные отношения
- •Корреляционное отношение можно рассчитать и по такой формуле
- •1.8. Оценка линейности взаимосвязи
- •1.9. Ранговая корреляция
- •Корреляция альтернативных признаков
1.3. Оценка направления и тесноты линейной связи
При анализе экономических процессов для измерения тесноты, т.е. меры связи между признаками используются корреляционное отношение и коэффициент корреляции r.
В общем случае существование и относительную силу связи между исследуемыми факторами можно оценить посредством корреляционного отношения. Анализ следует начинать с построения поля корреляции. На практике иногда трудно различить линейную связь от нелинейной. Поэтому часто определяется выборочный коэффициент парной корреляции r, который помимо силы связи показывает и ее направленность.
Коэффициент корреляции определяется по формуле:
,
(1)
где n - число пар
значений исследуемых факторов (объем
выборки);
,
,
X,
Y
- средние
значения и среднеквадратические
отклонения факторного и результативного
признаков соответственно.
Средние арифметические значения входного и выходного параметров вычисляются соответственно по формулам:
,
(2)
где Xi и Yi – единичные значения фактических значений факторного и результативного признаков соответственно; n - число пар исходных данных.
Дисперсии рассматриваемых факторов определяются по формулам:
;
. (3)
Коэффициент корреляции имеет большое значение при исследовании социально-экономических явлений и процессов, распределения которых близки к нормальным.
Значение коэффициента корреляции находятся в пределах от –1 до 1.
Принято считать: при r = 0,3 - слабая связь,
при r = 0,3 - 0,7 - средняя связь,
при r = 0,7 - сильная связь,
при r 0,9 - весьма сильная связь.
Для удобства расчета коэффициента корреляции можно использовать формулу
. (4)
1.4. Оценка достоверности коэффициента корреляции
Коэффициент парной корреляции, рассчитанный по выборочным данным, является случайной величиной. С уменьшением числа наблюдений надежность коэффициента корреляции падает. С увеличением числа наблюдений (свыше 500) распределение коэффициента корреляции r (не превышающее 0,9) стремится к нормальному.
Определенный по выборке коэффициент корреляции г является оценкой коэффициента корреляции генеральной совокупности.
Доверительный интервал для оценки истинного значения коэффициента корреляции в генеральной совокупности () имеет вид:
r – tтабл r r + tтабл r, ( 5 )
где r — средняя квадратическая ошибка выборочного коэффициента парной корреляции; tтабл — параметр распределения Стьюдента с числом степеней свободы k = п - 2 и уровнем значимости а.
Если коэффициент корреляции меньше 0,9 или выборка мала, среднеквадратическая ошибка выборочного коэффициента корреляции r рассчитывается по формуле
Значимость коэффициента корреляции можно проверить с помощью статистики t, распределения Стьюдента с n - 2 степенями свободы.
Наблюдаемое значение t (tнабл) вычисляется как
Критическое значение (tтабл) определяется по таблице распределения Стьюдента (приложение ) по уровню значимости а и числу степеней свободы k=п-2.
По общему правилу проверки статистических гипотез:
если tнабл < tтабл, принимается нулевая гипотеза Н0: r = 0 т.е. между Х и Y отсутствует корреляционная связь (при заданном уровне значимости);
если tнабл tтабл, принимается альтернативная гипотеза Н1: r 0, т.е. коэффициент корреляции значимо отличается от нуля и можно говорить о наличии корреляционной зависимости между Y и Х.
Критерий t подчиняется закону распределения Стьюдента с п - 2 степенями свободы.
Для оценки значимости r при малом объеме выборки целесообразно использовать z-преобразование Фишера. Для этого применяется статистика z:
, (6)
Р
аспределение
z
асимптотически приближается к нормальному.
Вариация z
выражается формулой, которая распределена
по нормальному закону со средним z
и дисперсией z2:
Область принятия гипотезы о нулевой корреляции имеет вид:
, (7)
где z – стандартная, нормально распределенная случайная величина. Если расчетное значение окажется вне этого интервала, то это будет признаком наличия статистической корреляции с уровнем значимости .
Для = 0,05 z/2 = 1,96; = 0,02 z/2 = 2,32;
= 0,01 z/2 = 2,58; = 0,1 z/2 = 1,64.
Пример 1. Менеджера туристической компании интересует, насколько возрастает привлекательность гостиницы в зависимости от ее расстояния до пляжа. С этой целью по 14 гостиницам города была выяснена среднегодовая наполняемость номеров и расстояние в километрах от пляжа. Статистические данные приведены в таблице 2
Таблица 2 - Данные к примеру 1
Расстояние, км |
0,1 |
0,1 |
0,2 |
0,3 |
0,4 |
0,4 |
0,5 |
0,6 |
0,7 |
0,7 |
0,8 |
0,8 |
0,9 |
0,9 |
Наполняемость, %
|
92
|
95 |
96
|
90
|
89
|
86
|
90
|
83
|
85
|
80
|
78
|
76
|
72
|
75
|
На рисунке видно, что связь между исследуемыми факторами обратно пропорциональная, т. е. с увеличением расстояния гостиницы от пляжа ее наполняемость ее уменьшается.
Рисунок 4 – Поле корреляции для примера 1
Оценим силу связи между исследуемыми факторами с помощью коэф-фициента корреляции. Значение коэффициента корреляции r = 0,94 говорит о наличии достаточно сильной обратно пропорциональной зависимости между данными факторами. Так как выборка мала (n < 30), то целесообразно произвести проверку значимости коэффициента корреляции с помощью z-преоб-разования Фишера. Расчеты показали, что zрасч.=5,87 > z табл.= 1,96 при уровне значимости =0,05. Таким образом, нет оснований, сомневаться в присутствии связи между исследуемыми факторами.