
- •1. Корреляционный анализ социально-экономических явлений
- •1.1. Направления возникновения корреляционной связи
- •1.2. Основные приемы изучения взаимосвязей
- •1.3. Оценка направления и тесноты линейной связи
- •1.4. Оценка достоверности коэффициента корреляции
- •1.5. Множественная линейная корреляция
- •Частная линейная корреляция
- •1.7. Эмпирическое и теоретическое корреляционные отношения
- •Корреляционное отношение можно рассчитать и по такой формуле
- •1.8. Оценка линейности взаимосвязи
- •1.9. Ранговая корреляция
- •Корреляция альтернативных признаков
1.7. Эмпирическое и теоретическое корреляционные отношения
Степень тесноты связи между переменными в случае не только линейной, но и нелинейной зависимости можно оценить с помощью теоретического корреляционного отношения теор. Поэтому теор часто называют «индексом корреляции». Теоретическое корреляционное отношение рассчитывается по формуле
где SR — сумма квадратов вследствие регрессии; ST — общая сумма квадратов.
Ниже будут приведены формулы расчета SR и ST.
Для характеристики тесноты корреляционной связи между признаками в аналитических группировках межгрупповую дисперсию сопоставляют с общей дисперсией. Это сопоставление называется эмпирическое корреляционное отношение эмп
2- межгрупповая дисперсия (по сгруппированным данным); σ2-общая дисперсия
Корреляционное отношение определяется как
(
7 )
где
-
сумма квадратов отклонений индивидуальных
значений yi
от общей средней арифметической
;
- сумма квадратов отклонений вариант
от групповых средних
,
соответствующих определенным,
фиксированным значениям независимой
переменной x.
Корреляционное отношение можно рассчитать и по такой формуле
(
8 )
где
- сумма квадратов отклонений групповых
средних
от общей средней
.
Значения распределены на отрезке [0; 1]: 0 1. Чем ближе к 1, тем теснее связь между переменными Х и Y, тем больше колеблемость Y объясняется колеблемостью X.
В случае линейной зависимости r = . Если связь — нелинейная, то r < . Это позволяет использовать в качестве меры линейности связи между переменными Х и Y. Если коэффициент корреляции r мало отличается от корреляционного отношения , то зависимость между переменными близка к линейной. В противном случае имеет место нелинейная зависимость между Х и Y.
Проверка значимости корреляционного отношения осуществляется с помощью критерия Фишера (F). Его значение рассчитывается по формуле:
, (
9 )
где п — объем выборки; т — число групп.
Число групп, по которым осуществляется группировка исходных данных, можно определить по формуле Стерджесса:
m =1+3,322· lgN. (10 )
Критическое значение F определяется по таблицам распределения Фишера (приложение ) по уровню значимости а и числу степеней свободы: Fтеор.(;1;2), где 1 = m - 1; 2 = n - m;
Уровень значимости — это достаточно малое значение вероятности, отвечающее событиям, которые в данных условиях исследования будут считаться практически невозможными. Появление такого события считается указанием на неправильность начального предположения. Чаще всего пользуются уровнями = 0,05 или = 0,01.
Расчетное значение Fнабл необходимо сравнить с теоретическим Fтеор. По общему правилу проверки статистических гипотез:
- если Fнабл < Fкр, нулевую гипотезу о том, что незначим, нельзя отклонить;
- если Fнабл Fкр, нулевая гипотеза отклоняется в пользу альтернативной. Коэффициент значимо отличается от нуля.
Квадрат эмпирического корреляционного отношения (2) называют коэффициентом детерминации. Он показывает, какая часть колеблемости Y объясняется колеблемостью X.
.
Он характеризует роль факторной вариации в общей вариации и может быть исчислен как с помощью дисперсионного анализа (разложением дисперсий методом аналитических группировок), так и с помощью регрессионных уравнений.