
- •1. Корреляционный анализ социально-экономических явлений
- •1.1. Направления возникновения корреляционной связи
- •1.2. Основные приемы изучения взаимосвязей
- •1.3. Оценка направления и тесноты линейной связи
- •1.4. Оценка достоверности коэффициента корреляции
- •1.5. Множественная линейная корреляция
- •Частная линейная корреляция
- •1.7. Эмпирическое и теоретическое корреляционные отношения
- •Корреляционное отношение можно рассчитать и по такой формуле
- •1.8. Оценка линейности взаимосвязи
- •1.9. Ранговая корреляция
- •Корреляция альтернативных признаков
1.8. Оценка линейности взаимосвязи
Для оценки степени приближения нелинейной зависимости к линейной используется критерий F:
где 2 – квадрат корреляционного отношения; r2 – квадрат коэффициента корреляции; n – объем выборки; kX – число групп по ряду X.
Теоретические значения Fтеор находятся по заданному уровню значимости и числу степеней свободы 1 = kX и 2 = n 2.
Если Fрасч < Fтеор – связь практически можно считать линейной.
Если Fрасч. Fтеор. – корреляция нелинейная.
Рассмотрим проверку гипотезы линейности на основе данных предыдущего примера.
Значение коэффициента корреляции равно r = 0,808.
Расчетное значение критерия F по формуле :
Теоретическое значение критерия F для числа степеней свободы 1 = 10 и 2 = 37 равно Fтеор = 2,18. Видно, что Fрасч < Fтеор. Таким образом, можно считать, что связь между рассматриваемыми факторами практически линейная.
1.9. Ранговая корреляция
Если п объектов какой-либо совокупности N пронумерованы в соответствии с возрастанием или убыванием какого-либо признака X, то говорят, что объекты ранжированы по этому признаку. Ранг х. указывает место, которое занимает i-й объект среди других п объектов, расположенных в соответствии с признаком Х (1= 1,2,..., п). Например, при исследовании рынка мы можем задать вопрос с целью выяснения предпочтений потребителей при выборе товара (при покупке акций, мороженого, водки и т. п.) таким образом, чтобы они распределили товар в порядке возрастания (или убывания) своих потребительских предпочтений. Если мы имеем 2 набора ранжированных данных, то можно попытаться установить степень линейной зависимости между ними. Предположим, имеется 5 продуктов, расположенных по порядку предпочтений от 1 до 5 в соответствии с двумя характеристиками А и В (табл.1.4).
Таблица 1.4
-
Характеристики для ранжирования
Продукт
V
W
X
У
Z
А
В
2
1
5
3
1
2
3
4
4
5
Для определения наличия взаимосвязи между ранговыми оценками используется коэффициент ранговой корреляции Спирмена. ,Его расчет основан на различии между рангами:
D = Ранг А - Ранг В.
Коэффициент корреляции рангов Спирмена р рассчитывается по формуле:
где п - число пар ранжированных наблюдений.
В нашем примере мы имеем 5 пар рангов, следовательно, л = 5.
т. е. между признаками есть достаточно сильная линейная связь. Этот коэффициент изменяется в промежутке от [-1; 1] и интерпретируется так же, как и коэффициент Пирсона. Разница лишь в том, что он применяется для ранжированных данных.
Значимость коэффициента Спирмена проверяется на основе (t-критерия Стьюдента по формуле
Значение коэффициента считается существенным, если tнабл > tкрит (a; k=n- 2).