- •Тема 7.
- •Содержание
- •Слово correlation (корреляция) состоит из приставки «co-», которая обозначает совместность происходящего (по аналогии
- •Если две какие-либо характеристики, полученные для одного и того же объекта
- •Показатели тесноты связи
- •Линейный коэффициент корреляции для несгруппированных данных
- •Линейный коэффициент корреляции для несгруппированных данных
- •Значимость линейного коэффициента корреляции определяется по таблицам критических значений Rкр N, где -
- •Принятие решений о тесноте связи на основе линейного коэффициента корреляции
- •Корреляционное отношение
- •η2 называют коэффициентом детерминации. Его значения находятся в интервале [0,1]:
- •Ранговые коэффициенты корреляции
- •Коэффициент Спирмена
- •Коэффициент Спирмена изменяется в пределах
- •Таблица критических значений коэффициента корреляции рангов Спирмена
- •Пример
- •Продолжение примера. Подставим полученные значения в формулу:
- •Коэффициент корреляции Кендалла
- •Коэффициенты ассоциации и контингенции
- •Таблица для расчета коэффициентов
- •Коэффициент ассоциации:
- •Коэффициент взаимной сопряженности
- •Для расчета коэффициента Пирсона первичные данные группируют:
- •Расчет коэффициента Пирсона:
- •Коэффициент Пирсона может принимать
Тема 7.
Методы изучения связи
между явлениями
Содержание
1.Классификация показателей тесноты связи
2.Способы расчета показателей и определение их значимости
Слово correlation (корреляция) состоит из приставки «co-», которая обозначает совместность происходящего (по аналогии с «координация») и корня «relation» ,
переводится как «отношение» или «связь».
Дословно correlation переводится как взаимосвязь.
Корреляционная зависимость -
зависимость случайных величин
(признаков), при которой изменению среднего значения одной соответствует изменение среднего значения другой случайной величины.
Если две какие-либо характеристики, полученные для одного и того же объекта
имеют тенденцию изменяться
совместно так, что создается возможность предсказать величину одной из них по значению другой, то говорят, что эти характеристики коррелируют между собой.
Показатели тесноты связи
|
|
|
|
|
|
|
Количественные |
|
Порядковые |
|
|
||
|
|
Номинальные |
||||
шкалы |
|
шкалы |
|
шкалы |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Линейный Корреляцион
коэффицие ное
нт отношение
корреляци
и
Коэффици Коэффици ент ент Спирмена Кендалла
Коэффициен |
Коэффицие |
|
ты |
нты |
|
ассоциации и |
Пирсона и |
|
контингенци |
Чупрова |
|
и |
||
|
||
|
|
Линейный коэффициент корреляции для несгруппированных данных
|
|
m |
|
|
|
|
|
|
||||
|
|
(xi |
x |
)( yi |
y |
) |
|
|
||||
R |
|
i 1 |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
m |
|
|
|
|
|||||||
|
|
(xi |
x |
)2 |
( yi |
|
y |
)2 |
|
|||
|
|
i 1 |
i 1 |
|
|
|
|
m- число пар наблюдений; xi, yi –значения
признаков для i-й единицы совокупности ( i-я |
||
пара); x |
y |
- среднее |
- среднее значение x; |
значение y.
Линейный коэффициент корреляции для несгруппированных данных
Rxy
x y
-xy - среднее значение произведений;
-Ϭx - среднее квадратическое отклонение x;
-Ϭy - среднее квадратическое отклонение yx y
Линейный коэффициент корреляции принимает значения в интервале |R|≤1.
Знак коэффициента характеризует
направление взаимосвязи:
• если R>0 связь прямая, т.е. с ростом признака x увеличивается y.
•если R<0 связь обратная, т.е. с ростом признака x уменьшается y.
Абсолютная величина R характеризует
степень тесноты рассматриваемой взаимосвязи.
Значимость линейного коэффициента корреляции определяется по таблицам критических значений Rкр N, где - уровень значимости, (чаще всего 0,05), N -объем выборки. Для оценки связи :
•Предполагают, что связь между признаками отсутствует.
•Рассчитывают значение линейного коэффициента корреляции.
•Сравнивают полученное значение с
критическим. Если R≥ Rкр , то предположение отвергают.
Можно воспользоваться упрощенным вариантом:
Принятие решений о тесноте связи на основе линейного коэффициента корреляции
-1 |
-0,75 |
-0,5 |
-0,3 |
0 |
+0,3 |
+0,5 |
+0,75 |
+1 |
-0,3≤R≤ 0,3 - связь практически отсутствует; -0,5 ≤ R ≤ -0,3, или 0,3 ≤ R ≤ 0,5 - связь слабая;
-0,75 ≤ R ≤ -0,5, или 0,5 ≤ R ≤ 0,75 - связь достаточно сильная;
-1 ≤ R ≤ -0,75, или 0,75 ≤ R ≤ 1- высокая степень зависимости между признаками.