Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кротов В М Методика организации и проведения пе...doc
Скачиваний:
0
Добавлен:
01.03.2025
Размер:
1.37 Mб
Скачать

2.6 Коэффициенты корреляции

Кроме рассмотренных основных одномерных описательных статистик, меры центральной тенденции и изменчивости для описания одной переменной, применяются коэффициенты корреляции. Коэффициент корреляции – двумерная описательная статистика, количественная мера взаимосвязи (совместной изменчивости) двух переменных.

К настоящему времени разработано великое множество различных коэффициентов корреляции. Их общей особенностью является то, что они отражают взаимосвязь двух признаков, измеренных в количественной шкалеранговой или метрической.

Коэффициент корреляции – это количественная мера силы и направления вероятностной взаимосвязи двух переменных; принимает значения в диапазоне от-1 до +1. Сила связи достигает максимума при условии взаимно однозначного соответствия: когда каждому значению одной переменной соответствует только одно значение другой переменной (и наоборот), эмпирическая взаимосвязь при этом совпадает с функциональной линейной связью. Показателем силы связи является абсолютная (без учета знака) величина коэффициента корреляции.

Направление связи определяется прямым или обратным соотношением значений двух переменных: если возрастанию значений одной переменной соответствует возрастание значений другой переменной, то взаимосвязь называется прямой (положительной); если возрастанию значений одной переменной соответствует убывание значений другой переменной, то взаимосвязь является обратной (отрицательной). Показателем направления связи является знак коэффициента корреляции.

Коэффициент корреляции r-Пирсона применяется для изучения взаимосвязи двух метрических переменных, измеренных на одной и той же выборке. Существует множество ситуаций, в которых уместно его применение. Влияет ли интеллект на успеваемость учащихся? Влияет ли настроение учащихся на успешность решения сложной физической задачи? Для ответа на подобные вопросы исследователь должен измерить два интересующих его показателя у каждого члена выборки.

Формула коэффициента корреляции Пирсона имеет вид: Если значения той и другой переменной были преобразованы в z-значения по формулам: , то формула для коэффициента корреляции r-Пирсона имеет вид: .

На величину коэффициента корреляции не влияет то, в каких единицах измерения представлены признаки. Следовательно, любые линейные преобразования признаков (умножение на константу, прибавление константы: уiib + а) не меняют значения коэффициента корреляции. Исключением является умножение одного из признаков на отрицательную константу: коэффициент корреляции меняет свой знак на противоположный.

Если обе переменные, между которыми устанавливается связь, представлены в порядковой шкале, или одна из них в порядковой, а другая – в метрической, то применяются ранговые коэффициенты корреляции (r-Cпирмена и τ-Кенделла. Тот и другой коэффициенты требуют для своего применения предварительного ранжирования обеих переменных.

Коэффициент корреляции r-Cпирмена определяется по формуле где di- разность рангов для испытуемого с номером i. Коэффициент корреляции r-Cпирмена равен коэффициенту корреляции r-Пирсона, вычисленному для двух предварительно ранжированных переменных.

Коэффициент корреляции τ- Кендалла рассчитывается по формуле где Р— число совпадений, Q— число инверсий, а (Р+ Q) = N(N- 1)/2.

Формулу для вычисления коэффициента корреляции τ- Кендалла может быть представлена и в виде .

При подсчете τ -Кендалла «вручную» данные сначала упорядочиваются по переменной X. Затем для каждого испытуемого подсчитывается, сколько раз его ранг по Y оказывается меньше, чем ранг испытуемых, находящихся ниже. Результат записывается в столбец «Совпадения». Сумма всех значений столбца «Совпадения» и есть Р – общее число совпадений, подставляется в формулу для вычисления τ -Кендалла.

В измерениях часто встречаются одинаковые значения. При их ранжировании возникает проблема связанных рангов. В этом случае действует особое правило ранжирования: объектам с одинаковыми значениями приписывается один и тот же, средний ранг.

При наличии одинаковых (связанных) рангов формулы ранговой корреляции Спирмена и Кендалла не подходят. Хотя сумма рангов и не меняется, но изменчивость данных становится меньше. Соответственно, уменьшается возможность оценить степень связи между измеренными свойствами.

При использовании корреляции Спирмена в случае связанных рангов возможны два подхода:

  • - если связей немного (менее 10% для каждой переменной), то вычислить г-Спирмена приближенно по приведенной ранее формуле;

  • - при большем количестве связей применить к ранжированным данным классическую формулу г-Пирсона- это всегда позволит определить ранговую корреляцию независимо от наличия связей в рангах.

При использовании корреляции τ-Кендалла в случае наличия связанных рангов в формулу вносятся поправки, и тогда получается общая формула для вычисления τ коэффициента корреляции τ -Кендалла независимо от наличия или отсутствия связей в рангах: ; где ; где i - количество групп связей по Х, fi - численность каждой группы); (i—количество групп связей по У, fi­-численность каждой группы).

При изучении связей между переменными наиболее предпочтительным является случай применения r-Пирсона непосредственно к исходным данным. Применяя r -Пирсона, необходимо убедиться, что:

  • - обе переменные не имеют выраженной асимметрии;

  • - отсутствуют выбросы;

  • - связь между переменными прямолинейная.

Если хотя бы одно из условий не выполняется, можно попытаться применить ранговые коэффициенты корреляции: r-Спирмена или τ-Кендалла. Но и ранговые корреляции имеют свои ограничения. Они применимы, если:

  • - обе переменные представлены в количественной шкале (метрической или ранговой);

  • - связь между переменными является монотонной (не меняет свой знак с изменением величины одной из переменных).