Лекции № 2.
Тема: Ранговый метод и метод квадратов корреляционного анализа.
Цель: Ознакомление студентов с ранговым методом и методом квадратов корреляционного анализа.
Ранговая корреляция – метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.
В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов переменных (табл. 2). Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.
Таблица 2
Ранжирование распределения показателей теста (n = 18)
В таблице 2 приведены данные для расчета коэффициентов ранговой корреляции. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе – соответствующие им данные теста зрительной памяти).
Коэффициент корреляции рангов Спирмена (rs) определяется из уравнения:
где di – разности между рангами каждой переменной из пар значений X и Y;
n – число сопоставляемых пар.
Используя данные таблицы 2, получаем:
Коэффициент корреляции рангов Кендалла ? определяется следующей формулой:
где Р и Q рассчитываются по таблице 12.
Так, в восьмой графе подсчитывается, начиная с первого объекта X, сколько раз его ранг по Y меньше, чем ранг объектов, расположенных ниже.
Соответственно, в девятой графе (S2) фиксируется, сколько раз ранг Y больше, чем ранги, стоящие ниже его в столбце X. Подставляя эти данные в формулу, получаем:
При сопоставлении приведенных коэффициентов оказывается, что коэффициент ? более информативен, чем rs, и рассчитывается проще. Поэтому на практике при расчете рановой корреляции отдают предпочтение коэффициенту ? (табл. 3).
Таблица 3
Распределение IQ-оценок и показателей теста зрительной памяти
Метод наименьших квадратов (МНК, англ. Ordinary Least Squares, OLS) — математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных. Он может использоваться для «решения» переопределенных систем уравнений (когда количество уравнений превышает количество неизвестных), для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений, для аппроксимации точечных значений некоторой функции. МНК является одним из базовых методов регрессионного анализа для оценки неизвестных параметров регрессионных моделей по выборочным данным.
Литература:
1. Применение методов статистического анализа для изучения общественного здоровья и здравоохранении: учебное пособие/ ред. Кучеренко В.З.-4-е изд., перераб. и доп.-М.:ГЭОТАР-Медиа, 2011.-256 с.
2. Герасимов А.Н. Медицинская статистика: учебное пособие/ Герасимов А.Н.-М.:МИА, 2007.-480 с.
Контрольные вопросы:
Ранговая корреляция
коэффициенты ранговой корреляции Спирмена и Кендалла.
Ранжирование распределения показателей теста
Коэффициент корреляции рангов Кендалла
Распределение IQ-оценок и показателей теста зрительной памяти
