- •Основы корреляционного анализа при комплексной оценке здоровья населения
- •2015 Г.
- •Использование коэффициентов корреляции в практической деятельности врача
- •Оценка статистических связей по коэффициентам корреляции
- •Ранговый метод Спирмена
- •Этапы вычисления рангового коэффициента корреляции Спирмена
- •Исходные данные и вычисленные параметры для определения коэффициента ранговой корреляции Спирмена
- •Коэффициент корреляции рангов Кендэла
- •Алгоритм вычисления коэффициента Кендэла
- •Исходные данные и параметры для расчета коэффициента корреляции рангов Кендэла
- •Коэффициенты ассоциации и сопряженности (контингенции)
- •Коэффициент корреляции Пирсона
- •Исходные данные и параметры расчета коэффициента линейной корреляции
- •Порядок вычисления
- •Регрессионный анализ
- •Вычисление коэффициентов регрессии
- •Измерение связи между признаками с помощью корреляционной решетки
- •Ситуационные задачи
- •Тестовые задания
- •Эталон ответов на тестовые задания
- •Вопросы для самоподготовки
- •Литература
Коэффициент корреляции рангов Кендэла
При проведении углубленных исследований рекомендуется поменять более сложный критерий оценки, который является более чувствительным и при добавлении новой пары наблюдений не требует переранжировки рядов.
Алгоритм вычисления коэффициента Кендэла
По общим правилам определяют порядковые ранги для каждого варианта ряда x и y.
Для каждого ранга второго ряда определяют число последующих рангов, больших по величине, и суммируются полученные числа, определяя величину P.
Для каждого ранга второго ряда находят число последующих рангов, которые по величине меньше, чем взятый ранг; найденные величины суммируются и получают величину Q, которая всегда является отрицательным показателем соответствия между рядами рангов и поэтому берется со знаком минус.
Вычисляют сумму полученных величин: S= P+Q.
Определяют коэффициент Кендэла по формуле, дают ему оценку достоверности:
Образец решения задачи
Исходные данные и параметры для расчета коэффициента корреляции рангов Кендэла
5- летние девочки |
Ранги | ||
Рост, см x |
Масса тела, кг y |
Rx |
Ry |
87 89 91 91 95 96 96 97 102 |
13 12 14 14 16 15 17 18 20 |
1 2 3,5 3,5 5 6,5 6,5 8 9 |
2 1 3,5 3,5 6 5 7 8 9 |
n=9 |
|
|
В соответствии с указанным алгоритмом вычисления для ряда Ry определяют:
P = 7 + 7 + 5 + 5 + 4 + 3 + 2 + 1 = 34
Q = 1 + 0 + 0 + 0 +1 + 0 + 0 + 0 = -2
S = P + Q = 34 + (- 2) = 32.
Полученную величину S и значение n подставляем в формулу:
τ =
По специальной таблице (обычно имеющейся в специальной литературе) значений вероятностей для оценки коэффициентов корреляции рангов Кендэла определяем вероятность ρ, которая должна при достоверной связи быть меньше 0,05. При n=9 и S=32 вероятность соответствует 0,0001 и коэффициент корреляции (τ = 0,89) признается значимым, т.е. между ростом 5-летних девочек и массой тела существует прямая, сильная и достоверная зависимость. Таблица рассчитана для числа наблюдений от 4 до 10, если число наблюдений больше, то оценку значимости коэффициента Кендэла лучше проводить по формуле:
t =
где t – доверительный критерий.
Для вычисления коэффициентов ранговой корреляции рациональнее использовать программируемые микрокалькуляторы или специальные компьютерные программы определения коэффициентов на языке Бейсик.
Коэффициенты ассоциации и сопряженности (контингенции)
При изучении зависимости качественных признаков, когда имеют место так называемые альтернативные признаки, т.е. вариация двух противоположных возможностей (“заболел – не заболел” или “привит – не привит” и др.), измерение связи может быть проведено в четырехпольной таблице путем вычисления коэффициентов ассоциации и сопряженности (контингенции). Когда получены статистические данные, характеризующие связь между двумя альтернативными признаками, то используются четырехклеточные таблицы сопряженности двух дихотомических признаков (разделенных надвое) с альтернативными значениями (“+”, “-”) (табл. 2).
Таблица 2
Таблица сопряженности признаков
-
Значение признака
В (да)
В (нет)
Суммарные значения
А (да)
А (нет)
a
c
b
d
a + b
c + d
Итого
a + c
b + d
a + b + c + d
Коэффициент ассоциации является показателем оценки тесноты связи между двумя альтернативными признаками и вычисляется по формуле:
Q =
Коэффициент сопряженности (современное название – коэффициент контингенции) вычисляется по формуле:
C1 =
Если известен критерий согласия χ2 (хи- квадрат), то при небольшом числе (до 100 единиц) наблюдений коэффициент контингенции можно определить по формуле:
C1 =
Образец решения задачи
Значение признака |
Заболели гриппом |
Не заболели |
Всего рабочих | |||
Иммунизированы Не иммунизированы |
32 82 |
a c |
1388 1088 |
b d |
1420 1170 |
a + b c + d |
Итого |
114 |
a + c |
2476 |
b + d |
2590 |
a+b+c+d |
Q =
C1 =
При χ2, равном 34,4, получаем:
C1 =
Коэффициент контингенции всегда имеет меньшее значение, чем коэффициент ассоциации; если он не менее 0,3, то это свидетельствует о наличии связи между качественными признаками.
Коэффициенты сопряженности и ассоциации оцениваются аналогично коэффициенту корреляции (от +1 до - 1). Рассчитанные в задаче коэффициенты свидетельствуют о наличии связи между рассматриваемыми признаками, т.е. прививки против гриппа влияют на заболеваемость. Знак «минус» указывает на обратную связь.