
- •Методические указания к решению задач по разделу 3 Таблицы n на m
- •Статистики тесноты связи
- •Фи-коэффициент
- •Коэффициент сопряженности признаков
- •V – коэффициент Крамера.
- •Коэффициент взаимной сопряженности Чупрова
- •Ранговые коэффициенты
- •Коэффициент ранговой корреляции Спирмена
- •Коэффициент "" Кендалла
- •Задачи для самоконтроля
Фи-коэффициент
Фи-коэффициент используют для измерения тесноты связи для таблицы с двумя рядами и двумя колонками (2*2).
Для выборки размера n эту статистику находят по формуле:
nr – итоговое число в ряду, nc – итоговое число в колонке, n – полный размер выборки, f0 – соответствующее число в таблице.
Фи-коэффициент принимает значение, равное 0, если связь отсутствует и 1, если связь сильная.
Задача 1. На основании данных о пользовании интернетом мужчинами и женщинами (30 человек) сделать выводы о связи пола и объема использования интернетом.
Использование интернета в зависимости от пола |
Мужчины |
Женщины |
Итого по строкам |
Много |
5 |
10 |
15 |
Мало |
10 |
5 |
15 |
Итого по столбцам |
15 |
15 |
30 |
Для этих данных подсчитаем f1 = 15*15 / 30 = 7,5
f2 = 15*15 / 30 = 7,5
f3 = 15*15 / 30 = 7,5
f4 = 15*15 / 30 = 7,5
Тогда значение хи-квадрат выглядит так: χ2 = (5-7,5)2/7,5 + (10-7,5)2/7,5 + (10-7,5)2/7,5 + (5-7,5)2/7,5 = 0,833+0,833+0,833+0,833 = 3,333
ф =
Таким образом, связь не очень сильна.
Коэффициент сопряженности признаков
Фи-коэффициент
применяют
только к небольшим таблицам, а коэффициент
сопряженности признаков - С -
используют
для оценки тесноты связи в таблицах
любого размера. Коэффициент сопряженности
признаков связан с хи-квадрат следующим
образом:
Значения коэффициента сопряженности находятся в интервале от 0 до 1. 0- нет связи, 1 – связь очень сильная.
V – коэффициент Крамера.
Это модифицированный коэффициент корреляции фи, используемый для таблиц больше, чем 22. Значение этого коэффициента лежит в интервале от 0 до 1. Для таблицы с r рядами и c колонками связь между V-коэффициентом Крамера и фи-коэффициентом выражается следующим образом:
В нашем примере
Коэффициент взаимной сопряженности Чупрова
Чем он ближе к 1, тем теснее связь.
φ2
– это показатель взаимной сопряженности,
определяемый следующим образом:
Ранговые коэффициенты
Среди непараметрических методов оценки тесноты связи наибольшее значение имеют ранговые коэффициенты Спирмена () и Кендалла (). Эти коэффициенты могут быть использованы для определения тесноты связи как между количественными, так и между качественными признаками. Все дальнейшие рассуждения опираются на понятия ранжирования и ранга. Ранжирование – это процедура упорядочивания объектов изучения, которая выполняется на основе предпочтения. Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания их величин, иначе говоря, ранг - это номер объекта в упорядоченном множестве аналогичных объектов.
Например, эксперт сравнивает объекты, иначе - ранжирует их. Чем больший ранг присваивается объекту, тем "лучше" объект.
Коэффициент ранговой корреляции Спирмена
В качестве меры
связи выступает коэффициент
ранговой корреляции Спирмена
().
Коэффициент корреляции Спирмена - это аналог коэффициента корреляции Пирсона, но подсчитанный для ранговых переменных, вычисляется он по следующей формуле:
где
d
– это разность рангов.
Коэффициент Спирмена принимает любые значения в интервале от –1 до 1. Определенная выше формула коэффициента корреляции Спирмена справедлива в случае, когда нет распределенных рангов. Если же они есть, то формула усложняется.