Корреляция альтернативных признаков
Альтернативные признаки – это признаки, принимающие только два возможных значения. Исследования их корреляции основано на показателях, построенных на четырехклеточных таблицах, в которые сводятся значения признаков.
-
a
b
c
d
Например, требуется измерить связь между прививками от гриппа и снижением заболеваемости гриппом в группе случайно выбранных студентов.
|
Заболели |
Не заболели |
Итого |
Привитые |
30 |
20 |
50 |
Не привитые |
15 |
5 |
20 |
Итого |
45 |
25 |
70 |
Вопрос: существует ли связь между заболеваемостью и прививками?
Решение
Для измерения тесноты взаимосвязи признаков производится расчет коэффициента контингенции по формуле:
(13)
Коэффициент контингенции принимает значения на интервале [-1; 1]. Интерпретация аналогична коэффициенту корреляции. Мы получили слабую отрицательную связь, то есть
Другой метод измерения связи основан на расчете коэффициента ассоциации:
(14)
Минус перед коэффициентом говорит об обратном направлении связи, чем больше прививок, тем меньше заболеваний.
Коэффициент контингенции всегда бывает меньше коэффициента ассоциации и дает более корректную оценку тесноты связи.
Задача 5.5 (Ефимова М.Р. Практикум стр. 168 – 169)
В результате обследования работников предприятия получены следующие данные (чел.)
Образование |
Удовлетворены работой |
Не удовлетворены работой |
Итого |
Высшее и среднее |
300 |
50 |
350 |
Незаконченное среднее |
200 |
250 |
450 |
Итого |
500 |
300 |
800 |
Требуется оценить тесноту взаимосвязи между уровнем образования и удовлетворенностью своей работой с помощью коэффициентов контингенции и ассоциации.
Решение
Коэффициент ассоциации –
Коэффициент контингенции –
Полученные коэффициенты подтверждают наличие существенной связи между исследуемыми признаками.
Задача. По данным социологического опроса 1000 человек получено следующее распределение ответов на два вопроса:
Считаете ли Вы, что Ваши доходы достаточны для удовлетворения основных потребностей?
Да
Нет
2. Вы работаете
В бюджетной организации
В коммерческой структуре
Распределение ответов имеет следующий вид:
-
Да
Нет
Да
170
756
Нет
230
520
Определите Есть ли связь между ответами на эти вопросы?
Задача. Проанализируйте связь между полом работника и характером труда в сезонных отраслях:
Численность занятых в отраслях | |||
|
Сезонных |
Не сезонных |
Всего |
Мужчины |
187 |
265 |
452 |
Женщины |
307 |
272 |
579 |
Всего |
494 |
537 |
1031 |
Задача. (Шмойлова Стр.222) Распределение предприятий по источникам средств характеризуется следующими данными:
Источники средств |
Зарождающийся бизнес |
Зрелый бизнес |
Итого |
Банковский кредит |
31 |
32 |
63 |
Собственные средства |
38 |
15 |
53 |
Того |
69 |
47 |
116 |
Вычислите коэффициенты ассоциации и контингенции. Какие выводы можно сделать на основании этих коэффициентов?
Коэффициент взаимной сопряженности К.Пирсона
Для оценки тесноты связи между признаками, принимающими любое число вариантов значений (категориальные, номинальные признаки), применяется коэффициент взаимной сопряженности К.Пирсона. Основой изучения связи между номинальными признаками служит таблица сопряженности – двумерное распределение единиц совокупности по признакам. В этой таблице в измерении связи участвуют не значения признаков. Вся информация о наличии или отсутствии связи содержится в частотах появления сочетаний признаков.
Информация для оценки этой связи группируется в виде таблицы:
Признаки |
A |
B |
C |
Итого |
D |
m11 |
m12 |
m13 |
Σ m1j |
E |
m21 |
m22 |
m22 |
Σ m2j |
F |
m31 |
m32 |
m33 |
Σ m3j |
Итого |
Σ mi1 |
Σ mi2 |
Σ mi3 |
Σ mij |
Где mij - частоты взаимного сочетания двух атрибутивных признаков;
n – число пар наблюдений.
Коэффициент взаимной сопряженности определяется по формуле
, (15),
где - показатель средней квадратической сопряженности.
Коэффициент взаимной сопряженности принимает значения в интервале [0;1]
Задача.Для изучения влияния условий труда на взаимоотношения в коллективе было проведено выборочное обследование 250 работников предприятия, ответы которых распределились следующим образом:
Условия труда |
|
Взаимоотношения |
в коллективе |
|
|
Хорошие |
Удовлетворитель-ные |
Неудовлетворитель-ные |
Итого |
Соответствуют требованиям |
30 |
20 |
10 |
60 |
Не полностью соответствуют |
25 |
50 |
15 |
90 |
Не соответствуют |
10 |
40 |
50 |
100 |
Итого |
65 |
110 |
75 |
250 |
Требуется охарактеризовать связь между исследуемыми показателями с помощью коэффициента взаимной сопряженности.