
8.4 Анализ таблиц сопряженности размера 2 2
Простейшая задача о взаимосвязи возникает тогда, когда имеются два признака, каждый из которых принимает два значения (табл.8.1).
Таблица 8.1 — Общая схема таблицы сопряженности 2 2
|
В |
не В |
|
А |
a |
b |
a+b |
не А |
c |
d |
c+d |
|
a+c |
b+d |
n=a+b+c+d |
Для характеристики
степени связи двух признаков применяется
коэффициент контингенции
,
определяемый формулой
Коэффициент
равен 0, если нет соответствия между
двумя дихотомическими признаками, и
равен +1 или –1, когда имеется полное
соответствие между ними. В силу трудностей
интерпретации знака коэффициента для
номинальных переменных часто используют
в анализе лишь абсолютную величину —
.
Коэффициент контингенции
вычисляется для номинальных данных,
представляющих естественные дихотомии,
например, пол. Приведение количественных
переменных к дихотомическому виду
связано с выбором граничной точки
разделения (например, население до 40
лет и население старше 40 лет).
8.5 Основы корреляционного анализа
Закономерности при проявлении социально-экономических и политических процессов складываются под влиянием множества причин, которые действуют одновременно и взаимосвязано. Изучением взаимосвязанности между несколькими величинами в основном занимается корреляционный анализ.
Наиболее широко
известной мерой связи служит коэффициент
корреляции Пирсона
(
):
,
где — значение признака x,
— значение признака
y,
— количество объектов.
Коэффициент корреляции может изменяться от –1 до +1. Если он равен 0, то связь между признаками отсутствует.
После вычисления
коэффициента корреляции возникает
вопрос, насколько показателен этот
коэффициент и не обусловлена ли
зависимость, которую он фиксирует
случайными отклонениями. Иначе говоря,
необходимо проверить гипотезу о том,
что полученное значение коэффициента
корреляции значимо отличается от 0. Если
гипотеза
(
=0)
будет отвергнута, говорят, что величина
коэффициента корреляции статистически
значима, т.е. эта величина не обусловлена
случайностью, при уровне значимости
.
Для случая, когда < 50, применяется критерий Стьюдента ( ):
.
Если
> 50, то необходимо использовать
-критерий
Коэффициенты
ранговой корреляции (Спирмена, Кендалла)
используются для измерения взаимосвязи
между качественными признаками, значения
которых могут быть упорядочены или
проранжированы по степени убывания или
нарастания данного качества у исследуемых
объектов. Наиболее простым с точки
зрения процедуры вычисления является
коэффициент
ранговой корреляции Спирмена
(
):
,
где — количество объектов,
— разность рангов
i-ой
пары.
Величина также как и коэффициент корреляции Пирсона изменяется от –1 до +1. значимость коэффициента корреляции Спирмена для <100 определяется по таблице критических значений коэффициента , зависящего от задаваемого уровня значимости и . Если >100, то критические значения находятся по таблице значений критических точек стандартного нормального распределения. Наблюдаемые значения критерия вычисляются по формуле
Коэффициенты ранговой корреляции используются как меры взаимозависимости между рядами рангов, а не как меры связи между значениями самих переменных.