Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ГОС по социологии - все части.doc
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
3.64 Mб
Скачать

4.5 Коэффициенты ранговой корреляции.

Коэффициенты связи между номинальными переменными никак не реагируют на наш произвол в присвоении определенным градациям тех, или иных числовых кодов.

Однако эти рассуждения становятся неверными, когда речь заходит о переменных, измеренных на порядковом уровне. Для такого рода переменных порядок расположения градаций уже существенен, поскольку он фиксирует степень выраженности измеряемого свойства. Измерение взаимосвязи в таблицах, построенных с использованием порядковых переменных, вполне возможно и нередко делается с использованием коэффициентов χ2, Крамера, λ и τ. Вместе с тем, эти коэффициенты не используют данные о порядке следования градаций, и, следовательно, лишают нас возможности использовать всю содержащуюся в переменных информацию. Для того, чтобы устранить этот недостаток, наряду с перечисленными коэффициентами, для порядковых переменных используют и другие меры связи - коэффициенты ранговой корреляции.

Коэффициенты χ2, Крамера, показывают, что с большой вероятностью мы можем утверждать наличие взаимосвязи между двумя рассматриваемыми показателями, поскольку значимость обоих этих коэффициентов весьма высока (P>0,999). Однако эти коэффициенты не дают ответа на важный вопрос: с ростом удовлетворенности материальным положением возрастает, или падает удовлетворенность жизнью в целом? Представляется, что удовлетворенностью жизнью должна возрастать с ростом удовлетворенности материальным положением, но те коэффициенты, которые есть в нашем распоряжении, не дают возможности это зафиксировать, либо хотя бы проверить направление взаимосвязи.

В настоящее время социологи используют несколько различных коэффициентов ранговой корреляции – ρ Спирмена, τ Кендэла, γ Гудмена-Краскала. Рассмотрим правила вычисления коэффициента γ (Гамма) Гудмена-Краскала, как наиболее простого и наиболее часто используемого при анализе социологических данных.

На первом шаге вычисления коэффициента γ фиксируются количества респондентов, у которых значение первой переменной не меньше значений второй переменной. Например, в таблице 2.8 у 5 респондентов значения обоих переменных равны 1, у 35 респондентов значения обеих переменных равны 2 и т.д.

показатель S – количество пар, в которых значение первой переменной не меньше значений второй переменной.

показатель D – количество пар, в которых значение первой переменной меньше значений второй переменной.

Имея значения S и D можно непосредственно вычислить коэффициент γ по формуле (2.7).

В целом, ранговые коэффициенты связи характеризуют ситуацию, когда сопоставляя двух случайно отобранных респондентов, у которых измеряются две порядковых переменных А и В мы можем сказать, что если у первого респондента значение переменной А больше, чем у второго респондента, то у него будет больше и значение по переменной В. Количество пар респондентов, у которых это правило выполняется и есть только что построенный показатель S. Количество пар респондентов, для которых действует обратное правило, то есть таких пар, у которых переменная А у первого респондента имеет значение больше, чем у второго, а переменная В – меньше, фиксируется показателем D. Таким образом, коэффициент γ фиксирует то, каких пар больше.

Из формулы (2.8) следует, что коэффициент γ может изменяться в интервале от -1 до +1. При этом коэффициент равен +1 в том случае, когда показатель D равен 0, то есть в ситуации, когда для всех респондентов верно, что если переменная А=i, а переменная В=j, то всегда i > j. Соответственно, γ равна -1 когда в той же ситуации переменных А и В всегда i < j.

Что означает ситуация, когда одна пара переменных, скажем А1 и А2 имеет более высокое (по абсолютной величине) значение коэффициента γ, чем пара переменных В1 и В2? Это означает, что для переменных А1 и А2 вероятность «правильного порядка» значений переменных выше, чем для переменных В1 и В2. Под «правильным порядком» мы понимаем такой, при котором если А=i, а В=j, то всегда i > j. или i < j. Вообще, коэффициент γ, имеет прямую вероятностную интерпретацию – это разность между вероятностями правильного и неправильного порядка для пары случайно извлеченных из выборки наблюдений. Именно в этом смысле следует понимать силу связи, которая фиксируется ранговыми коэффициентами корреляции.

Отличие ранговых коэффициентов корреляции от коэффициентов связи, основанных на χ2, либо на модели предсказания в том, что они фиксируют не только наличие, либо отсутствие связи, но и, в случае наличия связи, ее направление. Это, несомненно, является достоинством данных коэффициентов, но, в определенных случаях, может являться и их недостатком. Дело в том, что ранговые коэффициенты корреляции фиксируют только однонаправленные, монотонные формы зависимости.

Что произойдет, если зависимость между переменными не имеет однонаправленной связи? Оказывается, что в ситуации такого рода форм зависимостей ранговые коэффициенты связи оказываются неэффективными. Действительно, если может оказаться, что для части респондентов, например тех, кто имеет малые значения переменной Х (график 1 рисунка 2.12) значение рангового коэффициента связи будут отрицательные, а для тех респондентов, которые имеют большие значения переменной Х ранговый коэффициент будет положительный, то общее значение рангового коэффициента может оказать равным 0. И это при том, что, как показывает график, связь между переменными явно есть.

Таким образом, тот факт, что значение рангового коэффициента корреляции равно 0 не говорит об отсутствии связи, а говорит лишь об отсутствии монотонной связи.

Если при изучении взаимосвязи двух порядковых переменных мы получили нулевое значение ранговой корреляции, то как можно проверить с какой из ситуаций мы имеем дело: между переменными вообще нет зависимости, либо между переменными нет монотонной зависимости? Ответ достаточно прост: следует посчитать, скажем, коэффициент χ2. Если этот коэффициент покажет наличие связи при нулевом значении коэффициента γ, то, очевидно, что мы имеем дело с наличием немонотонной связи между переменными.

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

1) Сопоставить каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).

2) Определить разности рангов каждой пары сопоставляемых значений.

3) Возвести в квадрат каждую разность и суммировать полученные результаты.

4) Вычислить коэффициент корреляции рангов по формуле:.

где - сумма квадратов разностей рангов, а - число парных наблюдений.

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.

Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности.

Несколько иной подход в рассматриваемой группе мер связи основывается на подсчете числа несовпадений в ранжировке объектов по сопоставляемым переменным. Этот подход разработал М. Кендалл (1974), когда предпринял попытку истолковать процесс измерения связи между переменными, не прибегая к принципу произведения моментов. Он рассмотрел два порядковых признака xi и хj, на каждый из которых N объектов отображаются в N последовательных рангов (1, 2,..., N). Из N объектов формируется N(N — l)/2 пар, и для каждой пары подсчитывается количество совпадений порядка на признаке xi с порядком на признаке xj. Это количество обозначается «Р». Таким же образом определяется количество несовпадений (инверсий) «Q». Коэффициент ранговой корреляции, получивший название «тау» Кендалла, вычисляется по формуле

Несмотря на различие в подходах, между коэффициентами ранговой корреляции Спирмена и Кендалла существует тесная логическая связь. В то же время τ Кендалла имеет интересную для математических статистиков интерпретацию: если из N объектов случайно выбираются два объекта, то разность между вероятностью того, что они будут иметь одинаковый порядок как по xi, так и по xj, и вероятностью того, что у них будет наблюдаться различие в порядках по xi и хj, равна величине τ(«тау»). На основе подсчета количества совпадений и инверсий сконструирован целый ряд различных мер связи. В частности, этот принцип используется в коэффициенте бисериальной ранговой корреляции Кертена и Гласса (rrb), который применяется для изучения взаимодействия дихотомической и порядковой переменных. В то же время Гласc показал, что rrb аналогичен бисериальному коэффициенту корреляции для порядковых переменных и для его вычисления можно обойтись без подсчета совпадений и инверсий.