- •Введение
- •Тема 1. Общие аспекты применения математических методов в социологическом анализе
- •1.1.Статистические закономерности в анализе социологической информации: принципы моделирования реальности
- •Специфика математико-статистических методов применительно к социологической информации
- •Задачи математики применительно к социологической информации
- •1. 4. Сложности использования математических методов в социологии
- •Проблемы соотношения выборки и генеральной совокупности.
- •Отсутствие строгих обоснований возможности применения конкретных методов математической статистики.
- •Использование шкал низких типов.
- •Необходимость соотнесения модели метода с содержанием социологической задачи.
- •Тема 2. Общая характеристика процедуры анализа данных
- •2.1. Социологические данные
- •2. 2. Общие принципы анализа данных
- •Тема 3. Анализ одномерных распределений
- •Необходимость анализа одномерных распределений в социологии
- •3. 2. Меры средней тенденции
- •3.3. Дисперсия
- •Мера качественной вариации
- •3. 5. Энтропийный коэффициент разброса
- •Тема 4. Типы шкал и методы анализа информации
- •1. Номинальная шкала
- •4. 2. Ранговая шкала
- •4. 3. Интервальная шкала
- •Тема 5. Анализ двухмерных распределений
- •Общая характеристика двухмерных распределений
- •5.2. Показатели связи в двухмерных распределениях
- •Тема 6. Анализ связей между номинальными признаками
- •6.1. Общая характеристика подходов к анализу номинальных данных
- •6. 2. Анализ связей типа «признак-признак»
- •6.2.2. Коэффициенты связи, основанные на моделях прогноза
- •6.2.3. Коэффициенты связи, основанные на понятии энтропии.
- •6.2.4. Коэффициенты связи для четырехклеточных таблиц сопряженности.
- •6.2.5. Многомерные отношения преобладаний.
- •1. Если 1 дихотомический признак.
- •2. Если 2 дихотомических признака.
- •3. Если 3 дихотомических признака.
- •6.3. Анализ связей типа «альтернатива-альтернатива»
- •Анализ связей типа «группа альтернатив - группа альтернатив»
- •6.4.1. Анализ фрагментов таблиц сопряженности
- •6.4.2. Методы поиска сочетаний значений независимых признаков (предикторов).
- •Анализ связей типа «признак - группа признаков»
- •6.5.1. Номинальный регрессионный анализ (нра)
- •6.5.2. Логит- и пробит- модели
5.2. Показатели связи в двухмерных распределениях
Довольно часто используемым показателем силы связи выступают различные коэффициенты корреляции48. Корреляция указывает на степень статистической взаимосвязи признаков. Одним из индексов такого рода при использовании порядковой шкалы измерения выступает коэффициент ранговой корреляции Спирмена. Формула расчета его имеет следующий вид:
.
Коэффициент ранговой корреляции Спирмена будет равен +1 (абсолютная положительная связь), если ответы респондентов анализируемых групп будут в точности совпадать; он будет равен -1 (абсолютная отрицательная связь), если ответы всех респондентов обеих анализируемых групп будут прямо противоположны; если rs = 0, то это означает полное отсутствие всякой связи. Коэффициент ранговой корреляции показывает, насколько одинаковыми или различными оказываются ответы на один и тот же вопрос со стороны двух сравниваемых между собою групп респондентов.
Тема 6. Анализ связей между номинальными признаками
6.1. Общая характеристика подходов к анализу номинальных данных
Роль номинальных данных в социологии огромна, что объясняется следующими причинами:
- простота их получения и естественность интерпретации;
- они более надёжны, чем данные, полученные по шкалам более высокого типа;
- в методах, используемых для анализа номинальных данных, обычно бывают заложены модели, отвечающие естественной логике социолога.
Изучение связей между переменными, как правило, интересует исследователя не само по себе, а как отражение соответствующих причинно-следственных отношений. Однако социолог может наблюдать только статистические связи, а понятия «причина» и «следствие» не могут быть формализованы. Математика не может доказать, что такой-то признак служит причиной (следствием) того или иного явления. Для оценки связей между признаками используются частотные таблицы, или таблицы сопряженности (выборочные оценки вероятностных распределений многомерных случайных величин). На основе анализа подобных таблиц можно судить о сопряженности (совместной встречаемости) каких-то значений одних признаков с некоторыми значениями других признаков.
Предположим, что мы имеем два признака X и Y, первый из которых принимает значения 1, 2, . . ., r, а второй — значения 1, 2, . . ., c. Назовем двухмерной таблицей сопряженности матрицу, на пересечении i-й строки и j-го столбца которой стоит число nij, означающее количество объектов, обладающих i-м значением первого признака и j-м значением второго (i =1, . . ., r; j =1, . . ., c):
.
Обычно ее представляют с явно обозначенными наименованиями признаков и их значений и выписанными маргинальными суммами:
Таблица 18
Общий вид таблицы сопряженности
Значения X |
Значения Y |
Маргиналы по строкам |
|||||
1 |
2 |
… |
j |
… |
c |
||
1 |
n11 |
n12 |
… |
n1j |
… |
n1c |
n1. |
2 |
n21 |
n22 |
… |
n2j |
… |
n2c |
n2. |
… |
… |
… |
… |
… |
… |
… |
… |
i |
ni1 |
ni2 |
… |
nij |
… |
nic |
ni. |
… |
… |
… |
… |
… |
… |
… |
… |
r |
nr1 |
nr2 |
… |
nrj |
… |
nrc |
nr. |
Маргиналы по столбцам |
n.1 |
n.2 |
… |
n.j |
… |
n.c |
n |
Правый крайний столбец образуют строковые маргинальные суммы (маргиналы по строкам). Нижняя строка образуется столбцовыми маргинальными суммами (маргиналами по столбцам). Объем выборки n равен сумме маргиналов по столбцам (либо по строкам). В качестве элементов таблицы могут фигурировать частоты, средние значения, мода, медиана, дисперсии, величины отклонений от средних по строке (столбцу), разница между эмпирической и теоретической частотой (пакет SPSS).
Действия исследователя могут быть направлены на:
- поиск сочетаний значений признаков, детерминирующих поведение респондента, т.е. поиск взаимодействий;
поиск латентной переменной для каждого респондента.
Часто при этом используется т. н. оцифровка, т.е. приписывание каждой градации любого номинального признака определенного числа, отвечающего искомому значению соответствующей латентной переменной.
Математические методы работы с таблицами номинальных данных направлены на решение задач, типологизированных по классам. Рассмотрим классификацию задач, приведенную Ю.Н.Толстовой49. Ею выделяются следующие типы задач:
- «альтернатива-альтернатива», т. е. такие, которые позволяют изучать связь между отдельными значениями любых рассматриваемых признаков (детерминационный анализ50;
- «группа альтернатив - группа альтернатив», т.е. включающие анализ фрагментов таблиц сопряженности, методы выявления логических закономерностей, методы поиска детерминирующих сочетаний значений рассматриваемых признаков, в т. ч. алгоритмы, для обозначения которых используются аббревиатуры, включающие в себя сочетание AID (automatic interaction detector): CHAID, THAID51.
- «признак – признак» (наиболее знакомые социологу коэффициенты парной связи);
- «признак - группа признаков», включающие регрессионный анализ, методы построения индексов;
- «группа признаков - группа признаков», предполагающие канонический анализ, или анализ соответствий, который дает возможность осуществлять оцифровку, изучать связи между признаками с т. н. «совместными» альтернативами, находить веса признаков при формировании индекса52.
Тип задач, отвечающих рассмотрению всей совокупности признаков как системы, называется анализом системы признаков (логлинейный анализ или причинный анализ).