- •1. Типы шкал. Допустимые преобразования шкал. Примеры.
- •2. Вариационный ряд дискретного признака. Вариационный ряд непрерывного признака. Гистограмма. Кумулянта. Полигон частот.
- •3.Меры центральной тенденции непрерывного признака. Среднее, мода, медиана. Их свойства.
- •4. Меры вариации непрерывного признака. Размах, дисперсия, среднее квадратическое .
- •5. Меры центральной тенденции порядкового признака. Мода медиана. Свойства.
- •6. Меры вариации порядковых признаков. Размах, квартильное отклонение, вариация. Свойства
- •7. Нормальное распределение и его свойства.
- •8. Шкала Терстоуна измерения установки. Построение, работа со шкалой.
- •10. Шкалирование по Гуттману. Построение, достоинства и недостатки шкалы.
- •11. Метод семантического дифференциала.
- •12. Метод парных сравнений построения ранжированного ряда. Преимущества перед прямым ранжированием.
- •13. Логические индексы. Логический квадрат, логический прямоугольник.
- •14. Аналитические индексы. Примеры.
- •15. Графическое изображение двух или более вариационных рядов.
- •16.Двумерные распределения. Таблица сопряженности. Маргинальные частоты.
- •17. Анализ взаимосвязей признаков. Типы связей
- •Рекомендации по применению метода ранговой корреляции (метод Спирмена)
- •Зависимость статистическая - Взаимосвязь двух признаков или величин
- •18. Исследование локальной связи признаков. Коэффициент Юла. Вычисления и свойства.
- •19. Исследование глобальной связи связи между признаками. Критерий хи-квадрат.
- •Разберем самый простой пример.
- •20. Коэффициент ранговой корреляции Спирмена. Вычисления и свойства.
- •21. Коэффициент ранговой корреляции Кенделла. Вычисления и свойства.
- •22. К оэффициент Гудмана для номинальных шкал. Вычисления и свойства.
- •23. Коэффициент парной корреляции. Вычисление и свойства. Линия регрессии.
- •25. Типы и источники информации, используемые в социологии.
- •Тип 1: Данные типа “государственная статистика”.
- •Тип 3: Данные, полученные посредством анкет “сложной” структуры.
- •Тип 4: Данные об использовании бюджета времени.
- •Тип 5: Текстовые данные.
19. Исследование глобальной связи связи между признаками. Критерий хи-квадрат.
Критерий Хи-квадрат позволяет сравнивать распределения частот вне зависимости от того, распределены они нормально или нет.
Под частотой понимается количество появлений какого-либо события. Обычно, с частотой появления события имеют дело, когда переменные измерены в шкале наименований и другой их характеристики, кроме частоты подобрать невозможно или проблематично. Другими словами, когда переменная имеет качественные характеристики. Так же многие исследователи склонны переводить баллы теста в уровни (высокий, средний, низкий) и строить таблицы распределений баллов, чтобы узнать количество человек по этим уровням. Чтобы доказать, что в одном из уровней (в одной из категорий) количество человек действительно больше (меньше) так же используется коэффициент Хи-квадрат.
Разберем самый простой пример.
Среди младших подростков был проведён тест для выявления самооценки. Баллы теста были переведены в три уровня: высокий, средний, низкий. Частоты распределились следующим образом:
Высокий (В) 27 чел.
Средний (С) 12 чел.
Низкий (Н) 11 чел.
Очевидно, что детей с высокой самооценкой большинство, однако это нужно доказать статистически. Для этого используем критерий Хи-квадрат.
Наша задача проверить, отличаются ли полученные эмпирические данные от теоретически равновероятных. Для этого необходимо найти теоретические частоты. В нашем случае, теоретические частоты – это равновероятноые частоты, которые находятся путём сложения всех частот и деления на количество категорий.
В нашем случае: (В + С + Н)/3 = (27+12+11)/3 = 16,6
Формула для расчета критерия хи-квадрат:
Хи-квадрат = ∑(Э - Т)² / Т
Строим таблицу:
Эмпирич. (Э) Теоретич. (Т) (Э - Т)² / Т
Высокий 27 чел. 16,6 6.41
Средний 12 чел. 16,6 1,31
Низкий 11 чел. 16,6 1,93
Находим сумму последнего столбца:
Хи-квадрат = 9,64
Теперь нужно найти критическое значение критерия по таблице критических значений. Для этого нам понадобится число степеней свободы (df)
df = (R - 1) * (C - 1), где R – количество строк в таблице, C – количество столбцов.
В нашем случае только один столбец (имеются в виду исходные эмпирические частоты) и три строки (категории), поэтому формула изменяется – исключаем столбцы.
df = (R - 1) = 3-1 = 2
Для вероятности ошибки p≤0,05 и df = 2 критическое значение хи-квадрат = 5,99.
Полученное эмпирическое значение больше критического – различия частот достоверны (хи-квадрат = 9,64; p≤0,05).
Как видим, расчет критерия очень прост и не занимает много времени. Практическая ценность критерия хи-квадрат огромна. Этот метод оказывается наиболее ценным при анализе ответов на вопросы анкет.
20. Коэффициент ранговой корреляции Спирмена. Вычисления и свойства.
Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.
Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:
1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).
2) Определить разности рангов каждой пары сопоставляемых значений.
3) Возвести в квадрат каждую разность и суммировать полученные результаты.
4) Вычислить коэффициент корреляции рангов по формуле:.
где
-
сумма квадратов разностей рангов, а
-
число парных наблюдений.
При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.
Мощность коэффициента ранговой корреляции Спирмена несколько уступает мощности параметрического коэффициента корреляции.
Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных (пример 1), но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности
