- •Социология Данкова Жанна Юрьевна
- •Методы социологии
- •Общество как социокультурная система
- •Теоретические основы основания общества.
- •Социальная стратификация
- •Основные социальные структуры общества
- •Социальная общность
- •Социальная группа
- •Социальные институты
- •Социальная организация
- •Методология социологических исследований
- •Типы шкал
- •Преобразование шкал
- •Виды социологических исследований
- •Разработка методического инструментария
- •Анализ документа
- •Выборочный метод
- •Анализ данных
- •Задачи анализа данных
- •Социальное проектирование как отрасль социологической науки
Задачи анализа данных
Классификация – обнаруживает признаки, которые характеризуют группы объектов (т.е классы).
Кластеризация – предполагает разбиение объектов на группы уже после классификации (т.е общий массив данных делится на классы, после этого по каким-то дополнительным параметрам производится кластеризация)
Ассоциация – выявляет закономерности между связанными событиями в наборе данных.
Последовательность (последовательная ассоциация) – подобна ассоциации, но устанавливает закономерность не между одновременными событиями, а между теми, что связаны во времени.
Прогнозирование – оценивает пройденные (пропущенные) или будущие варианты развития объекта.
Определение отклонений (выбросов) – обнаружить и проанализировать данные, которые существенно отличаются о множества других данных. (выявить ряд нетипических шаблонов)
Оценивание – эта задача сводится к предсказанию непрерывных значений признаков объекта.
Анализ связей – предполагает нахождение зависимостей в общем массиве данных.
Визуализация – создаётся графический образ анализируемых данных.
Подведение итогов (создание выводов) – предполагает описание конкретных групп объектов.
Для того, чтобы выполнить все задачи анализа данных необходимо их преобразовать. Выделяют 4 функции преобразования данных.
Обобщение (создание базы данных, кодирование).
Концептуализация
Коммуникация – перевод результатов исследования со статистического языка на язык заказчика.
Эксраполяция – определение степени соответствия полученных результатов для всей совокупности респондентов.
Выполнить эти функции возможно только с помощью описательной статистики.
Описательная статистика – техника сбора и суммирование количественных данных. Цель описательной статистики – обработка данных, их систематизация, наглядное представление в форме графиков и таблиц, а также их количественное описание посредством основных статистических показателей.
Идея всех статистик состоит в следующем: вместо всех значений переменных можно изучить описательные статистики, которые дают общее представление о значениях, которые принимает эта переменная.
Показатели:
Максимум и минимум – максимальное и минимальное значение переменных.
Среднее арифметическое – сумма значений переменных, делённая на число значений переменных.
Медиана – значение в отсортированной выборке (по убыванию или возрастанию), которое делит эту выборку на две равные части. (отбрасываем самое минимальное и самое максимальное)
Квартили – значения, которые делят две половины выборки (разбитые медианой) ещё раз пополам. Бывают верхняя квартиль (75%) и нижняя квартиль (25%).
Квартальный размах – равен разности 75-го квартиля и 25-го. (от 25 до 75)
Дисперсия – это значение, которое отражает меру изменчивости значения переменной. Меняется от 0 до бесконечности. Значение 0 означает, что изменчивость отсутствует.
Стандартное отклонение – показывает степень разброса значений переменной от его среднего.
Мода – максимально часто встречающееся значение переменной. Если распределение или перечень значений показателей имеет несколько мод, говорят о мульмодальности. Наличие мультимодальности говорит об неоднородности выборки и о низкой валидности (надёжности) данных. (мультимодальность – несколько мнений, из которых непонятно кто как определился).
Асимметрия – коэффициент, который является мерой несимметричности распределения.
Экцесс – мера остроты пика распределения.
Атрибут – свойство, которое характеризует объект.
С описательными статистиками тесно связаны понятие представление результатов. Наиболее распространённым являются:
Графики
Ящик с усами – на нём отражаются медиана, квартильный размах, выбросы, грубые ошибки и размах, рассчитанный без выбросов и грубых ошибок.
Построение графиков осуществляется в программных комплексах для анализа данных.
Круговая диаграмма
Правила построения графиков:
Тщательный отбор статистических данных.
Выбрать наиболее оптимальный вид графика.
Название графика должно отражать содержательную часть
4. Надписи и легенда располагаются в нижней или правой части графика.
Допускается не более трёх цветов в графике
Виды графиков: линейные (статистические кривые, например уровень рождаемости), плоскостной (фоновый, столбиковый, полосовой, круговой, секторный, фигурный, точечный), объёмные («поверхности», «распределения») .
Таблицы
Существую одномерные и многомерные. В социологии используют понятие таблицы сопряжённости. Одномерные таблицы представляют собой простое распределение значений переменных, носят название линейки. Многомерные таблицы предполагают установление зависимости между единицами наблюдения, их мнениями и другими дополнительными признаками
Формирование рядов.
Ряды бывают динамические (совокупность значений показателя за определённый период времени), вариационный ряд (совокупность возможных значений показателя и частота встречаемости их заданной группе объектов), матрица типа «объект-признак» (совокупность данных, в которой строки соответствуют объектам, а столбцы - показателям).
Алгоритм анализа данных:
Существует 5 этапов:
Подготовка и первичная статическая обработка. Включает в себя:
определение вида исходных данных (понятие шкалы)
уточнение вида исследовательских задач
кодирование и перекодирование исходных данных
определение нормальности распределения (построение графика и наложение лекала)
классификация задача-метод
определение выбросов и грубых ошибок
расчёт основных статистических показателей
табличное распределение
графический анализ данных
Применение методов проверки гипотез
Уточнение гипотез и их разновидности
Определение факторов и степени их влияния на гипотезу
Выбор методов проверки гипотез:
Т-критерий
S-критерий для независимых выборок
Критерий Мана Уитли
ANOVA
Критерий Краскем Уолмс
Критерий Хи-квадрат
Корреляции Пирсона, Спирмана, Кендела
Установление возможных ошибок, которые могут быть допущены при интерпретации результатов анализа.
Использование методов многомерного анализа
Факторный анализ
Регрессионный анализ
Сравнительный анализ
Статистическую обработку мнений экспертов и фокус-групп с помощью коэффициента конкордации Кендела
Использование весовых коэффициентов и индексов. Данная процедура позволяет уменьшить или увеличить значение выбранных признаков.
Подготовка отчета. Итоговый документ должен включать в себя следующие обязательные блоки:
Общая информация (актуальность исследования, проблема кто проводил исследование, цель и задачи, объект и предмет, расчет выборки, теоретико-методологическую основу исследования)
Основная часть отчета, включает в себя аналитическую интерпретацию обработанных эмпирических данных, графическое представление полученных результатов.
Заключительная часть содержит выводы и практические рекомендации для решения проблемы.
Приложения. Содержит: программу исследования, образцы инструментария и одномерное распределение первичных данных (линейка).
