2. Анализ и обработка данных в социологии.
Эмпирические данные, полученные в ходе социологического исследования, еще не позволяют сделать верные выводы, обнаружить закономерности и тенденции, проверить выдвинутые программой исследования гипотезы.
Полученную первичную социологическую информацию следует обобщить, проанализировать и научно интегрировать. Для этого все собранные анкеты, карточки наблюдения или бланки интервью необходимо проверить, закодировать, ввести в ЭВМ, сгруппировать полученные данные, составить таблицы, графики, диаграммы и т. д. Иными словами, необходимо применить методы анализа и обработки эмпирических данных.
В социологии под методами анализа и обработки социологической информации понимают способы преобразования эмпирических данных, полученных в ходе социологического исследования. Преобразование производится с целью сделать данные обозримыми, компактными и пригодными для содержательного анализа, проверки исследовательских гипотез и интерпретации
Между тем анализ и обработка социологической информации как целостное образование составляет этап эмпирического социологического исследования, в ходе которого с помощью логико-содержательных процедур и математико-статистических методов на основе первичных данных раскрываются связи исследуемых переменных. С определенной долей условности методы обработки информации можно разделить на первичные и вторичные. Для первичных методов обработки исходной информацией служат данные, полученные в ходе эмпирического исследования, т. е. так называемая "первичная информация": ответы респондентов, оценки экспертов, данные наблюдения и пр. Примерами таких методов являются группировка, табулирование, расчет многомерных распределений признаков, классификация и др.
Вторичные методы обработки используют, как правило, для данных первичной обработки, т. е. это методы получения показателей, рассчитываемых по частотам, сгруппированным данным и кластерам (средних величин, мер рассеяния, связей, показателей значимости и т. д.). К методам вторичной обработки можно также отнести методы графического представления данных, исходной информацией для которых служат проценты, таблицы, индексы.
Кроме того, методы анализа и обработки социологической информации можно разделить на методы статистического анализа информации, в том числе методы описательной статистики (расчет многомерных распределений признаков, средних величин, мер рассеяния), методы статистики вывода (например, корреляционный, регрессивный, факторный, кластерный, причинный, логлинейный, дисперсионный анализ, многомерное шкалирование и др.), а также методы моделирования и прогнозирования социальных явлений и процессов (например, анализ временных рядов, имитационное моделирование, цепи Маркова и пр.).
С точки зрения использования технических средств выделяют два вида обработки социологической информации: ручную и машинную (с использованием средств вычислительной техники). Ручную обработку используют в основном в качестве первичной при небольших массивах информации (от нескольких десятков до сотни анкет), а также при относительно простых алгоритмах ее анализа. Вторичную обработку информации проводят с помощью микрокалькулятора или другой вычислительной техники. Примером социологических исследований, в которых часто используется ручная обработка, являются пилотажные, экспертные и социометрические опросы.
Однако основным средством анализа и обработки данных в настоящее время являются ЭВМ, в том числе персональные компьютеры, на которых осуществляется первичная и большинство видов вторичной обработки и анализа социологической информации. При этом анализ и обработка социологической информации на ЭВМ проводятся, как правило, посредством специально разрабатываемых машинных программ, реализующих методы анализа и обработки социологических данных. Эти программы обычно оформляются в виде специальных наборов программ или так называемых пакетов прикладных программ анализа социологической информации. В крупных социологических центрах анализ и обработка социологической информации наряду с пакетами прикладных программ опираются на архивы и банки социологических данных, позволяющих не только хранить необходимую информацию, но и эффективно использовать ее при осуществлении вторичного анализа социологических данных.
Этапы и механизмы обработки данных. Главная задача заключительного этапа соц иссл-я — анализ и интерпретация полученных данных, обобщение выводов и выдача рекомендаций по совершенствованию или изменений работы изучаемого социального механизма.
После проведения исследования осуществляются заключительные этапы, истолкование полученных данных.
Вначале информация проходит стадию предварительной подготовки к обработке(проверку методического инструментария на точность, полноту и качество заполнения, происходит выбраковка некачественно заполненных анкет).
Данные, полученные в социологическом исследовании на стадии: сбора эмпирического материала, как правило, обрабатываются на ЭВМ.
Современная технология обработки включает целый ряд этапов: редактирование данных, кодирование данных, контроль данных и исправление ошибок, выбор средств математической обработки данных, анализ данных Редактирование. Цель - подготовка информации, заключенной в вопроснике, для перевода на машинный носитель.Анкеты, полученные в результате опроса, могут содержать множество ошибок, неточностей и всякого рода погрешностей необходимо по возможности избегать их. Наиболее типичные ошибки: Нарушение полевых процедур опроса: использована не та форма вопросника; опрошен не тот респондент; отсутствуют шифры, идентифицирующие вопросник.Неполнота заполнения вопросника.
Кодирование. Цель— преобразование собранной информации в числовую форму, которая в свою очередь предназначена для запоминания в ЭВМ в машиночитаемой форме. Анкеты кодируются на стадии их создания, и респондент непосредственно отмечает тот код, который соответствует его ответу. Открытая форма вопросов
в интервью и анкетах, требующих специального кодирования после проведения опроса.
Важной составной частью подготовки данных к анализу является всесторонний контроль данных и исправление найденных ошибок. Источники ошибок кроются во всех предыдущих этапах исследования от сбора информации до ее ввода в ЭВМ. Практически очень трудно исправить все ошибки в данных, особенно если это исследование достаточно обширно. Исследователь должен решить, какого рода проверки и исправления наиболее важны для него, а какими ошибками можно пренебречь.
Средства математической обработки данных. Статистический анализ полученной социологической информации можно обработать следующими видами математической обработки данных:
- Статистическая группировка - это классификация или упорядочение данных по признаку подобия или различия. Основное назначение группировки - установлении численности каждой отдельно взятой части совокупности, расчленённой в соответствии со значениями определенного признака (или нескольких признаков), и в изучении влияния причин и зависимости явлений.
- Ряды распределения. Результат группировки единиц наблюдения по какому-либо признаку называется статистическим рядом. По вариационному ряду количественного признака можно подсчитать, как часто каждое значение этого признака встречается в совокупности.
- Статистические таблицы – обобщают исходные данные. По таким таблицам устанавливаются, измеряются и анализируются связи между признаками исследуемой совокупности объектов. Простые таблицы - перечень, список, отдельных единиц совокупности о количественной (или качественной) характеристикой каждой из них в отдельности. В групповых таблицах содержится группировка единиц совокупности по одному признаку, а в комбинационных — по двум и более признакам.
- Гистограмма — это графическое изображение интервального ряда. способ графического представления табличных данных. Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны.
- Кумулятивные кривые. Кумулята округляет индивидуальные значения признака в пределах интервала и представляет собой возрастающую ломаную линию.
- Полигоны. Для построения полигона величина признака откладывается на оси абсцисс, а частоты— на оси ординат. Из точек, соответствующих значениям признака, восстанавливаются перпендикуляры, равные по высоте частотам. Вершины перпендикуляров соединяются прямыми линиями.
