
Методы анализа информации
_____________________________________________________________________________
9. Подготовка данных к обработке
На практике для обработки и интерпретации данных обычно выделяют меньший объем времени, чем на создание инструментария или сбор информации. Но именно на этой стадии исследователи проверяют рабочие гипотезы, устанавливают существование связей детерминации и взаимодействия между социальными явлениями.
Последовательность действий ученых при обработке полученной информации любым из описанных в данном разделе методов в принципе совпадает (чистка массива данных, собственно описание, сокращение числа признаков, необходимых для итогового анализа, анализ взаимосвязей существенных признаков, интерпретация данных и построение моделей, прогнозирование развития событий), хотя выбор стратегии обработки информации во многом зависит от типа эмпирических данных. Различают несколько типов данных.
1. Данные типа «государственной статистики» получают из документальных источников, описывающих социум (социальную группу, политическое объединение, структуру власти, объективные социально-демографические характеристики российской властвующей элиты, характер голосования в конкретном регионе и т. д.) в пространстве и времени. Подобная информация собирается регулярно с определенной периодичностью и фиксируется в архивных данных. На основании этих сведений можно конструировать индексы, позволяющие проводить компаративистские исследования.
Статистические показатели также позволяют выделить схожие, однотипные группы объектов. В этом случае прибегают к типологическому анализу. К статистическим данным относятся и результаты переписи населения («объективка»), которые используют для формирования и контроля выборочной совокупности. Хотя последний раз всеобщая перепись населения проводилась в 1989 г., и данные эти явно устарели (например, по.роду занятий, возрастному показателю), тем не менее периодические выборочные пятипроцентные переписи населения отчасти восполняют пробелы в информации подобного рода.
2. Данные, полученные с помощью анкеты «простой» структуры. Полученная информация дает представление об общественном мнении с помощью простых, однозначно интерпретируемых вопросов (маркетинговые исследования для избирательных кампаний, мониторинга рейтинга политиков и властных структур). Основной задачей в подобном случае будет описание состояния отдельных эмпирических индикаторов как по всей совокупности, так и по отдельным подгруппам. Аналитические задачи, связанные с выявлением глубинной мотивации поведения, особенностей политического сознания людей, их выбора в исследованиях такого типа не ставятся. Тем не менее арсенал статистических приемов обработки предельно широк: от первичной группировки до многомерного анализа.
3. Информация, полученная в ходе опросов общественного мнения, включающих в себя наряду с анкетированием тестирование, не-стандартизированные интервью, наблюдение, эксперименты. Такая информация связана с исследованием политических установок, стереотипов. В этом случае наряду со статистическим методом многомерного шкалирования используют качественные методы анализа.
4. Текстовые данные. Они появляются при использовании в качестве методов сбора информации нарративного интервью в биографическом методе, игротехники, фокус-групп, контент-анализа, методик неоконченных предложений и тестов по типу двадцати самоопределений («Я - это ...»). При работе с подобной информацией достаточно часто используют трансакционный анализ.
Если в качестве исходных данных использованы результаты (отчеты) других проектов, то наиболее адекватным является вторичный анализ. Необходимым формальным требованием проведения вторичного сравнительного анализа в компаративных повторных или территориальных исследованиях является наличие сходных показателей в программе исследования (а в идеале - полное тождество или сопоставимость всего инструментария, что на практике практически неосуществимо). Допустимо использование обновленной методики, но при этом в повторном проекте материалы базового исследования располагаются в документах в начале, а все новинки (вопросы, тесты) в конце опросных листов- В случае обновления методик при повторных разработках прибегают к дополнительным проверкам выявленных зависимостей с помощью мысленного эксперимента.
С какими бы сведениями ни работал ученый, логическая схема обработки данных примерно одинакова. Собранную информацию систематизируют, вводят в компьютер для хранения и последующей обработки, формирования производных от эмпирических показателей индикаторов, поиска латентных характеристик, анализа взаимосвязи феноменов политической жизни, структурирования социальной реальности, После формирования массива данных специалисты переходят к обработке и окончательному оформлению результатов в виде схем, графиков, статистических расчетов и составлению отчета.
В современной политической литературе найдется не менее десятка различных способов классификации видов анализа. Традиционным остается подход, выделяющий статистический анализ (применительно к информации, полученной «жесткими» методами) и качественный анализ (применительно к данным, полученным с помощью «мягких» методик).
Различают два типа статистического анализа в зависимости от типа решаемых задач: дескриптивная статистика (описание признака в конкретной выборке) и индуктивная статистика (прогнозирование свойств всей генеральной совокупности на основании свойств выборочной совокупности). Непосредственно стадии анализа предшествует подготовка данных (выбраковка, кодирование, ввод данных в компьютер) к обработке.
Проверка методического инструментария на точность, полноту, качество заполнения. Проверка на точность заполнения заключается в проверке правильности ответов на каждый вопрос. Например, такую функцию выполняет проверка соответствия ответов на вопросы-фильтры и последующие вопросы.
Проверка анкет на полноту заполнения предполагает, что выбраковке подлежат документы, в которых пропущены ответы даже на один вопрос «паспортички» и на 10—15% содержательных вопросов.
Проверка на качество заполнения предполагает оценку ясности, четкости, понятности ответов и обводки кодов. Если в альтернативных закрытых вопросах респондент все же выделяет несколько вариантов ответов, то на практике обычно учитывают первый вариант. Все анкеты, не соответствующие предъявленным требованиям, подлежат выбраковке.
Оставшиеся после контроля документы нумеруются. Ремонт выборки может представлять одну из двух следующих процедур. Исследователи сравнивают идеальную выборочную модель с реальной выборкой и проводят дополнительный опрос, ликвидируя перекосы в выборке. Если количество отбракованных анкет невелико, то для восстановления необходимого объема и параметров выборки исследования возможна повторная обработка незначительного количества анкет.
Кодирование ~ процесс присвоения количественных значений информации. Кодируется не само содержание информации, а факт ее наличия или отсутствия. Закодированная в цифровой форме информация позволяет применять к ней математические методы обработки. При приписывании кодов (цифровых выражений операциональных ; определений) важно помнить, что нужно сохранять непрерывность (ни один номер не должен быть «потерян») и порядок приписывания кодов градациям переменной, например, для порядковых шкал по степени возрастания или убывания признака. Исследователю следует помнить, что хотя внешне закодированная в цифры информация номинальных, порядковых и интервальных шкал выглядит абсолютно идентично, существуют жесткие правила их обработки.
Фактически кодировка ответов на закрытые и полузакрытые вопросы осуществляется до начала исследования. Кодировка ответов на открытые вопросы включает три этапа. Во-первых, выписываются все возможные варианты ответов на отдельный листок. Напротив каждого варианта проставляют число, указывающее частоту его повторения. Во-вторых, все выписанные варианты ответов классифицируются по степени смысловой близости друг к другу. Близкие по смыслу группы ответов объединяются. В результате получаем формализованный список ответов (кодификатор). В-третьих, все ответы кодируются при помощи составленного кодификатора. В итоге более тысячи вариантов ответов объединяются в 10 — 15 смысловых групп.
При кодировке необходимо выполнять следующие правила:
а) выделяемые группы ответов определяются целью исследования;
б) объединенные в группе ответы должны иметь общее логическое и смысловое основание; в) разные группы ответов должны принципиально различаться по смыслу, иначе при классификации возникнут ошибки. Поскольку эта работа требует высокой квалификации, желательно, чтобы кодификацию открытых вопросов выполнял сам исследователь.
В зависимости от статистического пакета ответы могут быть закодированы с помощью позиционной или порядковой систем, Порядковая система кодирования предполагает сплошную нумерацию всех позиций. Эта система кодирования использовалась, например, в статистическом пакете Cobra для ЭВМ в 1980-х годах. Она весьма неудобна, поскольку в ней осложнено кодирование ответов на полузакрытые и открытые вопросы (при составлении анкеты необходимо оставлять «пустые» дополнительные номера).
В позиционной системе кодирования ответы нумеруются в каждом вопросе автономно. Теперь эта система используется все чаще (например, в SPSS).
Затем осуществляется ввод данных в электронную таблицу соответствующего статистического пакета, с помощью которого будет осуществляться обработка информации. Количество колонок в электронной таблице соответствует количеству анализируемых переменных, а число строк — количеству опрошенных респондентов.
Приемы статистики, используемые при обработке данных эмпирических исследований, должны соответствовать качеству исходной информации. Во-первых, уровень сложности анализа не должен превосходить уровень информативности данных. Во-вторых, следует соблюдать принципы соответствия процедур типу шкал. В-третьих, статистический анализ должен сопровождаться качественным анализом.