Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
workbook.rtf / workbook.doc
Скачиваний:
34
Добавлен:
22.05.2015
Размер:
2.05 Mб
Скачать

Контроль данных и исправление ошибок.

Дальнейший процесс преобразования информации из документа сбора состоит в перенесении кодов на машинный носитель — перфокарты — и ввод данных в память ЭВМ.

Важной составной частью подготовки данных к анализу явля­ется всесторонний контроль данных и исправление найденных ошибок. Источники ошибок кроются во всех предыдущих этапах иссле­дования от сбора информации до ее ввода в ЭВМ.

Практически очень трудно исправить все ошибки в данных, осо­бенно если это исследование достаточно обширно. Исследователь должен решить, какого рода проверки и исправления наиболее важ­ны для него, а какими ошибками можно пренебречь.

Процедура исправления данных состоит из трех этапов: выявления ошибок, нахождения истинных величин данных или кодов в исходных документах — анкетах, бланках, исправления данных.

Среди множества ошибок, требующих к себе соответствующего внимания, назовем две. Появление кодов, отсутствующих в инструк­ции по кодированию анкеты. Например, для оценки удовлетворенности

работой была использована шкала с градациями 1,2, 3,4,5,6, 7 и дополнительно коды — 0 (отсутствие ответа), 9 (респондент не работает и вопрос к нему не относится). Тогда числа 8,10,11 и т. д. будут ложными кодами, которые необходимо исправить.

Другая ошибка — появление кодов, выходящих за рамки логиче­ской структуры вопросника. Например, для вышеприведенного при­мера ясно, что на вопрос должны отвечать лишь работающие, и этот факт должен быть проверен при контроле данных. Иногда этот тип контроля называют проверкой данных на логическую согласован­ность.

После корректировки данных полезно подсчитать частотные распределения для всех переменных в исследовании. Это позволит выявить не только ложные коды, но и получить первые сведения о выборке.

Построение новых переменных.

Перед анализом данных и в процессе их анализа часть вопросов анкеты (переменные, признаки в терминологии этапа работы с данными) в исходной формулировке подвергается преобразованиям. Тип этих преобразований определяется гипотезами исследования, программой анализа полученной информацией и конкретными свойствами эмпирических данных, получаемых в результате их сбора.

Преобразования переменных могут быть очень простыми, когда,, например, для открытого вопроса о возрасте вводят определенную группировку возрастов или шкалу с семью градациями свертывают в трехбалльную, и очень сложными, когда на нескольких перемен­ных строится новая — индекс например, на основе вопросов о различных статьях денежных доходов семьи и ее составе подсчитыва­ется индекс — средний доход, приходящийся на одного члена этой семьи).

Для построения индексов могут применяться всевозможные ста­тистические методы — факторный анализ, кластерный, регрессион­ный а т. д., различные логически и теоретически обоснованные эвристические процедуры преобразования,

Подготовка эмпирических данных, полученных в ходе социоло­гического исследования, к анализу — достаточно трудоемкий, и дли­тельный процесс. Следующий этап работы с данными — собственно их анализ.

 

Соседние файлы в папке workbook.rtf