Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3_Подготовка данных.doc
Скачиваний:
24
Добавлен:
01.02.2015
Размер:
2.69 Mб
Скачать

3.4 Кодирование

Процедура кодирования (coding) заключается в присваивании кода, обычно цифрового, каждому возможному варианту ответа по каждому вопросу.

Код включает указание на положение столбцов (полей) и информации, которая в них содержится. Так, пол респондентов может кодироваться, например, следующим образом: 1 для женщин и — для мужчин. Поле отображает единичный элемент данных, например пол респондента. Запись (информация, которая касается одного элемента выборки) состоит из ряда соответствующих полей, например: пол, семейное положение, возраст, состав семьи, занятие респондента и т.д. Все демографические и личностные характеристики респондента, как правило, содержатся в одной регистрационной записи.

Данные (т.е. все записи) по всем респондентам хранятся обычно в одном компьютерном файле. Столбцы представляют собой поля, а строки — записи.

Если анкета включает только структурированные вопросы или очень незначительное количество неструктурированных вопросов, она кодируется заранее. Это означает, что коды присваиваются, прежде чем начинается непосредственная полевая работа. Если же в анкете содержатся в основном неструктурированные вопросы, коды присваиваются уже после того, как заполненные анкеты возвращаются с места сбора данных (так называемое посткодирование).

Код респондента и номер записи необходимо указывать для каждой записи данных. Следует также включать дополнительные коды для каждого респондента: код проекта, код интервьюера, код даты и времени, проверочный код.

Если возможно, по всем пропущенным данным следует использовать стандартные коды: коды пропущеннях значений должны отличаться от кодов, присвоенных ответам, полученным надлежащим способом в ходе опроса.

Кодирование структурированных вопросов, предполагающих выбор одного варианта ответа, — относительно простая процедура, поскольку в этом случае варианты ответов определяются заранее. Исследователь присваивает каждому возможному варианту ответа код и указывает столбец, в который этот код будет введен.

Кодирование неструктурированных вопросов или вопросов, допускающих несколько вариантов ответа, представляет более сложную задачу. Сначала ответы респондентов дословно записываются в анкету. Затем для них разрабатываются коды, которые и присваиваются конкретным ответам. Иногда, основываясь на предыдущих проектах или на теоретических предпосылках, можно разработать коды еще до начала работы по сбору данных. Однако обычно к этой процедуре приступают только тогда, когда получены заполненные анкеты. После этого исследователь составляет список, включающий наиболее частые варианты ответов на неструктурированные вопросы, и определяет категории, подлежащие кодированию. После того как коды разработаны, необходимо подготовить кодировщика, который будет присваивать записанным в словарной форме ответам соответствующие коды. Обычно при кодировании неструктурированных вопросов и анкет вообще рекомендуется выполнять следующие правила:

  1. Коды категорий должны быть взаимоисключающими и взаимоисчерпываюшими. Категории считаются взаимоисключающими, если каждому ответу присваивается только один код. Категории не должны перекрывать одна другую. Категории считаются взаимоисчерпывающими, если каждый ответ соответствует одному из кодов, присвоенных данной категории. Этого можно достичь введением дополнительного кода категории, например "другое" или "ни один из предложенных вариантов". Однако следует помнить, что в эту категорию должна войти только незначительная часть ответов (не больше 10%). Подавляющая часть ответов должна относиться к значимым категориям.

  2. По наиболее важным вопросам коды категорий должны присваиваться даже в том случае, если они не упоминались ни одним из респондентов. Иногда важно знать именно то, что никто из отвечающих не дал тот или иной вариант ответа. Например, собрав данные о частоте перелетов, совершаемых бизнесменами с использованием конкретных авиалиний, необходимо закодировать ее подробно, а не просто сгруппировать по двум кодам категорий — "летаю часто" и "летаю нечасто". Эти данные по частоте перелетов позволят исследователю впоследствии разграничить категории бизнесменов-путешественников несколькими разными способами. Если же категории определены заранее, последующий анализ данных ограничится только этими категориями.

Для кодировки данных составляется кодировочная книга (codebook) которая содержит инструкции по кодированию, а также необходимую информацию о переменных, используемых в конкретном наборе данных.

Кодировочная книга применяется как руководство для кодировщика и помогает исследователю правильно определять и располагать переменные. Даже если анкета закодирована заранее, следует подготовить формальную копировочную книгу. Кодировочная книга обычно включает следующую информацию: номер столбца, номер записи, номер переменной, название переменной, номер ответа, инструкции по кодированию.

2.3 Правила кодировки информации

Схема кодировки вопросов анкеты и ответов на них производится в соответствии с требованиями программы, в которой будут обрабатываться данные. Схема кодировки анкеты представляет собой таблицу соответствия вопросов и вариантов ответов анкеты внутреннему представлению переменных в базе данных используемой программы.

Кодирование вопросов анкеты зависит:

  • от типа построения вопроса (открытый или закрытый);

  • от количества возможных вариантов ответов (один или несколько);

  • от шкалы, по которой измеряются данные, которые будут получены в результате ответа на вопрос.

Существует три основных типа кодирования вопросов анкеты:

  1. Закрытые вопросы, в которых респондент может указать только один вариант ответа. Вне зависимости от типа шкалы кодируется одной переменной (например, q1), которая может принимать столько вариантов ответа, сколько ответов было предложено (табл.2.1 примеры 1-3).

  2. Закрытые вопросы в которых респондент может дать несколько вариантов ответа кодируются несколькими одновариантными переменными (например, q2_1, q2_2, q2_3 и т.д.). Тип шкалы одновариантных переменных может быть только номинальным (дихотомическим) вне зависимости от шкалы исходной переменной (табл.2.1 примеры 4-5).

  3. Открытые вопросы, независимо от количества возможных вариантов ответа на них, кодируются одной переменной. Тип шкалы в данном случае может быть любым – он соответствует шкале исходной переменной (табл.2.1 примеры 6-7).

Таблица 2.1 Примеры вопросов анкеты:

Вопрос анкеты

Возможные ответы

Характеристика

1

У Вас есть домашние животные?

Да, Нет

Вопрос закрытый, шкала дихотомическая, возможен один вариант ответа

2

Согласны ли Вы с утверждением:

«Для поступления в Вузы ЗНО является более объективным инструментом, чем экзамены в Вузах

Согласен, скорее согласен, не знаю, скорее не согласен, не согласен

Вопрос закрытый, шкала порядковая, возможен один вариант ответа

3

Сколько раз в неделю Вы занимаетесь спортом

Не занимаюсь, реже одного раза в неделю, 1-2, 3-4, 5 и более

Вопрос закрытый, шкала порядковая, возможен один вариант ответа

4

Какими иностранными языками Вы владеете

Англ., испанский, немецкий, французский, китайский, укажите свой вариант

Вопрос закрытый, шкала номинальная, возможно несколько вариантов ответа

5

Где Вы обычно покупаете овощи

На рынке, в магазине, в супермаркете, другое (укажите, где именно)

Вопрос закрытый, шкала номинальная, возможно несколько вариантов ответа

6

Укажите Ваш вес

-

Вопрос открытый, шкала относительная, возможен один вариант ответа

7

В каком городе Вы проживаете

-

Вопрос открытый, шкала номинальная, возможен один вариант ответа

Следующим шагом подготовительного этапа статистического анализа данных является оцифровка данных и ввод данных в компьютер.

Если статистический анализ проводится при помощи программных средств специального назначения, то данные для проведения анализа могут как импортироваться из других программных источников (баз данных, табличных редакторов, текстовых файлов и др.), так и вводиться непосредственно.