Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МИ ПОЧТИ ВСЕ.doc
Скачиваний:
75
Добавлен:
25.05.2017
Размер:
787.97 Кб
Скачать

Тема 11 Вопрос 2 Характеристика основных видов кодировки данных (категориальная, дихотомическая).

Существует два основных вида кодировки данных: дихотомическая и категориальная. Вид кодировки переменных определяется типом вопроса анкеты. Для кодировки многовариантных закрытых вопросов используется дихотомическая кодировка.

Дихотомическая кодировка включает только два варианта значений для метки переменной: «да» или «нет».

Категориальная кодировка предполагает несколько вариантов ответа на поставленный вопрос, т.е. метка переменной может принимать несколько значений.

При использовании категориальной кодировки данных все респонденты делятся на категории в зависимости от выбранного ими варианта ответа.

Тема 11 Вопрос 2 Общие принципы кодирования информации. Понятие книги кодов.

При кодировании данных необходимо следовать существующим общим принципам:

• располагать только один символ в каждой колонке. Когда вопрос допускает множество вариантов ответов, каждый вариант ответа размещать в отдельной колонке.

• использовать только числовые коды, а не буквы алфавита или специальные символы или знаки, так как для большинства компьютерных программ при обработке данных манипулирование чем-то иным, чем цифры, сопряжено с трудностями;

• использовать ровно столько колонок поля, назначаемого для переменной, сколько необходимо для полного охвата всех её возможных значений. Кроме того каждому полю должна назначаться не более чем одна переменная;

• использовать стандартные коды для «отсутствия информации». Так все ответы «не знаю» должны кодироваться цифрой 8, «нет ответов» - цифрой 9, а «не применялось» обозначаться как 0.

• кодировать идентификационный номер респондента для каждой анкеты. Как правило, нет необходимости идентифицировать в этом номере имя респондента. Этот код просто связывает анкету с кодируемыми данными. Такая информация часто полезна на этапе очистке данных.

Книга кодов - это книга, в которой описывается каждая переменная, в ней перечисляются коды каждой переменной и категории, включенные в каждый код. Далее в ней указывается, где в компьютерной записи располагается переменная и каким образом эта переменная читается - например, с десятичной точкой или как целое число.

Тема 11 Вопрос 3 Понятие табулирования данных.

Табулирование данных - это подсчет количеств событий, которые попадают в различные категории.

Тема 11 Вопрос 3 Формы табуляции (простая и перекрестная) и их характеристика.

Простая табуляция -- подсчет количества событий, которые попадают в каждую категорию, когда категории базируются на одной переменной. Перекрестная табуляция -- подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух и более переменных, рассматриваемых одновременно.

Простая табуляция связана с подсчетом для единственной переменной. Она может повторяться для каждой из переменных исследования, но табуляция для каждой переменной не зависит от табуляции для других переменных. Например, количество респондентов воспитывающих двух детей составляет 30,7%.

В перекрестной табуляции две или более переменных обрабатываются одновременно. (подсчет количества событий, которые попадают в каждую из нескольких категорий, когда категории базируются на двух и более переменных, рассматриваемых одновременно.)