
- •Тема 2 подготовка и создание базы данных в spss
- •1. Основы работы с электронной таблицей spss
- •Основные группы команд пакета spss,
- •2. Подготовка социологических данных к обработке
- •3. Создание базы данных при помощи spss
- •Имя переменной (Name)
- •Тип переменной (Type)
- •(Для численной переменной)
- •Формат столбца (Width)
- •Десятичные разряды (Decimal)
- •Метка переменной (Label)
- •Метки значений (Values)
- •Отсутствующие значения (Missing Values)
- •Шкала измерения (Measure)
- •Создание переменных для многозначных вопросов и их кодировка.
- •Многозначного вопроса
Шкала измерения (Measure)
В
поле Measure
щелкните
по кнопке
,
появится список с тремя возможными
шкалами измерения.
Scale – метрическая,
Nominal – номинальная,
Ordinal – порядковая.
По умолчанию в программе всегда стоит метрический тип шкалы. Изменив первоначальную настройку, нажмите клавишу <Tab> и переходите к описанию следующей переменной.
Подобным образом описываются все переменные, соответствующие всем вопросам анкеты. При создании матрицы данных надо помнить, что для кодировки однозначных и многозначных вопросов31 применяются разные методы.
Создание переменных для многозначных вопросов и их кодировка.
Предположим, что в анкету был включен вопрос о проблемах города, наиболее сильно волнующих респондентов. При этом, отвечая на вопрос, респонденты могли указать одновременно несколько проблем. Например, плохая работа жилищно-коммунальных служб, низкие пенсии, плохая работа транспорта и высокий уровень преступности.
Закодировать ответы респондентов на данный вопрос можно двумя способами: дихотомическим и категориальным.
Дихотомический способ применяется в том случае, когда не известно или не ограничено возможное число вариантов ответа.
Тогда для каждого варианта ответа (в нашем случае для проблемы) будет создаваться своя переменная. Кодировка каждой из таких переменных будет осуществляться по дихотомическому принципу (например, 1 = выбран ответ, 0 = не выбран ответ). При этом цифры, которые будут использованы
для кодировки переменных, могут быть любыми (1 и 0 или 1 и 2), – сами по себе они значения не имеют. Таким образом, если в ходе опроса выяснилось, что респондентов более всего волнуют 16 проблем города, то наша база данных будет содержать 16 переменных, относящихся к вопросу о проблемах. Безусловно, такой метод кодировки удобен лишь в том, случае, когда список возможных ответов на вопрос ограничен и насчитывает не более 30 градаций. Например, один из вопросов анкеты звучит следующим
образом:
Какие радиостанции вы чаще всего слушаете? (Можно выбрать любое количество ответов.)
1. |
«Ностальжи» |
7. |
«Русское радио» |
2. |
«Маяк» |
8. |
«Радио Иваново» |
3. |
«Н-Радио» |
9. |
«104,2 FM» |
4 |
Радио России» |
10. |
«Эхо Москвы» |
5 |
«Европа плюс» |
11 |
Местные радио станции |
6. |
«Радио-Ретро» |
12. |
Иные _______________ |
Как закодировать такой вопрос? В случае дихотомического способа кодировки электронная таблица будет выглядеть следующим образом (табл. 2.2).
Таблица 2.2. Дихотомический вариант кодировки многозначного вопроса
Случай |
v10_1 |
v10_2 |
v10_3 |
v10_4 |
v10_5 |
1 |
0 |
0 |
0 |
1 |
1 |
2 |
1 |
1 |
0 |
1 |
1 |
3 |
1 |
1 |
1 |
1 |
0 |
4 |
0 |
0 |
0 |
0 |
1 |
n… |
|
|
|
|
|
Опыт работы показывает, что многозначные вопросы удобнее кодировать следующим образом. В названии переменной первые две цифры обозначаются как номер вопроса, а после черты – номер вариантов ответа.
Таким образом, «v10_1» – это первая подсказка в 10-м вопросе, то есть «Ностальжи», «v10_2» – «Маяк» и т.д.
Код «1» в ячейке означает, что респондент слушает данную радиостанцию, «0» – нет.
Следовательно, респондент 1 слушает из всех радиостанций «Радио России» и «Европа плюс», а респондент 2 – «Ностальжи», «Маяк», «Радио России», «Европа плюс» и т.д.
Категориальный метод кодировки более удобен в ситуации неопределенного количества вариантов ответов на вопрос.
Например, если респонденты перечисляют политиков, которым больше всего симпатизируют, или свои ассоциации в связи с чем-либо. При этом мы не можем заранее знать весь спектр ответов на вопрос. Но можем ограничить число ответов, которые должен дать респондент. Например, респонденту предлагается назвать не более трех известных магазинов бытовой техники, авторитетных лиц или интересующих передач.
В таком случае мы создаем три переменные (в соответствии с ограничением возможного числа ответов одного респондента). Каждая из этих переменных будет содержать коды всех возможных (или указанных) вариантов ответа на данный вопрос.
Так, например, проблемы города могут быть закодированы следующим образом:
1 – плохая работа жилищно-коммунальных служб;
2 – низкие пенсии;
3 – плохая работа транспорта;
4 – высокий уровень преступности;
5 – санитарное состояние улиц и т.д.
При последующем вводе данных каждой выбранной проблеме будет соответствовать определенный код.
Предположим, что на вопрос о проблемах города респондент мог указать не более пяти проблем, следовательно, наша база данных будет содержать пять переменных (пять столбцов), относящихся к данному вопросу. В том случае, если респондент указал всего лишь одну проблему, то код данной проблемы (вариант ответа) будет заноситься в первую переменную данного вопроса, вторая и третья будут пропускаться. Если он указал две проблемы, то в соответствующих ячейках каждой созданной переменной будет стоять код варианта ответа (табл. 2.3).
Таблица 2.3. Категориальный вариант кодировки