Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTVETY_PO_SPSS.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.19 Mб
Скачать

7. Подготовка и создание базы данных в spss: подготовка социологических данных к обработке (в т.Ч. Дихотомический и категориальный способы кодировки).

Для того чтобы полученные данные можно было обработать, прежде всего следует создать так называемую кодировочную таблицу. Эта таблица устанавливает соответствие между отдельными вопросами анкеты и переменными, используемыми при компьютерной обработке данных.

Для создания таблицы необходимо иметь анкету или иной инструментарий, в котором отражены вопросы и варианты ответов на данные вопросы, поэтому подобную кодировочную таблицу можно создавать как в течение полевого этапа исследования, так и после его завершения. Например, вопросу анкеты «Ваш пол» может соответствовать переменная «пол». Таким образом, на подготовительном этапе, прежде чем перейти к вводу данных, необходимо определить переменные, соответствующие измеряемым в исследовании признакам.Признак – это некоторое общее для всех объектов (респондентов) качество, конкретные проявления которого, (значения признака) могут меняться от объекта к объекту. Значения признака называют также альтернативами, градациями. Пример. В качестве значений признака «возраст» респондентов могут выступать значения 21, 46, 89 лет. Признак «отношение к работе транспорта» может иметь следующие градации: положительное, отрицательное, нейтральное и т.д.

Переменные – это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Пример.

Все значения переменных в дальнейшем будут заноситься в матрицу данных. Она представляет собой таблицу, состоящую из определенного числа строк и столбцов. При этом каждая строка соответствует одной анкете (респонденту), а столбец – одной переменной.

Создание базы данных начинается с запуска программы SPSS. В результате откроется редактор данных SPSS (см. рис. 2.3). Здесь можно вводить новые данные или загружать существующие файлы данных при помощи команд File (файл) →Open.

Первым шагом является определение переменных. Для этого надо в редакторе данных дважды щелкнуть на ячейке с надписью «var» или на ярлычке –закладке в нижнем левом углу таблицы «Variable view» (просмотр переменных). Чтобы задать имя переменной, надо в текстовом поле «Name» ввести выбранное имя переменной. При этом каждая переменная имеет свое имя. Оно может представлять собой отражение номеров вопросов в анкете. Например, имена «var1» или «в25» будут соответствовать 1 и 25 вопросу анкеты. При выборе имени переменной следует соблюдать определенные правила:После ввода с клавиатуры в ячейку имя переменной нажмите клавишу <Tab>, чтобы подтвердить ввод и перейти к установке типа переменной.

Как видно из электронной таблицы, вновь созданные в SPSS переменные по умолчанию являются численными с максимальной длиной 8 знаков и дробной частью из 2 знаков (формат 8.2).

Если требуется изменить тип переменной, то щелкните в данной ячейке на кнопку с тремя точками.1. Numeric (числовые) – любые цифры, перед которыми стоит знак «+», «–» и десятичный разделитель.2. Comma (запятая) – к допустимым значениям относятся цифры, перед которыми стоит знак «+» или «–», точка как десятичный разделитель и одна или несколько запятых в качестве разделителей групп разрядов.3. Dot (точка) – к допустимым значениям относятся цифры, перед которыми стоит знак «+» или «–», и только точка как десятичный разделитель.4. Scientific notation (экспоненциальное представление) – при вводе данных разрешаются все допустимые численные значения, включая экспоненциальное представление, о котором говорит содержащаяся в числе буква Е или D.5. Date – дата или время.6. Dollar (знак доллара, точка как разделитель десятичный и запятая).7. Special currency (специальная валюта). Можно задавать собственные форматы валют.8. String (строка символов, текстовые переменные). В большинстве процедур их применение ограничивается или не допускается. С ними нельзя проводить никаких вычислительных операций, но можно проводить простой подсчет повторяемости.Десятичные разряды (Decimal). Увеличение или уменьшение этого значения также производится при помощи кнопки лифта. Например, переменная «пол» может принимать два значения, которые будут закодированы цифрами 1 и 2. Для нее можно задать. Метка переменной (Label)

Это название позволяет описать переменную более подробно. Метка переменной может содержать до 256 символов. Метки значений (Values)Эти названия позволят более подробно описать возможные значения переменной.

♦ Чтобы задать отсутствующие значения, надо нажать на кнопку с тремя точками в поле Пропуски (Missing). Откроется диалоговое окно «Define Missing Values» (определение отсутствующих значений)

♦ По умолчанию в программе предлагается вариант «No missing values» (нет отсутствующих значений), т.е. все значения сейчас рассматриваются как допустимые.

♦ Щелкнув левой клавишей мыши на пункте «Discrete missing values» (отдельные отсутствующие значения), для одной переменной можно задать до трех пользовательских отсутствующих значений. В рассматриваемом нами примере это будут значения: 3, 4, 5.

♦ Щелкнуть левой клавишей мыши на пункте «Range and one optional discrete missing value» (диапазон отсутствующих значений).

В полях Columns (Столбцы)и Alignment (Выравнивание) примите настройки, предлагаемые программой SPSS по умолч.Шкала измеренияScale – метрическая,номинальная, порядковая.Подобным образом описываются все переменные, соответствующие всем вопросам анкеты. При создании матрицы данных надо помнить, что для кодировки однозначных и многозначных вопросов применяются разные методы.Создание переменных для многозначных вопросов и их кодировка.Дихотомический способ применяется в том случае, когда не известно или не ограничено возможное число вариантов ответа. Тогда для каждого варианта ответа (в нашем случае для проблемы) будет создаваться своя переменная. Кодировка каждой из таких переменных будет осуществляться по дихотомическому принципу (например, 1 = выбран ответ, 0 = не выбран ответ). При этом цифры, которые будут использованыКатегориальный метод кодировки более удобен в ситуации неопределенного количества вариантов ответов на вопрос. Например, если респонденты перечисляют политиков, которым больше всего симпатизируют, или свои ассоциации в связи с чем-либо. При этом мы не можем заранее знать весь спектр ответов на вопрос. Но можем ограничить число ответов, которые должен дать респондент. Например, респонденту предлагается назвать не более трех известных магазинов бытовой техники, авторитетных лиц или интересующих передач. В таком случае мы создаем три переменные (в соответствии с ограничением возможного числа ответов одного респондента). Каждая из этих переменных будет содержать коды всех возможных (или указанных) вариантов ответа на данный вопрос.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]