Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
61
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

Глава 1. Информация, обрабатываемая статистическим пакетом

1.1. Анкетные данные

В большинстве социологических исследований анализируется анкетная информация. Условно эти данные можно представить в виде матрицы, строкам которой соответствуют объекты (анкеты), а столбцам – признаки (отдельные вопросы и подвопросы анкеты). Синонимом термина «признак» является термин «переменная», в дальнейшем мы будем употреблять их равноправно.

В современных статистических пакетах такую информацию принято представлять в виде таблицы. Обычно обрабатывается один файл данных, представленных в виде матрицы, которая на экране напоминает лист таблицы «Excel».

При кодировании информации для заполнения матрицы необходимо пользоваться определенными правилами в соответствии со структурой обрабатываемой анкеты.

Пример

Анкета обследования жалоб и проблем населения (шутка)

1. Пол

  1. Мужской

  2. Женский

2. Возраст …………

3. Проблемы (укажите 3 основные проблемы):

1. Учеба

2. Свободное время

3. Любовь

4. Музыка

4. Жалобы:

1. Служба

2. Здоровье

3. Зарплата

4. Жена

5. Собака соседа

Соответствующая анкете матрица данных изображена на рис. 1.1. Пол закодирован в соответствии с содержимым анкеты кодами: 1 – мужчины, 2 – женщины; возраст введен непосредственно отдельным столбцом; проблемы закодированы в трех переменных, в которых указаны коды обведенных при опросе подсказок. Для каждой жалобы отведена своя переменная.

N анкеты

1. Пол

2. Возраст

3. Проблемы

4. Жалобы

1. Слу­жба

2. Здо­ровье

3. Зар-плата

4. Жена

5. Со­ба­ка соседа

1

1

20

1

4

.

1

0

0

0

1

2

1

25

2

3

4

1

0

1

0

1

3

2

34

1

2

4

1

0

0

0

1

4

1

18

1

2

.

0

0

0

0

1

.

.

.

.

.

.

.

.

.

.

.

Рис. 1.1. Структура матрицы данных обследования жалоб и проблем населения

Итого 11 переменных закодированы в 11 столбцах. Приведенная матрица содержит информацию по 4 анкетам.

В нашем пособии работа пакета иллюстрируется на данных реального опроса населения восточных регионов России за 1991 г. о передаче островов Японии (анкета «Курильские острова», текст которой приведен в приложении 1, а файл с анкетными данными называется ОСТ. sav). В некоторых случаях использованы фактические данные «Российского мониторинга экономического положения и здоровья населения» (RLMS, [13]).

1.2. Типы переменных

Пакет допускает числовую или символьную кодировку информации.

1.2.1. Типы кодирования переменных

В статистическом пакете SPSS предусмотрено 8 типов кодированияпеременных. Подробнее о них можно узнать в книге [5]. Мы остановимся лишь на строчных (string) и числовых (numeric) переменных. Строчные переменные используются достаточно редко, в основном для введения ответов на открытые вопросы или фамилий респондентов. Например, строчная переменнаяdj56.1.18-й волны RLMS содержит именно такие ответы на вопрос «В чем состояла эта Ваша работа?».

Но обычно при внесении в компьютер информации для статистической обработки ответы на вопросы анкеты кодируются числами. Хотя с формальной точки зрения практически любая обрабатывающая программа может использовать цифры независимо от того, кодируется ли профессия, возраст или сведения о цвете глаз, различные методы анализа данных ориентированы на данные различающихся типов. Для получения интерпретируемых результатов исследователь должен различать тип обрабатываемых соответствующим методом переменных.

Данные, закодированные числами, различаются в соответствии с типами шкал измерения переменных.