
- •Оглавление
- •Глава 1. Особенности обработки данных в среде spss …...………...5
- •Глава 2. Программа курса «Использование spss в социологии»..………………………………………………………...…75 пояснительная записка к учебно-методическому пособию
- •Глава 1. Особенности обработки данных в среде spss.
- •Введение.
- •1.2. Роль исследователя и возможности spss.
- •1.3. Основы работы в spss.
- •1.4. Определение переменных и ввод данных в программу spss.
- •1.5. Определение и ввод данных для переменных с множественными ответами.
- •1.6. Основы анализа данных.
- •1.7. Анализ переменных с множественными ответами.
- •1.8. Отбор данных и формирование подвыборок в spss.
- •1.9. Анализ связей между переменными.
- •1.10. Сравнение выборок и проверка гипотез о равенстве средних.
- •Глава 2. Программа курса «Использование spss в социологии».
- •Программа курса «анализ данных в spss»
- •Раздел 1. Организация работы с данными в spss.
- •Тема 1. Spss и его особенности.
- •Тема 2. Подготовка рабочего поля для ввода данных.
- •Тема 3. Ввод данных в spss.
- •Раздел 2. Обработка и анализ данных в spss.
- •Тема 4. Работа с переменными и группировка данных.
- •Тема 5. Частотные распределения и описательные статистики.
- •Литература.
1.7. Анализ переменных с множественными ответами.
Выше мы рассматривали случай определения переменных в программе SPSS, которые характеризовались множественными ответами. Кроме того, что они имеют свои особенности при вводе, данный тип вопросов также специфичен относительно процедуры обработки. В данном разделе мы как раз остановимся на анализе такого типа вопросов. Продолжим рассматривать пример, обозначенный выше.
Дихотомный метод. Перед тем, как приступить непосредственно к анализу ответов респондентов, необходимо определить новую переменную для анализа, которая представляет собой агрегированный результат всех вариантов. Для этого в меню Analyze нужно выбрать Multiple Response (множественные ответы) и Define sets (определение). Раскроется следующее диалоговое окно.
Рис. 24. Определение переменной с множественными ответами для анализа.
В приведенном диалоговом окне нужно:
1. Выбрать в левом столбце все переменные, которые входят в наш вопрос с множественными ответами и наддав на стрелку переместить их в поле Variables in Set (переменные в наборе).
2. В поле Dichotomies Counted value (учитываемое значение дихотомической переменной) поставить цифру 1.
3. Присвоить набору имя (Name) и метку (Label). Пусть в нашем примере это будет sobstv и «приобретения» соответственно.
4. Нажать кнопку Add и нажать кнопку Close.
Все, наша переменная готова для анализа. Следующий шаг собственно сам процесс анализа. Для этого нужно в Analyze выбрать Multiple Response (множественные ответы) и Frequencies (частоты). Раскроется следующее диалоговое окно.
Рис. 25. Анализ переменной с множественными ответами.
Далее все, согласно правилам обработки – переносим вправо нашу анализируемую переменную и нажимаем ОК. В представленном отчете нас прежде всего интересует вторая таблица, ее последний столбец.
Рис. 26. Таблица результатов анализа переменной с множественными ответами.
В таблице видно, что в нашем примере автомобиль пиобрели 3 респондента, что составило 37,5% от общего числа опрошенных, столько же респондентов приобрели компьютер и т.п.
Категориальный метод. Процесс обработки данных в переменной, заведенной по категориальному методу полностью идентичен сказанному выше. единственное исключение – при определении анализируемой переменной нужно выделить Categories и задать диапазон от 1 до 11.
1.8. Отбор данных и формирование подвыборок в spss.
В практике социологических исследований при анализе данных иногда встречается необходимость модификации данных с целью формирования подвыборок. Например, по ходу решения исследовательских задач, необходимо выяснить характеристики ответов респондентов в возрасте от 16 до 30 лет мужского пола. Или нужно сравнить результаты политических взглядов у мужчин, проживающих в южной части страны по отношению к северянам.
Все подобные задачи могут быть успешно решены с применением программы SPSS на основании формирования подвыборок и модификации данных. Рассмотрим основные приемы.
Формирование подвыборок. Данная процедура требуется тогда, когда нам нужно определить четкие параметры. Например, отобрать мужчин в возрасте до 40 лет, проживающих в Центральном Федеральном округе. Процедура отбора случаев в программе SPSS реализуется через главное меню Data и выбор Select Cases (данные – выбор случаев). Раскроется следующее диалоговое окно.
Рис. 27. Диалоговое окно формирования подвыборки.
В данном окне в левой части представлены все переменные. В правой части предлагаются варианты выбора случаев. All cases – все случаи, if condition satisfied – выбор случаев, удовлетворяющих пользовательскому запросу. Именно этот раздал требуется выбрать для формирования подвыборки, удовлетворяющей запросу. Затем выбрать кнопку if… Откроется новое диалоговое окно, в котором непосредственно может быть задан запрос.
Рис. 28. Диалоговое окно для формирования запроса на отбор случаев.
Слева расположены все переменные. Для формирования условий используются сами переменные и знаки математической логики между ними, а также цифры, знаки неравенств и прочие элементы, обозначенные в центральной части окна – так называемые операторы. Операторы делятся на арифметические и логические. Рассмотрим их чуть подробнее.
Отношение — это логическое выражение, в котором два значения сравниваются друг с другом посредством оператора отношения. В областях, где применяется SPSS в операторах отношения значения переменной сравниваются с каким-либо численным значением (константой).
Операторы можно ввести в редактор условий либо щелкнув в диалоговом окне на кнопке с соответствующим знаком, либо введя с клавиатуры альтернативный текст. Например, вместо ~= можно ввести NE или <>.
Для построения условных выражений могут применяться следующие логические операторы:
Знак на кнопке |
Альтернативный текст |
Значение |
& |
AND |
Логическое И |
| |
OR |
Логическое ИЛИ |
~ |
NOT |
Логическое НЕ |
Логические операторы AND и ОК связывают два отношения, алогический оператор NOT меняет значение истинности условного выражения на противоположное. Между логическими операторами устанавливаются следующие приоритеты:
Приоритет |
Оператор |
1 |
NOT |
2 |
AND |
3 |
OR |
Логические операторы основаны на принципах булевой алгебры (логики высказываний), краткий обзор которых приводится в данном разделе.
Оператор И (конъюнкция)
Выражение 1 |
Выражение 2 |
Результат |
и |
и |
и |
и |
л |
л |
л |
и |
л |
л |
л |
л |
Легенда: и = истина (true); л = ложь (false)
При конъюнкции все участвующие выражения (отношения) должны быть истинными, чтобы общий результат также являлся истинным.
Оператор ИЛИ (дизъюнкция)
Выражение 1 |
Выражение 2 |
Результат |
и |
и |
и |
и |
л |
и |
л |
и |
и |
л |
л |
л |
При дизъюнкции хотя бы одно из участвующих отношений должно быть истинным, чтобы общий результат также был истинным.
Логическое НЕ (отрицание)
Выражение |
Результат |
и |
л |
л |
и |
Отрицание меняет истинность выражения на противоположную. При отрицании следует учитывать эквивалентность операторов:
отрицаемый оператор |
эквивалентный оператор |
< |
>= |
> |
<= |
<= |
> |
>= |
< |
Кроме логических операторов в программе SPSS также реализован процесс вычисления функций переменных. Список функций, который мы сейчас рассмотрим, - следующая важная часть диалогового окна Select Cases: If.
Этот список содержит множество математических функций, большая часть из которых, однако, имеет отношение только к модификации данных (расчету новых переменных).
Логические функции
В SPSS реализованы две логические функции:
RANGE (variable, begin, end): Функция RANGE возвращает значение 1, или true, если значение переменной лежит в диапазоне между заданными начальным и конечным значениями. Переменная может иметь как численный, так и строковый тип. RANGE (alter, 18, 22) возвращает значение 1, то есть true, если значение переменной alter лежит между 18 и 22 включительно. Можно задавать несколько диапазонов, например, RANGE (alter, 1, 17, 63, 99). В этом случае функция возвращает true, если значение переменной alter лежит между 1 или 17 или между 63 и 99 включительно. В функции RANGE можно также использовать переменные строкового типа, например, RANGE (name, A, Mzzzzzz). Тогда функция будет возвращать 1 для имен, начинающихся с букв от А до М включительно. Если имя начинается с другой буквы, функция возвратит 0.
ANY (variable, val1, val2, va!3,...): Функция ANY возвращает значение 1, или true, если значение переменной (значение первого аргумента) совпадает по крайней мере с одним из значений, указанных в последующем списке параметров (val1, val2, val3, ...). В противном случае возвращается значение 0 или false. Первый элемент, как правило, — переменная численного или символьного типа. Примеры: ANY (jahr, 1991, 1992, 1993, 1994) возвращает true, если значение переменной jahr равно 1991, 1992, 1993 или 1994. ANY (name, Schmidt, Meier, Raabe) возвращает значение true или 1 в тех случаях, когда переменная name содержит значения Schmidt, Meier или Raabe. Во всех остальных случаях возвращается значение 0. Не забывайте заключать строковые значения в двойные кавычки.
Строковые функции
Из общего количества 18 строковых функций мы рассмотрим три самых важных, на наш взгляд.
■ SUBSTR (variable, begin, length): Эта функция извлекает определенную часть из строки. Она возвращает подстроку или отдельный символ. Например, если строковая переменная name содержит значение Mannheim, то следующий вызов функции
SUBSTR (name, 1, 2)
возвратит значение Ма. Здесь из переменной name извлекаются два знака (третий аргумент) начиная с первой позиции (второй аргумент). Выражение
SUBSTR (name, I, 2) = Ma
будет истинным для значений переменной Maus, Mannesmann или Mahlmann. При сравнении со строками вместо двойных кавычек (= "Ма") можно также применять простые (= 'Ма'). Однако смешение простых и двойных кавычек (= 'Ма") не допускается.
■ UPCASE (argument): Функция UPCASE преобразует строчные буквы в прописные. В качестве аргумента можно задавать строку или переменную символьного типа. UPCASE (vorname) возвращает значение ANNA, если переменная vorname имеет значение Anna.
■ LOWER (argument): Функция LOWER преобразует прописные буквы в строчные. В качестве параметра можно задавать строку или переменную символьного типа. LOWER (vorname) возвращает значение anna, если переменная vomame имеет значение ANNA или Anna.
Функции переносятся в редактор условий следующим образом:
Поместите курсор на место в условном выражении, на котором должна быть вставлена функция.
Дважды щелкните на функции в списке функций или выделите функцию и щелкните на кнопке с треугольником около списка функций.
Функция будет вставлена в выражение. Вместо аргументов в этой функции будут стоять вопросительные знаки. Количество вопросительных знаков указывает минимальное количество аргументов, которое следует вставить. Отредактировать функцию можно следующим образом:
Выделите вопросительные знаки во вставленной функции.
Замените их соответствующими аргументами. Имена переменных для аргументов можно перенести из списка исходных переменных.
Теперь вернемся к нашему примеру. Итак из наших данных нам нужно отобрать мужчин не старше 40 лет, проживающих в Центральном Федеральном округе. Алгоритм отбора следующий:
Перенести переменную «федеральный округ» вправо, присвоив ей значение «=1».
Поставить знак &, перенести переменную «пол» вправо, присвоив ей значение «=1».
Поставить знак &, перенести переменную «возраст респондента» вправо, присвоив ей значение «<40». Должно получиться следующее выражение.
Рис. 29. Пример составления логического выражения для формирования подвыборки.
После этого нужно нажать кнопки Continue и в следующем окне ОК. В поле данных появилась еще одна переменная, обозначенная как filter_$, а внизу появилась надпись Filter On. Это означает, что все последующие вычисления относительно любой переменной будут выполняться с учетом определенного нами фильтра, т.е. в отношение мужчин до 40 лет, проживающих в Центральном Федеральном округе. Если нам необходимо убрать фильтр, то можно это сделать в меню Data → Select Cases → All Cases.