- •Прикладные компьютерные программы в обработке социологических данных
- •В ведение
- •Темы лекционных занятий
- •Тема 1. Интерфейс программы. Описание переменных.
- •Тема 2. Отбор данных
- •Тема 3. Работа с множественными ответами. Модификация данных
- •Тема 4. Таблицы сопряженности
- •Тема 5. Корреляционно-регрессионный анализ
- •Основные команды меню spss
- •Ввод данных с экрана
- •Типы переменных
- •Отбор данных
- •Таблицы сопряженности
- •Корреляционный и регрессионный виды анализа
- •Лабораторная работа №6 Факторный анализ
Таблицы сопряженности
До сих пор мы рассматривали только отдельные переменные. Мы проводили частотный анализ, а также описывали отдельные переменные статистическими характеристиками, такими как минимум, максимум и среднее значение. Методы анализа такого рода называются одномерными. В SPSS имеется большое количество разнообразных процедур, при помощи которых можно произвести анализ связи между двумя переменными. В программе он реализуется созданием таблиц сопряженности.
Analyze (Анализ)/ Descriptive Statistics (Дескриптивные статистики)/ Crosstabs... (Таблицы сопряженности). Откроется диалоговое окно Crosstabs. Список исходных переменных содержит переменные открытого файла данных. Здесь можно выбрать переменные для строк и столбцов таблицы сопряженности. Для каждого сочетания двух переменных будет создана таблица сопряженности. Сначала мы построим таблицу сопряженности из переменных «пол» и «настроение» (см. рис. 14).
Рис. 14. Вид окна создания таблиц сопряженности
После запуска программы мы получим следующее распределение (см. табл.2).
Таблица 2.
Вид таблицы распределения данных после запуска опции «таблицы сопряженности»
Настроение * Пол Crosstabulation | ||||
Count |
|
|
|
|
|
|
Пол |
Total | |
|
|
Мужской |
Женский | |
Настроение |
Нормальное, ровное настроение |
41 |
106 |
147 |
Испытываю напряжение, раздражение |
11 |
28 |
39 | |
Затрудняюсь ответить |
4 |
31 |
35 | |
Прекрасное настроение |
13 |
30 |
43 | |
Испытываю страх, тоску |
1 |
10 |
11 | |
Total |
70 |
205 |
275 |
Если для таблицы сопряженности приняты параметры по умолчанию, в каждой ячейке отображается только абсолютная частота. Метки переменных и значений в таблице соответствуют определениям переменных в файле данных SPSS. Числа в последней строке и в последнем столбце показывают суммы значений соответственно по строкам и столбцам.
Более тщательно исследовать существование зависимости позволяет вычисление значений ожидаемых частот. Чтобы определить эти значения, выполните следующие действия: Analyze (Анализ)/ Descriptive Statistics (Дескриптивные статистики)/ Crosstabs... (Таблицы сопряженности). В списке строк у нас должна стоять переменная «настроение», а в списке столбцов — переменная «пол». Щелкните на кнопке Cells... (Ячейки). Откроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отображение ячеек) (см. рис.15).
В группе Counts (Частоты) можно выбрать один или более следующих вариантов отображения: Observed (наблюдаемые)- будут отображаться наблюдаемые частоты. Это настройка по умолчанию. Expected (Ожидаемые). Если установить этот флажок, будут отображаться ожидаемые частоты. Они вычисляются как произведение сумм соответствующей строки и столбца, деленное на общую сумму частот. Установите флажок Expected.
Остатки являются показателем того, насколько сильно наблюдаемые и ожидаемые частоты отклоняются друг от друга. Чтобы получить остатки частот, выполните следующие действия. В группе Residuals (Остатки) можно выбрать один или более следующих вариантов отображения: Unstandardized (Ненормированные) - отображаются ненормированные остатки, то есть разность наблюдаемых и ожидаемых частот.
Таблицы сопряженности, которые мы рассмотрели выше, имеют тот недостаток, что в них приводятся только абсолютные значения. Чтобы узнать, насколько эти значения важны по отношению к общему количеству, надо определить их процентную долю. Для вычисления процентных значений выполните следующие действия: не изменяя прежних настроек, щелкните на кнопке Cells. В группе Percentages (Проценты) можно выбрать один или более из нижеследующих вариантов отображения:
- Row (По строкам) (вычисляются процентные значения по строкам: количество наблюдений в каждой ячейке, отнесенное к сумме по строке);
- Column (По столбцам) (вычисляются процентные значения по столбцам: количество наблюдений в каждой ячейке в отношении к сумме столбца);
- Total (Полные) (вычисляются полные процентные значения: количество наблюдений в каждой ячейке, отнесенное к общей сумме наблюдений).
Установите флажки Column, чтобы показать проценты по столбцу (см. рис. 15).
Рис. 15. Вид окна определения дополнительных опций по созданию таблиц сопряженности
Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК. В окне просмотра результатов будет получена таблица сопряженности (см. табл. 3).
Таблица 3.
Вид вывода таблицы сопряженности при использовании опций дополнительного меню
Настроение * Пол Crosstabulation | |||||
|
|
|
Пол |
Total | |
|
|
|
Мужской |
Женский | |
Настроение |
Нормальное, ровное настроение |
Count |
41 |
106 |
147 |
Expected Count |
37,4 |
109,6 |
147,0 | ||
% within Пол |
58,6% |
51,7% |
53,5% | ||
Residual |
3,6 |
-3,6 |
| ||
Испытываю напряжение, раздражение |
Count |
11 |
28 |
39 | |
Expected Count |
9,9 |
29,1 |
39,0 | ||
% within Пол |
15,7% |
13,7% |
14,2% | ||
Residual |
1,1 |
-1,1 |
| ||
Затрудняюсь ответить |
Count |
4 |
31 |
35 | |
Expected Count |
8,9 |
26,1 |
35,0 | ||
% within Пол |
5,7% |
15,1% |
12,7% | ||
Residual |
-4,9 |
4,9 |
| ||
Прекрасное настроение |
Count |
13 |
30 |
43 | |
Expected Count |
10,9 |
32,1 |
43,0 | ||
% within Пол |
18,6% |
14,6% |
15,6% | ||
Residual |
2,1 |
-2,1 |
| ||
Испытываю страх, тоску |
Count |
1 |
10 |
11 | |
Expected Count |
2,8 |
8,2 |
11,0 | ||
% within Пол |
1,4% |
4,9% |
4,0% | ||
Residual |
-1,8 |
1,8 |
| ||
Total |
Count |
70 |
205 |
275 | |
Expected Count |
70,0 |
205,0 |
275,0 | ||
% within Пол |
100,0% |
100,0% |
100,0% |
Так как в нашем случае процентные распределения существенно не отличаются, но тем не менее, мы можем выявить следующую закономерность: настроение у мужчин более спокойное и равномерное, а женщины чуть более расположены испытывать напряжение, раздражение. Данные выводы позволяют нам сделать как остатки по величинам, так и процентное соотношение по столбцу.
Применение переменных групп и слоев
Созданные выше таблицы сопряженности показывают распределние ответов по настроению респондентов в зависимости от но вполне может быть, что переменная «возраст» оказывает влияние на зависимость между «пол» и «настроение». Чтобы выявить возможные различия, следует создать отдельные таблицы, в нашем случае — по одной таблице для каждого возраста. В рассматриваемом примере переменная возраст играет роль переменной слоев. Анализ производится по группам, то есть для каждой группы составляется отдельная таблица сопряженности.
Analyze (Анализ)/ Descriptive Statistics (Дескриптивные статистики) / Crosstabs... (Таблица сопряженности). В списке строк у нас должна стоять переменная «настроение», а в списке столбцов — переменная «пол». Перенесите переменную «возраст» в список переменных слоев (см. рис. 16). Щелкните ОК. Получите следующее распределение данных (см. табл. 4).
Рис. 16. Вид окна таблиц сопряженности при создании слоя
Таблица 4.
Вид распределения данных при использовании дополнительного слоя при создании таблиц сопряженности
Настроение * Пол * Возраст Crosstabulation | |||||
Возраст |
Пол |
Total | |||
Мужской |
Женский | ||||
от 18 до 25 |
Настроение |
Нормальное, ровное настроение |
63,6% |
47,6% |
53,1% |
Испытываю напряжение, раздражение |
|
19,0% |
12,5% | ||
Затрудняюсь ответить |
9,1% |
9,5% |
9,4% | ||
Прекрасное настроение |
27,3% |
23,8% |
25,0% | ||
Total |
100,0% |
100,0% |
100,0% | ||
от 26 до 30 |
Настроение |
Нормальное, ровное настроение |
57,1% |
40,7% |
47,9% |
Испытываю напряжение, раздражение |
19,0% |
7,4% |
12,5% | ||
Затрудняюсь ответить |
4,8% |
11,1% |
8,3% | ||
Прекрасное настроение |
19,0% |
37,0% |
29,2% | ||
Испытываю страх, тоску |
|
3,7% |
2,1% | ||
Total |
100,0% |
100,0% |
100,0% | ||
от 31 до 40 |
Настроение |
Нормальное, ровное настроение |
47,8% |
54,0% |
52,7% |
Испытываю напряжение, раздражение |
30,4% |
14,9% |
18,2% | ||
Затрудняюсь ответить |
4,3% |
16,1% |
13,6% | ||
Прекрасное настроение |
17,4% |
12,6% |
13,6% | ||
Испытываю страх, тоску |
|
2,3% |
1,8% | ||
Total |
100,0% |
100,0% |
100,0% | ||
от 41 до 50 |
Настроение |
Нормальное, ровное настроение |
63,6% |
54,0% |
55,7% |
Испытываю напряжение, раздражение |
|
14,0% |
11,5% | ||
Затрудняюсь ответить |
9,1% |
16,0% |
14,8% | ||
Прекрасное настроение |
18,2% |
6,0% |
8,2% | ||
Испытываю страх, тоску |
9,1% |
10,0% |
9,8% | ||
Total |
100,0% |
100,0% |
100,0% | ||
старше 50 |
Настроение |
Нормальное, ровное настроение |
100,0% |
55,0% |
62,5% |
Испытываю напряжение, раздражение |
|
10,0% |
8,3% | ||
Затрудняюсь ответить |
|
20,0% |
16,7% | ||
Прекрасное настроение |
|
5,0% |
4,2% | ||
Испытываю страх, тоску |
|
10,0% |
8,3% | ||
Total |
100,0% |
100,0% |
100,0% |
Можно выбрать другие уровни переменных слоев. Для каждой категории каждой из переменной слоев будет создана отдельная таблица сопряженности. Чтобы добавить новый слой, щелкните на кнопке Next (Следующий). Каждый последующий уровень делит таблицу сопряженности на меньшие подгруппы.
Таблицы сопряженности с дихотомическими наборами
Таблицы сопряженности можно создавать между двумя наборами переменных, а также между набором и "обычной" переменной. Так, к примеру, нам необходимо в одной таблице сопряженности отобразить соотношение между набором «газеты» (множественный ответ на вопрос о предпочтении читаемых газет) и переменной «пол». Выберите в меню команды Analyze (Анализ)/ Multiple Response (Множественные ответы)/Crosstabs (Таблицы сопряженности). Появится диалоговое окно Multiple Response Crosstabs.
В списке исходных переменных показаны переменные всего файла ФМК.sav. (изучение социально-психологического климата ФМК). В списке наборов множественных ответов показан ранее определенный набор. Перенесите в список переменных строк набор $газеты, а в список переменных столбцов — переменную «пол». Эта переменная появится в списке столбцов с двумя вопросительными знаками, заключенными в скобки. Если таблица сопряженности строится между элементарными переменными (не являющимися наборами) и наборами, то для первых следует задать диапазон значений. Щелкните на кнопке Define Ranges... (Определить диапазоны). Откроется диалоговое окно Multiple Response Crosstabs: Define Variable Range (Таблицы сопряженности для множественных ответов: Определить диапазон переменной). Задайте минимальное значение (Minimum) "1", а максимальное (Maximum) — "2". Подтвердите выбор кнопкой Continue. Теперь вопросительные знаки заменены значениями "1" и "2" (см. рис. 17).
Щелкните на кнопке Options... (Параметры). Откроется диалоговое окно Multiple Response Crosstabs: Options. Абсолютные частоты в ячейках выводятся всегда. Дополнительно в группе Cell Percentages (Проценты в ячейках) выбираем Column (Отобразятся проценты по столбцам). Подтвердите ввод кнопкой Continue, а затем — ОК.
Рис. 17. Вид окна создания таблиц сопряженности для множественных ответов
Задание 1
1. Получить таблицу сопряженности переменной «количество братьев и сестер» и «раса» из базы данных 1991 USA….: в ячейках таблицы получить абсолютные частоты, проценты по строке и столбцу, общие проценты. Проанализировать реальную и ожидаемую величину, ненормализованные остатки. Выявить закономерности (если они есть) количества детей в зависимости от расы.
2. Получить таблицу сопряженности переменной «проблемы пьянства» и «раса»: в ячейках таблицы получить абсолютные частоты, проценты по строке и столбцу, общие проценты. Проанализировать реальную и ожидаемую величину, ненормализованные остатки. Выявить закономерности (если они есть). Добавить слой «кол-во братьев и сестер». Проанализировать общие закономерности.
3. Получить таблицу сопряженности переменной «проблемы пьянства» и «ощущение счастья (4 переменная)»: в ячейках таблицы получить абсолютные частоты, проценты по строке и столбцу, общие проценты. Проанализировать реальную и ожидаемую величину, ненормализованные остатки. Выявить закономерности (если они есть). Какую переменную Вы бы выбрали для «слоя». Проанализируйте с третьей переменной. Пропишите закономерности.
4. Составьте еще две таблицы сопряженности для подтверждения или опровержения гипотез по взаимосвязи двух (или трех) переменных. Проверьте Ваши гипотезы. Напишите выводы.
Задание 2
По базе данных «Кризис. sav» проанализируйте, как отличаются последствия от кризиса (переменные VAR 9-27) у тех, кто стал жить лучше, хуже и также (VAR 5-8).
Проанализируйте, какие слои населения больше всего затронул кризис (в зависимости от социально-демографических характеристик посмотрите распределение ответов на вопрос как стали жить за последние годы – лучше, хуже, также)
Рассчитайте удовлетворенность материальным положением, жизнью, социально-экономической обстановкой у тех, кто живет также и у тех, кто стал жить хуже (VAR 48-62).
Проанализируйте взаимосвязь между переменными самоидентификации по материальному положению (VAR98-106) и социальному положению (VAR168-176).
Рассчитайте среднюю заработную плату и средний среднемесячный доход на одного человека.
Лабораторная работа № 5