
- •Глава 1. Информация, обрабатываемая статистическим пакетом
- •1.1. Анкетные данные
- •1.2. Типы переменных
- •1.3. Имена переменных и метки, коды неопределенных значений
- •Глава 2. Статистический пакет для социологических исследований. Общее описпние и поодготовка данных
- •2.1. Структура пакета
- •2.2. Схема организации данных, окна spss
- •2.3. Управление работой пакета
- •2.4. Режим диалога и командный режим
- •Глава 2. Статистический пакет для социологических исследований. Общее описпние и поодготовка данных
- •2.1. Структура пакета
- •2.2. Схема организации данных, окна spss
- •2.3. Управление работой пакета
- •2.4. Режим диалога и командный режим
- •Variable labels rangv14 "ранг по доходам"/
- •V14_5 "квинтильные группы по доходам"/
- •Variable labels oppos 'Степень противостояния ссср и Японии'
- •Value labels oppos 1 'Взаимное' 2 'Одна из сторон' 3 'Нет противостояния'.
- •2.5. Операции с файлами Агрегирование данных (команда aggregate)
- •Функции агрегирования
- •Глава 3. Процедуры получения описательных статистик и таблиц сопряженности
- •3.1. Команды описания распределений
- •3.2 Анализ связи между неколичественными переменными. Crosstabs - таблицы сопряженности
- •Var lab w4 "Возможность удовлетворить территориториальные требования Японии".
- •Val lab w4 1 "отдать" 2 "не надо" "не знаю".
- •Cells статистики смещения частот
- •Statistics - исследование связи неколичественных перемееных
- •Измерение силы связи между номинальными переменными
- •Статистический эксперимент для оценки значимости и ее прямое вычисление
- •3.3. Сложные табличные отчеты. Таблицы для неальтернативных вопросов
- •ТипичнЫe примеРы использования Multiple Response Tables
- •Var lab m1 "Зап Сиб" m2 "Вост Сиб" m3 "Дальн Вост".
- •Var lab d1 'Жесткий вариант'
- •3.4. Множественные сравнения в таблицах для неальтернативных вопросов. Программа Typology Tables
- •Глава 4. Сравнение средних, корреляции
- •4.3. Compare Means - простые параметрические методы сравнения средних.
- •Variable labels lnv14m "логарифм промедианного дохода".
- •Var lab w10 "образование".
- •Value lab w10 1 "Высшее" 2 "н/высш" 3 "ср. Спец" 4 "среднее" 5 "ниже среднего".
- •4.4. Корреляции (correlations)
- •Глава 5. Непараметрические тесты. Команда Nonparametric tests.
- •5.1. Одновыборочные тесты
- •Var lab w4 "отношение к передаче островов".
- •Val lab 1 "Отдать" 2 "нет".
- •5.3. Тесты для ранговых переменных
- •5.4. Тесты для связанных выборок (related samples)
3.2 Анализ связи между неколичественными переменными. Crosstabs - таблицы сопряженности
CROSSTABS получает таблицы сопряженности многомерных распределений и связей двух и более переменных. Рекомендуется использовать CROSSTABS для переменных с небольшим числом значений (обычно для неколичественных переменных), так как каждая комбинация значений соответствует новой клетке в таблице.
CROSSTABS /TABLES= v1 v2 BY v10 BY pol.
Таблицы сопряженности для пары переменных X и Y содержат частоты Nij, с которыми встретилось сочетание i-го значения X и j-го значения Y. Кроме того, в таблице обязательно присутствуют маргинальные частоты Ni.- равные сумме чисел Nij по строке; N.j - сумме по столбцу (частоты i-го значения X и j-го значения Y, подсчитанные независимо) и N - общее число объектов.
Таблица, заполненная одними частотами Nij, обычно не имеет смысла, так как не проясняет должным образом взаимосвязи между переменными. Для исследования взаимосвязи необходимы статистики взаимосвязи переменных и статистики связи значений.
Основные подкоманды CROSSTABS:
/TABLES - задание таблиц;
/CELLS - статистики клеток таблицы;
/STATISTICS - статистики взаимосвязи переменных.
/METHOD - метод проверки значимости связи переменных.
/BARCHART - столбиковая диаграмма.
/TABLES задание таблиц
Параметр TABLES может быть опущен:
CROSSTABS v1 TO v5 BY v10.
Строки таблицы сопряженности соответствуют значениям переменной, указанной в тексте команды перед ключевым словом "BY"; столбцы матрицы соответствуют значениям переменной, расположенной после "BY".
Пример - совместное распределение по региону (R), точке зрения на иностранную помощь (v1) и полу (V8):
CROSSTABS TABLES R BY v1 BY v8/cells = COUNT ROW.
В результате выполнения этой команды рассчитывается таблица 3.3. Перед ключевым словом BY указываются переменные, по которым вычисляется двухвходовая таблица (переменная, значения которой идентифицируют строки), после ключевого слова BY указываются переменные, идентифицирующие столбцы. За следующими BY идут переменные условий, определяющие подвыборки, на которых рассчитываются таблицы. Хотя в современной версии пакета эти таблицы объединяются в одну таблицу, их статистический анализ производится по-отдельности. Ключевым словом BY могут разделяться и списки переменных. В этом случае процедурой получаются таблицы по всем парам таблиц из первого и второго списка. Например,
CROSSTABS V8 V11 V12 BY V4 V1.
Эта команда выведет таблицу сопряженности: V8 c V4, V8 c V1, V11 c V4, V11 c V1 и т.д., то есть сочетания по всем переменным, перечисленным в команде. Всего будет выдано на печать 6 таблиц. Если более двух списков переменных разделены ключевыми словами "BY", то переменные, стоящие за вторым, третьим и т.д. "BY", задают условия получения таблиц. Таблицы формируются на подвыборках, соответствующих сочетаниям значений этих переменных.
Таблица 3.3. Распределение переменной "Точка зрения на иностранную помощь" в разрезе региона и пола респондентов.
|
|
|
|
V1 точка зр. на иностр. Помощь |
||||
V8 Пол |
|
|
|
Не нужна |
огранич. |
Нужна |
не знаю |
Total |
Муж. |
R регион |
Дальн В |
Count |
25 |
91 |
22 |
7 |
145 |
|
|
|
% |
17.2 |
62.8 |
15.2 |
4.8 |
100 |
|
|
Вост сиб |
Count |
25 |
56 |
13 |
1 |
95 |
|
|
|
% |
26.3 |
58.9 |
13.7 |
1.1 |
100 |
|
|
Зап Сиб |
Count |
38 |
65 |
13 |
3 |
119 |
|
|
|
% |
31.9 |
54.6 |
10.9 |
2.5 |
100 |
|
Total |
|
Count |
88 |
212 |
48 |
11 |
359 |
|
|
|
% |
24.5 |
59.1 |
13.4 |
3.1 |
100 |
жен. |
R регион |
Дальн В |
Count |
26 |
87 |
9 |
6 |
128 |
|
|
|
% |
20.3 |
68.0 |
7.0 |
4.7 |
100 |
|
|
Вост сиб |
Count |
23 |
54 |
6 |
7 |
90 |
|
|
|
% |
25.6 |
60.0 |
6.7 |
7.8 |
100 |
|
|
Зап Сиб |
Count |
40 |
75 |
9 |
7 |
131 |
|
|
|
% |
30.5 |
57.3 |
6.9 |
5.3 |
100 |
|
Total |
|
Count |
89 |
216 |
24 |
20 |
349 |
|
|
|
% |
25.5 |
61.9 |
6.9 |
5.7 |
100 |
Употребление "BY" в команде CROSSTABS возможно до 10 раз, но и этого достаточно, чтобы занять все ресурсы компьютера.
Если мы хотим получить в одной команде CROSSTABS несколько независимых таблиц, то следует отделять списки переменных символом "/":.
CROSSTABS V8 V11 BY V4 V1/ V12 BY V1/cells row.
CELLS
Параметр CELLS задает вывод некоторых статистик (см. ключевые слова параметра CELLS) для клеток таблицы сопряженности. "CELLS" переводится как "клетка". Если этот параметр не указан, то в клетках таблицы выводятся только абсолютные частоты.
CROSSTABS V1 BY V4 /CELLS = COUNT ROW COLUMN.
Параметры подкоманды /CELLS
COUNT - абсолютное число объектов (Nij);
ROW - проценты по строке;
COLUMN - проценты по столбцу;
TOTAL - проценты по отношению ко всей выборке;
EXPECTED - частоты (Eij=Ni.*N.j/N), ожидаемые в случае независимости переменных (N – общая сумма частот в таблице);
RESID - изменение частоты по сравнению с ожидаемым (Nij-Eij);
SRESID
- стандартизованное изменение частоты
по сравнению с ожидаемым (Nij-Eij)/
(корень из слагаемого статистики
Хи-квадрат, вычисляемой для проверки
гипотезы независимости);
ASRESID - стандартизованное к нормальному распределению N(0,1) изменение частоты Zij=(Nij-Eij)/σij;
ALL - вывод для клетки всех статистик;
Таблица 3.4. Связь "Точки зрения на иностранную помощь" и "Возможн. удовлетворить территор. требований Японии" (частоты и проценты)
V1 точка зрения на иностранную помощь |
V4 Возможность удовлетворить территориториальные требования Японии |
Total |
|||
1 отдать |
2 не надо |
3 не знаю |
|
||
не нужна |
Count |
21 |
143 |
11 |
175 |
|
% row |
12.0 |
81.7 |
6.3 |
100.0 |
|
% col |
19.6 |
27.2 |
13.9 |
24.6 |
огранич. |
Count |
57 |
326 |
48 |
431 |
|
% row |
13.2 |
75.6 |
11.1 |
100.0 |
|
% col |
53.3 |
62.0 |
60.8 |
60.5 |
Нужна |
Count |
27 |
32 |
14 |
73 |
|
% row |
37.0 |
43.8 |
19.2 |
100.0 |
|
% col |
25.2 |
6.1 |
17.7 |
10.3 |
не знаю |
Count |
2 |
25 |
6 |
33 |
|
% row |
6.1 |
75.8 |
18.2 |
100.0 |
|
% col |
1.9 |
4.8 |
7.6 |
4.6 |
Total |
Count |
107 |
526 |
79 |
712 |
|
% row |
15.0 |
73.9 |
11.1 |
100.0 |
|
% col |
100.0 |
100.0 |
100.0 |
100.0 |
Таблица 3.4 получена в результате преобразования данных и применения процедуры CROSSTABS с параметром CELLS:
recode v4 (1,2=1)(3=2)(4=3) into W4.