Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебник по SPSS.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
1.89 Mб
Скачать

3.2 Анализ связи между неколичественными переменными. Crosstabs - таблицы сопряженности

CROSSTABS получает таблицы сопряженности многомерных распределений и связей двух и более переменных. Рекомендуется использовать CROSSTABS для переменных с небольшим числом значений (обычно для неколичественных переменных), так как каждая комбинация значений соответствует новой клетке в таблице.

CROSSTABS /TABLES= v1 v2 BY v10 BY pol.

Таблицы сопряженности для пары переменных X и Y содержат частоты Nij, с которыми встретилось сочетание i-го значения X и j-го значения Y. Кроме того, в таблице обязательно присутствуют маргинальные частоты Ni.- равные сумме чисел Nij по строке; N.j - сумме по столбцу (частоты i-го значения X и j-го значения Y, подсчитанные независимо) и N - общее число объектов.

Таблица, заполненная одними частотами Nij, обычно не имеет смысла, так как не проясняет должным образом взаимосвязи между переменными. Для исследования взаимосвязи необходимы статистики взаимосвязи переменных и статистики связи значений.

Основные подкоманды CROSSTABS:

/TABLES - задание таблиц;

/CELLS - статистики клеток таблицы;

/STATISTICS - статистики взаимосвязи переменных.

/METHOD - метод проверки значимости связи переменных.

/BARCHART - столбиковая диаграмма.

/TABLES задание таблиц

Параметр TABLES может быть опущен:

CROSSTABS v1 TO v5 BY v10.

Строки таблицы сопряженности соответствуют значениям переменной, указанной в тексте команды перед ключевым словом "BY"; столбцы матрицы соответствуют значениям переменной, расположенной после "BY".

Пример - совместное распределение по региону (R), точке зрения на иностранную помощь (v1) и полу (V8):

CROSSTABS TABLES R BY v1 BY v8/cells = COUNT ROW.

В результате выполнения этой команды рассчитывается таблица 3.3. Перед ключевым словом BY указываются переменные, по которым вычисляется двухвходовая таблица (переменная, значения которой идентифицируют строки), после ключевого слова BY указываются переменные, идентифицирующие столбцы. За следующими BY идут переменные условий, определяющие подвыборки, на которых рассчитываются таблицы. Хотя в современной версии пакета эти таблицы объединяются в одну таблицу, их статистический анализ производится по-отдельности. Ключевым словом BY могут разделяться и списки переменных. В этом случае процедурой получаются таблицы по всем парам таблиц из первого и второго списка. Например,

CROSSTABS V8 V11 V12 BY V4 V1.

Эта команда выведет таблицу сопряженности: V8 c V4, V8 c V1, V11 c V4, V11 c V1 и т.д., то есть сочетания по всем переменным, перечисленным в команде. Всего будет выдано на печать 6 таблиц. Если более двух списков переменных разделены ключевыми словами "BY", то переменные, стоящие за вторым, третьим и т.д. "BY", задают условия получения таблиц. Таблицы формируются на подвыборках, соответствующих сочетаниям значений этих переменных.

Таблица 3.3. Распределение переменной "Точка зрения на иностранную помощь" в разрезе региона и пола респондентов.

V1 точка зр. на иностр. Помощь

V8 Пол

Не нужна

огранич.

Нужна

не знаю

Total

Муж.

R регион

Дальн В

Count

25

91

22

7

145

%

17.2

62.8

15.2

4.8

100

Вост сиб

Count

25

56

13

1

95

%

26.3

58.9

13.7

1.1

100

Зап Сиб

Count

38

65

13

3

119

%

31.9

54.6

10.9

2.5

100

Total

Count

88

212

48

11

359

%

24.5

59.1

13.4

3.1

100

жен.

R регион

Дальн В

Count

26

87

9

6

128

%

20.3

68.0

7.0

4.7

100

Вост сиб

Count

23

54

6

7

90

%

25.6

60.0

6.7

7.8

100

Зап Сиб

Count

40

75

9

7

131

%

30.5

57.3

6.9

5.3

100

Total

Count

89

216

24

20

349

%

25.5

61.9

6.9

5.7

100

Употребление "BY" в команде CROSSTABS возможно до 10 раз, но и этого достаточно, чтобы занять все ресурсы компьютера.

Если мы хотим получить в одной команде CROSSTABS несколько независимых таблиц, то следует отделять списки переменных символом "/":.

CROSSTABS V8 V11 BY V4 V1/ V12 BY V1/cells row.

 

CELLS

Параметр CELLS задает вывод некоторых статистик (см. ключевые слова параметра CELLS) для клеток таблицы сопряженности. "CELLS" переводится как "клетка". Если этот параметр не указан, то в клетках таблицы выводятся только абсолютные частоты.

CROSSTABS V1 BY V4 /CELLS = COUNT ROW COLUMN.

Параметры подкоманды /CELLS

COUNT - абсолютное число объектов (Nij);

ROW - проценты по строке;

COLUMN - проценты по столбцу;

TOTAL - проценты по отношению ко всей выборке;

EXPECTED - частоты (Eij=Ni.*N.j/N), ожидаемые в случае независимости переменных (N – общая сумма частот в таблице);

RESID - изменение частоты по сравнению с ожидаемым (Nij-Eij);

SRESID - стандартизованное изменение частоты по сравнению с ожидаемым (Nij-Eij)/ (корень из слагаемого статистики Хи-квадрат, вычисляемой для проверки гипотезы независимости);

ASRESID - стандартизованное к нормальному распределению N(0,1) изменение частоты Zij=(Nij-Eij)/σij;

ALL - вывод для клетки всех статистик;

Таблица 3.4. Связь "Точки зрения на иностранную помощь" и "Возможн. удовлетворить территор. требований Японии" (частоты и проценты)

V1 точка зрения на иностранную помощь

V4 Возможность удовлетворить территориториальные требования Японии

Total

1 отдать

2 не надо

3 не знаю

не нужна

Count

21

143

11

175

% row

12.0

81.7

6.3

100.0

% col

19.6

27.2

13.9

24.6

огранич.

Count

57

326

48

431

% row

13.2

75.6

11.1

100.0

% col

53.3

62.0

60.8

60.5

Нужна

Count

27

32

14

73

% row

37.0

43.8

19.2

100.0

% col

25.2

6.1

17.7

10.3

не знаю

Count

2

25

6

33

% row

6.1

75.8

18.2

100.0

% col

1.9

4.8

7.6

4.6

Total

Count

107

526

79

712

% row

15.0

73.9

11.1

100.0

% col

100.0

100.0

100.0

100.0

Таблица 3.4 получена в результате преобразования данных и применения процедуры CROSSTABS с параметром CELLS:

recode v4 (1,2=1)(3=2)(4=3) into W4.