Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Прикладные комп программы Воробьева.doc
Скачиваний:
45
Добавлен:
22.03.2015
Размер:
1.42 Mб
Скачать

Таблицы сопряженности

До сих пор мы рассматривали только отдельные переменные. Мы проводили частот­ный анализ, а также описывали отдельные переменные статистическими характери­стиками, такими как минимум, максимум и среднее значение. Методы анализа такого рода называются одномерными. В SPSS имеется большое количество разнообразных процедур, при помощи кото­рых можно произвести анализ связи между двумя переменными. В программе он реализуется созданием таблиц сопряженности.

Analyze (Анализ)/ Descriptive Statistics (Дескриптивные статистики)/ Crosstabs... (Таблицы сопряженности). Откроется диалоговое окно Crosstabs. Список исходных переменных содержит переменные открытого файла данных. Здесь можно выбрать переменные для строк и столбцов таблицы сопряженности. Для каждого сочетания двух переменных будет создана таблица сопряженности. Сначала мы построим таблицу сопряжен­ности из переменных «пол» и «настроение» (см. рис. 14).

Рис. 14. Вид окна создания таблиц сопряженности

После запуска программы мы получим следующее распределение (см. табл.2).

Таблица 2.

Вид таблицы распределения данных после запуска опции «таблицы сопряженности»

Настроение * Пол Crosstabulation

Count

Пол

Total

Мужской

Женский

Настроение

Нормальное, ровное настроение

41

106

147

Испытываю напряжение, раздражение

11

28

39

Затрудняюсь ответить

4

31

35

Прекрасное настроение

13

30

43

Испытываю страх, тоску

1

10

11

Total

70

205

275

Если для таблицы со­пряженности приняты параметры по умолчанию, в каждой ячейке отображается только абсолютная частота. Метки переменных и значений в таблице соответствуют опреде­лениям переменных в файле данных SPSS. Числа в последней строке и в последнем столбце показывают суммы значений соответственно по строкам и столб­цам.

Более тщательно исследовать существование зависимости позволяет вычисление зна­чений ожидаемых частот. Чтобы определить эти значения, выполните следующие дей­ствия: Analyze (Анализ)/ Descriptive Statistics (Дескриптивные статистики)/ Crosstabs... (Таблицы сопряженности). В списке строк у нас должна стоять переменная «настроение», а в списке столбцов — пере­менная «пол». Щелкните на кнопке Cells... (Ячейки). От­кроется диалоговое окно Crosstabs: Cell Display (Таблицы сопряженности: Отобра­жение ячеек) (см. рис.15).

В группе Counts (Частоты) можно выбрать один или более следующих вариантов отображе­ния: Observed (наблюдаемые)- будут отображать­ся наблюдаемые частоты. Это настройка по умолчанию. Expected (Ожидаемые). Если установить этот флажок, будут отображаться ожи­даемые частоты. Они вычисляются как произведение сумм соответствующей строки и столбца, деленное на общую сумму частот. Установите флажок Expected.

Остатки являются показателем того, насколько сильно наблюдаемые и ожидаемые частоты отклоняются друг от друга. Чтобы получить остатки частот, выпол­ните следующие действия. В группе Residuals (Остатки) можно выбрать один или более следующих вариан­тов отображения: Unstandardized (Ненормированные) - отображаются ненормированные остатки, то есть разность наблюдаемых и ожидаемых частот.

Таблицы сопряженности, которые мы рассмотрели выше, имеют тот недостаток, что в них приводятся только абсолютные значения. Чтобы узнать, насколько эти значения важны по отношению к общему количеству, надо определить их процентную долю. Для вычисления процентных значений выполните следующие действия: не изменяя прежних настроек, щелкните на кнопке Cells. В группе Percentages (Проценты) можно выбрать один или более из нижеследующих вариантов отображения:

- Row (По строкам) (вычисляются процентные значения по строкам: количество наблюдений в каждой ячейке, отнесенное к сумме по строке);

- Column (По столбцам) (вычисляются процентные значения по столбцам: коли­чество наблюдений в каждой ячейке в отношении к сумме столбца);

- Total (Полные) (вычисляются полные процентные значения: количество наблю­дений в каждой ячейке, отнесенное к общей сумме наблюдений).

Установите флажки Column, чтобы показать проценты по столбцу (см. рис. 15).

Рис. 15. Вид окна определения дополнительных опций по созданию таблиц сопряженности

Щелкните на кнопке Continue, а в главном диалоговом окне — на ОК. В окне просмотра результатов будет получена таблица сопряженности (см. табл. 3).

Таблица 3.

Вид вывода таблицы сопряженности при использовании опций дополнительного меню

Настроение * Пол Crosstabulation

Пол

Total

Мужской

Женский

Настроение

Нормальное, ровное настроение

Count

41

106

147

Expected Count

37,4

109,6

147,0

% within Пол

58,6%

51,7%

53,5%

Residual

3,6

-3,6

Испытываю напряжение, раздражение

Count

11

28

39

Expected Count

9,9

29,1

39,0

% within Пол

15,7%

13,7%

14,2%

Residual

1,1

-1,1

Затрудняюсь ответить

Count

4

31

35

Expected Count

8,9

26,1

35,0

% within Пол

5,7%

15,1%

12,7%

Residual

-4,9

4,9

Прекрасное настроение

Count

13

30

43

Expected Count

10,9

32,1

43,0

% within Пол

18,6%

14,6%

15,6%

Residual

2,1

-2,1

Испытываю страх, тоску

Count

1

10

11

Expected Count

2,8

8,2

11,0

% within Пол

1,4%

4,9%

4,0%

Residual

-1,8

1,8

Total

Count

70

205

275

Expected Count

70,0

205,0

275,0

% within Пол

100,0%

100,0%

100,0%

Так как в нашем случае процентные распределения существенно не отличаются, но тем не менее, мы можем выявить следующую закономерность: настроение у мужчин более спокойное и равномерное, а женщины чуть более расположены испытывать напряжение, раздражение. Данные выводы позволяют нам сделать как остатки по величинам, так и процентное соотношение по столбцу.

Применение переменных групп и слоев

Созданные выше таблицы сопряженности показывают распределние ответов по настроению респондентов в зависимости от но вполне может быть, что переменная «возраст» оказывает влияние на за­висимость между «пол» и «настроение». Чтобы выявить возможные различия, следует создать отдельные таблицы, в нашем случае — по одной таблице для каждого возраста. В рассматриваемом примере переменная возраст играет роль переменной слоев. Анализ производится по группам, то есть для каждой группы составляется отдельная таблица сопряженности.

Analyze (Анализ)/ Descriptive Statistics (Дескриптивные статистики) / Crosstabs... (Таблица сопряженности). В списке строк у нас должна стоять переменная «настроение», а в списке столбцов — пере­менная «пол». Перенесите переменную «возраст» в список переменных слоев (см. рис. 16). Щелкните ОК. Получите следующее распределение данных (см. табл. 4).

Рис. 16. Вид окна таблиц сопряженности при создании слоя

Таблица 4.

Вид распределения данных при использовании дополнительного слоя при создании таблиц сопряженности

Настроение * Пол * Возраст Crosstabulation

Возраст

Пол

Total

Мужской

Женский

от 18 до 25

Настроение

Нормальное, ровное настроение

63,6%

47,6%

53,1%

Испытываю напряжение, раздражение

19,0%

12,5%

Затрудняюсь ответить

9,1%

9,5%

9,4%

Прекрасное настроение

27,3%

23,8%

25,0%

Total

100,0%

100,0%

100,0%

от 26 до 30

Настроение

Нормальное, ровное настроение

57,1%

40,7%

47,9%

Испытываю напряжение, раздражение

19,0%

7,4%

12,5%

Затрудняюсь ответить

4,8%

11,1%

8,3%

Прекрасное настроение

19,0%

37,0%

29,2%

Испытываю страх, тоску

3,7%

2,1%

Total

100,0%

100,0%

100,0%

от 31 до 40

Настроение

Нормальное, ровное настроение

47,8%

54,0%

52,7%

Испытываю напряжение, раздражение

30,4%

14,9%

18,2%

Затрудняюсь ответить

4,3%

16,1%

13,6%

Прекрасное настроение

17,4%

12,6%

13,6%

Испытываю страх, тоску

2,3%

1,8%

Total

100,0%

100,0%

100,0%

от 41 до 50

Настроение

Нормальное, ровное настроение

63,6%

54,0%

55,7%

Испытываю напряжение, раздражение

14,0%

11,5%

Затрудняюсь ответить

9,1%

16,0%

14,8%

Прекрасное настроение

18,2%

6,0%

8,2%

Испытываю страх, тоску

9,1%

10,0%

9,8%

Total

100,0%

100,0%

100,0%

старше 50

Настроение

Нормальное, ровное настроение

100,0%

55,0%

62,5%

Испытываю напряжение, раздражение

10,0%

8,3%

Затрудняюсь ответить

20,0%

16,7%

Прекрасное настроение

5,0%

4,2%

Испытываю страх, тоску

10,0%

8,3%

Total

100,0%

100,0%

100,0%

Можно выбрать другие уровни переменных слоев. Для каждой категории каждой из переменной слоев будет создана отдельная таблица сопряженности. Чтобы доба­вить новый слой, щелкните на кнопке Next (Следующий). Каждый последующий уро­вень делит таблицу сопряженности на меньшие подгруппы.

Таблицы сопряженности с дихотомическими наборами

Таблицы сопряженности можно создавать между двумя наборами переменных, а также между набором и "обычной" переменной. Так, к примеру, нам необходимо в одной таблице сопряженности отобразить соотношение между набором «газеты» (множественный ответ на вопрос о предпочтении читаемых газет) и пе­ременной «пол». Выберите в меню команды Analyze (Анализ)/ Multiple Response (Множественные ответы)/Crosstabs (Таблицы сопряженности). Появится диалоговое окно Multiple Response Crosstabs.

В списке исходных переменных показаны переменные всего файла ФМК.sav. (изучение социально-психологического климата ФМК). В списке наборов множественных ответов показан ранее определенный набор. Перенесите в список переменных строк набор $газеты, а в список переменных столбцов — переменную «пол». Эта переменная появится в списке столбцов с двумя вопросительными знаками, заключенными в скобки. Если таблица сопря­женности строится между элементарными переменными (не являющимися на­борами) и наборами, то для первых следует задать диапазон значений. Щелкните на кнопке Define Ranges... (Определить диапазоны). Откроется диалоговое окно Multiple Response Crosstabs: Define Variable Range (Таблицы со­пряженности для множественных ответов: Определить диапазон переменной). Задайте минимальное значение (Minimum) "1", а максимальное (Maximum) — "2". Подтвердите выбор кнопкой Continue. Те­перь вопросительные знаки заменены значениями "1" и "2" (см. рис. 17).

Щелкните на кнопке Options... (Парамет­ры). Откроется диалоговое окно Multiple Response Crosstabs: Options. Абсолютные частоты в ячейках выводятся все­гда. Дополнительно в группе Cell Percentages (Проценты в ячейках) выбираем Column (Отобразятся проценты по столбцам). Подтвердите ввод кнопкой Continue, а затем — ОК.

Рис. 17. Вид окна создания таблиц сопряженности для множественных ответов

Задание 1

1. Получить таблицу сопряженности переменной «количество братьев и сестер» и «раса» из базы данных 1991 USA….: в ячейках таблицы получить абсолютные частоты, проценты по строке и столбцу, общие проценты. Проанализировать реальную и ожидаемую величину, ненормализованные остатки. Выявить закономерности (если они есть) количества детей в зависимости от расы.

2. Получить таблицу сопряженности переменной «проблемы пьянства» и «раса»: в ячейках таблицы получить абсолютные частоты, проценты по строке и столбцу, общие проценты. Проанализировать реальную и ожидаемую величину, ненормализованные остатки. Выявить закономерности (если они есть). Добавить слой «кол-во братьев и сестер». Проанализировать общие закономерности.

3. Получить таблицу сопряженности переменной «проблемы пьянства» и «ощущение счастья (4 переменная)»: в ячейках таблицы получить абсолютные частоты, проценты по строке и столбцу, общие проценты. Проанализировать реальную и ожидаемую величину, ненормализованные остатки. Выявить закономерности (если они есть). Какую переменную Вы бы выбрали для «слоя». Проанализируйте с третьей переменной. Пропишите закономерности.

4. Составьте еще две таблицы сопряженности для подтверждения или опровержения гипотез по взаимосвязи двух (или трех) переменных. Проверьте Ваши гипотезы. Напишите выводы.

Задание 2

  1. По базе данных «Кризис. sav» проанализируйте, как отличаются последствия от кризиса (переменные VAR 9-27) у тех, кто стал жить лучше, хуже и также (VAR 5-8).

  2. Проанализируйте, какие слои населения больше всего затронул кризис (в зависимости от социально-демографических характеристик посмотрите распределение ответов на вопрос как стали жить за последние годы – лучше, хуже, также)

  3. Рассчитайте удовлетворенность материальным положением, жизнью, социально-экономической обстановкой у тех, кто живет также и у тех, кто стал жить хуже (VAR 48-62).

  4. Проанализируйте взаимосвязь между переменными самоидентификации по материальному положению (VAR98-106) и социальному положению (VAR168-176).

  5. Рассчитайте среднюю заработную плату и средний среднемесячный доход на одного человека.

Лабораторная работа № 5