Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
OTVETY_PO_SPSS.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
1.19 Mб
Скачать

16. Таблицы сопряженности.

. Наиболее часто перед социологами ставятся такие задачи, как описание и анализ совместного поведения двух и более переменных. При этом социолог формирует различные модели, например «респонденты, принадлежащие к разным возрастным, профессиональным или доходным группам, различаются по степени удовлетворенностью своей жизнью или политическим предпочтениям». Тем самым, допускается, что существует некоторая переменная (например, принадлежность к определенной социальной группе), которая объясняет поведение других переменных. Таким образом, в этой модели есть и причина и следствие.

В традиционной терминологии объясняющие переменные называются независимыми, а объясняемые переменные зависимыми. При описании совместного поведения нескольких переменных социолог прибегает к использованию многомерного анализа. Наиболее частым инструментом проверки гипотез о взаимосвязи двух переменных являются таблицы сопряженности.

Таблица сопряженности – это таблица, содержащая частоты совместного проявления значений двух признаков (например, X и Y), измеренных в данной совокупности единиц анализа. В ней строки соответствуют значениям одного признака, столбцы – другого. Иными словами, в таблицах сопряженности отражаются выборочные оценки вероятностных распределений многомерных случайных величин. На основе этой таблицы можно судить о сопряженности (взаимной встречаемости) каких-то значений одних признаков с некоторыми значениями других.

Каждая таблица сопряженности представляет собой численность групп респондентов, на которые подразделяется вся совокупность (т.е. матрицу абсолютных чисел). Кроме того, в таблице располагаются относительные частоты, т.е. доли, которые составляют группы из числа единиц анализа. Они приводятся в виде процентов. Наряду с этими частотами приводятся суммарные частоты по отдельным значениям признаков, а также вспомогательная информация, например по каждому вопросу число респондентов, не ответивших на этот вопрос.

Признаки в таблицах сопряженности – это вопросы анкеты, а

значения признаков – варианты ответов на эти вопросы.

Крайний правый столбец образуют строковые маргинальные суммы (маргиналы по строкам). Последняя строка содержит столбцовые маргинальные суммы.

Анализ Описательная статистика Таблицы сопряженности. где необходимо задать переменные, соответствующие нашим вопросам. Для этого из левой части окна, где содержится список всех переменных, при помощи клавиши (изображение стрелок) переносим в правую часть окна переменные «насколько безопасно чувствуете себя в городе» и «пол». При этом надо выбрать, каким образом переменные должны быть отражены в таблице сопряженности и соответственно заполнить окна «Row / Строки» и «Column / Столбцы». Ячейки Проценты.

Таким образом, мы видим, что главное назначение таблиц сопряженности – это удобное и наглядное представление исходной информации о переменных в целях выявления связей между ними.

17. Коэффициенты критерия «хи-квадрат» и его вычисление в spss.

Критерий Х2 (хи-квадрат) Пирсона – это универсальный инструмент для определения связи между признаками. Данный критерий имеет большое преимущество перед другими за счет того, что не связан со свойствами измеренных характеристик (это могут быть любые переменные, прерывные и непрерывные, номинальные или порядковые). Кроме того, его применение не требует предварительного знания закона распределения признака.

Критерий Х2 (хи-квадрат) Пирсона фиксирует степень расхождения реальной модели, полученной в результате исследования, и ожидаемой. Ожидаемая модель отражает распределение ответов в ситуации отсутствия связи между признаками. Взаимосвязь в статистике определяется через отрицание независимости принятым в математических науках «методом от противного». Поэтому для доказательства наличия связи, мы предполагаем ее отсутствие и на основе значимости статистического критерия опровергаем нашу гипотезу.где nij теор – ожидаемая частота; nij эмп – наблюдаемая или эмпирическая частота.

критерий Х2 Пирсона, отражает, на сколько процентов расходится реальная модель и теоретическая. Само значение критерия Х2 является величиной безразмерной и зависит от двух факторов. Во-первых, от степени расхождения наблюдаемых и ожидаемых частот (величины остатков). Во-вторых, от количества слагаемых, т.е. числа ячеек таблицы. Поэтому в первую очередь для нахождения связи нас интересует не значение самого коэффициента, а его значимость.

Значимость – это вероятность того, что эмпирический критерий принял какое-то значение (соответствующее теоретическому распределению). В статистике значимой является вероятность 95 % и более.

Таким образом, для утверждения наличия связи между признаками рассчитанная значимость критерия Х2 не должна превышать 5%, поскольку это вероятность нулевой гипотезы (гипотезы об отсутствии связи).

Максимальное число клеток с теоретической частотой меньше 5 должно быть 20%, иначе применение критерия Х2 не корректно.

Вычисление критерия Х2 в SPSS. Для вычисления критерия Х2 используют команды SPSS, предназначенные для построения таблиц сопряженности. В появившемся окне «Crosstabs / Таблицы сопряженности» (рис. 7.1) нажимают клавишу «Statistics/ Статистики».

В результате откроется окно «Crosstabs: Statistics / Таблицы сопряженности: Статистики», в котором надо активизировать функцию «Chi-square/ Хи-квадрат»

(n ij теор n ij эмп) 2

n ij теор

n

ч2 = ∑

ij=1 (7.1)

где nij теор – ожидаемая частота; nij эмп – наблюдаемая или эмпирическая частота.

Ожидаемая частота – та, которая стояла бы в той же клетке таблицы, если бы наши переменные были статистически не зависимыми.

Наблюдаемая или эмпирическая частота – та, что стоит в таблице сопряженности.

В знаменателе формулы может стоять любая частота, однако принято использовать теоретическую частоту, поскольку эмпирическая может оказаться равной нулю.

Для каждой клетки таблицы можно посчитать вероятность того, что человек попадет в определенную клетку, т.е. ожидаемую (или теоретическую) частоту.

Теоретическая частота находится по формуле

n ij =

n i * n j

n

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]