Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МУ по курсовой работе.doc
Скачиваний:
1
Добавлен:
01.07.2025
Размер:
979.46 Кб
Скачать

3.7. Кросс-табуляция

Проведение анализа частот и построение графиков дает мало полезной для анализа информации. Для ответа на поставленные в курсовом проекте задачи необходимо проведение многомерного анализа. Подробнее о методах анализа и принципах их выбора можно посмотреть в [] [].

Метод анализа данных путем построения кросс-таблиц имеет большое распространение, о чем свидетельствует наличие средств кросс-табуляции во многих приложениях. Это и сводные таблицы в Excel, и перекрестный запрос в Access. Часто такие таблицы называются таблицами сопряженности признаков.

В простейшем варианте кросс табуляции используется две переменные. Пусть исследуется зависимость частоты покупок модной одежды от семейного положения. Кросс-таблица для этого случая имеет вид табл. 2.

Таблица 2

Зависимость частоты покупок модной одежды от семейного положения

Частота покупки

Женат / замужем

Не женат / не замужем

Всего

Часто

65

32%

49

57%

114

41%

Редко

127

68%

42

43%

169

59%

Всего

192

100%

91

100%

283

100%

В числителе каждой клетки ставится количество респондентов, удовлетворяющих условиям попадания в эту клетку. Например, в верхней левой клетке со знаком дроби в числителе ставится число женатых (замужних), часто покупающих модные вещи респондентов. Но число респондентов не очень показательно из-за разницы в абсолютных величинах каждой и категорий, поэтому для увеличения наглядности таблицы лучше использовать проценты (указаны в знаменателе).

Исходя из того, что кросс табуляции подвергаются две переменные, проценты можно считать либо применительно к столбцу, либо применительно к строке. Выбор того или иного способа зависит от того, какая переменная является независимой (причиной), а какая – зависимой (следствием). В данном случае независимой переменной является семейное положение, а зависимой – частота покупки одежды. Поэтому проценты считаются для частот покупки относительно всей группы респондентов, имеющих одинаковое семейное положение. Сумма процентов по клеткам, соответствующим одному значению независимой переменной, должна составить 100%.

Такая таблица поможет сформулировать предварительную гипотезу о наличии или отсутствии связи между семейным положением и частотой покупок модной одежды. Эта гипотеза проверяется с помощью критерия хи-квадрат (chi-square). Этот критерий используется для проверки статистической значимости наблюдаемых связей в таблицах сопряженности признаков. Гипотеза для проверки критерием хи-квадрат состоит в том, что связи между переменными нет. В ходе проверки гипотезы сравниваются значения расчетного и табличного значения хи-квадрат, в случае, если расчетное значение хи-квадрат меньше табличного, значит, гипотеза подтверждается и связь отсутствует, в противном случае наличие и сила связи проверяется статистическими критериями:

  • фи коэффициентом, коэффициентом сопряженности признаков коэффициентом Крамера, лямбда коэффициентом или коэффициентом неопределенности (для номинальных переменных);

  • гамма коэффициентом, коэффициентом Соммерса, тау-b или тау-с Кендалла (для порядковых переменных).

В SPSS этот метод анализа реализован специальной функцией в меню «Анализ» - «Описательные статистики» - «Таблицы сопряженности»

38