Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ЛБ_7

.doc
Скачиваний:
41
Добавлен:
01.02.2015
Размер:
1.94 Mб
Скачать

Дисциплина: Теоретические основы выборочных исследований

Лабораторная работа №7

Анализ таблиц сопряженности

Таблицы сопряженности или кросстабуляции служат для описания связи двух или более номинальных (категориальных) переменных.

1. Построение таблиц сопряженности

1.1. Реализация в SPSS

Для составления таблиц сопряженности в программе SPSS необходимо выполнить следующую последовательность команд:

Analyze (Анализ) - Descriptive Statistics (Описательные статистики) –

Crosstabs (Кросстабуляции)

В результате откроется диалоговое окно (рис.1), в котором необходимо задать переменные, отражаемые в виде строк и в виде столбцов.

Рис.1. Диалоговое окно Crosstabs

Пример построения таблицы сопряженности для переменных food и diet представлен на рис.2.

Рис.2. Простая таблица сопряженности для переменных food и diet

Раздел Layer в диалоговом окне Crosstabs (рис.1.) позволяет создавать многоуровневые таблицы сопряженности для трех и более переменных.

Пример построения многоуровневой таблицы сопряженности для переменных food, diet и profit представлен на рис.3.

Рис.3. Многоуровневая таблица сопряженности для переменных food, diet и profit

1.2. Реализация в STATISTICA

Для составления таблиц сопряженности в программе STATISTICA необходимо выполнить следующую последовательность команд:

Statistics (Статистики) – Basic Statistics / Tables (Основные статистики и таблицы) – Tables and banners (Таблицы и заголовки)

В результате откроется диалоговое окно (рис.4.), в котором для построения простой таблицы сопряженности необходимо перейти на вкладку Stub-and-banner и указать переменные для анализа.

Рис.4. Диалоговое окно Crosstabulation tables

После нажатия кнопки ОК открывается окно результатов (рис.5).

Рис.5. Диалоговое окно Для

Затем, нажав на кнопку Stub-and-banner table, на экран будет выведена результирующая таблица.

Пример построения таблицы сопряженности для переменных food и diet представлен на рис.6.

Рис.6. Простая таблица сопряженности для переменных food и diet

Чтобы построить многоуровневую таблицу сопряженности, необходимо в диалоговом окне Crosstabulation tables (рис.4.) перейти на вкладку Crosstabulation и указать переменные для анализа. После нажатия кнопки ОК открывается окно результатов (рис.7.).

Рис.7. Диалоговое окно Crosstabulation tables Results

В диалоговом окне Crosstabulation tables Results, нажатием кнопки Review summary tables (Посмотреть таблицу результатов) или кнопки Summary открывается многоуровневая таблица сопряженности.

Пример построения многоуровневой таблицы сопряженности для переменных food, diet и profit представлен на рис.8.

Рис.8. Многоуровневая таблица сопряженности для переменных food, diet и profit

2. Критерий хи-квадрат.

Основной целью построения таблиц сопряженности является выявление взаимосвязи между двумя исследуемыми признаками или выявление соответствия совместного распределения теоретическому. Основным инструментом для проведения подобного рода исследований является тест хи-квадрат.

Для проведения теста хи-квадрат на соответствие реального распределения теоретическому, необходимо составить теоретическое распределение.

2.1. Реализация в SPSS

Для составления теоретического распределения в SPSS необходимо в диалоговом окне Crosstabs (рис.1.) воспользоваться кнопкой и Cells, после чего откроется диалоговое окно (рис.9.)

Рис.9. Диалоговое окно Crosstabs: Cell Display

Для выведения ожидаемых частот флажок из положения Observed нужно переместить в положение Expected – команда выведет на экран ожидаемые частоты для каждой ячейки в предположении, что переменные являются независимыми.

Результат выполнения команды представлен на рис.10.

Рис.10. Расчет ожидаемых частот

Для получения дополнительной информации для вывода на экран остатков (Redisual) в окне Cells выделить вид остатков, который нужен: обычные (Unstandartized), нормированные (Standartized) или уточненные нормированные (Adjusted standartized).

Раздел Percentage позволяет вывести относительные ожидаемые или наблюдаемые частоты, выраженные в процентах частоты, выраженные в процентах (команда Total). Или относительные частоты условного распределения (для распределения, составленного по столбцам (Column) или строкам (Row)).

На рис.11. представлена таблица сопряженности дополненная ожидаемыми частотами и значениями остатков.

Рис.11. Расширенный вид таблицы сопряженности

2.2. Реализация в STATISTICA

Для составления теоретического распределения в STATISTICA необходимо в диалоговом окне Crosstabulation tables Results (рис.5.) перейти на вкладку Options и установить флажок в поле Expected frequencies (Ожидаемы частоты).

Результат выполнения команды представлен на рис.12.

Рис.12. Расчет ожидаемых частот

Для получения дополнительной информации для вывода на экран остатков необходимо в диалоговом окне Crosstabulation tables Results (рис.5.) во вкладке Options установить фложок в поле Redisual frequencies.

Раздел Percentage позволяет вывести относительные ожидаемые или наблюдаемые частоты, выраженные в процентах частоты, выраженные в процентах (команда Total). Или относительные частоты условного распределения (для распределения, составленного по столбцам (Column) или строкам (Row)).

На рис.13. представлена таблица сопряженности дополненная ожидаемыми частотами и значениями остатков. Результат выводится отдельными таблицами.

Рис.13. Расширенный вид таблицы сопряженности

3. Расчет критерия хи-квадрат

Ответ на простейший вопрос о взаимосвязи переменных можно получить, вычислив критерий хи-квадрат. Для вычисления критерия хи-квадрат применяется формула Пирсона.

3.1. Реализация в SPSS

Для расчета хи-квадрат по формуле Пирсона в диалоговом окне Crosstabs (рис.1.), необходимо щелкнуть на кнопку Statistics, в результате чего откроется диалоговое окно (рис.14.), в котором необходимо выделить флажком команду Chi-square.

Рис.14. Диалоговое окно Crosstabs: Statistics

Пример расчета критерия хи – квадрат для переменных food и diet представлен на рис.15.

Рис.15. Расчет критерия хи-квадрат Пирсона

В нижней таблице приведены непосредственно результаты расчета критерия:

  • Pearson Chi-Square (Хи-квадрат по Пирсону),

  • Likelihood Ratio (Отношение правдоподобия),

  • Linear-by-Linear Association (Зависимость линейный-линейный),

  • N of Valid Cases (Объем выборки).

Визуальный анализ таблицы сопряженности говорит о том, что диету во время программы похудения скорее соблюдают те, кто на вопрос в анкете о правильном питании до программы похудения отвечал «затрудняюсь ответить» или «полностью не согласен».

Учитывая, что для числа степеней свободы и уровня значимости критическое значение критерия хи-квадрат равно , что меньше расчетного значения, можно говорить о том, что исследуемая зависимость подтверждается.

3.2. Реализация в STATISTICA

Для расчета хи-квадрат по формуле Пирсона в диалоговом окне Crosstabulation tables Results (рис.5.) во вкладке Options установить фложок в поле Pearson & M-L Chi-square, при этом обязательно должны быть рассчитаны ожидаемые частоты.

Пример расчета критерия хи – квадрат для переменных food и diet представлен на рис.16.

Рис.16. Расчет критерия хи-квадрат Пирсона

Результаты совпадают с теми, которые были получены при применении пакета SPSS.

4. Расчет критериев определяющих силу связи между явлениями

Помимо критерия хи-квадрат программа SPSS и STATISTICA позволяет рассчитывать значения таких критериев, как коэффициент контингенции, фи-критерий, критерий Крамера, лямбда-критерий и прочие.

4.1. Реализация в SPSS

Для того, чтобы рассчитать определяющие силу связи между явлениями, необходимо в диалоговом окне Crosstabs: Statistics (рис.14) установить соответствующие флажки.

Пример расчета фи-критерия (Phi) и критерия Крамера (Cramers V) представлены на рис.17.

Рис.17. Расчет фи-критерия и критерия Крамера

Значение критериев фи и Крамера принимает значение равное 0,49, что говорит об относительно сильной связи между переменными food и diet.

4.2. Реализация в STATISTICA

Для того, чтобы рассчитать определяющие силу связи между явлениями, необходимо в диалоговом окне Crosstabulation tables Results (рис.5.) во вкладке Options установить соответствующие фложки.

Индивидуальное задание

Все задания необходимо выполнить в трех пакетах: SPSS, STATISTICA, Excel.

  1. Создайте таблицы сопряженности разного вида – простые и многоуровневые. Дополните простые таблицы информацией на Ваш выбор – данными об ожидаемых частотах в абсолютной или относительной форме и т.д.

  2. Для двух простых таблиц сопряженности рассчитайте критерии хи-квадрат. Дайте пояснения полученному результату.

  3. Рассчитайте коэффициент сопряженности Крамера и Фи-коэффициент. Дайте пояснения полученным результатам.

  4. Проведите сравнительный анализ работы в трех пакетах.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]