
- •Лабораторная работа №3
- •1. Введение
- •2. Создание таблиц сопряженности
- •3. Графическое представление таблиц сопряженности
- •4. Статистические критерии для таблиц сопряженности
- •4.1. Тест хи-квадрат ()
- •Критерий хи-квадрат по формуле Пирсона
- •4.2. Коэффициенты корреляции
- •4.3. Меры связанности для переменных с номинальной шкалой
- •5. Практическое задание.
- •6. Контрольные вопросы.
- •7. Требования к отчету.
Критерий хи-квадрат по формуле Пирсона
В формуле Пирсона
вычисляется сумма квадратов
стандартизованных (нормированных)
остатков по всем полям таблицы
сопряженности. Поэтому поля с более
высоким стандартизованным остатком
вносят более весомый вклад в численное
значение критерия
и,
следовательно, в значимый результат.
Правило: Считается, что существует значимое различие между наблюдаемой и ожидаемой частотой, если нормированный остаток больше или равен 2. Другие предельные значения принимаются в соответствии со следующей таблицей.
Таблица 1
Предельные значения
Нормированный остаток |
Уровень значимости |
>=2,0 >=2,6 >=3,3 |
p<0,05 (*) p<0,01 (**) p<0,001 (***) |
Однако эти правила применимы только в случае, если ожидаемая частота не меньше 5.
Корректность проведения теста хи-квадрат определятся двумя условиями:
во-первых, ожидаемые частоты <5 должны встречаться не более чем в 20 % полей таблицы;
во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.
В
рассматриваемом нами примере формула
Пирсона не дает даже минимально значимую
величину критерия хи-квадрат (p>0,05).
Кроме того, как указывает примечание
после таблицы теста
,92,3 % полей имеют
ожидаемую частоту менее 5. Так как
допустимый предел в 20 % намного превышен,
то расхождение между наблюдаемыми и
ожидаемыми частотами считаем значительным.
Критерий хи-квадрат с поправкой на правдоподобие
Альтернативой формуле Пирсона для
вычисления
является поправка на правдоподобие:
При большом объеме выборки формула Пирсона и подправленная формула дают очень близкие результаты. В нашем примере критерий хи-квадрат с поправкой на правдоподобие составляет 36,237.
4.2. Коэффициенты корреляции
Тест
позволяет лишь выяснить сам факт
существования статистической зависимости
между двумя признаками. Далее будем
определять силу этой зависимости, её
вид и направленность.Критерии
количественной оценки зависимости
между переменными называются коэффициентами
корреляции или мерами связанности.
В качестве коэффициента корреляции между переменными, принадлежащими порядковой шкале, применяется коэффициент Спирмена, а для переменных с интервальной шкалой – коэффициент корреляции Пирсона, называемый также линейной корреляцией. При этом следует учесть, что каждую дихотомическую переменную, т.е. переменную, принадлежащую к номинальной шкале и имеющую две категории, можно рассматривать как порядковую.
Проверим, существует ли корреляция между переменными «ширина» и «вес» из файла данных «изучение крабов».
Для определения коэффициентов корреляции в диалоговом окне Таблицы сопряженности сбросьте все возможные настройки и перенесите соответствующие переменные в список строк и список столбцов. Щелкните на кнопкеСтатистики. Установите флажокКорреляции. ЩелкнитеПродолжить. В диалогеТаблицы сопряженностиоткажитесь от вывода таблиц. НажмитеOK.
Будут вычислены коэффициенты корреляции Спирмена и Пирсона, а также проведена проверка их значимости.
В данном случае обе переменные «ширина» и «вес» принадлежат к интервальной шкале. Проделав вышеуказанные действия, получим следующую таблицу (рис.12).
Рис.12. Симметричные меры переменных «ширина*вес»
Для интервальных переменных следует рассматривать коэффициент Пирсона (для порядковых - Спирмена). Он является максимально значимым (p<0,001) и составляет 0,838. Значит, между шириной и весом крабов изучаемой совокупности существует сильная корреляция (взаимосвязь). Переменные коррелируют положительно. Следовательно, большие по весу особи имеют больший размер тела, и наоборот.