- •Взаимосвязи между двумя переменными
- •Типы переменных и гипотезы
- •Ассоциация и причина
- •Ассоциации и скрытые признаки
- •Причинно-следственная связь: характеристики
- •Анализ условных распределений
- •Анализ условных распределений
- •Статистическая значимость взаимосвязи
- •Интерпретация (p) статистической значимости
- •Меры парной ассоциации
- •Фи [Cramer’s phi]
- •пример
- •– лямбда
Статистическая значимость взаимосвязи
•Значимость показывает вероятность (p-value) того, что наблюдаемое распределение случайно
•Если (p) > 0,05 – мы говорим о том, что наблюдаемая между переменными взаимосвязь является результатом случайности, флуктуации значений, стечения обстоятельств и т.п. Мы не можем утверждать, что она существует и в генеральной совокупности.
•Если Sig. (p) < 0,05, то мы на 95% уверенны, что обнаруженная связь неслучайна, т.е. существует в генеральной совокупности (при условии правильно сделанной выборки)
Интерпретация (p) статистической значимости
•p < 0.01 – p меньше, чем 1 из 100:
–если в генеральной совокупности между X и У нет взаимосвязи, то обнаруженная нами связь по чистой случайности появилась бы в 1 выборке из каждых 100
•p = 0.10 – p равно 10 из 100:
–наблюдаемая нами связь между Х и У случилась бы в десяти выборках из 100 даже если в генеральной совокупности связь между Х и У = 0
•p > 0.05 – p больше, чем 5 из 100:
–если в генеральной совокупности нет связи между Х и У, то наблюдаемые нами результаты появились бы более, чем в 5 выборках из 100 по чистой случайности
Меры парной ассоциации
•Сила - насколько сильно связаны два рассматриваемых признака? И направление – прямо или обратно-пропорционально связаны признаки?
–0 – нет связи, признаки независимы
–+1 – идеальная прямо пропорциональная связь или –1 – идеальная обратно пропорциональная связь
•PRE меры показывают насколько знание Х улучшает наши прогнозы (предсказания) значений У
•Интерпретация значений PRE коэффициентов:
–ниже 0,1 – слабая связь
–от 0,1 до 0,2 – умеренная связь
–от 0,2 до 0,3 – умеренно сильная связь
–0,3 и выше – сильная связь
Фи [Cramer’s phi]
•Номинальная-номинальная;
•Cramer's phi = 0.37 – корреляция, симметричная
•φ2 (phi*phi = 0.137) – PRE (коэффициент детерминации)
пример
|
Сандалии/ |
Кроссовк Кожаные |
Ботинки |
Другое |
Всего |
|
|
босоножки |
и |
ботинки |
|||
|
|
|
|
|||
Юноши |
6 |
17 |
13 |
9 |
5 |
50 |
Девушки |
13 |
5 |
7 |
16 |
9 |
50 |
Всего |
19 |
22 |
20 |
25 |
14 |
100 |
Cramer's phi = 0.37 (φ2 = 0.137) означает, что предпочтения обуви студентов на 14% определяются их полом. А значит, 86% разброса предпочтений остается без объяснения, есть и другие
– лямбда
•Номинальная-номинальная;
•Значение лямбды показывает,
насколько |
нам удалось бы |
уменьшить |
ошибочность нашего |
предсказания, когда мы опирались бы на одну переменную, чтобы предсказать другую.
• Просто *100 и говорим в %;