
- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
22. Значимость коэффициента корреляции
В большинстве случаев вычисление коэффициента корреляции (КК) осуществляется по небольшому объему исходных данных. Вследствие этого может оказаться, что корреляция во всей ГС близка к нулю, т.е. связи между двумя изучаемыми признаками нет. Хотя арифметически КК вычислений по исходным данным одной выборки отличается от нуля.
Поэтому после вычисления коэффициента корреляции нужно выяснить, является ли он значимым, т.е. фактически проверить гипотезу о том, что КК ГС отличен от нуля. Для решения такой задачи воспользуемся общей схемой проверки статистической гипотезы (ОСПСГ).
1. Выдвигаются две статистические гипотезы. Основная Н0 о том, что коэффициент корреляции ГС статистически равен нулю. Альтернативная Н1 о том, что этот КК статистически отличен от нуля.
Н0: ху = 0, где ху – коэффициент корреляции ГС.
Н 1: ху = 0
2. Выбираем уровень значимости .
3. Находим наблюдаемое значение статистики критерия по следующей формуле: 2
tнабл. = n – 2 (rxy : (1 – rxy))
4. Находится критическое значение статистики критерия. В нашем случае статистика критерия имеет t-распределение Стьюдента с числом степеней свободы = n – 2. Поэтому для нахождения критического значения tкр нужно воспользоваться статистической таблицей распределения Стьюдента (см. параграф 15).
5. Делаем вывод о правильности той или иной гипотезы 1) если –tкр < tнабл. < tкр, то принимается гипотеза Н0, т.е. делаем вывод о том, что коэффициент корреляции ГС статистически равен 0 на уровне значимости или, другими словами, является незначимым или между рассмотренными признаками линейной связи нет; 2) tкр < tнабл. < - tкр, то принимается гипотеза Н1, т.е. делаем вывод о том, что КК ГС статистически отличен от 0 на уровне значимости или, другими словами, является значимым или между двумя рассматриваемыми признаками имеется линейная корреляционная связь, о силе которой мы можем судить по величине КК rxy
tнабл.
Н1 Н0 Н1
Проверку гипотезы равенства нулю КК следует проводить всегда, когда - 0,3 < rxy < 0,3 (когда у нас объем выборки больше 40). n = 44 rxy = 0,45; 0,42. Пример: в результате эксперимента с 60 администраторами были измеряны инспекторские оценки новаторства (переменная х) и рассеянности (переменная у). По результатам эксперимента был вычислен КК Пирсона rxy = 0,3. Выяснить, является ли он значимым. Решение. Выбираем =0,05 n =
2
60. Вычисляем tнабл. = 60 –2 (0,3 : 1 – (0,3) = 2,41. Теперь ищем критическое значение по таблице /2 = 0,05/2 = 0,025. = 60 – 2 = 58. Из таблицы находим, что tкр = 1,98. Делаем вывод
Н1
- 1,98 1,98 2,41
Т.к. tнабл. > tкр, то мы должны принимать гипотезу Н1, т.е. делаем вывод о том, что КК является значимым. Между инспекторскими оценками новаторства и рассеянности существует умеренная, прямая, линейная корреляционная связь на уровне значимости 0,05.