- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
24. Коэффициент ранговой корреляции кендалла
Как и в случае КРК Спирмена исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.
Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен.
КРК Кендалла обычно обозначается и вычисляется по формуле:
= (P – Q) : ((n (n – 1)) :2), где P – общее количество совпадений; Q – общее количество инверсий. Например:
Лицо |
х |
у |
Совпадения |
Инверсия |
А С В Н Е F D G |
1 2 3 4 5 6 7 8 |
3 1 2 5 7 8 4 6 |
5 6 5 3 1 0 1 0 |
2 0 0 1 2 2 0 0 |
|
|
|
Р = 21 |
Q = 7 |
При вычислении КРК Кендалла для упрощения расчетов данные располагают по одной переменной (например, х) в порядке возрастания.
Так как для каждой пары может быть или совпадение или инверсия, то после подсчета совпадений количество инверсий равно количеству сравниваемых лиц (исключая себя) минус количество совпадений.
= (21 – 7) : (8 (8 – 1) : 2) = 0,5.
Отсюда видно, что между переменными х и у имеется прямая (положительная) средняя корреляционная связь.
В случае связанных (одинаковых) КРК Кендалла, как и КРК Спирмена, вычисляется по формуле:
= (P – Q) : [ n (n – 1) :2 – Kx ] [ n (n – 1) :2 – Ky ] , где поправки Кх и Ку вычисляются по следующим формулам:
k
Кх = [ fi (fi – 1)] : 2, где k - количество групп совпадающих
i=1
рангов по переменной х; fi - количество значений в i-той группе совпадений.
m
Ky = [gi (gi – 1)] : 2, где m - количество групп совпадающих
i=1
рангов по переменной у, gi - количество значений в i-той группе совпадений.
Наиболее часто на практике используется КРК Спирмена. Следует также отметить, что КРК Спирмена и КРК Кендалла связаны следующим приблизительным соотношением:
rs = 1,3
Значимость КРК Кендалла.
После вычисления КРК Кендалла необходимо проверить полученное значение КРК на значимость. Для этого воспользуемся общей схемой проверки статистической гипотезы.
1. Выдвигаются две статистические гипотезы:
Н0 о том, что КРК Кендалла статистически равен 0 и
Н1 о том, что этот КРК статистически отличен от 0.
Н0 : =0
Н1 : =0.
2. Выбирается уровень значимости .
3. Вычисляется наблюдаемое значение статистического критерия. Для этого сначала вычисляем величину
P – Q + 1 , P < Q
S=
P – Q – 1, P > Q, тогда наблюдаемое значение вычисляется по следующей формуле:
Zнабл. = S : (n (n – 1) (2n + 5)) : 18
4. Находим критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения критического значения необходимо воспользоваться статистической таблицей стандартного нормального распределения (см. параграф 17). Zкр
1 - /2
5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если - Zкр < Zнабл. < Zкр , то принимается нулевая гипотеза (Н0), т.е. делаем вывод о том, что КРК Кендалла статистически равен 0, т.е. является незначимым; 2) если Zнабл < - Zкр или Zнабл > Zкр, то принимается альтернативная гипотеза Н1, т.е. делаем вывод о том, что КРК Кендалла на уровне значимости статистически отличен от 0, т.е. является значимым.
Zнабл.
H1 H0 H1
-Zкр Zкр
Проверим значимость КРК Кендалла, вычисленного в примере выше.
= 0,5 = 0,05 n = 8 Р = 21 Q = 7.
Так как P > Q, то S = P – Q – 1 = 21 – 7 – 1 = 13. Вычисляем Zнабл.: Z = 13 : (8 (8 – 1) (2 8+ 5)) : 18 = 1,61.
1 - /2 = 1 – 0,05/2 = 0,975. Zкр = 1,96
H0
-1,96 1,61 1,96
т.е. - Zкр < Zнабл. < Zкр, то в нашем случае делаем вывод о том, что на уровне значимости 0,05 КРК Кендалла статистически равен 0, т.е. не является значимым.
Проверка гипотезы о равенстве двух коэффициентов корреляции.
Иногда может возникать задача сравнения для двух различных групп лиц. Например: сильнее ли коррелированы способности и успеваемость у мальчиков, чем у девочек?
Для решения такой задачи воспользуемся общей схемой проверки статистической гипотезы.
1. Выдвигаются две статистические гипотезы, основная нулевая Н0 о том, что КК двух рассматриваемых ГС статистически одинаковы и альтернативная Н1 о том, что эти КК статистически различны.
Н0: 1 = 2, где 1 – КК между двумя исследуемыми показателями в первой ГС
Н 1: 1 = 2, где 2 – КК между двумя исследуемыми показателями во второй ГС.
2. Выбираем уровень значимости .
3. Вычисляется наблюдаемое значение статистики критерия. Для этого сначала по исходным данным вычисляется КК, r1 и r2. После этого вычисленные КК с помощью преобразования Фишера преобразуются величины Z1 и Z2.
Z1 = ½ ln (1+r1) : (1 – r1)
Z2 = ½ ln (1+r2) : (1 – r2)
Тогда наблюдаемое значение статистики критерия вычисляется по следующей формуле:
Zнабл. = (Z1 – Z2) : (1 : (n – 3) + 1 : (m – 3), где n – количество лиц первой группы, а m – количество лиц второй группы.
4. Находится критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения Zкр нужно воспользоваться статистической таблицей стандартного нормального распределения (см. параграф 17).
5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если –Zкр < Zнабл < Zкр, то принимается гипотеза Н0, т.е. делаем вывод о том, что КК между исследуемыми показателями в двух рассматриваемых ГС статистически одинаковы на уровне значимости . 2) если Zнабл < -Zкр или Zнабл > Zкр, то принимается гипотеза Н1, т.е. делаем вывод о том, что эти КК статистически различны на уровне значимости .
Zнабл
Н1 Н0 Н1
Пример. В выборке из 200 детей в возрасте от 6 до 15 лет корреляция между интеллектом и скоростью обмена веществ определяется величиной r1 = 0,71. В выборке из 78 взрослых людей в возрасте от 18 до 25 лет интеллект и скорость обмена веществ имеют корреляционную связь, оцениваемую величиной r2 = 0,28. Проверить их статистическое совпадение.
Решение. Выбираем = 0,01.
Z1 = ½ ln (1+0,71) : (4 – 0,71) = 0,887
Z2 = ½ ln (1+0,28) : (1 – 0,28) = 0,288
Zнабл= (0,887 – 0,288) : 1 : (200 – 3) + 1 : (78 – 3) =4,4
Ищем критическое значение
1 - /2 = 1 – 0,01/2 = 0,995
Из таблиц находим, что Zкр = 2,58
Н1
-2,58 2,58 4,4
Так как Zнабл > Zкр, то принимаем гипотезу Н1, т.е. корреляция между интеллектом и скоростью обмена веществ у детей сильнее (т.к. r1 > r2), чем у взрослых.