- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
17. Сравнение средних значений ранжированных признаков двух независимых выборок
Как уже говорилось ранее, если исходные выборки извлечены не из нормальных ГС, то критерий Стьюдента не применим, им нельзя пользоваться. В этом случае используется не параметрический критерий Манна-Уитни. (параметр. – ср. знач. дисперсии; не параметр. – параметры выборки не интересуют). Этот же критерий можно использовать, когда наши исходные данные проранжированы, т.е. измерены в порядковой (ранговой) шкале. Данный критерий позволяет проверить гипотезы о равенстве средних значений двух ГС, когда в качестве исходных данных рассматриваются две независимые выборки. Для решения такой задачи воспользуемся общей схемой проверки статистической гипотезы.
1 этап. Выдвигаются две статистические гипотезы: основная нулевая Н0 о том, что средние значения двух рассмотренных ГС статистически одинаковы и альтернативная Н1 о том, что эти средние значения статистически различны:
Н0: х= у
Н 1: х= у
2 этап. Выбираем уровень значимости .
3 этап. Вычисляем необходимое значение статистики критерия. Для этого сначала две исходные независимые выборки (необязательно одинакового объема) х1, х2, …, хn и у1, у2, …, уm объединяем в одну выборку. Полученную объединенную выборку ранжируем, т.е. присваиваем каждому элементу объединенной выборки ранг, который соответствует порядковому номеру этого элемента в упорядоченной объединенной выборке. После этого вычисляем сумму рангов элементов первой выборки, которую обозначим R1 и сумму рангов элементов второй выборки R2. Затем вычисляем промежуточные величины u1=nm+1/2n(n+1) – R1
u2=nm+1/2m(m+1) – R2. Находим наибольшую из этих двух промежуточных величин, которую обозначим через u=max u1, u2 . Тогда наблюдаемое значение статистики критерия вычисляется по формуле: zнабл.= (u – 1/2nm) : ((nm(n+m+1) : 12.
4 этап. Находим критическое значение статистики критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения критического значения Zкр необходимо воспользоваться статистической таблицей стандартного нормального распределения. В этой таблице сначала находим столбец Ф(х), в котором отыскиваем значение 1 - /2, тогда в этой же строке на пересечении со столбцом х и находится требуемое нам Zкр. x Ф (x)
Zкр 1 - /2
5 этап. Делаем вывод о правильности той или иной гипотезы по следующему правилу:
1) если Zнабл. < Zкр, то принимается нулевая гипотеза Н0, т.е. делаем вывод о том, что средние значения исследуемого признака двух рассматриваемых ГС статистически одинаковы на уровне значимости .
2) если Zнабл. > Zкр, то принимается альтернативная гипотеза Н1, т.е. делаем вывод о том, что эти средние значения статистически различны на уровне значимости .
Zнабл.
Н0 Н1
область, где Zкр область, где
ср. знач. равны ср. знач. не равны
Примечания: 1) не имеет значения как ранжируются элементы выборки: по возрастающей или по убывающей. 2) если два или более элемента выборки имеют одинаковое значение, то они называются совпадающие. В этом случае каждому из этих элементов присваивают ранг, равный среднему значению из тех рангов, которые были бы присвоены этим совпадающим значениям в случае их несовпадения.
Пример: у 26 юношей в возрасте от 18 до 24 лет был измерен уровень невербального интеллекта с помощью методики Векслера. 14 юношей были студентами физического факультета, а 12 – психологического факультета. Можно ли утверждать, что одна из групп превосходит другую по уровню невербального интеллекта? Решение:
Физики (хi) |
Ранги физ. |
Психологи (уi) |
Ранги пс. |
111 104 107 90 115 107 106 107 95 116 127 115 102 99 |
15,5 6,5 11,5 1 20,5 11,5 9 11,5 2 22 26 20,5 4,5 3 |
113 107 123 122 117 112 105 108 111 114 102 104 |
18 11,5 25 24 23 17 8 14 15,5 19 4,5 6,5 |
|
R1=165 |
|
R2=186 |
n=14 m=12
102 : (4+5) : 2 = 4,5 104 : (6+7) : 2 = 6,5 107 : (10+11+12+13) : 4 = 11,5 111 : (15+16) :2 = 15,5. Для проверки правильности ранжирования мы должны вычислить величину R = ((n+m)(n+m+1)) : 2. Если мы правильно проранжировали, то эта величина R должна равняться сумме R1+R2.
R = R1 + R2 . В нашем случае R1 – сумма рангов элементов первой выборки = 165; R2 – второй выборки = 186 R1+R2=351 R = ((14+12)(14+12+1)) : 2 =351
3 этап. Вычисляем u1=14 12+1/2 14 (14+1) – 165 = 108 u2= 14 12+1/2 12 (12+1) – 186 = 80 Отсюда имеем, что u=108. Zнабл. = (108 – ½ 14 12) : (14 12 (14+12+1)) : 12 = 1,23.
4 этап. = 0,05 1 - /2 = 1 – 0,05/2 = 0,975. Из таблицы находим, что Zкр = 1,96 (был использован метод Манна-Уитни и был получен результат Zнабл. = 1,23 Zкр = 1,96)
H0 H1
1,23 1,96
Так как Zнабл. < Zкр, то мы принимаем нулевую гипотезу Н0, т.е. делаем вывод о том, что по среднему уровню невербального интеллекта студенты-физики не отличаются от студентов-психологов на уровне значимости 0,05.