
- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
Иногда нам приходится измерять один и тот же признак (показатель) для одной и той же группы лиц, но в различные моменты времени. Например, до проведения эксперимента и после эксперимента. В результате в качестве исходных данных мы получаем две выборки одинакового объема х1, х2, …, хn и у1, у2, …, уn (одни и те же люди). Причем элементы выборки, стоящие на одном и том же месте в каждой из выборок должны соответствовать измененному показателю для одного и того же лица. Поэтому такие выборки часто называются связанными. Они являются зависимыми, т.к. значения элементов второй выборки зависят от значений элементов первой выборки. Исходные данные в рассматриваемом примере называются типа «до – после». Связанными выборками могут рассматриваться также данные типа «брат – сестра» (в 1 выборке показываем мальчиков, во второй – девочек), «муж – жена». Для таких данных можно рассмотреть задачу сравнения средних значений двух выборок, для решения которой применяется общая схема проверки статистической гипотезы.
1 и 2 этапы – см. 15.
3 этап – вычисляем наблюдаемое значение статистики критерия. Для этого сначала из двух исходных выборок получаем одну выборку разностей, которую будем обозначать d1, d2, …, dn, где di = xi – yi. По полученной
n
выборке разностей вычисляем среднее значение d = di : n, а также
n 2 i=1
стандартное отклонение Sd = (di – d) : (n – 1), тогда наблюдаемое
i=1
значение статистики критерия вычисляется по следующей формуле:
tнабл. = n d/Sd
4 этап – находим критическое значение статистики критерия. В нашем случае статистика критерия имеет t-распределение Стьюдента с числом степеней свободы = n – 1, поэтому для нахождения t-критического необходимо воспользоваться статистической таблицей распределения Стьюдента (см 4 этап 15 параграфа).
5 этап – делаем вывод о правильности той или иной гипотезы по следующему правилу:
1) если –tкр < tнабл. < tкр, то принимается нулевая гипотеза, т.е. делаем вывод о том, что средние значения ГС статистически одинаковы или, другими словами, проведенный эксперимент не оказал влияния на средние значения изучаемого показателя.
2) если tнабл. < - tкр или tнабл. > tкр, то принимается альтернативная гипотеза, т.е. мы делаем вывод о том, что средние значения рассматриваемых ГС статистически различны или, другими словами, эксперимент привел к изменению среднего значения изучаемого показателя. Для того, чтобы выяснить, в какую сторону произошло изменение среднего значения (стало больше или меньше), необходимо сравнить среднее значение двух исходных выборок х и у (арифметически).
tнабл.
Н1 Н0 Н1
- tкр tкр
Примечание. 1) рассмотренный критерий должен применяться для выборок, извлеченных из ГС, имеющих нормальное распределение с одинаковыми дисперсиями. 2) если эти условия не выполняются, то необходимо воспользоваться критерием, рассмотренным далее в параграфе 18. 3) рассмотренный в данном параграфе критерий в литературе обычно называется парным t-критерием.
Пример: Был проведен эксперимент по исследованию влияния процесса обучения на уровень знаний студентов колледжа. 100 первокурсникам был предложен тест из 60 вопросов, этот же тест был предложен этим же студентам, но уже выпускникам (когда они уже отучились). В качестве измеряемого показателя рассматривалось количество правильных ответов. Проверить гипотезу о наличии либо отсутствии влияния процесса обучения в колледже на уровень знаний. Решение. В нашем эксперименте исходные данные представляют собой 100 пар значений типа «до – после», т.е. две связанные выборки х1, х2, …, х100 и у1, у2, …, у100. Выбираем уровень значимости = 0,01. По исходным выборкам была вычислена выборка разности, по которой было найдено d = - 7,02 Sd = 8,02 (стандартное отклонение) n = 100 tнабл. = 100 (- 7,02:8,02) = - 8,75. Будем искать по таблице tкр. /2 = 0,01:2 = 0,005 = n – 1 = 100 – 1 = 99. Выбираем из таблицы
30 2,75 2,576
альтернативная гипотеза Н1.
Н1
-
8,75 - 2,64 2,64
Т.е. мы делаем вывод, что процесс обучения в колледже приводит к изменению среднего уровня знаний. d = - 7,02 < 0 d = х – у < 0 = х < у. Таким образом, средний уровень знаний за время обучения в колледже повысился.