- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
18. Сравнение средних значений ранжированных признаков двух связанных выборок
Если исходные данные в виде двух связанных выборок извлечены не из нормальных ГС, то парные критерии из параграфа 16 не применимы. В этом случае используется критерий Уилкоксона. Этот же критерий может использоваться, когда исходные данные измерены в порядковой шкале. Исходные выборки в нашем случае должны быть связаны (зависимы), например: данными типа «до – после». Для решения задачи сравнения средних значений воспользуемся общей схемой проверки статистической гипотезы.
! . Выдвигаются две статистические гипотезы: основная нулевая о том, что средние значения двух рассматриваемых ГС статистически одинаковы на уровне значимости и альтернативная гипотеза о том, что эти средние значения статистически различны Н0 : х = у Н1 : у = х.
2. Выбираем уровень значимости .
3. Вычисляем наблюдаемое значение статистики критерия. До этого по двум исходным выборкам одинакового объема х1, х2, …, хn и у1, у2, …, уn получаем одну выборку разностей d1,d2,…,dn, где di=xi=yi. В полученной выборке разностей ранжируем абсолютные величины в возрастающем порядке. После этого каждому рангу приписываем знак его разности. Вычисляем сумму положительных рангов, которую обозначают , тогда наблюдаемое значение статистики критерия вычисляются по следующей формуле: Zнабл. = (N – (n(n+1) : 4) : (n(n+1)(2n+1) : 24).
4. Находим критическое значение статистического критерия. В нашем случае статистика критерия имеет стандартное нормальное распределение, поэтому для нахождения критического значения Zкр необходимо воспользоваться статистической таблицей стандартного нормального распределения (см.4 этап параграфа 17).
5. Делаем вывод о правильности той или иной гипотезы по следующему правилу: 1) если – Zкр < Zнабл. < Zкр, то принимается Н0, т.е. делается вывод о том, что среднее значение двух рассматриваемых ГС статистически одинаковы на уровне значения , или, другими словами, в результате эксперимента не произошло изменений среднего значения исследуемого признака. 2) если Zнабл. < - Zкр или Zнабл. > Zкр, то принимается гипотеза Н1, т.е. делаем вывод о том, что эти средние значения статистики различны на уровне значимости или, другими словами, в результате эксперимента произошли изменения среднего значения исследуемого признака.
Примечания: 1) нулевые разности игнорируются. В этом случае необходимо уменьшить соответствующим образом величину n. 2) если в выборке разностей встречаются абсолютные величины, то в этом случае в качестве ранга совпадающим значениям присваивается ранг, равный среднему значению тех рангов, которые получили бы эти величины в случае их несовпадения.
Пример: два сорта пшеницы сравнивают по урожайности. Сорт «а» - обычной разновидности, сорт «б» - новый гибрид. Для этого выбирают 10 участков, каждый из которых делят пополам. На каждом отдельном участке условия роста и созревания одинаковы, случайным образом выбирают одну половину участка и засевают ее сортом «а», а вторую – «б». Результаты сбора урожая приведены в соответствующей таблице. Есть ли подтверждение того, что урожайность сорта «б» выше урожайности сорта «а»?
-
Сорт «а»
yi
Сорт «б»
xi
Разности «б»-«а»
di=xi-yi
ранги
36,9
35,2
31,2
34,1
36,1
34,1
37,2
36,8
29,6
35,4
36,8
37,1
31,2
34,1
35,9
35,2
37,9
37,2
30,2
36,5
0,1
1,9
0,2
0
0,2
1,1
0,7
0,4
0,6
1,1
1
9
2,5
2,5
7,5
6
4
5
n=9 N=9+2,5+7,5+6+4+5+7,5=41,5
Zнабл.= (41,5 – (9(9+1) : 4)) : (9(9+1)(2 9+1) : 24) = 2,26
=0,05 1 - /2 Zкр = 1,96
Н1
- 1,96 1,96 2,26
Принимается гипотеза Н1, т.е. средние урожайности сортов «а» и «б» статистически различны на уровне значимости 0,05. Для окончательного ответа на поставленный задачей вопрос необходимо вычислить среднее значение по данным для сорта «б», а также среднее значение по данным для сорта «а». После чего сравнить арифметически эти вычисленные средние значения. В нашем случае, т.к. положительных разностей гораздо больше и они сравнимы по величине с отрицательными, то действительно средняя урожайность сорта «б» выше средней урожайности сорта «а».