- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
Свойства дисперсии.
1.Если выборка состоит из одного и того же значения, то дисперсия
2
этой выборки будет равна 0. 12, 12, 12, 12, 12. Sx=0. Дисперсия такой выборки равна 0. Дисперсия является неотрицательной величиной, поэтому
2
Sx= -2,12 – не бывает.
2. Если каждый элемент выборки умножить на одну и ту же
2
величину с, то дисперсия выборки изменится в с раз.
2 2
3. Sнов.= с Sстар. хнов.= с хстар.
Пример: вычислить дисперсию следующей выборки: 102, 106, 111, 112, 112, 114, 115, 115, 116, 119, 120, 122. n=12.
xi |
yi=xi-112 |
yi |
102 106 111 112 112 114 115 115 116 119 120 122 |
-10 -6 -1 0 0 2 3 3 4 7 8 10 |
100 36 1 0 0 4 9 9 16 49 64 100 |
|
yi=20 |
yi=338 |
2 n 2 n 2
Sy= (n yi-( yi) ) : n(n-1)= (12
i=1 i=1
2
338-(20) ):12 (12-1)= (4656-
400):12 11=4256:132=32,24.
В данном случае вычтем из каждого элемента выборки одну и ту же величину, равную 112.
Стандартное отклонение.
Меры изменчивости тесно связаны с дисперсией – является стандартное отклонение, которое обычно обозначается Sx (сигма). Оно определяется как положительное значение квадратного корня из дисперсии.
2
Sx = Sx
Стандартное отклонение часто используется для оценки диапазона изменения наших исходных данных. Для этого применяется правило «трех стандартных отклонений»: 99,5% исходных данных находится в интервале от х – 3 Sx до х + 3 Sx.
х1, х2, …, хn
99,5%
x – 3 Sx x x + 3 Sx
x=110; Sx=9; x – 3 Sx = 110 – 3 9 =83; x + 3 Sx = 110 + 3 9 =137 ; (83 ; 137) 142 0,5% (отклонение от стандартного отклонения).
Стандартное отклонение может быть использовано также в процедуре преобразования исходных данных, которая получила название стандартизации. Чаще всего она применяется для «сырых» баллов.
Пусть в ходе эксперимента получили выборку х1, х2, …, хn, где значения представляют собой сырые баллы. Для другого теста можно получить аналогичные данные, однако часто бывает, что шкала тестов различается по диапазону. Для того, чтобы можно было сравнить полученные данные по различным шкалам и применяют процедуру стандартизации. В результате ее получается новая выборка: z1, z2, …, zn.
zi= (xi-x):Sx , где xi , где xi - среднее значение первоначальной выборки; Sx – стандартное отклонение этой выборки (использование компьютера – мастер функций).
В результате новые стандартизованные данные будут иметь среднее значение, равное 0, а стандартное отклонение – 1, независимо от исходных данных, (т.е.шкалы): z=0; Sz=1.