- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
11. Нормальное распределение
Значения показателей (признаков) невозможно предугадать даже при полностью известных условиях эксперимента, в которых они измеряются.
Мы можем лишь указать вероятность того, что признак принимает то или иное значение.
Знание частоты встречаемости этих значений позволяет нам судить о распределении частот. Знание этого распределения исследуемого признака позволяет делать выводы о событиях, в которых участвует этот признак. Однако эти выводы тоже носят вероятностный или столастический характер.
Среди распределений есть такие распределения, которые встречаются на практике особенно часто. Эти распределения детально изучены и свойства их хорошо известны.
Наиболее распространенным распределением является нормальное распределение. Оно часто используется для приближенного описания многих случайных явлений, в которых на интересующий нас признак оказывает воздействие большое количество независимых случайных факторов, среди которых нет резко выделяющихся.
Нормальное распределение однозначно распределяется, если мы указываем значения двух его параметров: 1) среднее значение а; 2) дисперсии
2
( сигма). График нормального распределения называется кривой Гаусса и является симметричным относительно среднего значения а.
2
В ысота опред. , площадь под
2
кривой = 1. зависит от ширины.
а
Параметр а характеризует положение графика на плоскости и
2
называется поэтому параметром положения. Параметр характеризует степень сжатия или растяжения, поэтому он называется параметром
2
масштаба. Если среднее значение а=0, а дисперсия =1, то такое нормальное распределение называется стандартным. Рассмотренная в предыдущем параграфе процедура стандартизации исходных данных как раз и приводит к тому, что преобразованные данные z1, z2, …, zn имеют стандартное нормальное распределение.
График стандартного нормального распределения является симметричным относительно вертикальной координатной оси.
0
При обработке исходных данных иногда осуществляются преобразования с помощью арифметических операций. В результате этого возникает несколько новых видов распределения, связанных с нормальным.
Наиболее часто из таких распределений в статистике
2
рассматриваются следующие: 1) Х - распределение (хи-квадрат); 2) t – распределение Стьюдента; 3) F – распределение Фишера.
2
Х - распределение.
Оно определяется как сумма квадратов случайных величин, имеющих стандартное нормальное распределение.
2 2 2 2
Хn = Z1 + Z2 + ... +Zn
2
Х - распределение зависит от одного параметра, который называется числом степени свободы и обычно обозначается (ню). Этот параметр равен количеству суммируемых случайных величин.
=n
2
График Х распределения не является симметричным и расположен в положительной полуплоскости.
2
Среднее значение Х -распределения равно числу степен свободы (ню), а дисперсия равна 2 .
t – распределение Стьюдента.
Оно получается в результате деления частной величины, имеющей стандартное нормальное распределение на квадратный корень из случайной
2
величины, имеющей Х – распределение.
2
t = Z0: X :
t – распределение Стьюдента зависит от одного параметра – числа степеней свободы .
График этого распределения является симметричным относительно координатной вертикальной оси.
Е сли > 30, то распределение Стьюдента практически не отличается от стандартного нормального распределения.
0
F – распределение Фишера. 2
Оно получается путем деления случайной величины, имеющей Х – распределение с числом степеней свободы 1 на случайную величину,
2
имеющую Х – распределение с числом степеней свободы 2.
2 2 2 2
F 1, 2 = (X 1: 1) : (X 2: 2) = ( 2 X 1) : ( 1 X 2)
F – распределение Фишера зависит от двух параметров: 1, 2.
График F – распределения не является симметричным и имеет вид :
Рассмотренные выше четыре распределения протабулированы, т.е. для них имеются соответствующие статистические таблицы.