
- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
30. Однофакторный дисперсионный анализ (ода)
Наиболее часто при проведении ОФА рассматривают и анализируют дисперсию, поэтому совокупность таких методов носит название – ОДА.
Однако ОДА может применяться лишь при следующих предположениях:
Исходные данные должны представлять собой случайные выборки.
Эти выборки должны быть извлечены из нормально распределенных ГС.
Эти ГС должны иметь одинаковые дисперсии.
Все выборки исходных данных, т.е. столбцы таблицы, должны быть статистически независимыми.
При проведении ОДА для получения расчетных формул предполагалось, что исходные данные подчиняются линейной аддитивной (сложение) модели следующего вида:
хij = М + i + eij, где M – величина, отражающая некоторый средний уровень отклика. Она является одинаковой для всех данных одной таблицы; j – величина, отражающая влияние j-го уровня факторов. Она является одинаковой для элементов j-го столбца; eij – случайная ошибка модели. Для каждого исходного наблюдения она различна; xij – исходное наблюдение, соответствующее значению отклика для i-го человека при j-ом уровне факторов.
В результате такой модели исходная задача выяснения наличия или отсутствия влияния фактора на отклик сводится к проверке следующих статистических гипотез:
Н0: 1 = 2 = … = k о том, что нет влияния фактора на отклик и
Н1 о том, что хотя бы одно из j отлично от других, т.е. есть влияние фактора на отклик.
Для проверки этих статистических гипотез используется F-критерий Фишера, который является достаточно громоздким, поэтому рассмотрим компьютерный вариант проведения ОДА.
Для его проведения используется раздел «ОДА» пакета анализа данных, имеющегося в Excel. Для этого необходимо сначала ввести исходные данные на рабочий лист в виде таблицы. После этого вызывается раздел ОДА и указываются необходимые параметры.
В результате работы данных раздела полученные результаты ОДА представляются в виде следующих двух таблиц:
Однофакторный дисперсионный анализ. Итоги.
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
Столбец 1 Столбец 2 Столбец 3 |
* |
* |
* |
* |
* (число) – это количество наблюдений в соответствующем столбце; сумма – это сумма элементов соответствующего столбца; среднее – это среднее значение элементов соответствующего столбца; дисперсия – это дисперсия элементов соответствующего столбца. ANOVA1 – однофакторный анализ; ANOVA2 – двухфакторный анализ; ANALYSIS OF VARIANCE – анализ дисперсий.
ANOVA
Источник вариации |
SS |
df |
MS |
F |
P-значение |
F-критическое |
Между группами |
* |
* |
* |
* |
* |
* |
Внутри групп |
* |
* |
* |
|
|
|
Итого |
* |
* |
|
|
|
|
SS – сумма квадратов; df - степени свободы; MS – средний квадрат; F – наблюдаемое значение статистики критерия (Fнабл).
По результатам, приведенным в таблице, мы должны сделать вывод о наличии или отсутствии влияния фактора на отклик. Для этого можно воспользоваться двумя способами:
1 способ. Для этого сравниваем две величины F и Fкр, если F < Fкр, то делаем вывод о том, что нет влияния фактора на отклик; если F > Fкр, то делаем вывод о том, что есть влияние фактора на отклик.
2 способ. Для этого сравнивают две величины Р-значения и уровень значимости (который задается в качестве исходного параметра). (В компьютере 0,05 – по умолчанию). Если Р > , то делаем вывод, что нет влияния фактора на отклик; если же Р < , то есть влияние факторов на отклик.