- •1. Введение
- •2. Основные этапы статистического анализа данных
- •3. Генеральная совокупность и выборка из нее. Репрезентативность выборки
- •4. Основные способы организации выборки
- •5. Шкалы измерений
- •6. Табулирование данных
- •7. Квантиль
- •8. Графическое представление данных
- •80 Огива всегда
- •9. Меры центральной тенденции
- •10. Меры изменчивости
- •Для получения более точной меры изменчивости, которая
- •Лучше всего вычислять дисперсию с помощью компьютера, используя встроенную функцию Excel (мастер функций), которая называется Дисп (исходный диапазон).
- •11. Нормальное распределение
- •В ысота опред. , площадь под
- •12. Предварительный анализ выборки
- •13. Статистический вывод. Проверка гипотез
- •14. Общая схема проверки статистической гипотезы
- •15. Сравнение средних значений количественных признаков двух независимых выборок
- •16. Сравнение средних значений количественных признаков двух зависимых (связанных) выборок
- •17. Сравнение средних значений ранжированных признаков двух независимых выборок
- •18. Сравнение средних значений ранжированных признаков двух связанных выборок
- •19. Сравнение дисперсий двух независимых выборок
- •20. Сравнение дисперсий двух зависимых (связанных) выборок
- •22. Значимость коэффициента корреляции
- •23. Анализ взаимосвязи ранжированных признаков
- •24. Коэффициент ранговой корреляции кендалла
- •25. Анализ взаимосвязи номинальных признаков с помощью корреляционного анализа
- •26. Бисериальный коэффициент корреляции (бкк)
- •27. Ранговый бисериальный коэффициент корреляции
- •28. Анализ взаимосвязей номинальных признаков с помощью таблиц сопряженности
- •29. Однофакторный анализ (офа)
- •30. Однофакторный дисперсионный анализ (ода)
- •31. Двухфакторный анализ
- •32. Двухфакторный дисперсионный анализ (дда)
- •33. Проверка нормальности распределения исходных данных
- •Статистическая обработка исходных данных с помощью Microsoft Excel.
- •Раздел 5 предназначен для проверки равенства средних значений, но он практически не используется, т.К. Требует знания дисперсии гс, что на практике редко встречается.
- •Литература
32. Двухфакторный дисперсионный анализ (дда)
Наиболее распространенным способом проведения двухфакторного анализа является анализ дисперсии. Также как и ОДА в случае ДДА для получения расчетных формул статистиками использовалась линейная аддитивная модель, но следующего вида:
хij = M + j + i + ( )ij + eij, где xij; M; j; eij см. параграф 30; i – величина, отражающая степень влияния i-того уровня фактора В. Она является одинаковой для элементов i-той строки; ( )ij – величина, отражающая степень влияния на отклик в результате взаимодействия i-того уровня фактора В и j-того уровня фактора А.
Такая модель сводит задачу выяснения влияния фактора на отклик к задаче проверки следующих трех пар статистических гипотез:
1) Н0: 1 = 2 = … = k. Нет влияния фактора А на отклик.
Н1: j (хотя бы одно j отлично от других). Есть влияние фактора А на отклик.
2) Н0: 1 = 2 = … = n. Нет влияния фактора В на отклик.
Н1: j (хотя бы одно i отлично от других). Есть влияние фактора В на отклик.
3) Н0: ( )ij. Все ( ) ij одинаковы. Нет влияния на отклик в результате взаимодействия факторов А и В.
Н1: ( )ij (хотя бы одно ( ) ij отлично от других). Есть влияние на отклик в результате взаимодействия факторов А и В.
Рассмотрим пример. Для проверки этих гипотез используются разделы «ДДА без повторений» и «ДДА с повторениями» пакеты анализа данных Excel. Результаты расчета приводятся в двух таблицах аналогичных ОДА. Итоги.
Группы |
Счет |
Сумма |
Среднее |
Дисперсия |
Строка 1 (в.) |
* |
* |
* |
* |
Строка 2 (с.) |
* |
* |
* |
* |
Строка 3 (н.) |
* |
* |
* |
* |
|
|
|
|
|
Столбец 1(м.) |
* |
* |
* |
* |
Столбец 2 (д.) |
* |
* |
* |
* |
После того, как делается вывод, что есть влияние среднее
ANOVA
Источники вариации |
SS |
df |
MS |
F |
P-значение |
F-критерий |
А строки |
* |
* |
* |
* |
* |
* |
В столбцы |
* |
* |
* |
* |
* |
* |
Погрешность |
* |
* |
* |
|
|
|
Итого |
* |
* |
|
|
|
|
Вывод о наличии либо отсутствии влияния соответственного фактора на отклик делается по такому же правилу, что и в случае ОДА (см. параграф 30 оба способа).
Для фактора А берется информация из строки с названием столбцы. А для фактора В из строки с названием строки.
Эти таблицы для случая «ДДА без повторений». В этом случае взаимодействие факторов А и В не рассматривается, т.к. в каждой ячейке таблицы исходных данных находится только одно число, что не позволяет вычислить дисперсию.
Итоговые таблицы для раздела «ДДА с повторениями» аналогичны, только в таблице ANOVA появляется дополнительная строка (взаимодействия).