- •Дисперсионный анализ и его интерпретация
- •Введение
- •1 Цели и задачи дисперсионного анализа
- •2 Теория дисперсионного анализа
- •3 Типы anova
- •4 Шаги проведения anova
- •5 Модели дисперсионного анализа
- •5.1 Однофакторный дисперсионный анализ
- •5.1.1 Замечания
- •5.2 Полный двухфакторный анализ
- •5.2.1 Замечания
- •Заключение
- •Список использованных источников
5.1.1 Замечания
1. В случае, когда зависимая переменная Y не является количественной, а принадлежит к категориальной порядковой шкале, используют т.н. неметрический дисперсионный анализ (nonmetric analysis of variance). В качестве характеристики центральной тенденции в группах используются не среднее, а медиана. Для этого случая также имеется набор статистических процедур, позволяющих решить задачу дисперсионного анализа - выявить наличие или отсутствие влияния выбранных факторов и их сочетаний на соответствующие центральные показатели в группах. Отметим среди этих процедур K–выборочный медианный тест, однофакторный анализ на базе рангового критерия Крускала-Уоллиса, описанный ранее.
2. Если зависимая переменная Y имеет векторный характер, то есть является многомерной с.в., то применяют т.н. многомерный дисперсионный анализ (MANOVA – multivariate analysis of variance), однофакторный или многофакторный.
Цель
анализа остается прежней – проверить
различия средних значений в группах,
но уже в отношении нескольких зависимых
переменных - компонент
Y
.
Многомерный дисперсионный анализ используют преимущественно в случаях, когда компоненты вектора Y коррелированны. В противном случае предпочтительнее выполнить ANOVA для каждой из этих компонент.
Место дисперсионного анализа в ряду других важнейших статистических методов демонстрирует диаграмма на рисунке 4.
Рисунок 4 – Ряд статистических методов
5.2 Полный двухфакторный анализ
Пусть
фактор А разбит на p1
уровней, а фактор В на p2
уровней. Данные статистического
эксперимента, таким образом, распадаются
в матрицу с p1
строками и p2
столбцами. Наблюдение, попавшее в (i,
j)−ую ячейку этой матрицы, обозначим
через yij.
Разброс данных обусловлен как чисто
случайными (неучтенными) факторами, так
и влиянием на результат эксперимента
рассматриваемых нами факторов. Обозначим
через ηij
истинное среднее значение отклика в
(i, j)−ой ячейке. Степень различия между
этими средними указывает на степень
влияния факторов на результат. Основным
моментом излагаемой далее теории
2-факторного ДA
является представление среднего ηij
в виде четырех слагаемых: ηij
=
+ аi
+
+
yij.
Покажем справедливость этого представления и, заодно, дадим интерпретацию входящих в него слагаемых.
Обозначим через Ai = ηi. – истинное среднее i-ого уровня фактора А (– среднее в i -ой строке). Аналогично, через Bj = η.j обозначим истинное среднее j -ого уровня фактора В (– среднее по j -ому столбцу).
Общее среднее значение ожидаемых результатов экспериментов по всем ячейкам – генеральное среднее.
=
ղ…=
Отличие среднего i -ого уровня фактора А от генерального среднего естественно взять в качестве меры влияния фактора А на отклик. Соответствующая разность αi = Ai − µ называется главным эффектом i-ого уровня фактора А. Аналогично, главным эффектом j –ого уровня фактора В называется отклонение βj = Bj − µ.
Заметим далее, что главный эффект αi есть среднее (по столбцам) величин ηij − Bj : αi =(ηij − Bj)/p2. Указанные величины можно трактовать как эффекты уровней А по отношению к j-ому уровню В. Поэтому превышение этой величины над своим средним естественно назвать взаимодействием i-ого уровня А с j-ым уровнем В: γij = ηij −Bj − αi = ηij − Ai −Bj + µ.
Легко проверить, что взаимодействие удовлетворяет всем соотношениям: ηij = Ai+Bj +γij−µ = µ+(Ai−µ)+(Bj−µ)+γij = µ+ αi+ βj +γij.
