3. Двухфакторный дисперсионный анализ
Рассмотрим дисперсионный анализ влияния двух факторов А и В, одновременно действующих на признак. Остановимся на случае с одинаковым числом испытаний на уровнях. Последовательность этапов двухфакторного анализа аналогична ранее рассмотренной схеме однофакторного анализа. Однако при данном анализе необходимо, кроме оценки влияния каждого фактора, учитывать их совместное действие на результативный признак.
Двухфакторный анализ проводят по следующей схеме.
1. Результаты экспериментов заносят в таблицу, подобную табл. 9.5, где по горизонтали указывают градации фактора А, а по вертикали — фактора В. На пересечении строк и столбцов заносят значения результативного признака xijk при i-м значении фактора А и j-м значении фактора В, а k указывает номер испытания и изменяется от 1 до q.
Таблица 9.5. Данные для двухфакторного дисперсионного анализа
Уровень A |
Уровень B |
|||||
В1 |
В2 |
... |
Вj |
... |
Вm |
|
A1 |
x111 x112 x11k x11q |
x121 x122 x12k x12q |
... |
x1j1 x1j2 x1jk x1jq |
... |
x1m1 x1m2 x1mk x1mq |
A2 |
x211 x212 x21k x21q |
x221 x222 x22k x22q |
... |
x2j1 x2j2 x2jk x2jq |
... |
x2m1 x2m2 x2mk x2mq |
... |
... |
... |
... |
... |
... |
... |
Ai |
xi11 xi12 xi1k xi1q |
xi21 xi22 xi2k xi2q |
... |
xij1 xij2 xijk xijq |
... |
xim1 xim2 ximk ximq |
... |
... |
... |
... |
... |
... |
... |
An |
xn11 xn12 ... xn1k ... xn1q |
xn21 xn22 ... xn2k ... xn2q |
... |
xnj1 xnj2 ... xnjk ... xnjq |
... |
xnm1 xnm2 ... xnmk ... xnmq |
2. Вычисляют внутригрупповые выборочные средние для каждой пары уровней А и В:
.
Полученные данные заносят в табл. 9.6.
Таблица 9.6. Результаты двухфакторного анализа
Уровень A |
Уровень B |
Среднее по строкам |
||||||
В1 |
В2 |
... |
ВJ |
... |
Вm |
|||
A1 |
|
|
|
|
|
|
|
|
A2 |
|
|
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
|
Ai |
|
|
|
|
|
|
|
|
... |
|
|
|
|
|
|
|
|
An |
|
|
|
|
|
|
|
|
Среднее по столбцам |
|
|
|
|
|
|
|
Вычисляют:
• групповые выборочные средние при постоянном значении фактора А:
;
• групповые выборочные средние при постоянном значении фактора В:
;
• общее выборочное среднее:
.
3. Рассчитывают межгрупповые суммы квадратов отклонений:
• для фактора А:
;
• для фактора В:
.
• для совместного действия факторов А и В:
;
• внутригрупповая сумма квадратов отклонений для прочих факторов:
;
• общая сумма квадратов отклонений:
.
4. Находят числа степеней свободы:
• для влияния фактора А:
fфакт A = n – 1;
• для влияния фактора В:
fфакт B = m – 1;
• для совместного влияния факторов А и В:
fфакт AB = (n – 1)(m – 1);
• для влияния прочих факторов:
fост = nm(q – 1);
• для общего варьирования:
fобщ = nmq – 1.
5. Определяют выборочные дисперсии как отношение сумм квадратов отклонений к соответствующим числам степеней свободы:
;
;
;
;
.
6. Полученные данные заносят в табл. 9.7.
Таблица 9.7. Оформление результатов вычислений с использованием двухфакторного дисперсионного анализа
Изменчивость |
Число степеней свободы |
Сумма квадратов |
Оценка дисперсий |
Влияние фактора А |
n – 1 |
|
|
Влияние фактора В |
m – 1 |
|
|
Совместное влияние факторов А и В |
(n – 1)(m – 1) |
|
|
Внутригрупповая (остаточная) |
Nm(q – 1) |
|
|
Общая |
Nmq – 1 |
|
|
7. Определяют значимость влияния фактора А, фактора В и их совместного действия на результативный признак. Для этого расчетное значение критерия Фишера сравнивают с его табличной величиной. Влияние фактора А считается значимым на уровне значимости α, если выполняется неравенство:
.
Для фактора В:
.
Для совместного влияния факторов А и В:
.
Значения Fтабл(α; f1, f2) находят по таблице Фишера–Снедекора (см. табл. П8 и П9 в приложении) для заданного значения уровня значимости α и степеней свободы f1 и f2. Если какое-либо неравенство не выполняется, то, соответственно, влияние фактора на результативный признак считается несущественным.
Пример 9.3. Проверить, влияют ли пол и возраст на частоту госпитализации пациентов с диагнозом «хроническая обструктивная болезнь легких». В табл. 9.8 представлены показатели госпитализации по поводу хронической обструктивной болезни легких на 100 тыс. населения.
Таблица 9.8. Исходные данные для примера 9.3
Пол (А) |
Возраст (В), годы |
|||||
30 |
40 |
50 |
60 |
70 |
80 |
|
Мужской |
1 |
2 |
5 |
25 |
61 |
90 |
1 |
1 |
2 |
24 |
60 |
89 |
|
2 |
2 |
3 |
26 |
59 |
86 |
|
1 |
3 |
4 |
23 |
56 |
87 |
|
Женский |
1 |
2 |
4 |
21 |
40 |
39 |
1 |
1 |
2 |
20 |
41 |
40 |
|
2 |
2 |
3 |
19 |
39 |
42 |
|
1 |
1 |
2 |
22 |
37 |
40 |
Результаты расчета на компьютере: Qфакт А = 1764; Qфакт В = 10 740; Qфакт АВ = 22 398; Qост = 60.
Решение. Находим число степеней свободы:
для фактора А: fA = n – 1 = 2 – 1 = 1;
для влияния фактора В: fB = m – 1 = 6 – 1 = 5;
для совместного влияния факторов А и В:
fAB = (n – 1)(m – 1) = 1 · 5 = 5;
для влияния прочих факторов:
fост = n · m · (q – 1) = 2 · 6 · (4 – 1) = 2 · 6 · 3 = 36.
Находим выборочные дисперсии:
;
.
;
.
Находим расчетные значения критерия Фишера:
для фактора А:
;
для фактора В:
;
для совместного влияния факторов А и В:
.
Fтабл(α; f1, f2) находим по таблице Фишера–Снедекора (см. табл. П8 в приложении).
Сравнивая расчетные и табличные значения критерия Фишера, делаем выводы.
1. Fрасч A > Fтабл(0,01; 1; 36) = 7,4.
Пол больных значимо влияет на частоту госпитализации пациентов с диагнозом «хроническая обструктивная болезнь легких».
2. Fрасч B > Fтабл(0,01; 5; 36) = 3,6.
Возраст также значимо влияет на частоту госпитализации данных больных.
3. Fрасч AB > Fтабл(0,01; 5; 36) = 3,6.
Имеет место совместное влияние пола и возраста на частоту госпитализации данных больных.