2. Схема однофакторного дисперсионного анализа
Схема проведения однофакторного дисперсионного анализа следующая.
1. Полученные данные заносят в таблицу, подобную табл. 9.1, где в верхней части по горизонтали указывают градации регулируемого фактора А, а по вертикали — номера испытаний. Данные группируют по столбцам, каждый из которых соответствует одному уровню фактора.
Таблица 9.1. Данные для однофакторного дисперсионного анализа
Номер испытания |
Уровни фактора А |
|||||
А1 |
А2 |
... |
Аj |
... |
Аm |
|
1 |
x11 |
x12 |
|
x1j |
|
x1m |
2 |
x21 |
x22 |
|
x2j |
|
x2m |
... |
|
|
|
|
|
|
i |
xi1 |
xi2 |
|
xij |
|
xim |
... |
... |
... |
... |
... |
... |
... |
n |
xn1 |
xn2 |
|
xnj |
|
xnm |
Групповое cреднее |
|
|
... |
|
... |
|
2. Вычисляют групповые выборочные средние
и общее выборочное среднее
,
где N = n · m.
3. Рассчитывают межгрупповую сумму квадратов, которая показывает отклонение групповых средних от общего выборочного среднего и определяется влиянием различных уровней фактора А:
.
Внутригрупповая сумма квадратов показывает отклонение наблюдений xij от соответствующих групповых средних и учитывает разбросы значений xij внутри каждой группы, вызванные случайными признаками при постоянном значении фактора А:
.
Общая сумма квадратов определяется по формуле:
или Qобщ = Qфакт + Qост.
4. Определяют числа степеней свободы:
• для межгруппового или факторного варьирования (отклонения):
fфакт = m – 1;
• для внутригрупповой или остаточной вариации:
fост = N – m;
• для общего варьирования:
fобщ = N – 1.
Следует отметить, что числа степеней свободы находятся между собой в определенных соотношениях:
fобщ = fфакт + fост.
5. Находят выборочные дисперсии как отношение сумм квадратов отклонений к соответствующим числам степеней свободы:
• факторная выборочная дисперсия:
;
• остаточная выборочная дисперсия:
;
• общая выборочная дисперсия:
.
6. Определяют эффективность влияния фактора А на результативный признак. Для этого сравнивают расчетный критерий Фишера и его табличное значение. Влияние фактора А считается значимым на уровне значимости α, если выполняется неравенство:
.
Значения Fтабл(α; f1, f2) находят по таблице (см. табл. П8 и П9 в приложении) для заданного уровня значимости α, f1 = m – 1 и f2 = N – m. Если неравенство не выполняется, то влияние фактора А на результативный признак считается несущественным.
Результаты вычислений сводятся в табл. 9.2.
Таблица 9.2. Оформление результатов вычислений однофакторного дисперсионного анализа
Изменчивость |
Число степеней свободы |
Сумма квадратов |
Оценка дисперсий |
Межгрупповая (факторная) |
m – 1 |
|
|
Внутригрупповая (остаточная) |
N – m |
|
|
Общая |
N – 1 |
|
|
Пример 9.1. Проверить, влияет ли степень тяжести хронической обструктивной болезни легких на объем форсированного выдоха за 1 с (в % должного) — табл. 9.3.
Таблица 9.3. Исходные данные для примера 9.1
Номер испытания |
Степень тяжести заболевания |
||
легкая |
средняя |
тяжелая |
|
1 |
70 |
61 |
45 |
2 |
75 |
56 |
49 |
3 |
74 |
62 |
50 |
4 |
80 |
60 |
45 |
5 |
72 |
53 |
47 |
6 |
76 |
52 |
42 |
|
|
|
|
Определим групповые выборочные средние:
;
;
;
Общая выборочная средняя:
.
Найдем суммы квадратов отклонений.
Определим число степеней свободы:
fфакт = m – 1 = 3 – 1 = 2;
fост = N – m = 6·3 – 3 = 15;
fобщ = N – 1 = 6·3 – 1 = 18 – 1=17.
Найдем выборочные дисперсии:
;
;
.
Расчетное значение F-критерия равно:
.
По таблице Фишера–Снедекора (см. таблицы в приложении) найдем:
Fтабл(0,05; 2, 15) = 3,7; Fтабл(0,01; 2, 15) = 6,4.
Поскольку Fрасч > Fтабл, то степень тяжести хронической обструктивной болезни легких достоверно влияет на объем форсированного выдоха с вероятностью 0,99.
При проведении экспериментальных исследований не всегда удается получить на каждом уровне фактора А одинаковое количество наблюдений. В этом случае рассмотренные формулы будут иметь несколько иной вид.
Пример 9.2. Исследовалось влияние различных режимов питания (фактор А) на увеличение массы экспериментальных животных (кг) (табл. 9.4). Проверить влияние фактора А на массу животных. Считать, что выборка взята из генеральных совокупностей с нормальным законом распределения и одинаковыми дисперсиями.
Таблица 9.4. Исходные данные для примера 9.2
Количество животных i |
Уровни фактора А |
|||
A1 |
A2 |
A3 |
A4 |
|
1 |
2,4 |
1,6 |
2,0 |
2,4 |
2 |
2,5 |
2,1 |
1,6 |
2,2 |
3 |
2,1 |
1,9 |
1,8 |
– |
4 |
2,6 |
1,7 |
– |
– |
5 |
– |
1,7 |
– |
– |
|
2,4 |
1,8 |
1,8 |
2,3 |
Выборочные средние:
;
;
;
;
Для нахождения межгрупповой (факторной) суммы квадратов, учитывая неодинаковое количество испытаний, используют формулу:
,
где n1 = 4; n2 = 5; n3 = 3; n4 = 2; тогда:
Qфакт = 4 · (0,4)2 + 5 · (–0,2)2 + 3 · (–0,2)2 + 2 · (0,3)2 = 1,05.
Остаточная сумма квадратов равна:
Qобщ = 1,68 + 0,4 = 2,08.
Определим число степеней свободы:
для факторного варьирования:
fфакт = m – 1 = 4 – 1 = 3;
для остаточного варьирования:
fост = N – m = 14 – 4 =10;
для общего варьирования:
;
fобщ = N – 1 = 14 – 1 = 13.
Определим выборочные дисперсии:
факторная выборочная дисперсия:
;
остаточная выборочная дисперсия:
;
общая выборочная дисперсия:
.
Вычислим расчетное значение F-критерия:
.
По таблицам найдем:
Fтабл(0,05; 3, 10) = 3,71;
Fтабл(0,01; 3, 10) = 6,55.
Поскольку Fрасч > Fтабл, то влияние различных режимов питания на массу экспериментальных животных значимо с вероятностью 0,99 (уровнем значимости α = 0,01).