ТВ_и_МС
.pdfОсновы дисперсионного анализа |
153 |
ТОбщее среднее равно среднему арифметическому групповых средних, взвешенному по объемам групп.
Доказательство:
Обозначим объем совокупности n , число групп m , групповые средние xk ,
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
общее |
среднее |
x , |
|
число элементов |
в k -й группе |
nk , ∑nk = n . |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x1 |
,x2 |
k =1 |
|
|
|
Пусть в |
|
k -й группе наблюдаются значения признака |
,...,xn . Тогда |
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(Σx) |
|
|
|
|
|
k |
|
|
групповое среднее xk |
= |
x1 + x2 |
+ ...+ xn |
|
= |
k , где (Σx)k |
– сумма значе- |
|||||||||||||||||||
|
|
|
|
k |
|
|
||||||||||||||||||||
|
|
|
nk |
|
|
|
nk |
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
ний признака для элементов k -й группы, и (Σx)k |
= xk nk . |
|
|
|
|
|
||||||||||||||||||||
Общее среднее |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
x |
+ x |
2 |
+ ...+ x |
n |
|
|
1 |
m |
|
1 |
|
|
m |
|
|
n x + n x |
2 |
+ ...+ n x |
m |
|
||||
x = |
|
1 |
|
|
|
|
= |
|
|
∑( |
Σx)k = |
|
|
∑nk xk = |
1 1 |
2 |
|
m |
. |
|||||||
|
|
|
n |
|
|
|
|
|
|
|
|
|
n |
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
n k =1 |
|
n k =1 |
|
|
|
|
|
|
|
ОГрупповая дисперсия – дисперсия значений признака X, принадлежащих группе, относительно группового среднего,
|
1 |
n |
|
Dk (гр) = |
∑k (xik − xk )2 (суммирование идет по элементам k -й группы). |
||
nk |
|||
|
i=1 |
ОВнутригрупповая дисперсия – среднее арифметическое дисперсий, взвешенное по объемам групп,
D(внутр) = |
1 ∑nk Dk(гр) = n1D1(гр) + n2 D2(гр) + ...+ nm Dь(гр) . |
||
|
m |
|
|
|
n k =1 |
|
|
|
n |
|
ОМежгрупповая дисперсия – дисперсия групповых средних относительно общего среднего,
D(межгр) = 1 ∑m nk (xk − x )2 .
n k =1
ООбщая дисперсия – дисперсия значений признака X, принадлежащих всей совокупности, относительно общего среднего,
D(общ) = 1 ∑n (xi − x )2 ,
n i=1
(суммирование идет по всей совокупности). Справедливо следующее утверждение:
ТЕсли совокупность состоит из нескольких групп, то общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
Доказательство:
|
|
n |
|
|
m nk |
|
|
m nk |
|
D(общ) = |
1 |
∑(xi − x )2 |
= |
1 ∑∑(xi − x )2 |
= |
1 |
∑∑(xi − xk + xk − x )2 = |
||
|
n i=1 |
|
|
n k =1 i=1 |
|
n k =1 i=1 |
|
||
|
1 |
m nk |
|
|
|
|
|
− xk )(xk − x ) |
|
= |
∑∑ (xi − xk )2 + (xk − x )2 + 2 (xi |
= |
|||||||
|
n k =1 i=1 |
|
|
|
|
|
|
|
154 |
|
|
|
|
|
|
|
Лекции 15–16 |
|
|
m nk |
|
m nk |
|
|
m nk |
− xk )(xk − x )= |
= |
1 |
∑∑(xi − xk )2 + |
1 ∑∑(xk − x )2 + |
2 |
∑∑(xi |
|||
|
n k =1 i=1 |
|
n k =1 i=1 |
|
n k =1 i=1 |
|
||
|
|
m |
m |
|
m |
|
nk |
|
= |
1 |
∑nk Dk(гр) + |
1 ∑nk (xk − x )2 + |
2 ∑(xk − x ) ∑(xi − xk ) = |
||||
|
n k =1 |
n k =1 |
|
n k =1 |
|
i=1 |
= D(внутр) + D(межгр)
Пример:
Пусть совокупность состоит из двух групп, статистические ряды для них имеют вид:
xi |
2 |
|
|
|
4 |
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi′ |
|
|
|
|
3 |
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
mi |
1 |
|
|
|
7 |
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
mi′ |
|
|
|
2 |
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Объемы |
|
|
групп |
|
n1 =∑mi =10 , |
|
n2 = ∑mi′ = 5 , |
|
|
|
|
объем |
|
|
|
|
совокупности |
||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
n = n1 + n2 |
=15 , число значений признака в совокупностях ν1 = 3 , ν2 |
= 2 . |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Групповые средние |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
∑mi xi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑mi′ xi′ |
|
|
|
2 3 |
|
|
|
|
|||||||||||||||||||||
|
x = |
i=1 |
|
|
|
|
|
|
|
|
= 1 2 +7 4 |
+ 2 5 = 4 , |
|
|
|
|
|
|
|
x = |
i=1 |
|
|
= |
+3 8 = 6 , |
||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
1 |
|
|
|
|
|
n1 |
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
n2 |
|
|
|
|
|
|
|
|
|
5 |
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n1 x1 + n2 x2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
общее среднее |
|
|
|
|
|
|
|
|
|
x = |
|
|
= 4 10 +6 5 = |
14 . |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n + n |
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
||||||||
Групповые дисперсии |
|
|
|
|
|
|
|
|
|
|
1 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
= 1 (2 −4) |
|
|
+7 ( |
4 −4) |
|
|
|
|
|
|
|
|
(5 −4) |
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
D1(гр) = |
|
|
|
1 ∑mi (xi − x1 )2 |
2 |
|
2 |
|
+ 2 |
2 |
|
|
6 , |
|
||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
= |
|
|||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
n1 |
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
||||||
|
D2(гр) = 1 ∑mi′ |
(xi − x2 )2 |
= 2 (3 −6) |
2 |
+3 (8 −6) |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
= 6 . |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n2 |
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Внутригрупповая дисперсия |
10 0,6 +5 6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
m |
|
|
|
|
|
= 12 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
D(внутр) |
= |
∑nk Dk(гр) = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
n k =1 |
|
|
|
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Межгрупповая дисперсия |
|
|
|
|
|
|
|
10 (4 − |
|
|
|
)2 +5 (6 − |
|
|
|
)2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
m |
|
|
|
|
|
|
2 |
|
|
|
14 |
|
|
14 |
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
D( |
межгр) |
= |
|
|
|
∑nk (xk |
− x ) |
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
|
. |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
9 |
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
n k =1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
Общая дисперсия |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
1 (2 − |
14 |
)2 |
+7 (4 − |
14 |
)2 + |
2 (5 − |
14 |
)2 + |
2 (3 − |
14 |
)2 +3 (8 − |
14 |
|
)2 |
|
|
148 |
|
|||||||||||||||||||||||||||||||||||||||||
D |
= |
3 |
3 |
3 |
3 |
3 |
= |
. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
(общ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
15 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
45 |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
D |
|
|
|
+ D |
межгр) |
= 12 |
+ 8 |
= |
148 = D |
|
|
|
|
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
(внутр) |
|
|
|
|
( |
5 |
9 |
|
|
45 |
|
|
|
(общ) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Основы дисперсионного анализа |
|
|
|
|
|
|
|
|
157 |
Используя полученные суммы квадратов и числа степеней свободы, вы- |
|||||||||
числим несмещенные оценки трех дисперсий: |
|
|
|
|
|
||||
s2 = |
Q0 |
|
, s2 = |
Q1 |
, s2 |
= |
Q2 |
|
. |
0 |
N −1 |
1 |
N − p |
2 |
|
p −1 |
|
Группы, на которые разбита вся совокупность результатов, соответствуют различным значениям фактора, поэтому s12 характеризует рассеяние внутри групп, (случайная вариация признака, s12 называют также остаточной дисперсией); s22 характеризует рассеяние групповых средних (систематическая вариа-
ция). Задачу проверки существенности влияния исследуемого фактора можно, как обсуждалось в предыдущем параграфе, представить как задачу о сравнении внутригрупповой и межгрупповой дисперсий. Если влияние фактора отсутству-
ет, то s12 и s22 являются независимыми оценками дисперсии генеральной совокупности σ2 . Если же фактор оказывает существенное влияние, то отношение s22 : s12 превзойдет критический предел и выборки следует считать взятыми из
разных совокупностей (отличающихся уровнем воздействия фактора). Сравнение дисперсий двух выборок производится с помощью F - распре-
деления Фишера – Снедекора. Выдвигается нулевая гипотеза H0 : X 1 = X 2 = ... = X p = X об отсутствии влияния фактора По выборочным данным
|
2 |
|
|
p −1 |
|
|
|
вычисляются оценки дисперсий s12 и s22 и их отношение |
F = |
s2 |
; |
|
|
. В |
|
s12 |
|
||||||
|
|
|
N − p |
|
фигурных скобках после отношения дисперсий указаны числа степеней свободы, учтенных при расчете s12 и s22 . Задавшись уровнем значимости α , определяем по таблице критическое значение Fα и сравниваем вычисленное значение F с критическим. Если F ≤ Fα , то нет оснований отвергать нулевую гипотезу, влияние фактора не существенно; если же F > Fα , то нулевая гипотеза отвер-
гается и статистически подтверждается влияние фактора.
Результаты вычислений удобно оформить в виде таблицы, носящей название таблицы дисперсионного анализа.
Характер |
Сумма квадратов |
Число |
Оценка |
|||||||||||||||
степеней |
||||||||||||||||||
вариации |
дисперсии |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
свободы |
|
|
|
|
|
|
|
Систематическая |
Q2 = ∑nj ( |
|
j − |
|
|
)2 |
|
|
|
|
|
|
Q2 |
|
|
|||
X |
X |
p −1 |
s22 |
= |
||||||||||||||
(межгрупповая) |
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
p −1 |
|
|
|
Остаточная |
Q1 = ∑∑(xij − |
|
|
j )2 |
|
|
|
|
Q1 |
|
||||||||
X |
N − p |
s12 |
= |
|
||||||||||||||
N − p |
||||||||||||||||||
(внутригрупповая) |
i |
j |
|
|
|
|||||||||||||
|
Q0 = Q1 +Q2 |
= ∑∑(xij − |
|
)2 |
|
|
|
|
|
|
|
|||||||
Итого: |
X |
N −1 |
|
–– |
||||||||||||||
|
|
i j |
|
|
|
|
|
|
|
158 |
Лекции 15–16 |
Для вычисления сумм квадратов удобно воспользоваться формулами:
2 |
|
G2 |
|
Tj2 |
G2 |
|
|
Q0 = ∑xij |
− |
N |
, Q2 = ∑ |
|
− |
N |
, Q1 = Q0 −Q2 , |
|
|||||||
ij |
|
j |
n j |
|
где Tj = ∑xij – сумма значений признака при определенном значении фактора,
G = ∑∑i xij – общая сумма значений признака.
i j
Пример:
Для проверки влияния методики обучения производственным навыкам на качество подготовки отбираются случайным образом четыре группы учеников, которые после окончания обучения (по разным методикам) показали следующие результаты (см. таблицу ниже).
Группа |
|
Выработка, шт. |
|
|
Число |
|
Суммарная |
|
Групповое |
||||||||||||||||
(методика) |
|
|
|
учени- |
|
выработка, |
|
|
|
среднее |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
ков |
|
шт. |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
1 |
60, 80, 75, 80, 85, 70 |
|
|
6 |
|
|
450 |
|
|
|
|
|
|
75 |
|
||||||||||
2 |
75, 66, 85, 80, 70, 80, |
|
|
7 |
|
|
546 |
|
|
|
|
|
|
78 |
|
||||||||||
80, 90 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
426 |
|
|
|
|
|
|
|
|
|
|
||
3 |
60, 80, 65, 60, 86, 75 |
|
|
6 |
|
|
|
|
|
|
|
|
71 |
|
|||||||||||
4 |
95, 85, 100, 80 |
|
|
|
4 |
|
|
360 |
|
|
|
|
|
|
90 |
|
|||||||||
|
Итого: |
|
|
|
|
|
|
|
23 |
|
|
1782 |
|
|
|
|
|
77,48 |
|
||||||
Вычисляя суммы, имеем G =1782 , N = 23 , |
|
|
Tj2 |
|
|
|
|
||||||||||||||||||
|
|
2 |
|
|
|
|
|
G2 |
|
|
|
|
|
|
|
|
|
|
|
||||||
|
∑xij =140481, |
N |
=138066,3, |
∑ |
|
|
|
=138984 |
|
||||||||||||||||
|
|
|
|
||||||||||||||||||||||
|
j |
|
|
|
|
|
|
|
|
|
|
|
j |
nj |
|
|
|
|
|||||||
и заполняем таблицу дисперсионного анализа. |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Характер |
|
|
|
|
|
|
|
|
|
|
|
|
Число |
|
|
|
|
Оценка |
|
||||||
|
|
|
Сумма квадратов |
|
степеней |
|
|
|
|
|
|||||||||||||||
вариации |
|
|
|
|
|
|
|
|
дисперсии |
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
свободы |
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
Систематическая |
|
|
|
|
Q2 = 917,7 |
|
|
|
3 |
|
|
917,7 |
= 305,9 |
|
|||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
3 |
|
|
|
|
|
|||
Остаточная |
|
|
|
|
Q1 =1497,0 |
|
|
|
19 |
|
|
1497,0 |
= 78,8 |
|
|||||||||||
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19 |
|
|
|
|
||||
Итого |
|
|
|
|
|
Q0 = 2414,7 |
|
|
|
22 |
|
|
|
|
|
|
–– |
|
|||||||
Экспериментальное значение критерия F |
= 305,9 = 3,88 . Для уровня значи- |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
78,8 |
|
|
|
|
|
|
|
|
|
|
|||
мости α = 0,05 |
табличное значение критерия F |
= 3,13 . Так как |
|
F > F , ну- |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
α |
|
|
|
|
|
|
|
|
|
α |
|
левая гипотеза |
H0 : |
|
1 = |
|
2 = ... = |
|
p = |
|
с вероятностью 0,95 |
отклоняется, |
|||||||||||||||
X |
X |
X |
X |
т.е. методика обучения значимо влияет на производственные навыки.
Основы дисперсионного анализа |
159 |
16.1.Однофакторный анализ при группировке по случайным блокам
Пусть проверяется различие в урожайности нескольких сортов сельскохозяйственной культуры. Если все участки земли по плодородию примерно одинаковы, то лучше всего прибегнуть к полностью случайному плану размещения сортов по участкам. Однако участки чаще всего различаются между собой, и это будет вызывать дополнительный разброс в экспериментальных данных. Для устранения влияния неоднородности выделенную для эксперимента площадь делят на участки, которые назовем блоками, с примерно одинаковым качеством земли в пределах каждого блока (между блоками могут существовать большие различия в отношении качества земли). Затем каждый блок делят на столько делянок, сколько испытывается сортов культуры. Распределение сортов по делянкам производится в случайном порядке. Такой метод планирования эксперимента получил название метод случайных блоков. В отличие от полностью случайного плана число единиц наблюдения для каждого уровня фактора должно быть одинаковым, т.е. n1 = n2 = ... = nj = ... = np = n . Модель эксперимен-
та можно записать в виде
xij = X +αi + βj +εij ,
где αi – эффект блоков, βj – эффект уровня фактора, εij – случайная компонента.
Преимущество метода случайных блоков в том, что с его помощью уменьшается разброс данных наблюдения. Результаты наблюдений сводятся в таблицу:
Уровень |
Результат наблюдения по блокам |
|
|
Сумма по |
Среднее по |
|||||||||||||||||||
фактора |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
строкам |
уровням |
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
фактора |
||||||||
|
1 |
2 |
… |
|
i |
… |
|
n |
|
|||||||||||||||
1 |
x |
|
x |
21 |
… |
|
x |
… |
|
x |
n1 |
T |
|
|
X1 |
|||||||||
|
11 |
|
|
|
|
i1 |
|
|
|
1 |
|
|
||||||||||||
2 |
x |
|
x |
|
|
… |
x |
… |
|
x |
|
|
T |
|
|
|
|
|
|
|
||||
22 |
n2 |
|
|
X2 |
||||||||||||||||||||
|
12 |
|
|
|
|
i2 |
|
|
|
2 |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
… |
|
|
|
|
|
|
|
||
… |
|
… |
|
… |
… |
|
… |
… |
|
… |
|
|
|
… |
||||||||||
j |
x1 j |
x2 j |
|
|
xij |
|
|
xnj |
Tj |
|
|
|
|
|
|
|
||||||||
… |
… |
|
|
X j |
||||||||||||||||||||
… |
|
… |
|
… |
… |
|
… |
… |
|
… |
… |
|
|
|
… |
|||||||||
p |
x1 p |
x2 p |
|
|
xip |
|
|
xnp |
Tp |
|
|
|
|
|
|
|
||||||||
… |
… |
|
X p |
|||||||||||||||||||||
Сумма по вертикали |
|
B1 |
|
B2 |
… |
|
Bi |
… |
|
Bp |
G |
|
|
|
|
|
||||||||
|
|
|
X |
|||||||||||||||||||||
Среднее по блокам |
|
|
|
|
|
|
|
… |
|
|
|
… |
|
|
|
p |
–– |
|
|
|
–– |
|||
|
B |
1 |
|
B |
2 |
|
B |
i |
|
B |
|
|
|
160 |
Лекции 15–16 |
Общую сумму квадратов Q0 = ∑∑(xij − X )2 разобьем на три составляю-
i j
щие:
Q0 = ∑∑(xij − X )2 = ∑∑(xij − Bi + Bi − X j + X j − X + X − X )2 =
i |
j |
i |
j |
ij (xij − Bi − X j + X )+(Bi − X )+(X j − X ) 2 =
=∑∑i j (xij − Bi − X j + X )2 +(Bi − X )2 + (X j − X )2 + 2∑i ∑j (X j − X )(Bi − X )+= ∑∑
+2∑∑ (xij − Bi − X j + X )(Bi − X )+(xij − Bi − X j + X )(X j − X ) .
i j
Все суммы перекрестных произведений обращаются в ноль, например,
2∑∑(X j − X )(Bi − X )= 2∑(X j − X )∑(Bi − X )= 0,
i j |
|
|
|
j |
|
|
|
i |
так как |
|
|
|
|
|
|
|
|
∑( |
|
− |
|
)= ∑ |
|
−n |
|
= 0 . |
Bi |
X |
Bi |
X |
|||||
i |
|
|
|
i |
|
|
|
|
Оставшиеся суммы квадратов можно преобразовать:
Q0 = ∑∑i j (xij − X )2 = ∑∑i j (xij − Bi − X j + X )2 + (Bi − X )2 + (X j − X )2 =
= ∑∑(xij − Bi − X j + X )2 + p∑(Bi − X )2 + n∑(X j − X )2 = Q1 +Q2 +Q3 ,
i |
j |
i |
j |
где первое слагаемое, Q1 , описывает остаточную вариацию, второе, Q2 – вариацию между блоками, третье, Q3 – межгрупповую вариацию, обусловленную изменением уровня фактора.
Расчет удобно вести следующим образом: вычислить Q0 , Q2 и Q3 непо-
|
Q0 = ∑xij2 − G |
2 |
|
|
∑Bi2 |
− G |
2 |
|
|
∑Tj2 |
− G |
2 |
|
средственно, |
|
, |
Q2 = |
i |
|
, Q3 |
= |
j |
, |
||||
|
p |
|
n |
||||||||||
|
ij |
N |
|
|
N |
|
|
N |
|||||
а Q1 вычислить как их разность, |
Q1 = Q0 −Q2 −Q3 . |
|
|
|
|
|
|||||||
Снова организуем данные в таблицу. Числа степеней свободы для Q0 , Q2 , |
|||||||||||||
Q3 очевидны, а |
число |
степеней |
свободы |
для |
|
Q1 |
найдем |
из |
соотношения |
||||
ν1 =ν0 −ν2 −ν3 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
Основы дисперсионного анализа |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
161 |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Характер |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Число |
|
|
Оценка |
|
||||||||
|
|
|
|
|
|
|
Сумма квадратов |
степеней |
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
вариации |
|
дисперсии |
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
свободы |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
Систематическая |
Q3 = n∑( |
|
|
|
j |
− |
|
|
|
)2 |
|
|
|
|
|
|
Q3 |
|
|
|
|||||||||||
|
|
|
X |
X |
p −1 |
|
s32 |
= |
|
|||||||||||||||||||||||||
|
|
|
(межгрупповая) |
|
|
|
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
p −1 |
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
Q2 = p∑( |
|
|
i |
− |
|
|
|
)2 |
|
|
|
|
|
|
Q2 |
|
|
|
|||||||
|
|
|
Между блоками |
B |
X |
n −1 |
|
s22 |
= |
|
||||||||||||||||||||||||
|
|
|
|
n −1 |
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
Остаточная |
Q = Q −(Q +Q ) |
(n −1)(p −1) |
s12 = |
|
|
|
Q1 |
|
|
||||||||||||||||||||
|
|
|
|
|
|
1 |
0 |
2 |
3 |
|
|
|
|
(n −1)(p −1) |
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
Q0 = ∑∑(xij − |
|
|
|
)2 |
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
Итого: |
X |
N −1 |
|
|
|
–– |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
i |
j |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
Для проверки значимости влияния фактора используем критерий Фишера |
||||||||||||||||||||||||||||||
|
|
|
|
s2 |
|
|
p −1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F |
|
|
= |
|
3 |
; |
|
|
|
, в качестве нулевой гипотезы предполагая, что рас- |
||||||||||||||||||||||||
|
|
s2 |
(p −1)(n −1) |
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
сматриваемый |
фактор не |
влияет |
на значения |
признака. Как |
обычно, при |
|||||||||||||||||||||||||||||
F |
≤ F |
нулевая гипотеза не отклоняется, при F |
> F – отклоняется, т.е. влия- |
|||||||||||||||||||||||||||||||
|
|
|
|
|
α |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
α |
|
|
|
|
|
|
|
|
|
ние фактора считается статистически значимым.
Как видно из таблицы дисперсионного анализа, введение блоков уменьшает долю остаточной вариации, так как часть этой вариации теперь объясняется различием в блоках.
Пример:
Рассмотрим классическую ситуацию, для которой применяется метод случайных блоков. Проверяется урожайность четырех сортов пшеницы.
Для эксперимента выделено пять участков земли, на каждом из которых высеяны все четыре сорта пшеницы (делянки по 1 га).
Результаты эксперимента приведены в таблице.
|
Урожайность (ц/га) по блокам |
Сумма |
Среднее |
||||||
Уровень |
|
|
|
|
|
по |
|
по |
|
|
|
|
|
|
|
||||
фактора |
1 |
2 |
3 |
4 |
5 |
блокам |
факторам |
||
|
Tj |
|
X j |
|
|||||
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
||
1 |
28,7 |
26,7 |
21,6 |
25,0 |
28,2 |
130,2 |
26,04 |
||
|
|
|
|
|
|
|
|
||
2 |
24,5 |
28,5 |
27,7 |
28,7 |
32,5 |
141,8 |
28,38 |
||
|
|
|
|
|
|
|
|
||
3 |
23,2 |
24,7 |
20,0 |
24,0 |
24,0 |
115,9 |
23,18 |
||
|
|
|
|
|
|
|
|
||
4 |
29,0 |
28,7 |
22,5 |
28,0 |
27,0 |
135,2 |
27,04 |
||
|
|
|
|
|
|
|
|
||
Суммы по |
105,4 |
108,6 |
91,8 |
105,7 |
111,7 |
523,2 |
26,16 |
||
|
|
|
|
|
|
|
|
|
|