
- •Харьковский государственный технический
- •1.1 Идея дисперсионного анализа
- •1.2 Однофакторный анализ
- •1.2.1 Разложение суммы квадратов
- •1.2.2 Оценка дисперсий
- •1.2.3 Оценка влияния фактора
- •1.2.4 Случай не равночисленных вычислений
- •1.3 Двухфакторный анализ
- •1.3.1 Разложение сумм квадратов
- •1.3.2 Оценка дисперсий
- •1.3.3 Оценка влияния факторов
- •4.2 Методические указания по организации самостоятельной работы студентов
1.2.1 Разложение суммы квадратов
Разложим сумму g квадратов отклонений наблюдений от общего среднего на две составляющие суммы, одна из которых будет характеризовать влияние фактора случайности, а вторая - фактора изменчивости Х.
(1.4)
Дисперсия, характеризующая рассеивание наблюдений в результате действия обоих факторов как случайности (с дисперсией d02 ), так и изучаемого Х (с дисперсией dx2 ) представлена в виде:
.
(1.5)
Сумма квадратов отклонений ‘внутри серий’, характеризующая остаточное рассеивание случайных погрешностей внутри опыта, то есть их воспроизводим ость (с дисперсией d02):
(1.6)
Сумма квадратов отклонений ‘между сериями’.
(1.7)
Сумма
характеризует рассеивание средних
серий за счёт случайных причин (с
дисперсией для
средних серий) и исследуемого фактора
(с дисперсией d?2).
1.2.2 Оценка дисперсий
Пусть влияние Х на Y отсутствует, то есть
нуль гипотеза об однородности
верна. Тогда все серии параллельных
наблюдений можно рассматривать как
случайные выборки из одной и той же
нормальной совокупности и, следовательно:
Несмещённая оценка дисперсии воспризводимости d02 по всем um наблюдениям определяется выражением:
,
(1.8)
с числом степеней свободы um-1.
2. Выборочная дисперсия рассеивания ‘внутри серий’ или остаточная оценка дисперсии воспризводимости d2 находится как среднее из выборочных дисперсий по каждой серии в отдельности
.
(1.9)
Выборочная дисперсия рассеивания между средними серий служит несмещённой оценкой дисперсии
, с которой нормально распределены независимые друг от друга средние серии:
,
(1.10)
с числом степеней свободы Vx=u-1.
Таким образом, S0 и SX независимы друг от друга.
При отсутствии влияния фактора Х выборочные оценки SXSX SX однородны, так как являются оценками одной и той же генеральной дисперсии d2.
Предположим теперь, что влияние фактора Х на выходной параметр существенно, то есть нуль гипотеза об однородности не верна. Тогда серии параллельных наблюдений можно рассматривать как случайные выборки с одной и той же дисперсией d02 и различными центрами распределения С1,....,Сj,.....,Cu и, следовательно:
1) выборочная дисперсия d2 характеризует влияние как фактора случайности, так и фактора Х, то есть d2=d02+d?2;
поскольку S0 не изменяется при замене yjl на yjl- yj, то выборочная дисперсия S02 также не изменяется и по-прежнему является несмещённой оценкой для d2, то есть S02 » d2;
3)поскольку сумма SX учитывает не
только случайные, но и систематические
расхождения между средними серий и
увеличивается за счет влияния фактора
Х, то дисперсия
при этом также увеличивается и перестаёт
служить оценкой только для
,
то есть
,
откуда Sx2 »
d2+mdx2;
4) независимость S0 и SX друг от друга сохраняется.
Таким образом, для дисперсии фактора Х можно дать две приближённые оценки dx2 » d2- d02 » d2- d02 ,
Первая оценка менее точна из-за погрешностей величин S2 и S02. Точность же второй выше, так как дисперсии входят в неё, делённые на m. Из этого очевидно, что при влиянии фактора Х выборочной оценки S2, S02, S?2 неоднородны. Сопоставляя эти выборочные дисперсии, можно принять решение о справедливости первого или второго предположения относительно значимости влияния фактора Х (с дисперсией dx2) на выходной параметр.