- •Харьковский государственный технический
- •1.1 Идея дисперсионного анализа
- •1.2 Однофакторный анализ
- •1.2.1 Разложение суммы квадратов
- •1.2.2 Оценка дисперсий
- •1.2.3 Оценка влияния фактора
- •1.2.4 Случай не равночисленных вычислений
- •1.3 Двухфакторный анализ
- •1.3.1 Разложение сумм квадратов
- •1.3.2 Оценка дисперсий
- •1.3.3 Оценка влияния факторов
- •4.2 Методические указания по организации самостоятельной работы студентов
1.2.1 Разложение суммы квадратов
Разложим сумму g квадратов отклонений наблюдений от общего среднего на две составляющие суммы, одна из которых будет характеризовать влияние фактора случайности, а вторая - фактора изменчивости Х.
(1.4)
Дисперсия, характеризующая рассеивание наблюдений в результате действия обоих факторов как случайности (с дисперсией d02 ), так и изучаемого Х (с дисперсией dx2 ) представлена в виде:
. (1.5)
Сумма квадратов отклонений ‘внутри серий’, характеризующая остаточное рассеивание случайных погрешностей внутри опыта, то есть их воспроизводим ость (с дисперсией d02):
(1.6)
Сумма квадратов отклонений ‘между сериями’.
(1.7)
Сумма характеризует рассеивание средних серий за счёт случайных причин (с дисперсией для средних серий) и исследуемого фактора (с дисперсией d?2).
1.2.2 Оценка дисперсий
Пусть влияние Х на Y отсутствует, то есть нуль гипотеза об однородности верна. Тогда все серии параллельных наблюдений можно рассматривать как случайные выборки из одной и той же нормальной совокупности и, следовательно:
Несмещённая оценка дисперсии воспризводимости d02 по всем um наблюдениям определяется выражением:
, (1.8)
с числом степеней свободы um-1.
2. Выборочная дисперсия рассеивания ‘внутри серий’ или остаточная оценка дисперсии воспризводимости d2 находится как среднее из выборочных дисперсий по каждой серии в отдельности
. (1.9)
Выборочная дисперсия рассеивания между средними серий служит несмещённой оценкой дисперсии , с которой нормально распределены независимые друг от друга средние серии:
, (1.10)
с числом степеней свободы Vx=u-1.
Таким образом, S0 и SX независимы друг от друга.
При отсутствии влияния фактора Х выборочные оценки SXSX SX однородны, так как являются оценками одной и той же генеральной дисперсии d2.
Предположим теперь, что влияние фактора Х на выходной параметр существенно, то есть нуль гипотеза об однородности не верна. Тогда серии параллельных наблюдений можно рассматривать как случайные выборки с одной и той же дисперсией d02 и различными центрами распределения С1,....,Сj,.....,Cu и, следовательно:
1) выборочная дисперсия d2 характеризует влияние как фактора случайности, так и фактора Х, то есть d2=d02+d?2;
поскольку S0 не изменяется при замене yjl на yjl- yj, то выборочная дисперсия S02 также не изменяется и по-прежнему является несмещённой оценкой для d2, то есть S02 » d2;
3)поскольку сумма SX учитывает не только случайные, но и систематические расхождения между средними серий и увеличивается за счет влияния фактора Х, то дисперсия при этом также увеличивается и перестаёт служить оценкой только для , то есть , откуда Sx2 » d2+mdx2;
4) независимость S0 и SX друг от друга сохраняется.
Таким образом, для дисперсии фактора Х можно дать две приближённые оценки dx2 » d2- d02 » d2- d02 ,
Первая оценка менее точна из-за погрешностей величин S2 и S02. Точность же второй выше, так как дисперсии входят в неё, делённые на m. Из этого очевидно, что при влиянии фактора Х выборочной оценки S2, S02, S?2 неоднородны. Сопоставляя эти выборочные дисперсии, можно принять решение о справедливости первого или второго предположения относительно значимости влияния фактора Х (с дисперсией dx2) на выходной параметр.