- •Дисперсионный анализ
- •11 Однофакторный дисперсионный анализ
- •1. Краткие сведения из теории статистики
- •2. Справочная информация по технологии работы
- •12. Двухфакторный дисперсионный анализ без повторений и с повторениями
- •1. Краткие сведения из теории статистики
- •2. Справочная информация по технологии работы
12. Двухфакторный дисперсионный анализ без повторений и с повторениями
1. Краткие сведения из теории статистики
Продолжая тему главы 11, в которой была рассмотрена процедура однофакторного дисперсионного анализа, перейдем к задаче о действии на результативный признак Y двух факторов – А и В. Такие задачи характерны как для промышленных и технологических экспериментов, так и для гуманитарных исследований. Типичный пример — выяснение зависимости качества пряжи от типа станка и вида сырья, из которой она изготавливается (см. пример 1).
Логика однофакторного и двухфакторного дисперсионного анализа во многом схожа и состоит в следующем.
Пусть - математическое ожидание результативного признака Y при уровне - математическое ожидание результативного признака Y при уровне 2. Если при изменении уровня фактора A групповые математические ожидания не изменяются, т.е. , то считаем, что результативный признак не зависит от фактора A, в противном случае такая зависимость имеется. Аналогично, если при изменении уровня фактора В сохраняется равенство , то считаем, что У не зависит от фактора В. Но поскольку числовые значения математических ожиданий неизвестны, возникает задача проверки следующих гипотез:
Проверять эти гипотезы, так же как и в задаче однофакторного дисперсионного анализа, можно только при соблюдении следующих требований:
-
при различных сочетаниях уровней факторов А и В наблюдения независимы;
-
при каждом сочетании уровней факторов А и В результатичный признак Y имеет нормальный закон распределения с постоянной для различных сочетаний генеральной дисперсией .
Основой проведения двухфакторного дисперсионного анализа служит комбинационная группировка по двум факторам с последующим разложением дисперсии результативного признака по формуле
где - общая выборочная дисперсия — показатель вариации наблюдаемых «игреков», вызванной влиянием на Y фактора А фактора В и остаточных факторов;
- дисперсия групповых средних по фактору А — показатель вариации наблюдаемых «игреков», вызванной влиянием на Y фактора А;
- дисперсия групповых средних по фактору В — показатель вариации наблюдаемых «игреков», вызванной влиянием на У фактора В;
- средняя групповых дисперсий — показатель вариации наблюдаемых «игреков», вызванной влиянием на Y остаточных факторов.
На основе данного разложения для генеральной дисперсии находятся четыре несмещенные оценки: . Приччем оценка является несмещенной оценкой в любом случае, оценка - при выполнении гипотезы , оценка - при выполнении гипотезы , а оценка — при выполнении гипотез НА и НB.
Проверка гипотезы основывается на сравнении дисперсий . В математической статистике доказывается, что если гипотеза НА верна, то величина
имеет F-распределение с числом степеней свободы , т.е.
Аналогичным образом рассчитывается и величина FB.
Проверка выдвинутых гипотез осуществляется так же, как и при однофакторном дисперсионном анализе, и состоит в нахождении правосторонних критических интервалов с последующим контролем попадания (или непопадания) в данный интервал расчетных значений (или ). Если расчетное значение попадает в критический интервал, то гипотеза НА (Нв) отвергается, т.е. считается, что фактор А (В) влияет на результативный признак У.
Двухфакторный дисперсионный анализ может иметь две разновидности: без повторений и с повторениями. В первом случае каждому уровню факторов соответствует только одна выборка данных, во втором - определенным уровням факторов может соответствовать более одной выборки данных.