- •Глава 3 активный эксперимент. Ортогональные планы первого порядка
- •Полный факторный эксперимент
- •Обработка результатов эксперимента
- •Дробный факторный эксперимент
- •Применение планов первого порядка в отсеивающих экспериментах
- •Глава 4 планирование эксперимента при отыскании экстремальной области
- •Классические методы определения экстремума
- •Факторные методы определения экстремума
- •Центральные композиционные планы второго порядка
- •Ортогональные центральные композиционные планы
- •Глава 5 дисперсионный анализ при экспериментальном исследовании
- •Однофакторный дисперсионный анализ
- •Двухфакторный эксперимент. Иерархическая и перекрестная классификации
- •Латинские и греко-латинские квадраты
Двухфакторный эксперимент. Иерархическая и перекрестная классификации
При однофакторном дисперсионном анализе данные только группируются по различным уровням единственного фактора. Для случая двух факторов необходимо учитывать и способ их взаимодействия, т. е. вид модели. Существуют два вида взаимодействия факторов Х1 и Х2 — иерархическое и перекрестное, либо иерархическая и перекрестная классификации.
При иерархической классификации различают факторы основной группы и факторы подгрупп. Каждый уровень одного основного фактора может быть связан с множеством уровней второго фактора — фактора подгруппы.
При перекрестной классификации каждый уровень одного фактора может сочетаться со всеми уровнями другого фактора и упорядочение в этом случае, в отличие от иерархической классификации, невозможно.
Для большей наглядности различия классификаций и особенностей проведения эксперимента рассмотрим следующий пример [11]. Пусть имеются четыре установки, на каждой из которых тремя операторами производится некоторая продукция (или проводятся измерения). Необходимо оценить однородность полученной продукции. Таким образом, реализуется двухфакторный эксперимент, где одним фактором с четырьмя уровнями является установка, а вторым фактором с двенадцатью уровнями — операторы. При такой постановке задачи нет никаких оснований связывать какого-либо оператора одной установки с оператором другой установки. Следовательно, существует иерархическая связь, схематически представленная на рис. 5.1, где каждый крестик обозначает одно наблюдение (единицу продукции, одно измерение). Например, имеется три наблюдения для второго оператора первой установки и одно наблюдение для второго оператора четвертой установки (на рис. 5.1 порядковый номер этого, оператора 11).
Рис. 5.1. Представление иерархической связи между факторами
(
)
Рис. 5.2. Представление перекрестной связи между факторами
Однако, если известно, что операторы имеют различную квалификацию и из трех операторов, работающих на каждой из установок, один имеет 1-й разряд, второй — 2-й, а третий — 3-й, то при имеющихся исходных данных реализуется перекрестная классификация с четырьмя уровнями «установка» и тремя уровнями «разряд». Схематически перекрестная связь представлена на рис. 5.2. (предполагаем, что первый оператор каждой установки имеет 1-й разряд, а третий — 3-й разряд). В данном случае присутствует сложная взаимосвязь между факторами.
Рассмотрим
вначале иерархическую классификацию.
Как и в случае однофакторного анализа,
отличие наблюдений определяется
действительным влиянием фактора Xj
и
действием случайных величин ε.
Основной
фактор (установка) содержит уровней
(в рассмотренном примере N
—
4). Каждый i-й
основной фактор связан с множеством
ni
уровней фактора подгруппы. В рассматриваемом
примере число уровней второго фактора
— операторов для всех подгрупп одинаково
ni
= 3.
Для
каждой
подгруппы
i-го
основного фактора (i-й
группы) проводится mk
наблюдений.
Так, для (k
=
2) второй подгруппы i
=
3 основного фактора число наблюдений
mik
= 3. Иными словами, в соответствии с
рис. 5.1 оператор с порядковым номером
8 на установке 3 провел 3 наблюдения. На
основании полученных экспериментальных
данных можно вычислить:
среднее подгрупп
,
где
уikl
— текущее значение (
)
наблюдения
k-м
оператором
(
)
на
i-й
установке (
);среднее основных групп
—
усредненное значение наблюдения на
i-й
установке «прикрепленными» операторами;общее среднее
.
В соответствии с основной идеей дисперсионного анализа разобьем полную сумму квадратов наблюдений от общего среднего на компоненты, используя найденные средние подгрупп и основных групп:
где
— число
наблюдений на i-й
установке (например, для второй установки
i
=
2 число наблюдений Ri
=
6);
характеризует отклонение между основными
группами (между средними значениями
наблюдений, полученных на
установках)
и имеет число степеней свободы fxl
= (N—1);
характеризует отклонения внутри
основных групп между подгруппами
(отклонения между средними значениями
наблюдений, полученными
операторами,
работающими на i-й
установке) и имеет
степеней свободы,
.
Разделив
сумму квадратов на ее число степеней
свободы получим оценки соответствующих
дисперсий (средний квадрат). Сравнение
среднего квадрата между основными
группами
с
остаточным средним квадратом
(оценка
дисперсии влияния случайных величин)
может использоваться для проверки
гипотезы о равенстве (постоянстве)
среднего каждой группы (установки имеют
одинаковую систематическую
погрешность). Для этой цели вычисляется
и
сравнивается с табличным значением
коэффициента Фишера FT
при
числе степеней свободы
и
.
Если Fp
<
FT,
то гипотеза принимается (в приведенном
на рис. 5.1 схематическом примере
и
).
Сравнение
среднего квадрата между подгруппами
внутри основных групп
,
с
остаточным средним квадратом
может
использоваться для проверки гипотезы
об отсутствии различий между средними
подгрупп в каждой основной группе
(наблюдения, получаемые различными по
квалификации операторами, работающими
на одной установке, для всех установок
однородны, т.е. расхождения наблюдений
не зависят от субъективных свойств
операторов, а только от параметров
установок). Для этой цели необходимо
найти
и
известным способом сравнить с FT
при
и
.
Если
необходимо проверить гипотезу об
отсутствии влияния операторов отдельно
для каждой i-й
установки, то необходимо вместо
и
Fp
подставить
вычисленное значение
с числом степеней свободы (ni = 1).
При перекрестной классификации взаимосвязь между наблюдениями и факторами, как следует из рис. 5.2, весьма сложна. Наглядное представление об этом может быть получено на основании табл. 5.6.
Таблица 5.6
Для простоты выкладок, не теряя общности рассуждений, будем полагать, что опыты при различных сочетаниях факторов повторяются одинаковое число т раз; i — порядковый номер варьирования (изменения) фактора X1, k— порядковый номер варьирования фактора Х2, l — порядковый номер параллельного опыта в серии при каждом ik сочетании уровней факторов (графа ik таблицы), т.е. при фиксированных значениях факторов.
По
полученным в результате эксперимента
наблюдениям yikl
определим среднее значение
серий из т
повторных наблюдений для каждого
сочетания i-го
и k-го
уровней
факторов (для каждой графы таблицы)
Затем определяем среднее значение по строкам таблицы из N2 • т наблюдений для каждого i-го уровня фактора Х1 (производим суммирование по строкам, а результаты сводим в последний столбец таблицы)
Аналогичным
образом определяется и среднее значение
по
столбцам таблицы N1
• т
наблюдений для каждого k-го
уровня
фактора Х2,
результаты сводятся в последнюю строку
таблицы
(в данном случае средние значения снабжены индексом «штрих», чтобы можно было отличить среднее по столбцам от среднего по строкам).
Из табл. 5.6 также можно определить общее среднее всех R = N1N2m наблюдений по всем N1N2 сочетаниям уровней
Сопоставляя отклонения соответствующих средних значений, можно получить полную картину о взаимосвязях факторов, наблюдений и случайных величин.
Так,
рассеяние средних по строкам
определяется
влиянием только одного фактора Х1
с дисперсией
,
на рассеяние средних по столбцам
оказывает влияние только фактор Х2
с дисперсией
,
так как все уровни другого фактора в
каждом из этих случаев осреднены.
Рассеяние в каждой серии относительно
среднего в той же серии обусловлено
действием только случайных величин в
с дисперсией
,
а
рассеяние самих средних в сериях по
всем возможным сочетаниям уровней Х1
и Х2
по
отношению к общему среднему
обусловлено
не только влиянием случайных величин,
но и взаимодействием факторов X1,
и Х2
с дисперсией
.
Полную
сумму квадратов
вначале
можно разделить на сумму квадратов
между ячейками и сумму квадратов внутри
ячеек:
(5.7)
Остальные суммы квадратов можно получить, разбивая сумму квадратов между ячейками на три части:
где
— сумма
квадратов отклонений «между строками»,
характеризующая рассеяние средних по
строкам
в
результате действия случайных величин
с дисперсией среднего для строки
,
фактора
Х1
с дисперсией
,
и взаимодействия факторов с дисперсией
среднего для строки
;
- сумма
квадратов отклонений «между столбцами»,
характеризующая рассеяние средних
по столбцам в результате действия
случайных величин с дисперсией среднего
для столбца
,
фактора
Х2
дисперсией
и взаимодействия факторов с дисперсией
среднего для столбца
;
— сумма квадратов отклонений между
сериями, характеризующая рассеяние
средних
серий
в результате действия случайных величин
с дисперсией среднего
,
и
взаимодействия факторов с дисперсией
.
Следовательно, полная сумма квадратов в соответствии с (5.7) может быть представлена в виде
Где
—
сумма
квадратов отклонении «внутри серий»,
характеризующая рассеивание отдельных
наблюдений уikl
в сериях только за счет влияния случайных
величин, так как на протяжении серии
Х1
и Х2
остаются постоянными.
Гипотезу
об отсутствии различий между средними
внутри строк или столбцов, т.е. о
несущественном влиянии факторов X1
и
Х2,
можно проверить, вычисляя соответственно
отношение среднего квадрата между
строками
,
с
числом степеней свобода
или между столбцами
с
числом степеней свобода
к
оценке дисперсии случайных величин
с
числом степеней свобода
.
Гипотезу
об отсутствии взаимодействий факторов
можно проверить, используя отношение
среднего квадрата взаимодействий
,
с
числом степеней свобода
к
среднему квадрату случайных величин
.
Проверка
гипотезы производится аналогично ранее
рассмотренной.
Для случая, когда т = 1, т.е. опыты не повторяются, невозможно непосредственно определить суммы квадратов и оценить отдельно от значений параметра. Таким образом, невозможно определить, насколько велико наблюдаемое значение среднего квадрата ввиду того, что нельзя применить известную стандартную процедуру сравнения, которая применяется при наличии , вычисленного по результатам эксперимента. В данном случае поступают так, если бы взаимодействия были равны нулю (для всех i и k), т.е. предполагают, что эффекты строк и столбцов комбинируются аддитивно. При этом средний квадрат взаимодействия
используется как остаточный средний квадрат (эквивалент влияния случайных величин). Для случая наличия взаимодействия факторов такой подход увеличивает значение и соответственно ухудшает точность анализа.
