Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ПФЭ.docx
Скачиваний:
2
Добавлен:
01.07.2025
Размер:
1.84 Mб
Скачать
  1. Двухфакторный эксперимент. Иерархическая и перекрестная классификации

При однофакторном дисперсионном анализе данные толь­ко группируются по различным уровням единственного фактора. Для случая двух факторов необходимо учитывать и способ их взаимодействия, т. е. вид модели. Существуют два вида взаимодействия факторов Х1 и Х2 — иерархиче­ское и перекрестное, либо иерархическая и перекрестная классификации.

При иерархической классификации различают факторы основной группы и факторы подгрупп. Каждый уровень од­ного основного фактора может быть связан с множеством уровней второго фактора — фактора подгруппы.

При перекрестной классификации каждый уровень од­ного фактора может сочетаться со всеми уровнями другого фактора и упорядочение в этом случае, в отличие от иерар­хической классификации, невозможно.

Для большей наглядности различия классификаций и особенностей проведения эксперимента рассмотрим следую­щий пример [11]. Пусть имеются четыре установки, на каж­дой из которых тремя операторами производится некоторая продукция (или проводятся измерения). Необходимо оце­нить однородность полученной продукции. Таким образом, реализуется двухфакторный эксперимент, где одним факто­ром с четырьмя уровнями является установка, а вторым фактором с двенадцатью уровнями — операторы. При такой постановке задачи нет никаких оснований связывать какого-либо оператора одной установки с оператором другой уста­новки. Следовательно, существует иерархическая связь, схематически представленная на рис. 5.1, где каждый кре­стик обозначает одно наблюдение (единицу продукции, одно измерение). Например, имеется три наблюдения для второго оператора первой установки и одно наблюдение для второго оператора четвертой установки (на рис. 5.1 порядковый номер этого, оператора 11).

Рис. 5.1. Представление иерархической связи между факторами

( )

Рис. 5.2. Представление перекрестной связи между факторами

Однако, если известно, что операторы имеют различную квалификацию и из трех операторов, работающих на каждой из установок, один имеет 1-й разряд, второй — 2-й, а тре­тий — 3-й, то при имеющихся исходных данных реализует­ся перекрестная классификация с четырьмя уровнями «уста­новка» и тремя уровнями «разряд». Схематически перекрест­ная связь представлена на рис. 5.2. (предполагаем, что первый оператор каждой установки имеет 1-й разряд, а тре­тий — 3-й разряд). В данном случае присутствует сложная взаимосвязь между факторами.

Рассмотрим вначале иерархическую классификацию. Как и в случае однофакторного анализа, отличие наблю­дений определяется действительным влиянием фактора Xj и действием случайных величин ε. Основной фактор (установ­ка) содержит уровней (в рассмотренном примере N — 4). Каждый i-й основной фактор связан с множеством ni уровней фактора подгруппы. В рассматриваемом приме­ре число уровней второго фактора — операторов для всех подгрупп одинаково ni = 3. Для каждой под­группы i-го основного фактора (i-й группы) проводится mk наблюдений. Так, для (k = 2) второй подгруппы i = 3 основного фактора число наблюдений mik = 3. Иными слова­ми, в соответствии с рис. 5.1 оператор с порядковым номе­ром 8 на установке 3 провел 3 наблюдения. На основании полученных экспериментальных данных можно вычислить:

  • среднее подгрупп , где уikl — текущее значение ( ) наблюдения k-м оператором ( ) на i-й установке ( );

  • среднее основных групп — усредненное значение наблюдения на i-й установке «прикрепленными» операторами;

  • общее среднее .

В соответствии с основной идеей дисперсионного анализа разобьем полную сумму квадратов наблюдений от общего среднего на компоненты, используя найденные средние подгрупп и основных групп:

где — число наблюдений на i-й установке (например, для второй установки i = 2 число наблюдений Ri = 6); характеризует отклонение между основными группами (между средними значениями наблюдений, полученных на установках) и имеет число степеней свободы fxl = (N—1); характеризует отклонения внутри основных групп между подгруппами (отклонения между средними значениями наблю­дений, полученными операторами, работающими на i-й установке) и имеет степеней свободы, .

Разделив сумму квадратов на ее число степеней свободы получим оценки соответствующих дисперсий (средний квад­рат). Сравнение среднего квадрата между основными груп­пами с остаточным средним квадратом (оценка дисперсии влияния случайных величин) мо­жет использоваться для проверки гипотезы о равенстве (по­стоянстве) среднего каждой группы (установки имеют оди­наковую систематическую погрешность). Для этой цели вычисляется и сравнивается с табличным зна­чением коэффициента Фишера FT при числе степеней свободы и . Если Fp < FT, то гипотеза принимается (в приведенном на рис. 5.1 схемати­ческом примере и ).

Сравнение среднего квадрата между подгруппами внутри основных групп , с остаточным средним квад­ратом может использоваться для проверки гипотезы об отсутствии различий между средними подгрупп в каждой основной группе (наблюдения, получаемые различными по квалификации операторами, работающими на одной уста­новке, для всех установок однородны, т.е. расхождения наблюдений не зависят от субъективных свойств операто­ров, а только от параметров установок). Для этой цели необ­ходимо найти и известным способом сравнить с FT при и .

Если необходимо проверить гипотезу об отсутствии влияния операторов отдельно для каждой i-й установки, то необходимо вместо и Fp подставить вычисленное зна­чение

с числом степеней свободы (ni = 1).

При перекрестной классификации взаимосвязь между наблюдениями и факторами, как следует из рис. 5.2, весьма сложна. Наглядное представление об этом может быть по­лучено на основании табл. 5.6.

Таблица 5.6

Для простоты выкладок, не теряя общности рассуждений, будем полагать, что опыты при различных сочетаниях факто­ров повторяются одинаковое число т раз; i — порядковый номер варьирования (изменения) фактора X1, k— порядко­вый номер варьирования фактора Х2, l — порядковый номер параллельного опыта в серии при каждом ik сочетании уров­ней факторов (графа ik таблицы), т.е. при фиксированных значениях факторов.

По полученным в результате эксперимента наблюдениям yikl определим среднее значение серий из т повторных наблюдений для каждого сочетания i-го и k-го уровней факторов (для каждой графы таблицы)

Затем определяем среднее значение по строкам табли­цы из N2 • т наблюдений для каждого i-го уровня фактора Х1 (производим суммирование по строкам, а результаты сво­дим в последний столбец таблицы)

Аналогичным образом определяется и среднее значение по столбцам таблицы N1 • т наблюдений для каждого k-го уровня фактора Х2, результаты сводятся в последнюю строку таблицы

(в данном случае средние значения снабжены индексом «штрих», чтобы можно было отличить среднее по столбцам от среднего по строкам).

Из табл. 5.6 также можно определить общее среднее всех R = N1N2m наблюдений по всем N1N2 сочетаниям уровней

Сопоставляя отклонения соответствующих средних зна­чений, можно получить полную картину о взаимосвязях факторов, наблюдений и случайных величин.

Так, рассеяние средних по строкам определяется влия­нием только одного фактора Х1 с дисперсией , на рассея­ние средних по столбцам оказывает влияние только фак­тор Х2 с дисперсией , так как все уровни другого фактора в каждом из этих случаев осреднены. Рассеяние в каждой серии относительно среднего в той же серии обусловлено действием только случайных величин в с дисперсией , а рассеяние самих средних в сериях по всем возможным сочетаниям уровней Х1 и Х2 по отношению к общему сред­нему обусловлено не только влиянием случайных величин, но и взаимодействием факторов X1, и Х2 с дисперсией .

Полную сумму квадратов вначале можно разделить на сумму квадратов между ячейками и сумму квадратов внутри ячеек:

(5.7)

Остальные суммы квадратов можно получить, разбивая сумму квадратов между ячейками на три части:

где — сумма квадратов отклоне­ний «между строками», характеризующая рассеяние средних по строкам в результате действия случайных величин с дисперсией среднего для строки , фактора Х1 с дисперсией , и взаимодействия факторов с дисперсией среднего для строки ; - сумма квадратов отклонений «между столбцами», характери­зующая рассеяние средних по столбцам в результате дей­ствия случайных величин с дисперсией среднего для столб­ца , фактора Х2 дисперсией и взаимодействия факторов с дисперсией среднего для столбца ; — сумма квадратов отклонений между сериями, характеризующая рассеяние средних серий в результате действия случайных вели­чин с дисперсией среднего , и взаимодействия факторов с дисперсией .

Следовательно, полная сумма квадратов в соответствии с (5.7) может быть представлена в виде

Где — сумма квадратов отклонении «внутри серий», характеризующая рассеивание отдель­ных наблюдений уikl в сериях только за счет влияния слу­чайных величин, так как на протяжении серии Х1 и Х2 оста­ются постоянными.

Гипотезу об отсутствии различий между средними внут­ри строк или столбцов, т.е. о несущественном влиянии фак­торов X1 и Х2, можно проверить, вычисляя соответственно отношение среднего квадрата между строками , с числом степеней свобода или между столб­цами с числом степеней свобода к оценке дисперсии случайных величин с числом степеней свобода .

Гипотезу об отсутствии взаимодействий факторов можно проверить, используя отношение среднего квадрата взаимо­действий , с числом степеней свобода к среднему квадрату случайных величин . Проверка гипотезы производится аналогично ранее рассмотренной.

Для случая, когда т = 1, т.е. опыты не повторяются, невозможно непосредственно определить суммы квадратов и оценить отдельно от значений параметра. Таким об­разом, невозможно определить, насколько велико наблюда­емое значение среднего квадрата ввиду того, что нельзя применить известную стандартную процедуру сравнения, которая применяется при наличии , вычисленного по ре­зультатам эксперимента. В данном случае поступают так, если бы взаимодействия были равны нулю (для всех i и k), т.е. предполагают, что эффекты строк и столбцов комбиниру­ются аддитивно. При этом средний квадрат взаимодей­ствия

используется как остаточный средний квадрат (эквивалент влияния случайных величин). Для случая наличия взаимо­действия факторов такой подход увеличивает значение и соответственно ухудшает точность анализа.