
Дисперсионный анализ
В любом эксперименте средние значения наблюдаемых величин меняются в связи с изменением основных факторов (качественных и количественных), определяющих условия опыта, а также случайных факторов. Исследование влияния тех или иных факторов на изменчивость средних является задачей дисперсионного анализа.
Дисперсионный анализ — это первый статистический метод отсеивания факторов в активном эксперименте. Активный эксперимент — это эксперимент, при анализе результатов которого исследователь учитывает рекомендации математической теории планирования эксперимента. Он основан на представлении о том, что значимость фактора определяется его вкладом в дисперсию параметра оптимизации. Это обусловило широкое применение дисперсионного анализа при изучении точности различных методов измерений (особенно при анализе вещества). Он позволяет указывать на те факторы, которые вызвали ошибку, и отсеять незначимые, на улучшение которых нецелесообразно затрачивать инженерные усилия. Дисперсионный анализ нужно использовать при оценке воспроизводимости результатов опытов, проводимых на пилотных установках. Воспроизводимость во времени служит характеристикой качества изготовления установки; с учетом этой характеристики заказчик должен принимать установку от изготовителя.
Дисперсионный анализ особенно эффективен при изучении нескольких факторов.
При классическом методе исследования варьируют только один фактор, а остальные оставляют постоянными. При этом для каждого фактора проводится своя серия наблюдений, не используемая при изучении других факторов.
Дисперсионный анализ состоит в выделении и оценке отдельных факторов, вызывающих изменчивость случайной величины. Для этого производится разложение суммарной выборочной дисперсии на составляющие, обусловленные независимыми факторами. Каждая из этих составляющих представляет собой оценку дисперсии генеральной совокупности. Чтобы решить, значимо ли влияние данного фактора, необходимо оценить значимость соответствующей выборочной дисперсии в сравнении с дисперсией воспроизводимости, обусловленной случайными факторами. Проверка значимости оценок дисперсий проводится по критерию Фишера. Если рассчитанное значение критерия Фишера окажется больше табличного, то рассматриваемый фактор влияет на изменчивость средних значений. Если же рассчитанное значение критерия Фишера окажется меньше табличного, то нет основания считать влияние рассматриваемого фактора значимым.
2.2. Однофакторный дисперсионный анализ
Рассмотрим действие единичного фактора А (количественного или качественного), который принимает k различных значений (уровней фактора). На i-м уровне производится ni наблюдений, результаты которых можно записать следующим образом:
Будем полагать, что результаты любого наблюдения можно представить в виде модели
Yij = μ + di + εij, (2.1)
где μ — суммарный эффект во всех опытах; di — эффект фактора А на i-м уровне (i = 1,2, …,k); εij — ошибка измерения на i-м уровне.
Предположим, что наблюдения на фиксированном уровне фактора нормально распределены относительно среднего значения μ+di с общей дисперсией σ2. Общее число опытов равно N:
N = n1+n2+ … +nk.
Проверяется нулевая гипотеза равенства средних значений на различных уровнях фактора А:
m1 = m2 = … = mk = m. (2.2)
Наиболее простые расчеты получаются при равном числе опытов на каждом уровне фактора А:
n1 =n2 =…= nk = n.
Общее число наблюдений N равно kn, где k — число серий опытов, а n — число параллельных опытов в серии.
Влияние фактора А является значимым, если
,
где f1=k-1,
f2=k(n-1)=N-k. (2.3)
Обозначим через
yi
среднее значение наблюдений на i-м
уровне:`yi
=
,(2.4)
а общее среднее значение для всей выборки из N наблюдений
yi
=
`yi. (2.5)
Методика проведения эксперимента
Пусть необходимо провести эксперимент на условном химико-технологическом объекте, в который поступают вещества А и В, и в ходе химической реакции получается вещество D. Входными параметрами объекта являются: СА — концентрация вещества А, СВ — концентрация вещества В. Каждому сочетанию СА и СВ соответствует определенное значение выходной концентрации продукта CD, являющейся случайной величиной.
В результате проведения эксперимента должны быть получены вероятностные характеристики для случайной величины CD. Для этого необходимо:
1) задать значения СА, СВ, равные величинам нижних границ диапазона САmi,, CBmin;
2) провести 10 серий по 6 опытов в каждой по изменению значений СА при СВ=const;
3) провести аналогичную серию опытов по изменению СВ при СА=const.
4) варианты подобных выборок случайных величин включены в базу данных ПК [1].
Однофакторный дисперсионный анализ можно провести по следующему алгоритму [2]:
1) итоги по столбцам
(2.6)
2) сумма квадратов всех наблюдений
(2.7)
3) сумма квадратов итогов по столбцам, деленная на число наблюдений в столбце
(2.8)
4) квадрат общего итога, деленный на число всех наблюдений (корректирующий член)
(2.9)
5) сумма квадратов для столбца
. (2.10)
6) SSобщ — общая сумма квадратов, равная разнице между суммой квадратов всех наблюдений и корректирующим членом
(2.11)
7) SSост — остаточная сумма квадратов для оценки ошибки эксперимента
(2.12)
8) дисперсия SA2
;
(2.13)
9) дисперсия Sош2
(2.14)
Результаты расчета обычно представляются в виде таблицы дисперсионного анализа (табл. 2.1).
Таблица 2.1