Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
иванов экзамен.docx
Скачиваний:
10
Добавлен:
22.09.2019
Размер:
321.76 Кб
Скачать

5. Однофакторный дисперсионный анализ

Рассмотрим идеальный вариант – случайные воздействия отсутствуют и необходимо исследовать влияние только одного фактора. Наилучшей оценкой влияния фактора может служить величина, аналогичная дисперсии, характеризующая рассеяние выходной величины i вокруг некоторого среднего значения. Однако не следует забывать, что в данном случае наблюдается только аналогия с дисперсиями, так как i – детерминированные величины, поскольку влияющие величины и погрешность восприятия отсутствуют.

Тогда количественная оценка влияния фактора может быть представлена в виде:

2i = ∑ (iy’)2/(N-1),

где N – количество приборов (уровней), каждым из которых проводится одно измерение.

В действительности наблюдается влияние случайных неучтенных величин, которые в совокупности можно обозначить ε. Влияние их можно представить в виде 2ε. При этом дисперсия выходной величины уже будет определяться не только влиянием фактора х, но и случайной величины ε. Сопоставление влияния этих величин через сопоставление обусловленных ими дисперсий и является основой дисперсионного анализа. Если исследуемый фактор несущественен и дисперсия воспроизводимости, характеризующая один опыт, известна, то общая дисперсия будет в основном определяться дисперсией воспроизводимости. Если же фактор существенен, то можно считать, что

S20{y} = 2x + 2g.

Таблица 3.1.

i

l=1

l=2

l=m

i

1

11

12

1m

1

2

21

22

2m

2

N

N1

N2

Nm

N

Исходя из данного соотношения, можно найти дисперсию, которую обуславливает изучаемый фактор. Обычно дисперсия воспроизводимости 2ε неизвестна и ее необходимо найти по результатам экспериментальных исследований, поэтому проводят параллельные опыты для каждого уровня варьирования факторов.

Предположим, что исследование объекта проводится одновременно различными приборами с целью уменьшения влияния фактора – прибора на результат исследования (погрешность показаний). Выясним, можно ли систематические погрешности приборов считать одинаковыми.

Пусть приборов будет N (фактор варьируется на N уровнях) и для каждого прибора (уровня) проводится серия из m параллельных опытов. Число опытов при реализации однофакторного дисперсионного анализа будет Nm. Результаты опытов приведены в таблице 3.1.

По результатам исследований для каждого i-го уровня независимой переменной (разновидности прибора) находят среднее значение (предполагаем одинаковую кратность проведения опытов).

y’i = ∑ yi1/m.

Разброс значений откликов в фиксированной строке (для конкретного прибора) определяется совокупным действием случайных величин и характеризуется оценкой дисперсии воспроизводимости. Раэброс между средними значениями выходных величин определяется влиянием фактора. Если систематические погрешности приборов одинаковы, то следует ожидать повышенного рассеивания выборочных средних y’i.

Несмещенная оценка дисперсии воспроизводимости для всей совокупности исследования определяется в виде

S20{y} =∑∑(i1 – y’)2/(Nm – 1),

где y’ = ∑ yi/N.

Рассмотрим числитель данного выражения Q20, введя под скобки –y’i и +y’i:

Q20 = ∑∑[(il – y’i) + (y’i – y’)]2 + ∑∑[(il – y’i)2 + 2∑∑(il – y’i)(y’i – y’) + +∑∑ (y’i – y’)2.

Рассмотрим отдельно второе слагаемое в правой части выражения Q20:

∑∑(il – y’i)(y’i – y’) = ∑(y’i – y’) ∑(il – y’i).

Так как сумма отклонений от среднего в i – ой серии равна нулю

∑(il – y’i) = 0, то и второе слагаемое также равно нулю.

Следовательно, полная сумма квадратов отклонений отдельных наблюдений от y’:

Q20 = ∑∑[(il – y’i)2 + ∑∑ (y’i – y’)2 = ∑∑[(il – y’i)2 + m∑(y’i – y’)2,

или в сокращенном виде

Q20 = Q2ε + Q2х,

где

Q20 = ∑∑[(il – y’i)2; Q2ε = ∑∑[(il – y’i)2;

Q2х = m∑(y’i – y’)2.

Слагаемое Q2х представляет сумму квадратов разностей между средними y’i отдельных серий (строк, приборов) и общей средней y’ по всей совокупности наблюдений и характеризует степень расхождения систематических погрешностей в отдельных приборах. Ее также называют «рассеиванием по факторам».

Слагаемое Q2ε представляет сумму квадратов разностей между отдельными наблюдениями и средней соответствующей серии y’i (среднее значение показаний данного прибора) и характеризует «остаточное рассеивание» случайных погрешностей опытов.

Следовательно, полное рассеивание показаний приборов Q20 складывается из двух компонент, характеризующих рассеивание между приборами, т.е. различие между их систематическими погрешностями Q2х и рассеиванием «внутри» приборов (серий), характеризующим одинаковую (на основании предпосылок дисперсионного анализа) для всех приборов вариацию под воздействием случайных величин Q2ε.

Предположим, что гипотеза равенства систематических погрешностей верна и потому нормальные распределения для всех приборов тождественны, т.е. погрешности имеют одинаковый центр распределения (систематическая погрешность) и дисперсию Q2ε. Вэтом случае все Nm наблюдений можно рассматривать как выборку из одной и той же нормальной совокупности, а Q20/(Nm – 1), как уже отмечалось, является несмещенной оценкой дисперсии Q2ε по этой выборке. Откуда следует, что отношение Q20/ Q2ε , будет следовать распределению 2 с (Nm – 1) степенями свободы.

Однако средние по группам (приборам) y’i также, в соответствии с предположением, нормально распределены с дисперсией Q2ε/m каждая и независимы друг от друга. Поэтому

∑(y’i – y’)2/(N – 1) = Q2х/m(N – 1)

является несмещенной выборочной характеристикой дисперсии Q2ε/m, полученной на основании N наблюдений величины y’i. В результате можно заключить, что величина

распределена по закону 2 с (N – 1) степенями свободы.

Сумма квадратов отклонений от среднего в каждой серии, отнесенная к дисперсии

∑(il – y’i)2/2ε,

также распределена по закону 2 с (m – 1) степенями свободы.

Согласно свойству композиции для Nсерий (приборов), компонента

Q2ε/2ε =∑∑(il – y’i)2/ 2ε

также распределена по закону 2 c N(m – 1) является также оценкой параметра 2ε.

Из изложенного следует, что в случае равенства систематических погрешностей приборов (несущественности влияния исследуемого фактора) существуют три несмещенные оценки 2ε. Отношение двух однородных оценок дисперсий

Fp = [Q2х/(N – 1)]/[ Q2ε /N(m – 1)]

будет следовать F – распределению с (N – 1) и N(m – 1) степенями свободы. Задаваясь  уровнем значимости , на основании таблицы F-распределения, можно установить соответствующий  предел, так что

P(Fp>FT) = /100.

Рассмотрим случай, когда исследуемый фактор существенен, т.е. гипотеза о равенстве систематических погрешностей (центров распределения случайных погрешностей) неверна, но параметр 2ε во всех N совокупностях один и тот же. Изменение центров построчных распределений, т.е. замена il на il – сi (где сi – систематическая составляющая погрешности i-го прибора) не изменит значения Q2ε, которое по прежнему распределено по закону 2 c N(m – 1) степенями свободы, а Q2ε /N(m – 1) остается несмещенной оценкой 2ε. Однако числитель выражения (3.1.) именно учитывает расхождение между центрами распределения сi и имеет тенденцию к возрастанию при увеличении расхождения между систематическими составляющими. Поэтому правило проверки правильности выдвинутой гипотезы можно представить в следующем виде: гипотеза с1 = с2 =  = сN принимается, если FT >FP, и отбрасывается, если FP >FT. Схема однофакторного дисперсионного анализа может быть представлена в виде табл. 3.2.