Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

книги / Организация и математическое планирование эксперимента.-1

.pdf
Скачиваний:
0
Добавлен:
20.11.2023
Размер:
1.64 Mб
Скачать

Глава 3. ДИСПЕРСИОННЫЙ АНАЛИЗ И ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА ПРИ ДИСПЕРСИОННОМ АНАЛИЗЕ

Изучение влияния основных факторов на изменчивость средних является задачей дисперсионного анализа. Р.А. Фишер впервые в 1938 г. определил дисперсионный анализ как «отделение дисперсии, приписываемой одной группе величин, от дисперсии, приписываемой другим группам». В зависимости от числа источников дисперсии различают однофакторный и многофакторный анализ. Идеи планирования эксперимента можно встретить в работах древнекитайских математиков (И. Цзын), изображение плана для четырех факторов встречается в письме Ферма к Паскалю. Количественные оценки эффектов факторов получал генетик Мендель в опытах с горохом, а также другие ученые, но концепции планирования эксперимента до Р.А. Фишера не существовало.

Дисперсионный анализ состоит в оценке отдельных факторов, вызывающих изменчивость изучаемой случайной величины. Для этого суммарную выборочную дисперсию раскладывают на составляющие, обусловленные независимыми факторами. Чтобы оценить, значимо ли влияние данного фактора, необходимо оценить значимость соответствующей выборочной дисперсии в сравнении с дисперсией воспроизводимости. Проверку значимости оценок дисперсий производят по критерию Фишера. Если рассчитанное значение критерия Фишера оказывается меньше табличного, то нет оснований считать влияние рассматриваемого фактора значимым, а если больше табличного, то рассматриваемый фактор влияет на изменчивость средних.

Полагают:

– случайные ошибки наблюдений имеют нормальное распределение;

41

– факторы влияют только на изменчивость средних значений, а дисперсия наблюдений остается постоянной (эксперименты равноточны).

Математической моделью эксперимента называют модель со случайными уровнями факторов (случайная модель), если все уровни выбраны случайным образом. Модель называют моделью с фиксированными уровнями факторов (модель с фиксированными уровнями факторов), когда все уровни фиксированы. Когда часть факторов рассматривают на фиксированном уровне, а уровни остальных выбирают случайным образом, то это модель смешанного типа.

3.1. Однофакторный дисперсионный анализ

Фактор А принимает k различных значений (уровни фактора) (табл. 3.1). На i-м уровне производят ni наблюдений, результаты которых представляют в форме таблицы (i в каждой строке изменяется от 1 = j до k = j в каждом столбце – от i = 1

до i = n↓).

Таблица 3.1

Исходные данные для однофакторного анализа с равным числом повторений опытов

Номер

 

Уровни фактора А

 

наблюдений

a1

a2

ak

1

y11

y21

yk1

2

y12

y22

yk2

 

n

y1n

y2n

ykn

Итоги

A1 n

y1j

A2 n

y2 j

Ak n

ykj

 

j 1

 

j 1

 

 

j 1

 

Результат любого наблюдения можно представить в виде модели

42

yij di ij ,

где μ суммарный эффект во всех опытах; di эффект фактора A на i-м уровне; εij ошибка измерения на i-м уровне.

Предположим, что наблюдения на фиксированном уровне фактора нормально распределены относительно среднего значения μ + di с общей дисперсией σ2. Общее число опытов

N n1 n2 nk .

Наиболее простые расчеты получают при равном числе опытов на каждом уровне факторов А: n1 n2 nk n (см. табл. 3.1).

Общее число наблюдений N равно kn. Обозначим через уi ср среднее значение наблюдений на i-м уровне:

 

 

nj 1 yij

 

A

y

 

 

 

i

,

 

 

i ср

 

n

 

n

 

 

 

а общее среднее значение для всей выборки N наблюдений

 

1

k n

1

k

yср

yij

yi ср.

 

k

 

N i 1 j 1

i 1

Для проведения дисперсионного анализа необходимо общую выборочную дисперсию

 

 

 

 

 

 

 

 

 

 

 

k n

 

yij

2

 

 

 

 

 

 

k

 

n

2

 

i 1 j

1

 

k n

(y

y

)

2

 

 

yij

N

 

 

 

s2

 

 

i

1

j

 

 

 

 

 

ij

ср

 

 

 

 

 

 

 

 

 

 

 

N 1

 

 

 

 

 

 

N 1

 

 

 

i 1 j 1

 

 

 

 

 

 

 

 

 

 

разложить на составляющие, которые характеризовали бы вклад каждого фактора А и фактора случайности. Фактор случайности легко оценить благодаря наличию повторных опытов на каждом уровне. Выборочная дисперсия на каждом уровне

43

 

yij yi ср 2

 

n

 

yij2

nj

1 yij 2

 

n

 

j

1

 

n

 

s2j

 

 

 

 

 

 

,i 1, 2, , k.

n 1

 

 

n 1

 

j 1

 

 

 

 

 

Если нет уверенности в равноточности экспериментов, однородность дисперсий s12, s22, , sk2 можно проверить по кри-

терию Кохрена.

Если между дисперсиями нет значимых различий, для оценки генеральной дисперсии 2, характеризующей фактор случайности, используют выборочную дисперсию

n

sош2 si2.

i 1

Число степеней свободы sош2 равно k (n – 1) = N – k. При-

ближенную оценку для дисперсии фактора А можно получить следующим образом:

2A s2 sош2 ,

где s2 общая выборочная дисперсия.

Введем обозначение sА2 nσА2 + sош2. Эта дисперсия имеет k – 1 степеней свободы. Влияние А считается значимым, если

sА2/sош2 > F1–p (f1, f2), f1 = k – 1, f2 = N – k. Таким образом, гипотезу проверяют по одностороннему критерию Фишера.

Итак, дисперсионный анализ проводят по следующему алгоритму:

1. Подсчитывают итоги по столбцам:

Ai n yij .

j 1

2.Вычисляют сумму квадратов всех наблюдений:

k n

SS1 yij2.

i 1 j 1

44

3.Подсчитывают сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:

SS2 n Ai2 . i 1 n

4.Вычисляют квадрат общего итога, деленный на число всех наблюдений (корректирующий член):

SS3

ik 1Ai 2

.

N

 

 

5.Определяют сумму квадратов для столбца:

SSA SS2 SS3.

6.Подсчитывают общую сумму квадратов (SSобщ), равную разнице между суммой квадратов всех наблюдений и корректирующим членом:

SSобщ SS1 SS3.

7. Подсчитывают остаточную сумму квадратов (SSост) для оценки ошибки эксперимента:

SSост SS1 SS2.

8. Определяют рассеяние, вызванное фактором А (sA2 ): sA2 kSSA1.

9. Подсчитывают выборочную дисперсию sош2 : sош2 nSSk ост1 .

Если вычисленное отношение

S 2

F

, то влияние фак-

A

Sош2

тора А следует считать незначимым.

1 p

 

 

 

 

45

При таком плане расчетов общая дисперсия s2 связана только с фактором случайности и может служить оценкой для дисперсии воспроизводимости. Если же справедливо неравенст-

во

SA2

F

f , f

 

,

f k 1,

f

 

k 1 n N k, различие

Sош2

 

 

 

1 p

1

2

 

1

 

2

 

между дисперсиями значимо и, следовательно, значимо влияние фактора А.

В отличие от модели с фиксированными уровнями, выводы по случайной модели распространяются на всю генеральную совокупность уровней. Рассмотрим схему вычислений для разного числа параллельных наблюдений.

Пусть на уровне ai проведено ni параллельных наблюдений. Общее число наблюдений

k

Nni .

i 1

1.Итоги по столбцам:

ni

Ai yij , ij 1,2, , k.

j 1

2.Суммы квадратов всех наблюдений

k n

SS1 yij2.

i 1 j 1

3.Суммы квадратов итогов по столбцам, деленные на число наблюдений в соответствующем столбце,

SS2 n Ai2 . i 1 ni

4.Квадрат общего итога, деленный на число всех наблю-

дений,

SS3

ik 1Ai 2

.

N

 

 

46

Дальнейшие вычисления для SSА, SSобщ, SSост, sA2 и sош2 совпадают с однофакторным экспериментом с равным числом параллельных наблюдений.

Если вычисленные дисперсии s2 и s2

значимо отличают-

A

ош

 

ся друг от друга, дисперсию фактора А вычисляют по формуле

k 1 N s2 s2

 

 

2 A ош .

A N 2 k ni

i1

3.2.Двухфакторный дисперсионный анализ

Изучают влияние на процесс одновременно двух факторов А и В. Фактор А исследуют на уровнях а1, а2, …, аk, фактор В – на уровнях b1, b2, …, bm. Допустим, что при каждом сочетании уровней факторов А и В производится n параллельных наблюдений. Общее число наблюдений N = nkm. Результат наблюдений представляют в виде следующей модели:

yijq i j i j ijq ,

где μ общее среднее; αi эффект фактора А на i-м уровне; i = 1, 2, …, k; βj эффект фактора В на j-м уровне; j = 1, 2, …, m; αiβj эффект взаимодействия факторов; εijq – ошибка измерений.

Эффект взаимодействия представляет собой отклонение среднего по наблюдениям в ij-й серии от суммы трех первых

членов в модели для yijq, а εijq (q = 1, 2, …, n) учитывает вариацию внутри серии наблюдений (ошибка воспроизводимости).

Предполагаем, что εijq распределена нормально с нулевым математическим ожиданием и дисперсией ош2 . Если между факторами нет взаимодействия, то принимают линейную модель:

yijq i j ij .

47

Такую модель принимают при отсутствии параллельных наблюдений.

В линейной модели через yi ср и yj ср обозначим среднее по столбцам и строчкам соответственно:

yi ср Aki ; y j ср Bmj ,

через yср среднее всех результатов;

 

k m

yij

 

yср

i 1 j 1

.

km

 

 

 

 

Нулевую гипотезу о незначимости влияния факторов А и В проверяют по критерию Фишера

F

sA2

F

f , f

2

;

f k 1,

f

2

k 1 m 1 ,

s2

 

1 p

1

 

1

 

 

 

ош

 

 

 

 

 

 

 

 

принимается нулевая гипотеза. Если

F

sA2

F

f , f

2

,

s2

 

1 p

1

 

 

ош

 

 

 

 

нулевая гипотеза отвергается и влияние фактора А считают значимым. Аналогично для фактора В:

F

sB2

F

f , f

2

;

f m 1,

f

2

k 1 m 1 ,

s2

 

1 p

1

 

1

 

 

 

ош

 

 

 

 

 

 

 

 

принимается нулевая гипотеза. При справедливости неравенства

F

sB2

F

f , f

2

 

s2

 

1 p

1

 

 

ош

 

 

 

 

влияние фактора В считают значимым.

48

В случае линейной модели удобно применять следующий алгоритм расчета. Находят:

1. Итоги по столбцам:

m

Ai yij ,i 1,2, , k.

i 1

2.Итоги по строкам:

k

Bj yij , j 1,2, , m.

j 1

3.Сумму квадратов всех наблюдений:

k m

SS1 yij2.

i 1 j 1

4. Сумму квадратов итогов по столбцам, деленную на число наблюдений в столбце:

k Ai2

SS2 mi 1 .

i

5. Сумму квадратов итогов по строкам, деленную на число наблюдений в строке:

SS3

mj 1Ai 2

.

k

 

 

6. Квадрат общего итога, деленный на число всех наблюдений (корректирующий член):

SS4

ik 1Ai 2

 

mj 1Bj 2

.

km

km

 

 

 

7.Сумму квадратов для столбца:

SSA SS2 SS4.

49

8.Сумму квадратов для строки:

SSB SS3 SS4.

9.Общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом:

SSобщ SS1 SS4.

10. Остаточную сумму квадратов:

SSост SSобщ SSA SSB SS1 SS2 SS3 SS4 . 11. Дисперсию sA2:

sA2 kSSA1 .

12. Дисперсию sВ2:

sB2 mSSB1 .

13. Дисперсию sош2 :

s2

 

SSост

.

ош

 

k 1 m 1

 

14. Результаты удобно представлять в виде таблицы.

В дальнейшем по предложенной выше схеме вычисляют коэффициент Фишера и сравнивают его с табличным значением:

F

 

sA2

F

f , f

2

;

f

k 1, f

2

k 1 m 1 ;

s2

A

 

 

1 p

1

 

1

 

 

 

 

 

ош

 

 

 

 

 

 

 

 

 

F

 

 

sB2

 

F

f , f

2

;

f

m 1, f

2

k 1 m 1 .

 

s2

B

 

 

1 p

1

 

1

 

 

 

 

 

 

ош

 

 

 

 

 

 

 

 

 

50

Соседние файлы в папке книги