книги / Методы оптимизации эксперимента в химической технологии
..pdf4) квадрат общего итога, деленный на число всех наблюдений,
|
5S3 |
|
(Ш .26) |
|
Дальнейшие |
расчеты |
проводятся |
по формулам (IIL17) —(IIL21). |
|
Если дисперсии |
^ и 4 |
значимо отличаются друг от друга, диспер |
||
сию фактора А вычисляют по формуле |
|
|||
|
о* « |
(6 — \)N |
(III.27) |
|
|
|
2 |
||
|
|
N* |
|
|
|
|
- 4=1 * |
|
|
|
|
|
|
Пример 1. Рассмотрим применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор А) на процесс радикальной поли
меризации. Изучалось влияние |
на выход полимера (у, %) |
пяти различных галоген- |
|||||
алкилов: СНз1(Д1), СзН71(Д2), |
С4Нв1(дз), |
СгНбВг (Д4), СзН?Вг(дб). Результаты |
эксперимента |
||||
с различными |
галоидными |
алкилами |
(фиксированные уровни фактора |
А) приведены |
|||
в таблице. |
|
|
|
|
|
|
|
Номер |
|
|
|
|
Уровни фактора А |
|
|
наблюдения |
|
|
|
|
|
|
|
|
а 1 |
|
02 |
аз |
а4 |
05 |
|
1 |
79,80 |
|
87,30 |
42,45 |
76,0 |
70,70 |
|
2 |
86,30 |
|
69,60 |
64,3 |
83,5 |
64,65 |
|
3 |
86,50 |
|
81,75 |
78,9 |
72,80 |
38,50 |
|
4 |
92,30 |
|
77,95 |
61,00 |
89,00 |
77,00 |
|
5 |
76,50 |
|
83,65 |
31,30 |
76,50 |
91,50 |
|
6 |
87,05 |
|
64,80 |
72,85 |
87,45 |
68,00 |
|
7 |
82,50 |
|
67,30 |
58,65 |
74,50 |
38,05 |
|
8 |
90,00 |
|
75,45 |
52,50 |
93,15 |
79,95 |
|
Итоги |
А у - 6 8 0 ,9 5 |
Ач — 607,8 |
Аз — 461,95 |
Ал — 652,9 |
Аъ - 528,35 |
Определим средние значения выхода для каждого галоидного алкила:
_ |
680,95 |
„ |
- |
|
607,8 |
_ |
- |
461,95 |
ух = |
—-— =85,1; |
у* = |
~ |
= 75,97; у3 — |
^ — 57,74; |
|||
|
8 |
' |
^ |
|
8 |
|
|
|
|
- |
652,9 |
= 81,61; |
- |
528,35 |
|
||
|
у4 |
= —-— |
уъ = |
—-— = 66,04 |
||||
|
|
|
8 |
|
|
|
8 |
|
и общее среднее для всех результатов
5
» = 4 " 2 * =7 3 ,2 -
4=1
Для облегчения вычислений будем вместо значений у рассматривать отклонения у> >тих значений от величины, близкой к общему среднему всех результатов, равной 73 (см. таблицу).
Н о м е р |
|
У р о в н и ф а к т о р а А |
|
|
|
н а б л ю д е н и я |
|
|
|
|
|
|
а\ |
02 |
аз |
04 |
аь |
1 |
6,8 |
14,3 |
-30,55 |
-3,0 |
“ 2,3 |
2 |
13,3 |
-3,4 |
“ 8,7 |
10,5 |
-8,35 |
3 |
13,5 |
8,75 |
5,9 |
-0,2 |
-34,5 |
4 |
19,3 |
4,95 |
-12,0 |
16,0 |
4,0 |
5 |
3,5 |
10,65 |
-41,7 |
3,5 |
18,5 |
6 |
14,05 |
-8,2 |
-0,15 |
14,45 |
-5,0 |
7 |
9,5 |
“ 5,7 |
-14,35 |
1,5 |
-34,95 |
8 |
17,0 |
2,45 |
-20,5 |
20,15 |
6,95 |
Итоги |
96,95 |
23,8 |
-122,05 |
68,9 |
-55,65 |
По данным таблицы |
проведем |
вычисления |
по формулам (III. 14) — (III.21) |
в соответ |
|
ствии с вышеприведенной схемой. Результаты расчета представлены в таблице. |
|
||||
И ст о ч н и к |
Ч и с л о |
с т е п е н е й |
С у м м а к в а др а т о в |
С р е д н и й |
к в адр ат |
д и с п е р с и и |
с в о б о д ы |
|
|
|
|
А |
|
4 |
4084,5 |
1021 |
|
Ошибка |
|
35 |
5281,46 |
150,9 |
|
Общая сумма |
|
39 |
9365,96 |
|
|
Полученные в результате расчета дисперсии сравним по критерию Фишера:
F = *A / = 1021/150.9 = 6,9.
По табл. 5 приложения находим /о,9б(4,35) —2,65. Так как F> 2,65, различие галогеналкилов следует признать значимым. Установив при помощи дисперсионного анализа тот факт, что средние значения выходов полимера в целом существенно различаются между собой, перейдем к сравнению влияния отдельных галогеналкилов. Проведем это срав нение по критерию Дункана (см. гл. II, 14) с доверительной вероятностью р—0,95. Нормированная ошибка среднего равна
s—= | / 150,9/8 = 4,35.
уw
Расположим средние значения в порядке возрастания их величин и выпишем из табл. 7 приложения значимые ранги для / —35 и р —0,05:
Уз(C4H9I) |
(С3 |
Н7Вг) у,(С3Н71) |
М С2Н6Вг) 7I (CH3I) |
|||
S7.74 |
|
66.04 |
75,97 |
81.61 |
85.1 |
|
Р • |
• . |
. . |
2 |
3 |
4 |
5 |
Ранги, |
г . |
. . |
2,875 |
3,025 |
з,п |
3,185 |
Г • S y |
|
. . |
12,5 |
13,2 |
13,52 |
13,9 |
Уг “ |
= |
27. 3 > |
13,9 — различие значимо |
||
у х — у ь = 19,05 > 13,52 — различие значимо |
|||||
yj — yt = |
9,13 < |
13,2 — различие |
незначимо |
||
у, — у4 = |
3,49 < |
12,5 |
— различие |
незначимо |
|
у4 — Уз = |
23,81 > |
13,52 |
— различие значимо |
У* — Уь*= 15,56 > 13,2— различие значимо
уг — уг = 5,64 < 12,5 — различие незначимо
Уг — у3= 18,17 > 13,2 — различие значимо
Уг — Уъ= 9,92 < 12,5 — различие незначимо
Уь — у3= 8,25 < 12,5 — различие незначимо
3. Двухфакторный дисперсионный анализ. Изучается влияние на процесс одновременно двух факторов А и В. Фактор А исследуется на уровнях аъ а2 ,...,ак, фактор В —на уровнях b]f Ьъ...,Ьт . Допустим, что при каждом сочетании уровней факторов А и В проводится п параллельных наблюдений (табл. 7).
Т а б л и ц а 7. |
Данные для двухфакторного дисперсионного |
анализа с повторениями |
||||
в |
|
|
А |
|
Итоги |
|
|
|
|
|
|||
|
а\ |
<*2 |
а/ |
ак |
|
|
Ь\ |
-У1 1 1>УМ2 |
У211 ' У212 |
У/,,’У/,2 |
Уки.Укп |
Я, |
|
|
У\\П |
Уз\П |
— Уьп |
•••» -У/ОЛ |
|
|
In |
У\2\ >У122 |
У22\>У222 |
У1з\ »У122 |
-У*2. »Ук22 |
«2 |
|
- » У | 2 Я |
•"» Уз2П |
— Упп |
—»-УАал |
|||
|
|
|||||
h |
Уф >Уф |
Уф ^2j2 |
Уф >Уф |
. У # , >УЮ2 |
д/ |
|
•••>У{/п |
Уфх |
-У(/'л |
ykjn |
|
bm |
У\т1 |
,У1/Л2 |
У2 /П1 *У2ГП2 |
.Уinn • У 1тз |
Укт\»-Уton2 |
Вт |
У\тп |
•••» Узтп |
•••* Утп |
•••» Уктп |
|
||
|
|
|||||
Итоги |
|
л, |
Л2 |
А1 |
|
|
Общее число наблюдений равно N = пкт. Результат наблюдения мож но представить в виде следующей модели:
УЩ —I1 + ai + ?./+ а1Р/ + |
eUq. |
|
(III.28) |
|
где ц —общее среднее; а, —эффект |
фактора А |
на /-м |
уровне, |
|
/= 1,2,...,к; Jij - эффект фактора В на |
/-м |
уровне, |
/ = 12 |
т- n,R — |
эффект взаимодействия факторов. |
|
|
’ ’ |
’ ’ j |
Эффект взаимодействия представляет собой отклонение среднего по наблюдениям в (ф-й серии от суммы первых трех членов в «одели (111.28), ави ( , - 1,2,..„л) учитывает вариацию внутри серии
наблюдений (ошибка воспроизводимости). Будем полагать, как и преж де, что eijq распределена нормально с нулевым математическим ожиданием и дисперсией а02ш. Если предположить, что между факторами нет взаимодействия, то можно принять линейную модель:
|
|
y ij= P + ai + $j + 4j- |
|
(III .29) |
||
Эта модель обычно применяется при отсутствии параллельных |
||||||
наблюдений (табл. 8): |
|
|
|
|
|
|
Т а б л и ц а 8. Данные для двухфакторного |
дисперсионного анализа без |
повторении |
||||
В |
|
|
А |
|
|
И тоги |
|
|
|
|
|
||
|
а, |
а 2 |
|
|
а к |
|
by |
У \\ |
У21 |
|
|
Уку |
Ву |
ь2 |
Уу2 |
У22 |
|
|
Ук2 |
в 2 |
Ьщ |
У\т |
У2т |
|
|
Укт |
В т |
4тоги |
Ау |
а 2 |
|
|
А к |
|
Рассмотрим |
вначале |
линейную |
модель |
(III.29). Через |
у} и у? |
|
обозначим средние, соответственно, по столбцам и по строчкам: |
||||||
|
|
- |
At |
|
(III.30) |
|
|
|
У1 = |
— . |
|
||
|
|
|
т |
|
|
|
|
|
УГ |
|
Bj |
|
|
|
|
|
Т |
|
(III .31) |
|
|
|
|
|
|
|
через у —среднее всех результатов:
к |
m |
|
У — 7 |
Ун• |
(Ш. 32) |
km |
||
*=l |
/=1 |
|
Рассеяние в средних по столбцам у\, |
относительно общею |
среднего у не зависит от фактора В, так как все уровни фактора £ усреднены. Это рассеяние связано с влиянием фактора А и случай, ного фактора. Так как дисперсия среднего (см. гл. II, 5) в m раз меньше дисперсии единичного измерения, имеем
« • * , + ■ £ |
■ |
<ш *>> |
f=I |
|
|
В свою очередь, рассеяние в средних по |
строчкам |
не зависц^ |
ог фактора А и связано с влиянием фактора В: |
|
|
m — 1 |
(III.34) |
|
|
/=1 |
позволяют оценить влияние факторов А |
Равенства (III.33) |
и (III.34) |
|
и В, если известна |
оценка |
дисперсии а 2. Чтобы оценить фактор |
случайности при отсутствии параллельных наблюдений, поступим следующим, образом. Найдем дисперсию наблюдений по /-му столбцу:
т
тZ 7 |
(III.35) |
|
Эта дисперсия обусловлена влиянием фактора В и фактора случай ности
S?: Л+о*.
Равенство станет более точным, если вместо $2 использовать средневзвешенную дисперсию по всем столбцам:
|
|
|
|
k |
|
|
k |
т |
|
|
|
* |
, „ |
1 |
V |
2 |
|
1 |
|
|
(III.36) |
|
в |
' |
k |
|
1 |
k(m— 1) |
|
|
|
|
|
|
|
|
i = i |
|
|
t = i |
' / = 1 |
|
|
Вычитая (III.35) из (III.34), получим |
|
|
|
|||||||
|
|
|
k |
т |
|
|
|
|
|
|
k |
k(m |
|
|
|
|
|
|
|
(III.37) |
|
|
/=i |
|
|
|
;=1 |
|
|
|||
|
|
|
|
|
|
|
|
|
||
Отсюда |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
(III.38) |
|
(k — 1) (m— 1) |
|
|
|
|
|
|
|||
|
L^l |
|
/=1 |
|
7=1 |
|
J |
|||
Обозначим полученную оценку (111.38) для дисперсии |
а 2 через ^ш. |
|||||||||
Число |
степеней |
свободы |
|
равно |
( к - \) |
(т -1). |
Введем также сле |
|||
дующие обозначения: |
|
k |
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
||
|
|
|
4 = Y I T |
|
— ~у)г ^т°*А + s*,,, , |
(III.39) |
||||
|
|
|
|
|
1=1 |
|
|
|
|
|
|
|
|
|
|
т |
|
|
|
|
|
|
|
|
4 = ; ~ г |
^ |
№ |
~ ^ 2 ~ fegB + |
‘ |
(П1-40) |
||
Величины |
s% и |
можно |
считать выборочными дисперсиями с |
(к - 1) и (т - 1) степенями свободы соответственно. Проверяют нуле вые гипотезы о незначимое™ влияния факторов А и В по критерию Фишера. Если дисперсионное отношение
F = |
/*). fx = k - 1; f2= ( A - D ( m - l ) , (111-41) |
|
sL |
принимается гипотеза //° : а, =0. Если
F = — >F1. p (flt /а), |
(III.42) |
s om
нулевая гипотеза отвергается и влияние фактора А считается значи мым. Аналогично, если
А
F — 2 < Fx^p (flt f 2), SOIU
h = m - 1; /a = (*— I)(m— 1), |
(III.43) |
принимается гипотеза Н° :Д =0. При справедливости неравенства
F = |
4 |
(III.44) |
>Fi- |
влияние фактора В считается значимым. При проверке нулевых гипо тез применяется односторонний критерий Фишера, гак как альтерна тивой равенству а% = с*02шслужит неравенство С5^>о02,. При проведении дисперсионного анализа в условиях линейной модели (IIL29) удобно использовать следующий алгоритм расчета. Находят: 1) - итоги по столбцам
Af— |
ytj, i —1» 2, ... , kt |
(III.45) |
/=1
2) |
итоги по строкам |
|
|
|
|
к |
|
1, 2, ... , т; |
(III.46) |
|
2 J УН* |
/= |
||
|
i=i |
|
|
|
3) |
сумму квадратов всех наблюдений |
|
||
|
к |
т |
|
|
|
S S i= 2 |
2 |
у ) г |
(Ш-47) |
|
i=l /=1 |
|
||
4) сумму квадратов итогов по столбцам, деленную на число |
||||
наблюдений в столбце, |
к |
|
||
|
|
(III.48) |
||
|
SSo = |
|
|
|
|
|
1=1 |
|
|
5) |
сумму квадратов итогов по строкам, деленную на число наблюдений |
|||
в строке, |
|
|
|
|
|
SSs = ± 2 * |
fill.49) |
||
|
|
/ = |
1 |
|
6) |
квадрат общего итога, деленный на число всех наблюдений (коррек |
|||
тирующий член), |
|
|
|
/ к |
Ч 2 |
/ т |
Ч 2 |
7) сумму квадратов для столбца
SSA= SS2 — SS 4J
8) сумму квадратов для строки
SSB = SS3 — S 5 4; |
(111.52) |
9) общую сумму квадратов, равную разнице между суммой квадратов всех наблюдений и корректирующим членом,
•550бщ — SSj — SS^t
10) остаточную сум м у квадратов
SS0CT — *SS()(5nj ■— SSA— 5 S g = SSj — SS2 — S5g 4" SS4 t
11) ди сп ерси ю |
&А |
|
|
|
SA = 3SA /(* — •); |
||
12) ди сп ерси ю |
&в |
|
|
|
s2a |
= S y |
m - l ) ; |
13) ди сп ерси ю |
&ош |
5 5 |
0CT |
|
2 |
||
|
S°m |
(k — 1) |
(m — 1) |
Результаты расчета удобно представлять в виде табл. 9.
(111.53)
(I I I .54)
(I I I .55)
(III .56)
(I I I .57)
Т а б л и ц а |
9. Двухф акторны й дисперсионный |
анализ (без |
повторения опытов) |
|||||||
И с т о ч н и к |
Ч и с л о с т е п е н е й |
|
|
|
|
|
М а т е м а т и ч е с к о е |
|||
д и с п е р с и и |
|
с в о б о д ы |
С у м м а к в а др а т о в |
С р е д н и й к в адр ат |
о ж и д а н и е с р е д |
|||||
|
|
|
|
|
|
|
|
н е г о |
кв адр ата |
|
|
|
|
|
|
|
S S j |
|
|
|
|
A |
к - |
1 |
ssA = SS2 - b |
c2 |
= |
--------- d -------- |
т о А |
+ а о ш |
||
А |
|
к - |
1 |
|||||||
|
|
|
|
|
|
|
|
|||
|
|
|
s s B = s s 3 - SS± |
|
|
SSp |
|
к& в |
|
|
В |
т |
- 1 |
s 2 |
= |
B |
1 |
+ |
о 0Ш |
||
|
|
|
|
В |
|
m - |
|
|
|
|
Остаток |
(*-1) ( " > - ! ) |
SS0CT — SSi — |
3 |
|
■SSO C T |
|
_ 2 |
|
||
|
|
|
SS2 ~~ s s 3 + |
* ° Ш _ |
( * - l ) ( m - l ) |
|
° о ш |
|||
|
|
|
|
|
|
|
|
|
||
|
|
|
+ s s 4 |
|
|
|
|
|
|
|
Общая |
к т - 1 |
SSoQiu. = SS, — |
|
|
|
|
|
|
|
|
сумма |
|
|
- s s 4 |
|
|
|
|
|
|
|
Установив при помощи дисперсионного анализа значимость влияния данного фактора, выясняют затем при помощи критерия Стьюдента или рангового критерия Дункана, какие именно средние значения у различны.
Линейная модель (III.29) справедлива, если между факторами А иВ нет взаимодействия. В противном случае этому взаимодействию как фактору
присуща своя дисперсия ojfB. Взаимодействие ЛВ, о%в служит мерой того, насколько влияние фактора А зависит от уровня фактора В, и наобо рот, насколько влияние фактора В зависит от уровня А. В приведенном алгоритме при наличии взаимодействия между факторами , как со ставная часть, входит в дисперсию 5§ш. Выделить &ав можно только при наличии параллельных наблюдений.
Пусть при каждом сочетании уровней факторов А и В проводится п параллельных опытов. Так, в табл. 7 в ячейке, образованной пере сечением /-го столбца и 7-й строки, имеется целая серия наблюдений yvi, yiJ2, ..., yUn. Сохраним обозначение yV за средним результатом в ячейке. Выборочная дисперсия результатов в каждой ячейке
п
(III.58)
и=
имеет п—1 степень свободы. Если выборочные дисперсии по всем ячейкам однородны, их можно усреднить и использовать полученную средневзвешенную дисперсию
k т
(III.59)
в качестве оценки для дисперсии воспроизводимости а2. Число степеней свободы ш равно тк(п—[). Более удобная формула для вычисления дисперсии воспроизводимости
k т
(III.60)
mk(n — 1)
где y.j —сумма наблюдений в //-й ячейке.
При проведении дисперсионного анализа для нелинейной модели удобно использовать следующий алгоритм расчета. По табл. 7 находят: 1) суммы наблюдений в каждой ячейке
|
п |
(III.61) |
|
у ц = 2 |
|
|
j — 11 2 , ... | тпр i — l f 2, ... |
р k % |
2) |
квадрат сумм наблюдений в каждой ячейке |
|
|
|
(III.62) |
3) |
итоги по столбцам |
|
тп п
кп
|
|
^ |
= 2 |
2 |
уни* |
|
|
|
|
|
|
1= |
1 U— 1 |
|
|
|
|
5) сумму всех наблюдений (общий итог) |
|
|
||||||
k |
т |
п |
|
|
к |
|
т |
( I I I . 65) |
2 |
2 |
2 |
Ун* = |
2 |
А*— |
2 Bi' |
||
i= 1 /= 1 |
и= 1 |
|
i= I |
|
/= 1 |
|
||
6) сумму квадратов всех наблюдений |
|
|
|
|||||
|
|
|
k |
т |
п |
|
|
( I I I . 66) |
|
s s i= |
2 |
2 |
2 |
у2ш ' |
|
,= 1 / = 1 и=1
7)сумму квадратов итогов по столбцам, деленную на число наблюде
ний в столбце,
1
S S 2 = — mn
k |
|
|
У4 |
( I I I . 67) |
|
V . |
А* \ |
i= 1
8) сумму квадратов итогов по строкам, деленную на число наблюде
ний в строке, |
т |
|
<ш -“ > |
|
/= 1 |
9) квадрат общего итога, деленный на число всех наблюдений (коррек тирующий член),
к т п |
^а |
|
|
|
|
|
|
УШ |
|
|
|
|
|
SSA= -(1=1 /=1 и=\ |
|
At = |
1 |
|
Bj I ; ( I I I . 69) |
|
N |
|
|
|
mkn |
i=i |
|
10) сумму квадратов для столбца |
|
|
|
|
||
|
|
|
|
|
||
|
SSA = SS2 |
— S S 4 I |
|
|
(111.70) |
|
11) сумму квадратов для строки |
|
|
|
|
|
|
|
SSB = SS3— S S 4 ; |
|
|
(111.71) |
||
12) сумму квадратов для дисперсии воспроизводимости |
|
|||||
|
|
к |
т |
|
|
|
|
|
S |
%уи |
|
|
|
|
s s oul- s S l— |
^ |
— |
: |
|
(111.72) |
13) общую сумму квадратов, равную разнице между суммой квадра тов всех наблюдений и корректирующим членом,
5 5 0бщ = 5 5 1 - 5 5 4 ; |
(П1.73) |
14) остаточную сумму квадратов отклонений для эффекта взаимо действия АВ
S A — S S A /(Ь— l);
16) дисг^ерсию j2в
sB = SSB/(m— ‘);
17) Дисперсию &АВ
2
SjiB~ (k— 1) (m— 1) ’ 18) дисперсию воспроизводимости
2 SSoill s°w~ mk (n — 1)
( I I I . 7 5 )
( I I I . 76)
( I I I .77)
( I I I . 78)
Проверка гипотезы 0 значимости взаимодействия факторов А и В проводится по / ’-критерию одинаково для моделей со случайными и фиксированными уровнями. Однако проверки гипотез о значимости факторов А и В проводят неодинаково для разных моделей. В табл. 10 приведен двухфакторный дисперсионный анализ с повторными опытами для модели со случайными уровнями.
Т а б л и ц а 10. Двухфакторный дисперсионный анализ для модели со случайными уровнями (с повторными опытами)
Ис т о ч н и к
ди с п е р с и и
AB
Остдток
(ошибка)
Общая
сумма
Ч и с л о с т е п е н е й |
С у м м а к в адр атов |
С р е д н и й к в адр ат |
с в о б о д ы |
к- 1
т- 1
(к- 1) (m- 1)
m k ( n - 1)
SSA = SS2 — SS4
SSB = SSs - SSA
SSAB = -
— SS2 — SS3 +
+ SSA
$ ? 2 f-i
|
SSA |
|
к - 1 |
4 - |
SS R |
m- 1 |
|
|
SSA B |
A B |
( к - 1) ( m - 1) |
s2 = • |
m k ( n - 1) |
|
mkn - 1 |
*^общ ~ SSi |
|
- S S A |
М а т е м а т и ч е с к о е о ж и д а н и е с р е д н е г о кв адр ата
птаА +ПаЛ В + 0 ош
nko£+ +Оош
Я% +«ш
Из табл. 10 видно, что для оценки значимости фактора А необходимо составить дисперсионное отношение вида