книги / Оптимизация эксперимента в химии и химической технологии
..pdfразложить на составляющие, которые характеризовали бы вклад, фактора А и фактора случайности. Фактор случайности при этом легко оценить благодаря наличию повторных опытов на каждом уровне. Определим выборочную, дисперсию на каждом уровне:
П
— У (Уи — Уl)2 = |
1 |
у Ь |
(in.б) |
|
п — 1 |
||||
п — 1 ^ |
L |
|
||
1 |
|
|
||
<•=1,2,..., |
|
|
||
Ес^и нет уверенности в равноточности экспериментов, |
однород |
|||
ность дисперсий s I2, s22, ..., S/t2 |
можно проверить по критерию Кох- |
|||
рена (см. гл. П, 13). |
|
|
|
Если между дисперсиями нет значимых различий, для оценки генеральной дисперсии а2, характеризующей фактор случайности, используют выборочную дисперсию 52ош :
J ___ |
[ k n |
k / n \ 2 n |
|
§S*-v§(S-)]' (HI-7) |
|||
Snit» — .S; = k ( n - l ) |
Число степеней свободы дисперсии s2om равно k(n—1) = N —k. При ближенную оценку для дисперсии фак+ора А можно получить сле дующим образом:
°A ~ S2~ S210и. (Ш*8)
Более точную оценку для ста2 можно получить, рассматривая от клонения средних уг на отдельных уровнях от общего среднего всей выборки у. Действительно,
£-1 |
(Ш*9) |
|
|
Отсюда |
|
(У1 — У)2 — |
(Ш .10) |
Дисперсия фактора А для модели с фиксированными уровнями ( ста2) не связана ни с какой случайной величиной, это условное название для математического ожидания среднего квадрата откло нений, обусловленного влиянием фактора А. Такое обозначение удобно, так как определяет рассеяние, вызванное влиянием фак тора А аналогично показателю влияния случайного фактора, что позволяет непосредственно сравнивать фактор А с эффектом слу чайности. Введем также следующее обозначение:
k |
|
5л = - ^ 7 ^ ] ( < / < - 4 Г)2~ пол + » ош- |
(Ш-11) |
Эта дисперсия имеет k—1 степеней свободы. Если дисперсия значимо отличается от 52ош, нулевая гипотеза mi = m2= =тц=гп отвергается, и влияние фактора А считается существенным. Проверяется нулевая гипотеза по критерию Фишера. Так как альтернй' тивой (Та2= ог2ош является неравенство аА2> о20ш, Для проверки гИ' потезы применяется односторонний критерий Фишера. Влияние фактора А считается значимым, если
s2
— |
> Fi - p ( f u / 2), |
(III.12) |
5 ош |
|
|
/ 1=^— 1,
f 2 = k ( n — 1) = N — k.
Дисперсионный анализ можно провести по следующему алгО' ритму: подсчитывают 1) итоги по столбцам
Ai = ^ y jr , |
(Ш.13) |
2) сумму квадратов всех наблюдений
(шл4)
/-1 7-1
3) сумму квадратов итогов по столбцам, деленную на число на блюдений в столбце,
SS2 = |
А2- |
(III. 15> |
4) квадрат общего итога, деленный на число всех наблюдений (корректирующий член),
|
|
|
|
(Ш. 16) |
5) |
сумму квадратов для столбца |
|
|
|
|
SSA = SS2 — SS3; |
|
(III. 17) |
|
6) |
5S06m — общую сумму квадратов, равную |
разнице |
между |
|
суммой квадратов всех наблюдений |
и корректирующим членом, |
|||
|
SS06m = SSi - |
SS3; |
|
(III. 18) |
7) |
5 5 0ст —остаточную сумму квадратов для |
оценки |
ошибки |
|
эксперимента |
|
|
|
8) |
дисперсию S A 2 |
|
2 |
S$A . |
|
|
|
|
|
|
|
|
|
|
|
|
(III.20) |
||
|
|
|
SA~ k - i ’ |
|
|
|
|||
|
|
|
|
|
|
|
|||
9) |
дисперсию s2om |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
*^*^ост |
|
|
(III.21) |
|
|
|
|
|
|
|
|
|
|
|
Результаты расчета обычно представляются в виде таблицы дис |
|||||||||
персионного анализа |
(табл. 6). |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
Т а б л и ц а б |
|
|
Однофакторный дисперсионный анализ (с равным числом |
|
|||||||
|
|
|
повторений опытов) |
|
|
|
|||
Источник |
Число степеней |
|
|
Средний квадрат |
Математическое |
||||
дисперсии |
свободы |
Сумма квадратов |
ожидание |
среднего |
|||||
|
|
|
|
|
|
|
|
квадрата |
|
A |
|
k - 1 |
SSA = |
SS2 |
— *$*$з |
2 |
S$A |
2 . |
2 |
|
|
k - \ |
п°А + |
°ош |
|||||
|
|
|
|
|
|
|
|
|
|
Остаток |
|
* ( п - 1 ) |
S S OCT = |
*^*^1 — *^*^2 |
2 |
S S QCT |
9 |
|
|
|
5 ош - |
Л(П_ 1} |
ОШ |
||||||
|
|
|
|
|
|
|
|
о“ |
|
Общая сумма |
kn — 1 |
55обш ^ |
SS\— SS$ |
5 5 0бш |
|
|
|||
kn — 1 |
|
|
|||||||
|
|
|
|
|
|
|
|
Если отношение sA2/s20m^:Fi-p, то влияние фактора А следует считать незначимым. При этом общая дисперсия s2 связана только с фактором случайности и может служить оценкой для дисперсии вопроизводимости. Такая оценка лучше, чем (III.7), так как имеет большее число степеней свободы, равное kn—1. При интерпретации результатов дисперсионного анализа необходимо иметь в виду, Фго очень низкое значение дисперсионного отношения может быть свя зано с тем, что влияние какого-то важного неконтролируемого в ходе эксперимента фактора не было рандомизировано. Это может увеличить дисперсию внутри уровней, а дисперсию между уровня ми оставить неизменной, что уменьшает дисперсионное отношение.
Результаты экспериментов при этом не подчиняются |
модели |
(III.1). |
между |
Если же справедливо неравенство (III. 12), различие |
дисперсиями sA2 и 52ош значимо и, следовательно, значимо влияние фактора А. Определим оценку влияния фактора А из (III.11):
sA—sn
При этом нулевая гипотеза |
mi = m2= =/n/t= m отвергается, и раз |
личие между средними т\, |
т2, ..., тк следует считать значимым. |
Для выяснения вопроса, какие именно средние различны, применя ются критерии Стьюдента, Фишера или ранговый критерий Дун кана (см. гл. II, 14).
При интерпретации результатов дисперсионного анализа для мо дели со случайными уровнями обычно интересуются не проверкой' гипотез относительно средних, а оценкой компонент дисперсий; В отличие от модели с фиксированными уровнями выводы по слу
чайной модели распространяются |
на .всю генеральную |
совокуп |
|||||||
ность уровней. |
|
|
|
|
|
|
|
|
|
Рассмотрим схему вычислений для разного числа параллельных |
|||||||||
наблюдений. Пусть на уровне |
а* проведено |
п\ |
параллельных на |
||||||
блюдений. Общее число всех наблюдений равно |
|
|
|||||||
|
|
|
*: = 2 1ni' |
|
|
|
|||
Определим: 1) итоги по столбцам |
|
|
|
|
|
||||
|
|
ni |
|
|
|
|
|
|
|
|
A i = |
2 |
УЛ |
1 |
~ |
2 , . . . , |
k\ |
|
(II I .23) |
|
|
]=i |
|
|
|
|
|
|
|
2) суммы квадратов всех наблюдений |
|
|
|
||||||
|
|
SSX1 = 2 |
2 |
|
|
|
(Ш .24) |
||
|
|
|
|
/=1 ;=1 |
|
|
|
||
3) |
сумму квадратов |
итогов |
по столбцам, |
деленных |
на число |
||||
наблюдений в соответствующем столбце |
|
|
|
||||||
|
|
|
|
ft |
|
Л2 |
|
|
|
|
|
SS2 = |
^ - ^ - ; |
|
|
(ИГ.25) |
|||
|
|
|
|
'i=i |
‘ |
|
|
|
|
4) |
квадрат общего итога, деленный на число всех наблюдений |
||||||||
|
|
SS3 |
|
|
|
|
|
|
(III.26) |
Дальнейшие расчеты проводятся по формулам |
(III.17) — |
||||||||
(III.21). Если дисперсии sA2 и s2om значимо |
отличаются |
друг от |
|||||||
друга, дисперсию фактора А вычисляют по формуле |
|
||||||||
|
’ |
— |
-}г |
~ |
( 4 - 4 H)- |
|
|
(ш -27> |
I=»1
Пример 1. Рассмотрим применение однофакторного дисперсионного анализа для выяснения влияния вида галоидного алкила (фактор А) на процесс ради кальной полимеризации. Изучалось влияние на выход полимера (у %) пяти раз-
84
личных галоидных алкилов: CH3I (a\)t C3H7I (а2), С4Н91 (а3), С2Н5Вг (аА) у
С3Н7Вг (а5). Результаты эксперимента с различными галоидными алкилами (фик сированные уровни фактора А) приведены в таблице.
Номер |
|
|
Уровни фактора А |
|
|
наблюде |
Д, |
аг |
03 |
04 |
08 |
ния |
|||||
1 |
79,80 |
87,30 |
42,45 |
76,0 |
70,70 |
2 |
86,30 |
69,60 |
64,3 |
83,5 |
64,65 |
3 |
86,50 |
81,75 |
78,9 |
* 72,80 |
38,50 |
4 |
92,30 |
77,95 |
61.,00 |
89,00 |
77,00 |
5 |
76,50 |
83,65 |
31,30 |
76,50 |
91,50 |
6 |
87,05 |
64,80 |
72,85 |
87,45 |
68,00 |
7 |
82,50 |
67,30 |
58,65 |
74,50 |
38,05 |
8 |
90,00 |
75,45 |
52,50 |
93,15 |
79,95 |
Итоги |
А\ = 680,95 |
А2 = 607,8 |
Из = 461,95 |
А* = 652,9 |
А5 = 528,35 |
|
i |
|
|
|
|
Определим средние значения выхода для каждого галоидного алкила:
- |
680,95 |
_ |
607,8 |
„ |
_ |
- |
461,95 г_ |
- |
652,9 |
1/1 = |
— z— = 85,1; |
\У2 = |
~— = |
7э,97; |
'1/з = |
— — = 57»74; У4 = |
8 |
||
|
|
|
|
|
|
|
|
|
|
|
|
= |
81,61; |
_ |
528,35 |
|
|
|
|
|
|
i/5= — |
= 66,04 |
|
|
и общее среднее для всех результатов
5
/-1
Для облегчения ^вычислений будем вместо значений у рассматривать отклог нения у1 этих значений от величины, близкой к общему среднему всех результа
тов, равной 73 (см. таблицу).
Номер |
|
|
Уровни фактора А |
|
|
наблюде |
|
а2 |
|
|
|
ния |
|
0з |
а\ |
* |
|
1 |
6,8 |
14,3 |
—30,55 |
з,о |
—2,3 |
2 |
13,3 |
—3,4 |
- 8 , 7 |
10,5 |
- 8 ,3 5 |
3 |
13,5 |
8,75 |
5,9 |
- 0 , 2 |
—34,5 |
4 |
19,3 |
4,95 |
—12,0 |
16,0 |
4,0 |
5 |
3,5 |
10,6544 |
—41,7 |
3,5 |
18,5 |
.6 |
14,05 |
—8,2 |
—0,15 |
14,45 |
—5,0 |
7 |
9,5 |
—5,7 |
— 14,35 |
1-,5 |
—34,95 |
8 |
17,0 |
2,45 |
- 2 0 ,5 |
20,15 |
6,95 |
Итоги |
96,95 |
23,8 |
—122,05 |
68,9 |
- —55,65 |
А
По данным таблицы проведем вычисления по формулам (III.14) — (III.21) в соответствии с вышеприведенной схемой. Результаты расчета представлены & таблице.
Источник дисперсии |
Число степеней |
Сумма квадратов |
Средний квадрат |
свободы |
|||
А |
4 |
4084,5 |
1021 |
Ошибка |
35 |
5281,46 |
150,9 |
Общая сумма |
39 |
9365,96 |
|
Полученные в результате расчета дисперсии сравним по критерию Фишера:
F = |
S 2A |
1021 |
|
6,9. |
|
|
|
150,9 |
По табл. 5 приложения находим |
F0I95(4,35) =2,65. Так как F>2,65, различие |
галоидных алкилов следует признать значимым. Установив при помощи диспер сионного анализа тот факт, что средние значения выходов полимера в целом •существенно различаются между собой, перейдем к сравнению влияния отдельных
галоидных |
алкилов. Проведем это сравнение |
по критерию |
Дункана |
(см. |
гл. II, 14) |
с доверительной вероятностью (5 = 0,95. |
Нормированная |
ошибка |
сред |
него равна |
|
|
|
|
Расположим средние значения в порядке возрастания их величин и выпишем из табл. 7 приложения значимые ранги для /= 3 5 и р = 0,05:
^ Q H g l ) |
,У5(Сз Н7В г) |
У 2(С зН71) |
У4 (С2Н5Вг) |
у а(СН31) |
|
Р |
66,04 |
75,97 |
^ |
81,61 |
85,1 |
2 |
3 |
4 |
5 |
||
ранги, г |
2,875 |
3,025 |
|
3,11 |
3,185 |
ранги, умножен |
|
|
|
|
|
ные на нормиро |
|
|
|
|
|
ванную ошибку, |
12,5 |
13,2 |
|
13,52 |
13,9 |
Г-5— |
|
||||
У |
|
|
|
|
|
У\ —_^з = 27,3> 13,9 — различие значимо Ул — Уь= 19,05> 13,52 — различие значимо У\ —J/2= 9,13< 13,2 — различие незначимо
У\ —^4 = 3,49<12,5 — различие незначимо У\ —j/з= 23,81 > 13,52 — различие значимо J/4 — Уъ= 15,56> 13,2 — различие значимо У\ — У2= 5,64<12,5 — различие незначимо У2—Л3= 18,17> 13,2 — различие значимо У2 Уъ= 9,92< 12,5 — различие незначимо
Уъ — */з = 8,25< 12,5 — различие незначимо
3. Двухфакторный дисперсионный анализ. Изучается влияние на процесс одновременно двух факторов А и В. Фактор А исследу ется на уровнях аь а2} ..., а/*, фактор В — на уровнях b\, Ь2, ..., Ьт. Допустим, что при каждом сочетании уровней факторов А и В про водится п параллельных наблюдений (табл. 7).
А
В |
|
|
|
|
|
|
а г |
|
Аз |
||
b i |
0111» |
Уи2 |
1/211» |
1/212 |
|
|
Упп |
|
|
||
|
|
|
1/21л |
||
|
W |
|
|
|
|
|
У121, |
У122 |
1/221» |
1/222 |
|
Н |
• • • * У\2п |
• • • » |
1/22/1 |
||
|
|||||
|
\1 |
|
|
|
|
|
l/l/ Ь |
У\]2 |
1/2/1» |
1/2/2 |
|
b J |
• • • » УЦп |
• • • » |
1/2/л |
||
|
|||||
Ьт |
У\т\* 1/1m2 |
У2т1 » 1/2ш2 |
|||
• • • » У\тп |
• • • 1 |
1/2тл |
|||
|
|||||
Итоги |
А |
|
^ 2 |
|
|
|
Итого |
"i |
|
ак |
Уill у |
У112 |
Уklli УЫ2 |
|
УПп |
Умп |
У/21» |
1//22 |
Ук21» Ук22 |
|
|
в 2 |
•••» |
1//2Л |
• • • » Ук2п |
1///1» |
Уij2 |
УкЛ, Ук ) 2 |
|
|
By |
• • • » |
1///Л |
• • • . 0АУп |
Уiml 1 Уim2 |
1/Лт1» Укт2 |
|
• • • » Ушп |
|
В т |
• • • » |
l/ft/пл |
|
м |
Л |
|
Общее число наблюдений равно N —nkm. Результат наблюдения можно представить в виде следующей модели:
yijq = Р- + О/ + Ру + О/Ру + eljqt (III. 28)
где р. — общее среднее; Oj — эффект фактора А на г-м уровне, i = = 1, 2, , k; ру — эффект фактора В на /-м уровне, / = 1, 2, , т\ а,Ру — эффект взаимодействия факторов.
Эффект взаимодействия представляет собой отклонение средне го по наблюдениям в (t/)-ft серии от суммы первых трех членов в модели (111.28), а гцд (q= 1, 2, ..., п) учитывает вариацию внутри серии наблюдений (ошибка воспроизводимости). Будем полагать, как и прежде, что гцд распределена нормально с нулевым матема тическим ожиданием и дисперсией о20ш. Если предположить, что
между факторами нет взаимодействия, то можно |
принять линей |
ную модель: |
(III.29> |
0 /у =(* + «/ + Ру+ Е/у. |
Эта модель обычно применяется при отсутствии параллельных наблюдений (табл. 8).
А
в |
<*1 |
ал |
°k |
Итоги |
|
' |
|||
Ьх |
Уи |
У21 |
Ук\ |
Вх |
bo |
У12 |
У22 |
У k2 |
В2 |
Ьт |
У\т |
У2т |
Уkm |
Вт |
Итоги |
Ах |
Аг |
Ak |
|
Рассмотрим вначале линейную модель (III.29). Через Tji п у /
.обозначим средние, соответственно, по столбцам и по строчкам:
Ух — |
At |
» |
(Ш. 30) |
|
т |
||||
|
||||
~У) = |
Bj |
|
(III.31) |
|
к |
’ |
|||
|
‘через у — среднее всех результатов:
(III.32)
/ - 1 i-i
Рассеяние в_средних по столбцам у ь г/2, ... , ук относительно об
щего среднего у не зависит от фактора В, так как все уровни фак тора В усреднены. Это рассеяние связано с влиянием фактора А и случайного фактора. Так как дисперсия среднего (см. гл. II, 5) в т раз меньше дисперсии единичного измерения, имеем
1 |
k |
о2 |
|
|
|
||
k — 1 |
^ (yi — У)2 |
+ т |
(Ш. 33) |
|
1-\ |
|
|
В свою очередь рассеяние в средних по строчкам не зависит от фактора А и связано с влиянием фактора В:
т
J-l
Равенства (III.33) и {III.34) позволяют оценить влияния факто ров А и В, если известна оценка дисперсии а2. Чтобы оценить фактор случайности при отсутствии параллельных наблюдений, по-
ступим следующим образом. Найдем дисперсию |
наблюдений па |
|
i-му столбцу: |
т |
|
|
|
|
*? = ■ |
(Mil— Hi)2- |
(III.35> |
Эта дисперсия обусловлена влиянием фактора В и фактора случай ности
Равенство станет более точным, если вместо Sj2 использовать, средневзвешенную дисперсию по всем столбцам:
|
|
■2 , J1, |
|
|
k |
т |
|
|
|
|
|
|
|
( У Н - У д 2- |
|
(Ш-Зб> |
|
|
|
|
|
|
|
|
||
|
|
|
|
i=i |
<=1 |
)=1 |
|
|
Вычитая (III.35) из (III.34), получим |
|
|
|
|||||
|
а2 |
1 |
1кk |
тТП |
|
т |
|
|
" |
k |
~ k ( m — 1)________ |
|
i-i |
|
|
||
|
|
|
с=1 |
j=i1 |
|
|
|
|
Отсюда |
|
|
|
|
|
|
|
|
|
О2 ~ |
(6— 1) (/га |
[ kя |
ТПm |
m |
- | |
(III.38) |
|
|
|
|
i = i |
^ = i |
; = i |
J |
|
|
|
|
|
|
|
Обозначим полученную оценку (III.38) для дисперсии s20tu. Число степеней свободы s20m равно (k— \){m —1). также следующие обозначения:
•k
О |
ТП |
\^1 |
— |
== |
о |
9 |
S/,~ |
* - l |
^ |
(i/i- '/)2~ w o A + s-UI, |
|||
|
|
i-1 |
|
|
|
|
|
|
ТП |
|
|
|
|
4 = |
m _ |
1 ] S |
( ^ |
_ y )2* |
ftea + s2n.- |
о2 через: Введем
(III.39)
(III.40)
Величины 5а2 и sB2 можно |
считать |
выборочными дисперсиями, с |
(й— 1) и (т— 1) степенями |
свободы |
соответственно. Проверяют |
нулевые гипотезы о незначимости влияния факторов А и В по кри
терию Фишера. Если дисперсионное отношение
F - |
SA |
Fi_p(/i, / 2), |
< |
4ш
(III.4J)
/1 = Л— 1; / 2 = ( * ~ 1)(/П— 1),
принимается гипотеза Н0: cti = 0. Если
Р = — > Px-pUu fi), |
(III.42) |
®ощ |
|
нулевая гипотеза отвергается, и влияние фактора А считается зна чимым. Аналогично, если
Р : —г~ < Pi-pUu fi),
som
(III.43)
fi = т— 1; f 2 = ( k - l ) ( m - l ) ,
принимается гипотеза H0: Pj = 0. При справедливости неравенства
F = |
> Р\-Р |
(III. 44) |
влияние фактора В считается значимым. При проверке нулевых ги потез' применяется односторонний критерий Фишера, так как аль тернативой равенству о а 2 = о 2ош служит неравенство оА2> о2ош- При проведении дисперсионного анализа в условиях линейной мо дели (III.29) удобно использовать следующий алгоритм расчета. Находят: 1) итоги по столбцам
А/= 2 уи , 1=1, 2......к, |
(III.45) |
2) итоги по строкам
в ) = ^ У ц , J =1>2...... |
т< |
(Ш.46) |
/-1 |
|
|
3) сумму квадратов всех наблюдений
k* |
т |
(III.47) |
s s x= 2 |
2 Уи> |
|
1-U- 1 |
|
4) сумму квадратов итогов по столбцам, деленную на число на блюдений в столбце,
|
k |
SS2 = |
(III.48) |
5) сумму квадратов итогов по строкам, деленную на число на блюдений в строке,
т
SS3 = i - ^ B , 2; |
(III.49) |