Оптимизация эксперимента в химии и химической технологии
..pdfгде
|
|
|
п |
|
|
|
|
|
|
|
i2-l 91 |
|
|
|
|
|
|
|
|
п |
|
|
|
|
|
|
п |
ViPi (О |
|
|
|
|
|
а1 |
2 |
|
|
(IV .75) |
|
|
|
|
|
|
|
||
|
|
|
2 |
p \ w |
|
|
|
|
|
|
/2-1 |
9ip»(о |
|
|
(IV. 76) |
|
|
|
|
|
|
|
|
|
|
|
2 * 1 ( 0 |
|
|
|
|
|
|
|
/-г |
|
|
|
|
Суммы, стоящие в знаменателе, можно определить по сокращен |
|||||||
ной формуле: |
|
|
|
|
|
|
|
|
|
(ft!)2 П(П2 — 1) (п2 — 4). ■,(п2 _ Щ |
|||||
|
|
|
[(2Л — 1)!1]2 22ft (2k + |
1) |
(IV. 77) |
||
i=i |
|
|
|
||||
|
|
|
|
|
|
|
|
где (26—1)!! — произведение |
всех нечетных |
чисел |
от 1 до 2/е—1 |
||||
включительно. В частности, |
|
|
|
|
|
||
|
2 |
|
|
|
|
|
(IV .78) |
|
|
|
|
|
|
|
|
|
i - 1 |
|
|
|
|
|
|
|
|
|
л (п 2— 1)(и2 — 4) |
|
(IV. 79) |
||
|
|
2 ( ) |
|
180 |
|
|
|
|
/-1 |
|
|
|
|
||
|
|
|
|
|
|
|
|
V I |
Г 2 т |
п(п2- |
1) (Л2 - 4) (п2 - |
9) |
(IV. 80) |
||
^ |
3 ( |
’ |
|
2800 |
|
|
|
|
|
|
|
||||
/=1 |
|
|
|
|
|
|
|
V I „2 . ~ |
п ("2- |
1) (« 2- 4) (Ла - |
9) (п2 _ |
16) |
|||
4 ( ) ~ |
|
|
44100 |
|
|
(IV .81) |
|
|
|
|
|
|
|||
1-1 |
|
|
|
|
|
|
|
Эти суммы используются и для вычисления сумм SSh, нужных для определения остаточной дисперсии:
SSft = SSft-! — а\ 2 Р\ (О- |
(IV .82) |
/-1 |
|
Посде получения уравнения регрессии (IV.73) |
переменную 2 |
опять заменяют первоначальной переменной х. |
|
Пример 2. Требуется определить зависимость степени диссоциации а йоди стого водорода от температуры t. Экспериментальные данные приведены ниже.
t, ° С |
200 |
300 |
320 |
340 |
360 |
380 |
400 |
420 |
440 |
460 |
480 |
а |
0,178 |
0,182 |
0,186 |
0,191 |
0,196 |
0,202 |
0,207 |
0,213 |
0,220 |
0,228 |
0,236 |
Объем выборки /1=11. Температура фиксировалась через равные интервалы
20° (h=20).
Р еш ен и е . Применим метод Чебышева для получения уравнения регрессии степени диссоциации от температуры. Сделаем замену переменных по формуле
/ — 260
Одновременно для удобства вычислений заменим* а на у
£/ = 1000 (ot — 0,178).
Полученные значения z \, yi и полиномов Чебышева, посчитанных по формулам (IV.63), (IV.65) и (IV.66), в которые вместо х подставлены значения /= 1, 2,
11, приведены в таблице.
• Г 1 |
«1 |
Pi (О |
ytPx (О |
Рг{1) |
уf i d ) |
р »(П |
ух*МО |
1 |
0 |
—5 |
0 |
15 |
0 |
—36 |
0 |
2 |
4 |
—4 |
—16 |
6 |
24 |
7,2 |
28,3 |
3 |
8 |
~ 3 |
—24 |
—1 |
—8 |
26,4 |
24,2 |
4 |
13 |
—2 |
—26 |
—6 |
—78 |
27,5 |
358,8 |
5 |
18 |
—1 |
—18 |
—9 |
— 162 |
16,8 |
302,4 |
6 |
24 |
0 |
0 |
—10 |
—240 |
0 |
0 |
7 |
29 |
1 |
29 |
- N9 |
—261 |
—16,8 |
—487,2 |
8 |
35 |
2 |
70 |
—6 |
—210 |
—27,6 |
->96,6 |
9 |
42 |
3 |
126 |
— 1 |
—42 |
—26,4 |
—1108,8 |
10 |
50 |
4 |
200 |
6 |
300 |
- 7 ,2 |
—360 |
11 |
58 |
5 |
290 |
15 |
870 |
36 |
2088 |
2 |
281 |
|
631 |
|
193 |
|
67,2 |
Определим коэффициенты уравнения вида
У= а0Ро (*) + a\.Pi (г),
Ро(.г)= 1; ^1 (*) = * — 6.
По формуле (IV.74)
а0 = 281- = 25,6;о „
YJ
П
S (0 по сокращенной формуле (IV.78) равна
/-1
11 (121 — Г) = ПО,
12
|
|
|
|
|
631 |
|
с |
|
|
|
|
|
|
|
|
|
|
|
|
°' = П 5 - 5’73' |
|
|
|
|
|
|
|||||
Уравнение регрессии первого порядка имеет вид |
|
|
|
|
|
|
|
||||||||
|
|
|
у = 25,6 + |
5,73 ( г - |
6). |
|
|
|
|
|
|||||
Определим остаточную дисперсию |
s 20CT. Для |
этого |
по |
формулам |
(IV.7J) и |
||||||||||
(IV.82) вычислим суммы: |
|
и |
\ 2 |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
и |
|
_ |
|
|
|
|
|
|
78 961 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
s s o= |
У , У] |
|
И |
|
= |
10 843 — — - — |
= 3665, |
|
||||||
|
/-1 |
|
|
|
|
|
|
|
11 |
|
|
|
|||
|
|
и |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
S S x = S S 0 — а\ 2 р \ (0 = 3 6 6 5 — 5 »7 3 2 *1Ю = 53 , |
|
|
||||||||||||
откуда |
|
|
|
/=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
S S j |
__ _53_ |
|
5 9 |
|
|
|
|
||||
|
|
|
2 |
_ |
|
|
|
|
|
||||||
|
|
|
1ост |
л — 2 |
9 |
|
5,У' |
|
|
|
|||||
Определим теперь уравнение регрессии второго порядка |
|
|
|||||||||||||
|
|
У = |
а0Р 0 (z) + |
a i P i |
(z) + а2Р 2 (*)• |
|
|
|
|||||||
По формуле (IV.65) |
/М г) |
равно |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
Я 2 ( г ) |
= г 2 — \2 z |
4 - |
26. |
|
|
|
|
||||
По формуле (IV.79) |
находим |
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
и |
2 |
_ П ( 1 2 1 - 1 ) ( 1 2 1 - 9 ) _ |
|
|
|
||||||||
|
|
|
|
|
|
||||||||||
и определяем |
/=1 р 2 ( ° - |
|
|
|
180 |
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
fl2= i |
i |
= 0 ’225- |
|
|
|
|
|
||||
В результате получим уравнение регрессии второго порядка |
|
|
|||||||||||||
|
у = |
25,6 + |
5,73 (z — 6) + |
0 ,225 (*2 _ |
\<lz |
+ 26). |
|
|
|||||||
Определим остаточную дисперсию |
|
2 |
|
|
|
|
|
|
|
||||||
|
s2 |
ост: |
|
|
|
|
|
|
|
||||||
|
|
S S ) - a 2 2 |
Р \ (г) |
53 - |
0,2252-858 |
9,6 |
, 0 |
||||||||
|
S S 2 |
______________ j t i |
|
|
|
||||||||||
52 ост |
п — 3 |
|
|
п — 3 |
|
|
|
|
|
|
8 |
--- |
п |
--- * |
|
|
|
|
|
|
|
|
|
|
|
8 |
|
||||
Проверим значимость различия |
2 |
|
|
2 |
|
по критерию Фишера |
|||||||||
Sj ост и s 2 ост |
|||||||||||||||
|
|
|
|
F = |
|
|
|
1.2 |
|
4 9 |
|
|
|
|
|
|
|
|
|
s* |
|
|
|
' |
’ |
|
|
|
|
||
|
|
|
|
|
5 2 ост |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
^0.95 (9,8) = 3,4, |
|
|
|
|
|
F > F i-p V u h),
значит уравнение второго порядка является существенным уточнением уравнения первого порядка. Определим уравнение регрессии третьего порядка:
у = a0PQ(z) + aiPy(z) + а2Р2 (г) + а3Р 3( г ) .
Подставляя л=11 в формулу (IV.66), получим
Р 3 (г) = 23 — 18г2 + 90,2г — 191,1.
По формуле (IV.80) находим
V r |
« n |
11 (121 — 1) (121 — 4) (121 — 9) |
|
2 а |
Рз0)== |
---------------2 8 оо--------------- |
= 6177-7- |
/-1 |
|
|
|
откуда
67,2
д3 = — g ' = 0,0109, 177,6
и уравнение регрессии третьего-порядка имеет вид
у = 25,6 + 5,73 (г — 6) + 0,225 (*2 — 12^ -Н 26) Ч-
+ 0,0109 (*з + 18*2 + 90* — 191,1).
Проверим существенность перехода от уравнения регрессии второго порядка к уравнению третьего порядка. Для этого определим
SS2 — а \ у , p h i )
|
SS3 |
fZi |
____ |
9 ,6 — 0,01092.6177,6 |
8,9 |
|
S3 ост |
п — 4 |
п — 4 |
|
|
|
= “7=1,27, |
|
|
|
|
|
||
|
|
*3 |
ост |
> s; |
|
|
|
|
|
2 ост* |
|
Следовательно, нужно остановиться на регрессии второго порядка. Делая обратную замену у и г на а и /, получим
ft — 260 \
1000(а — 0,178) = 25,6 + 5,73 ( — —— — б) +
20
t — 260\2 |
|
t — 260 + 26j |
|
K |
12 |
|
|
— |
) “ |
20 |
|
|
|
|
и окончательно
а = 0,1731 — 0,000139/ + 0,00000056/2.
Полученное уравнение является окончательным в классе полиномов. OiieifoM тесноту найденной связи при помощи корреляционного отношения (IV.89):
9 = K i - e ,
ss2 |
9,6 |
£ = ■SSn |
= 0,00272, |
3665 |
b= V 1 — 0,00272 = 0,986.
Корреляционное отношение 0 близко к 1, следовательно, найденная связь близка к строго функциональной.
8. Трансцендентная регрессия. При малых объемах выборки п увеличение порядка полинома может привести к росту остаточной дисперсии. Чтобы уменьшить число определяемых коэффициентов, используют трансцендентную регрессию. Вычисление коэффициен тов трансцендентной регрессии может оказаться весьма трудоем ким вследствие необходимости решать систему нелинейных уравне ний. Вычисление упрощается,, если провести замену переменных. Например, зависимости показательного типа и дробно-степенного
У= Ъ0Ьf, |
(IV.83) |
У= bascbl |
(IV.84) |
линеаризуются логарифмированием: |
|
Ig У= !g b0 + х Ig bi, |
(IV.85) |
ig У= ig *o + bi Ig |
(IV.86) |
положив
Ig У = z , lgb0 = a и lg^i = аи 1g x = t,
получим линейные уравнения относительно новых переменных:
z = a0 + агх, z = aQ+ bit.
Коэффициенты Яо, Яь определяются по методу наименьших квадратов. По полученным яо и а\ определяются коэффициенты Ь0 и Ь\. Однако следует иметь в виду, что полученные таким образом коэффициенты уравнений регрессии (IV.83) и (IV.84) являются смещенными оценками для соответствующих генеральных коэффи циентов.
9. Оценка тесноты нелинейной связи. Если считать, что уравне ние регрессии найдено с достаточной точностью, то остаточная дис персия обусловлена только наличием дисперсии воспроизводимо сти, т. е.
|
|
|
лвоспр* |
.(IV.87) |
Чем меньше доля |
2 |
2 |
в общей |
о |
5ОСт ~ 5 Воспр |
дисперсии sy2, тем |
|||
сильнее связь между |
У и X, |
так как меньше |
доля случайности в |
этой связи. Поэтому силу связи можно характеризовать величиной
|
( П — О ^ с т |
|
£ — |
(Л — 1)4о » |
|
где |
|
(IV.88) |
2 _ |
2 |
(yi —Ui)2 |
_/_1---------------- |
||
ост — |
|
„ _ 7 |
|
2 |
<.У1-у)2 |
7 - 1
и
п
Связь тем сильнее, чем меньше £. Величина
V l - £ = 0 |
(IV .89) |
называется корреляционным отношением. Чем больше 0, тем силь нее связь
0 < 0 < 1. |
(IV. 90) |
Если 0=1, то существует функциональная |
зависимость между |
параметрами. Однако при 0= 0 величины У и X нельзя считать не зависимыми, так как связь между ними, не сказываясь на диспер сиях, может проявить себя в моментах более высокого порядка. И только лри нормальном распределении равенство нулю корреля ционного отношения однозначно свидетельствует об отсутствии связи между случайными величинами. Корреляционное отношение, как и коэффициент корреляции в линейной регрессии, характеризу ет тесноту связи между случайными величинами*. Вообще анализ силы связи по 0 называют корреляционным анализом.
При линейной регрессии корреляционное отношение равно ко эффициенту корреляции:
= |г* I |
(IV .91) |
10. Метод множественной корреляции. Если необходимо иссле довать корреляционную связь между многими величинами, то поль зуются уравнениями множественной регрессии:
У — ^0 + Ь\х \ + ^2Х2 "Ь |
"Е bkxk • |
(IV .92) |
Уравнение (IV.92) представляет собой поверхность регрессии при k = 2 и гиперповерхность при /е>2. Эту поверхность называют поверхностью отклика. При построении поверхности отклика на координатных осях факторного пространства откладываются чис ленные значения параметров (факторов). Исходный статистиче ский материал представлен в табл. 26.
Перейдем от натурального масштаба к новому, проведя норми ровку всех значений случайных величин по формулам:
где г/j0, x°ji — нормированные значения соответствующих факторов; у, xj — средние значения факторов; sy, sXj — среднеквадратичные отклонения факторов:
S y =
|
п |
2 (г/г-</)2 |
2 (•*;< — xj)2 |
1=1_______ |
|
п — 1 |
п — 1 |
|
Т а б л и ц а 26 |
И сходны й стати сти ч ески й |
м ат е р и ал в |
н а ту р а л ьн о м |
м ас ш та б е |
|
||
Номер опита |
Xi |
Ха |
х9 |
|
xk |
У |
1 |
*11 |
*21 |
*31 |
|
*Л1 |
Ух |
2 |
*12 |
*22 |
*32 |
|
** 2 |
У2 |
3 |
*13 |
*23 |
*33 |
|
**з' |
Уз |
п |
* 1 п |
*2п |
* 3 л |
. |
* * л |
Уп |
В табл. 27 приведен исходный статистический материал в но вом масштабе:
Т а б л и ц а 27
И сходны й стати сти ч ески й м ат е р и ал в б е зр а зм ер н о м м ас ш та б е
Номер опыта |
А |
'S |
|
|
i A |
|
,0 |
|
|
• |
x k |
||||
1 |
Ах |
JL*0 |
|
|
*31 |
x kX |
|
2 |
*12 |
|
|
x ° |
JL-0 |
||
|
* 2 2 |
|
|
x 32 |
x k2 |
||
3 |
V0 |
JL»0 |
|
|
jk° |
r° |
|
|
* 1 3 |
*23 |
|
|
*33 |
Xk3 |
|
п |
л:0 |
X2n |
|
|
v° |
x kn |
|
|
■*1/1 |
|
|
*3/1 |
|||
В новом масштабе имеем: |
|
|
|
|
|
||
|
*5 = |
0, i/o = 0 и so |
= 1 , 5^о= |
1. |
|||
|
|
|
|
|
хJ |
|
|
Выборочный коэффициент корреляции при этом равен |
|||||||
|
* |
|
1 |
п |
|
||
|
|
2 |
|
||||
|
y ° X j |
Л — 1 |
|
||||
|
|
|
|
|
i■=»! |
|
|
|
|
п |
|
|
|
|
|
|
го о |
2 |
Ч |
д-° |
|
/, т — 1, |
k , |
|
к1хт |
mi |
|
I > т. |
|
||
|
|
/-1 |
|
|
|
|
yo
A
A
A
A„
(IV .94)
(IV .95)
Вычисленный по формуле (IV.95) выборочный коэффициент корреляции равен коэффициенту корреляции между переменными,
выраженными в натуральном масштабе гух^ ^х]хт- Уравнение
регрессии между нормированными переменными не имеет свобод ного члена и принимает вид
уО = (цх^ + а2Х2 + |
+ a kxl. |
(IV .96) |
Коэффициенты уравнения (IV.96) находятся из условия
(y°i— ^/)2= min •
i=\
Условия минимума функции S определяются |
так же, как для |
||
зависимости от одной переменной: |
|
|
|
dS |
dS |
dS |
(IV. 97) |
-----= 0; |
------ = 0 |
. . . ----- |
|
дй\ |
да>2 |
d&k |
|
и система нормальных уравнении имеет вид
«12 ( А ) 2+ -2 2 |
А А |
+ |
+ **2 А А |
= .£ A r t . |
||||
1=1 |
i=1 |
|
i = 1 |
|
1=1 |
|
||
п |
п |
{ А ) 2+ |
п |
|
|
п |
А уЧ (iv-98> |
|
ах2 А А |
+ «2 2 |
+ а*2 А А |
= 2 |
|||||
/ - 1 |
1=1 |
|
|
i=Y |
|
i - 1 |
|
|
«12 А А |
+ *2 2 |
А А |
+ ■■■ + ** 2 |
1 |
( А )2= 2 |
А уЧ• |
||
/=-1 |
i=l |
|
|
i= |
|
/-1 |
|
Умножим левую и правую части системы уравнений (IV.98) на 11(п—1). В результате при каждом коэффициенте a,j получается согласно (IV.95) выборочный коэффициент корреляции г*. Прини мая во внимание, что
п
получаем систему нормальных уравнений в виде
«1 + |
а 2 ^ , , а + |
a Zr*Xlx , + |
+ |
a A , x k = |
V , • |
|
aA |
, Xl + а 2 + |
azr*XiX, + |
• • • + |
акГ*ХгХк = |
r*yXi, |
(IV .99) |
+ а2Г.гАг, + aSrxkx, + ... + Clk — rУхк
В системе уравнений (IV.99) гх1хт= г Хтх1- Для многопараметриче
ских процессов система (IV.99) оказывается высокого порядка и для ее решения необходимо использовать вычислительную машину. Решив систему (IV.99), рассчитывают коэффициент множествен ной корреляции R:
R = a.\rtJXl + a2ryXi + + а.кг*ух^. (IV. 100)
Коэффициент множественной корреляции служит |
показателем |
силы связи для множественной регрессии: |
|
0 < R < 1. |
(IV .101) |
Для выборок небольшого объема в величину R необходимо внес ти коррекцию на систематическую ошибку. Чем меньше число сте пеней свободы выборки f — fi—/, тем больше завышается сила свя зи, оцениваемая коэффициентом множественной корреляции. Фор мула для коррекции
|
R ' = I / |
1 |
- (1 -т ? 2 ) |
1 |
t |
(IV. 102) |
|
|
|
г |
|
|
п — I |
|
|
где R' — скорректированное значение |
коэффициента |
множествен |
|||||
ной корреляции; |
/ — число |
коэффициентов |
уравнения |
регрессии. |
|||
В уравнении (IV.92) l = k + 1. |
|
|
|
|
|||
От уравнения |
(IV.96) |
можно перейти к натуральному масштабу |
|||||
по формулам |
|
|
|
|
|
|
|
|
bJ = a J ~ |
T |
~ |
J = 1 < 2...b \ j |
+ 0, |
|
|
|
|
s x' |
i |
|
|
|
(IV ЛОЗ) |
|
|
|
|
|
|
|
ьо — У — /2-1 bJ*}‘
При наличии параллельных опытов молено рассчитать диспер сию воспроизводимости и провести статистический анализ уравне ния регрессии.
Пример 4. Необходимо получить зависимость степени извлечения серной кис
лоты |
(у) из травильных растворов от следующих |
факторов: Х \ — концентрации |
|
H2S 0 4 |
в исходном растворе; ^ — концентрации |
сульфата железа |
FeS04; х3 — |
объемного соотношения спирт — кислота.^ Исходным статистическим |
материалом |
служит выборка объемом в 105 измерений, полученная пассивным экспериментом. Р е ш е н и е . Известно, что зависимость между степенью извлечения серной кислоты и выбранными факторами в исследуемой области носит линейный харак тер. В связи с этим определим эту зависимость в виде линейного уравнения ре
грессии
У — Ьо + Ь\Х\ -J- Ь2Х2 + 63лг3
методом множественной корреляции. По формулам (IV.93) все результаты
эксперимента переводим в стандартный масштаб. Затем по (IV.95) вычисляем выборочные коэффициенты корреляции:
V . = |
0 -212- V ^ ° . ° 43. r \ Xt = |
0,903, Г*,Л1 — |
0,417, |
|
|
r*x,x> = — 0,128, |
4 |
, 3 = 0,046. |
|
Полученные |
значения коэффициентов корреляции подставляем в систему |
|||
уравнений (IV.99). В результате получим |
|
|
|
|
|
а\ — 0,417а2 — 0 |
,128д3 = 0,212, |
|
—0«,417^1 -|- 0 ,046д3 = 0,043,
—0,128^1 + 0,046^2+ а3 = 0,903.
Решив систему, получим ах= 0,397, а2=0,166, |
а3 = 0,903 и уравнение регрес |
сии в стандартном масштабе: |
|
уо = 0,397*° + 0,166^ + |
0,903*3 • |
По формулам (IV. 103) перейдем к натуральному масштабу:
У = _ 26,5 + 1,987^ + 1 ,17*2 + 14,14х з.
Проверим адекватность полученного уравнения по критерию Фишера
Дисперсию воспроизводимости определим по данным трех параллельных опытов
|
|
2 |
|
( й - * ° ) |
|
|
|
^воспр |
и~1 |
|
|
|
|
|
|
|
|
|
|
|
где у0 — среднее по параллельным опытам. |
|
|
||||
Число |
степеней свободы sj;0CIip |
|
равно |
2. Остаточную дисперсию определим |
||
по формуле (IV.53): |
|
|
|
|
|
|
|
|
105 |
Он - it ) 2 |
|
||
|
|
2 |
|
|||
|
52 |
I-1 |
|
|
36,03. |
|
|
ост |
105 — 4 |
|
|
||
Число степеней свободы SQCT равно |
|
101; ^-отношение равно 9,4. Табличное зна |
||||
чение критерия Фишера для уровня значимости р = 0,05 и чисел степеней свободы |
||||||
/ I= 101 и f2= 2 Ft -P(fi, /2) = 19,5. Следовательно, |
полученное уравнение регрессии |
|||||
адекватно эксперименту. |
|
|
|
|
|
|
11. |
Регрессионный анализ в |
матричной форме. Регрессионный |
||||
анализ в матричной форме удобен |
для |
решения задач на ЦВМ. |
||||
Методом наименьших квадратов необходимо найти коэффициенты |
||||||
уравнения регрессии по данным табл. 26. |
|
|||||
|
у = Ь§хо + |
Ь{Х\ 4- ^2*2 “Ь |
+ bkx kf |
где хо — фиктивная переменная, равная 1.