Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Оптимизация эксперимента в химии и химической технологии

..pdf
Скачиваний:
31
Добавлен:
15.11.2022
Размер:
14.6 Mб
Скачать

где

 

 

 

п

 

 

 

 

 

 

 

i2-l 91

 

 

 

 

 

 

 

п

 

 

 

 

 

 

п

ViPi

 

 

 

 

 

а1

2

 

 

(IV .75)

 

 

 

 

 

 

 

 

 

2

p \ w

 

 

 

 

 

 

/2-1

9ip»(о

 

 

(IV. 76)

 

 

 

 

 

 

 

 

 

 

2 * 1 ( 0

 

 

 

 

 

 

/-г

 

 

 

Суммы, стоящие в знаменателе, можно определить по сокращен­

ной формуле:

 

 

 

 

 

 

 

 

 

(ft!)2 П(П2 — 1) (п2 — 4). ■,(п2 _ Щ

 

 

 

[(2Л — 1)!1]2 22ft (2k +

1)

(IV. 77)

i=i

 

 

 

 

 

 

 

 

 

 

где (26—1)!! — произведение

всех нечетных

чисел

от 1 до 2/е—1

включительно. В частности,

 

 

 

 

 

 

2

 

 

 

 

 

(IV .78)

 

 

 

 

 

 

 

 

i - 1

 

 

 

 

 

 

 

 

л (п 2— 1)(и2 — 4)

 

(IV. 79)

 

 

2 ( )

 

180

 

 

 

/-1

 

 

 

 

 

 

 

 

 

 

 

V I

Г 2 т

п(п2-

1) (Л2 - 4) (п2 -

9)

(IV. 80)

^

3 (

 

2800

 

 

 

 

 

 

/=1

 

 

 

 

 

 

 

V I „2 . ~

п ("2-

1) (« 2- 4) (Ла -

9) (п2 _

16)

4 ( ) ~

 

 

44100

 

 

(IV .81)

 

 

 

 

 

1-1

 

 

 

 

 

 

 

Эти суммы используются и для вычисления сумм SSh, нужных для определения остаточной дисперсии:

SSft = SSft-! а\ 2 Р\ (О-

(IV .82)

/-1

 

Посде получения уравнения регрессии (IV.73)

переменную 2

опять заменяют первоначальной переменной х.

 

Пример 2. Требуется определить зависимость степени диссоциации а йоди­ стого водорода от температуры t. Экспериментальные данные приведены ниже.

t, ° С

200

300

320

340

360

380

400

420

440

460

480

а

0,178

0,182

0,186

0,191

0,196

0,202

0,207

0,213

0,220

0,228

0,236

Объем выборки /1=11. Температура фиксировалась через равные интервалы

20° (h=20).

Р еш ен и е . Применим метод Чебышева для получения уравнения регрессии степени диссоциации от температуры. Сделаем замену переменных по формуле

/ — 260

Одновременно для удобства вычислений заменим* а на у

£/ = 1000 (ot — 0,178).

Полученные значения z \, yi и полиномов Чебышева, посчитанных по формулам (IV.63), (IV.65) и (IV.66), в которые вместо х подставлены значения /= 1, 2,

11, приведены в таблице.

• Г 1

«1

Pi

ytPx

Рг{1)

уf i d )

р »(П

ух*МО

1

0

—5

0

15

0

—36

0

2

4

—4

—16

6

24

7,2

28,3

3

8

~ 3

—24

—1

—8

26,4

24,2

4

13

—2

—26

—6

—78

27,5

358,8

5

18

—1

—18

—9

— 162

16,8

302,4

6

24

0

0

—10

—240

0

0

7

29

1

29

- N9

—261

—16,8

—487,2

8

35

2

70

—6

—210

—27,6

->96,6

9

42

3

126

— 1

—42

—26,4

—1108,8

10

50

4

200

6

300

- 7 ,2

—360

11

58

5

290

15

870

36

2088

2

281

 

631

 

193

 

67,2

Определим коэффициенты уравнения вида

У= а0Ро (*) + a\.Pi (г),

Ро(.г)= 1; ^1 (*) = * — 6.

По формуле (IV.74)

а0 = 281- = 25,6;о „

YJ

П

S (0 по сокращенной формуле (IV.78) равна

/-1

11 (121 — Г) = ПО,

12

 

 

 

 

 

631

 

с

 

 

 

 

 

 

 

 

 

 

 

°' = П 5 - 5’73'

 

 

 

 

 

 

Уравнение регрессии первого порядка имеет вид

 

 

 

 

 

 

 

 

 

 

у = 25,6 +

5,73 ( г -

6).

 

 

 

 

 

Определим остаточную дисперсию

s 20CT. Для

этого

по

формулам

(IV.7J) и

(IV.82) вычислим суммы:

 

и

\ 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

_

 

 

 

 

 

 

78 961

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

s s o=

У , У]

 

И

 

=

10 843 — — - —

= 3665,

 

 

/-1

 

 

 

 

 

 

 

11

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S S x = S S 0 — а\ 2 р \ (0 = 3 6 6 5 — 5 »7 3 2 *= 53 ,

 

 

откуда

 

 

 

/=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S S j

__ _53_

 

5 9

 

 

 

 

 

 

 

2

_

 

 

 

 

 

 

 

 

1ост

л — 2

9

 

5,У'

 

 

 

Определим теперь уравнение регрессии второго порядка

 

 

 

 

У =

а0Р 0 (z) +

a i P i

(z) + а2Р 2 (*)•

 

 

 

По формуле (IV.65)

/М г)

равно

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Я 2 ( г )

= г 2 \2 z

4 -

26.

 

 

 

 

По формуле (IV.79)

находим

 

 

 

 

 

 

 

 

 

 

 

 

 

и

2

_ П ( 1 2 1 - 1 ) ( 1 2 1 - 9 ) _

 

 

 

 

 

 

 

 

 

и определяем

/=1 р 2 ( ° -

 

 

 

180

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

fl2= i

i

= 0 ’225-

 

 

 

 

 

В результате получим уравнение регрессии второго порядка

 

 

 

у =

25,6 +

5,73 (z 6) +

0 ,225 (*2 _

\<lz

+ 26).

 

 

Определим остаточную дисперсию

 

2

 

 

 

 

 

 

 

 

s2

ост:

 

 

 

 

 

 

 

 

 

S S ) - a 2 2

Р \ (г)

53 -

0,2252-858

9,6

, 0

 

S S 2

______________ j t i

 

 

 

52 ост

п — 3

 

 

п — 3

 

 

 

 

 

 

8

---

п

--- *

 

 

 

 

 

 

 

 

 

 

8

 

Проверим значимость различия

2

 

 

2

 

по критерию Фишера

Sj ост и s 2 ост

 

 

 

 

F =

 

 

 

1.2

 

4 9

 

 

 

 

 

 

 

 

s*

 

 

 

'

 

 

 

 

 

 

 

 

 

5 2 ост

 

 

 

 

 

 

 

 

 

 

 

 

 

^0.95 (9,8) = 3,4,

 

 

 

 

 

F > F i-p V u h),

значит уравнение второго порядка является существенным уточнением уравнения первого порядка. Определим уравнение регрессии третьего порядка:

у = a0PQ(z) + aiPy(z) + а2Р2 (г) + а3Р 3( г ) .

Подставляя л=11 в формулу (IV.66), получим

Р 3 (г) = 23 — 18г2 + 90,2г — 191,1.

По формуле (IV.80) находим

V r

« n

11 (121 — 1) (121 — 4) (121 — 9)

 

2 а

Рз0)==

---------------2 8 оо---------------

= 6177-7-

/-1

 

 

 

откуда

67,2

д3 = — g ' = 0,0109, 177,6

и уравнение регрессии третьего-порядка имеет вид

у = 25,6 + 5,73 — 6) + 0,225 (*2 — 12^ -Н 26) Ч-

+ 0,0109 (*з + 18*2 + 90* — 191,1).

Проверим существенность перехода от уравнения регрессии второго порядка к уравнению третьего порядка. Для этого определим

SS2 — а \ у , p h i )

 

SS3

fZi

____

9 ,6 — 0,01092.6177,6

8,9

S3 ост

п — 4

п — 4

 

 

 

= “7=1,27,

 

 

 

 

 

 

 

*3

ост

> s;

 

 

 

 

2 ост*

 

Следовательно, нужно остановиться на регрессии второго порядка. Делая обратную замену у и г на а и /, получим

ft — 260 \

1000(а — 0,178) = 25,6 + 5,73 ( — —— — б) +

20

t — 260\2

 

t — 260 + 26j

K

12

 

) “

20

 

 

 

и окончательно

а = 0,1731 — 0,000139/ + 0,00000056/2.

Полученное уравнение является окончательным в классе полиномов. OiieifoM тесноту найденной связи при помощи корреляционного отношения (IV.89):

9 = K i - e ,

ss2

9,6

£ = ■SSn

= 0,00272,

3665

b= V 1 — 0,00272 = 0,986.

Корреляционное отношение 0 близко к 1, следовательно, найденная связь близка к строго функциональной.

8. Трансцендентная регрессия. При малых объемах выборки п увеличение порядка полинома может привести к росту остаточной дисперсии. Чтобы уменьшить число определяемых коэффициентов, используют трансцендентную регрессию. Вычисление коэффициен­ тов трансцендентной регрессии может оказаться весьма трудоем­ ким вследствие необходимости решать систему нелинейных уравне­ ний. Вычисление упрощается,, если провести замену переменных. Например, зависимости показательного типа и дробно-степенного

У= Ъ0Ьf,

(IV.83)

У= bascbl

(IV.84)

линеаризуются логарифмированием:

 

Ig У= !g b0 + х Ig bi,

(IV.85)

ig У= ig *o + bi Ig

(IV.86)

положив

Ig У = z , lgb0 = a и lg^i = аи 1g x = t,

получим линейные уравнения относительно новых переменных:

z = a0 + агх, z = aQ+ bit.

Коэффициенты Яо, Яь определяются по методу наименьших квадратов. По полученным яо и а\ определяются коэффициенты Ь0 и Ь\. Однако следует иметь в виду, что полученные таким образом коэффициенты уравнений регрессии (IV.83) и (IV.84) являются смещенными оценками для соответствующих генеральных коэффи­ циентов.

9. Оценка тесноты нелинейной связи. Если считать, что уравне­ ние регрессии найдено с достаточной точностью, то остаточная дис­ персия обусловлена только наличием дисперсии воспроизводимо­ сти, т. е.

 

 

 

лвоспр*

.(IV.87)

Чем меньше доля

2

2

в общей

о

5ОСт ~ 5 Воспр

дисперсии sy2, тем

сильнее связь между

У и X,

так как меньше

доля случайности в

этой связи. Поэтому силу связи можно характеризовать величиной

 

( П — О ^ с т

£ —

(Л — 1)4о »

где

 

(IV.88)

2 _

2

(yi —Ui)2

_/_1----------------

ост —

 

„ _ 7

 

2

<.У1-у)2

7 - 1

и

п

Связь тем сильнее, чем меньше £. Величина

V l - £ = 0

(IV .89)

называется корреляционным отношением. Чем больше 0, тем силь­ нее связь

0 < 0 < 1.

(IV. 90)

Если 0=1, то существует функциональная

зависимость между

параметрами. Однако при 0= 0 величины У и X нельзя считать не­ зависимыми, так как связь между ними, не сказываясь на диспер­ сиях, может проявить себя в моментах более высокого порядка. И только лри нормальном распределении равенство нулю корреля­ ционного отношения однозначно свидетельствует об отсутствии связи между случайными величинами. Корреляционное отношение, как и коэффициент корреляции в линейной регрессии, характеризу­ ет тесноту связи между случайными величинами*. Вообще анализ силы связи по 0 называют корреляционным анализом.

При линейной регрессии корреляционное отношение равно ко­ эффициенту корреляции:

= |г* I

(IV .91)

10. Метод множественной корреляции. Если необходимо иссле­ довать корреляционную связь между многими величинами, то поль­ зуются уравнениями множественной регрессии:

У — ^0 + Ь\х \ + ^2Х2

bkxk •

(IV .92)

Уравнение (IV.92) представляет собой поверхность регрессии при k = 2 и гиперповерхность при /е>2. Эту поверхность называют поверхностью отклика. При построении поверхности отклика на координатных осях факторного пространства откладываются чис­ ленные значения параметров (факторов). Исходный статистиче­ ский материал представлен в табл. 26.

Перейдем от натурального масштаба к новому, проведя норми­ ровку всех значений случайных величин по формулам:

где г/j0, x°ji — нормированные значения соответствующих факторов; у, xj — средние значения факторов; sy, sXj — среднеквадратичные отклонения факторов:

S y =

 

п

2 (г/г-</)2

2 (•*;< — xj)2

1=1_______

 

п — 1

п — 1

 

Т а б л и ц а 26

И сходны й стати сти ч ески й

м ат е р и ал в

н а ту р а л ьн о м

м ас ш та б е

 

Номер опита

Xi

Ха

х9

 

xk

У

1

*11

*21

*31

 

*Л1

Ух

2

*12

*22

*32

 

** 2

У2

3

*13

*23

*33

 

**з'

Уз

п

* 1 п

*2п

* 3 л

.

* * л

Уп

В табл. 27 приведен исходный статистический материал в но­ вом масштабе:

Т а б л и ц а 27

И сходны й стати сти ч ески й м ат е р и ал в б е зр а зм ер н о м м ас ш та б е

Номер опыта

А

'S

 

 

i A

 

,0

 

 

x k

1

Ах

JL*0

 

 

*31

x kX

2

*12

 

 

x °

JL-0

 

* 2 2

 

 

x 32

x k2

3

V0

JL»0

 

 

jk°

 

* 1 3

*23

 

 

*33

Xk3

п

л:0

X2n

 

 

x kn

 

■*1/1

 

 

*3/1

В новом масштабе имеем:

 

 

 

 

 

 

*5 =

0, i/o = 0 и so

= 1 , 5^о=

1.

 

 

 

 

 

хJ

 

 

Выборочный коэффициент корреляции при этом равен

 

*

 

1

п

 

 

 

2

 

 

y ° X j

Л — 1

 

 

 

 

 

 

i■=»!

 

 

 

п

 

 

 

 

 

 

го о

2

Ч

д-°

 

/, т — 1,

k ,

 

к1хт

mi

 

I > т.

 

 

 

/-1

 

 

 

 

yo

A

A

A

A„

(IV .94)

(IV .95)

Вычисленный по формуле (IV.95) выборочный коэффициент корреляции равен коэффициенту корреляции между переменными,

выраженными в натуральном масштабе гух^ ^х]хт- Уравнение

регрессии между нормированными переменными не имеет свобод­ ного члена и принимает вид

уО = (цх^ + а2Х2 +

+ a kxl.

(IV .96)

Коэффициенты уравнения (IV.96) находятся из условия

(y°i— ^/)2= min •

i=\

Условия минимума функции S определяются

так же, как для

зависимости от одной переменной:

 

 

dS

dS

dS

(IV. 97)

-----= 0;

------ = 0

. . . -----

дй\

да>2

d&k

 

и система нормальных уравнении имеет вид

«12 ( А ) 2+ -2 2

А А

+

+ **2 А А

= .£ A r t .

1=1

i=1

 

i = 1

 

1=1

 

п

п

{ А ) 2+

п

 

 

п

А уЧ (iv-98>

ах2 А А

+ «2 2

+ а*2 А А

= 2

/ - 1

1=1

 

 

i=Y

 

i - 1

 

«12 А А

+ *2 2

А А

+ ■■■ + ** 2

1

( А )2= 2

А уЧ

/=-1

i=l

 

 

i=

 

/-1

 

Умножим левую и правую части системы уравнений (IV.98) на 11(п—1). В результате при каждом коэффициенте a,j получается согласно (IV.95) выборочный коэффициент корреляции г*. Прини­ мая во внимание, что

п

получаем систему нормальных уравнений в виде

«1 +

а 2 ^ , , а +

a Zr*Xlx , +

+

a A , x k =

V , •

 

aA

, Xl + а 2 +

azr*XiX, +

• • • +

акГ*ХгХк =

r*yXi,

(IV .99)

+ а2Г.гАг, + aSrxkx, + ... + Clk — rУхк

В системе уравнений (IV.99) гх1хт= г Хтх1- Для многопараметриче­

ских процессов система (IV.99) оказывается высокого порядка и для ее решения необходимо использовать вычислительную машину. Решив систему (IV.99), рассчитывают коэффициент множествен­ ной корреляции R:

R = a.\rtJXl + a2ryXi + + а.кг*ух^. (IV. 100)

Коэффициент множественной корреляции служит

показателем

силы связи для множественной регрессии:

 

0 < R < 1.

(IV .101)

Для выборок небольшого объема в величину R необходимо внес­ ти коррекцию на систематическую ошибку. Чем меньше число сте­ пеней свободы выборки f — fi—/, тем больше завышается сила свя­ зи, оцениваемая коэффициентом множественной корреляции. Фор­ мула для коррекции

 

R ' = I /

1

- (1 -т ? 2 )

1

t

(IV. 102)

 

 

г

 

 

п I

 

где R' — скорректированное значение

коэффициента

множествен­

ной корреляции;

/ — число

коэффициентов

уравнения

регрессии.

В уравнении (IV.92) l = k + 1.

 

 

 

 

От уравнения

(IV.96)

можно перейти к натуральному масштабу

по формулам

 

 

 

 

 

 

 

 

bJ = a J ~

T

~

J = 1 < 2...b \ j

+ 0,

 

 

 

s x'

i

 

 

 

(IV ЛОЗ)

 

 

 

 

 

 

 

ьо — У /2-1 bJ*}‘

При наличии параллельных опытов молено рассчитать диспер­ сию воспроизводимости и провести статистический анализ уравне­ ния регрессии.

Пример 4. Необходимо получить зависимость степени извлечения серной кис­

лоты

(у) из травильных растворов от следующих

факторов: Х \ — концентрации

H2S 0 4

в исходном растворе; ^ — концентрации

сульфата железа

FeS04; х3 —

объемного соотношения спирт — кислота.^ Исходным статистическим

материалом

служит выборка объемом в 105 измерений, полученная пассивным экспериментом. Р е ш е н и е . Известно, что зависимость между степенью извлечения серной кислоты и выбранными факторами в исследуемой области носит линейный харак­ тер. В связи с этим определим эту зависимость в виде линейного уравнения ре­

грессии

У — Ьо + Ь\Х\ -J- Ь2Х2 + 63лг3

методом множественной корреляции. По формулам (IV.93) все результаты

эксперимента переводим в стандартный масштаб. Затем по (IV.95) вычисляем выборочные коэффициенты корреляции:

V . =

0 -212- V ^ ° . ° 43. r \ Xt =

0,903, Г*,Л1 —

0,417,

 

r*x,x> = — 0,128,

4

, 3 = 0,046.

 

Полученные

значения коэффициентов корреляции подставляем в систему

уравнений (IV.99). В результате получим

 

 

 

 

а\ — 0,417а2 — 0

,128д3 = 0,212,

 

0«,417^1 -|- 0 ,046д3 = 0,043,

0,128^1 + 0,046^2+ а3 = 0,903.

Решив систему, получим ах= 0,397, а2=0,166,

а3 = 0,903 и уравнение регрес­

сии в стандартном масштабе:

 

уо = 0,397*° + 0,166^ +

0,903*3 •

По формулам (IV. 103) перейдем к натуральному масштабу:

У = _ 26,5 + 1,987^ + 1 ,17*2 + 14,14х з.

Проверим адекватность полученного уравнения по критерию Фишера

Дисперсию воспроизводимости определим по данным трех параллельных опытов

 

 

2

 

( й - * ° )

 

 

^воспр

и~1

 

 

 

 

 

 

 

 

 

где у0 — среднее по параллельным опытам.

 

 

Число

степеней свободы sj;0CIip

 

равно

2. Остаточную дисперсию определим

по формуле (IV.53):

 

 

 

 

 

 

 

105

Он - it ) 2

 

 

 

2

 

 

52

I-1

 

 

36,03.

 

ост

105 — 4

 

 

Число степеней свободы SQCT равно

 

101; ^-отношение равно 9,4. Табличное зна­

чение критерия Фишера для уровня значимости р = 0,05 и чисел степеней свободы

/ I= 101 и f2= 2 Ft -P(fi, /2) = 19,5. Следовательно,

полученное уравнение регрессии

адекватно эксперименту.

 

 

 

 

 

11.

Регрессионный анализ в

матричной форме. Регрессионный

анализ в матричной форме удобен

для

решения задач на ЦВМ.

Методом наименьших квадратов необходимо найти коэффициенты

уравнения регрессии по данным табл. 26.

 

 

у = Ь§хо +

Ь{Х\ 4- ^2*2 “Ь

+ bkx kf

где хо — фиктивная переменная, равная 1.