Планирование эксперимента в химической технологии
..pdfОценки дисперсий |
случайной |
величины X |
вычисляют по фор |
|||
мулам: |
|
|
|
|
|
|
4 = |
N_1 S |
|
|
|
(6) |
|
|
|
и= I |
|
|
||
4 = N |
|
Lo=l |
|
|
\u=1 |
(7) |
|
|
|
|
|
||
где (W — 1) = / — число степеней свободы. |
|
|||||
Среднеквадратичное отклонение переменной X определяют так: |
||||||
- |
|/ - д Г - 1 |
£ |
(*«— *)2 |
|||
|
|
|
|
U=1 |
|
|
Оценки центральных |
моментов асимметрии |
(р3) и эксцесса рас |
||||
считывают по формулам |
соответственно: |
|
||||
|
|
|
|
N |
|
|
|
= |
/у_1 |
2 |
*)3* |
(8) |
|
|
|
|
ц=1 |
|
|
|
|
|
л _ |
|
|
. |
(9) |
|
|
|
|
|
|
|
|
|
|
|
N |
|
|
f^4 |
|
|
V |
^ 4’ |
( 10) |
|
— 1 2 |
||||||
|
|
|
|
|
|
(И) |
где Ах и Сх — коэффициенты асимметрии и эксцесс. |
||||||
Пример 2. При каталитическом |
|
|
||||
крекинге объемные скорости(а, |
|
) |
Таблица 1. |
Расчет оценки |
подачи сырья по опытным данным |
дисперсии |
|
|
|||||
следующие: 1,0; |
1,1; 0,65; 1,5; 2,5; |
|
|
|
||||
1,6; 1,3; |
0,9. |
|
математического |
№ п/п |
хи * |
<*ц — *)2 |
||
Найти оценки |
|
|
|
|||||
ожидания и дисперсии. |
1 |
—0,3188 |
0,10163 |
|||||
Решение. |
|
|
||||||
|
|
0,04787 |
||||||
|
|
» |
|
|
2 |
—0,2188 |
||
|
|
|
|
3 |
-0,6688 |
0,44729 |
||
х — -g~ 2 |
хи = |
"I- |
4 |
0.1812 |
0,03283 |
|||
1,39520 |
||||||||
|
и= \ |
|
|
5 |
1,1812 |
|||
-|“ 0,65 -f- |
115 — 2,5 -f- 1э6 —f—1,3 4~ |
6 |
0,2812 |
0,07907 |
||||
7 |
-0,0188 |
0,00035 |
||||||
+ |
0,9)= |
1,3188 «1,32; |
8 |
—0,4188 |
0,17539 |
N
si = - 8 ^ т 2 (*«“ 1,32)2=0,328. |
2 = 2,28440 |
Расчет оценок дисперсий рекомендуется оформлять как пока зано в табл. 1.
Пример 3. Измерялась степень осаждения гидроксида железа х (%) в присутствии хрома. Результаты эксперимента следующие: 94,89; 95,69; 98,18; 98,54; 97,08; 93,80; 94,89; 95,62. Определить оценки центральных моментов — асимметрию и эксцесс.
Решение. Оценки центральных моментов находят по расчетным данным табл. 2. Рассчитываются: среднее х = 9,6086 ^ 96,1;
среднеквадратичное отклонение sx= ]/2,8365 = 1,6842; центральные моменты третьего и четвертого порядков:
9,422
1,35;
7
1,35
Ах = 1.6843 » 0,287;
87,941
Н4= ‘ 7 »12,58;
12,58
с , = ■3 = — 1,42.
1.6844
Расчет интервальных оценок |
для математического ожидания и |
дисперсии переменной X производится по формулам: |
|
|
( 12) |
где sx — среднеквадратичное |
отклонение; тх — математическое |
ожидание; х — среднее по выборке; tq — значение критерия Стьюдента (находят по таблицам для f = N — 1 числа степеней свободы и уровня значимости q)\ q — уровень значимости при определенной
Таблица 2. Расчет оценок центральных моментов
№ п/п |
хи “ х |
(хи — X)* |
(хи — xf |
(■хи — *>4 |
1 |
—1,196 |
1,4304 |
— 1,7108 |
2,0461 |
2 |
—0,396 |
1,15682 |
—0,062101 |
0,024592 |
3 |
2,454 |
6,0221 |
14,778 |
36,265 |
4 |
2,094 |
4,3848 |
9,1818 |
19,227 |
5 |
0,994 |
0,98804 |
0,98211 |
0,97622 |
6 |
—2,286 |
5,2258 |
—11,946 |
27,309 |
7 |
—1,196 |
1,4304 |
— 1,7108 |
2,0461 |
8 |
—0,466 |
0,21716 |
—0,1012 |
0,047159 |
2 = 19,355 |
2 = 9,422 |
2 = 87,941 |
доверительной вероятности Р (Р = 0,95, тогда q = 0,05 или 5%).
|
|
sl f |
^ |
_ 2 ^ |
sl i |
|
|
|
~ Z 2 |
^ |
<*х ^ |
2 * |
(* 3 ) |
|
|
*1—<7/а |
|
У*(11г |
|
|
где а2 — дисперсия переменной |
X; |
Х*/2— значение |
X2 = распре |
|||
деления для |
q!2 |
уррвня значимости; |
Х?_^/2 — значение X2 = рас |
|||
пределения |
для |
(1 — q/2) |
уровня значимости; f — число степеней |
|||
свободы. |
|
|
|
|
|
|
Пример 4. Результаты измерения состава смеси на хроматогра фе дали следующие значения целевого продукта (в вес. %): 76,48;
76,43; |
77,20; 76,45; |
76,25; 76,48; |
76,48; |
76,60. |
|
|||
Найти s i |
х и интервальные оценки дисперсии а* и математиче |
|||||||
ского ожидания тх. |
|
|
|
|
|
|||
Решение. |
|
|
|
|
|
|
|
|
|
|
|
|
8 |
|
|
|
|
|
|
|
* = |
и2= 1 хи = |
76,546 %; |
|
||
|
|
8 |
|
|
|
|
|
|
4 |
= |
U2= 1 (Xu ~ |
76,546)2 = -L • 0,5543 = 0,0790 ( % f. |
|||||
Интервальная оценка для tnx: |
|
|
|
|||||
|
f = N — 1 = 7 , <7 = 5%. |
Из приложения 4 tT = 2,36, |
||||||
76,55 |
2,36 У 0,0790 |
тх ^ |
|
76,55 -j- 2,36 |
• /0,0 7 9 0 |
|||
|
|
|
УХ |
|
|
|
|
у х |
|
|
|
76,31 < / п , < |
|
76,79. |
|
||
Интервальная |
оценка |
для а*: |
|
|
|
|||
f = N — 1 = 7 . |
Из приложения 3 %i-q/2— 16,013, |
l q/t = 1,690, |
||||||
|
|
|
0,0790 |
7 / |
2 / |
|
0,0790 7 |
|
|
|
|
16,013 |
|
|
1,690 |
|
|
|
|
|
0,03459 < |
о* < |
|
0,3278. |
|
|
|
|
§ 4. Методы оценки гипотез |
|
|||||
|
|
Для |
проверки гипотез |
|
испытывалась |
некоторая ну |
левая гипотеза Н0 по сравнению с альтернативной гипотезой Нг или Нъ # 2, •••> Нп• Методы проверки гипотез используются при решении задач отличия среднего вычисленного от стандартного, отличия в отклонениях переменных, обнаружения и исключения аномальных значений переменных и т. д.
Проверка гипотез относительно средних. Предположим имеется некоторое стандартное среднее х0 и ряд измерений переменной
X = {*!, х2, ..., хл/}- Выдвигается гипотеза, что х0 Ф х, т. е. раз ница между стандартным средним х0 и вычисленным по выборке х существенна. Альтернативная гипотеза: х0 = х. Справедливость этой гипотезы проверяется по формуле:
(14)
При выполнении условия (14) гипотеза х0 Ф х принимается. То есть, если абсолютное значение разности между стандартным
средним и вычисленным по выборке превышает значение —t S ,
то принимается гипотеза, что выборочное среднее в статистическом смысле существенно отличается от стандартного среднего.
Пример 5. Десять термометров сопротивления откалиброваны
по стандартному, который показывает х0 = 1000 мв. При измерении такого напряжения каждым термометром сопротивления были по лучены следующие данные: 986; 1005; 991; 994; 983; 1002; 996; 998;
1002; 983.
Проверить гипотезу о том, что среднее по выборке 10 термомет ров сопротивления значимо (существенно) отличается от стандарт ного среднего.
Решение.
|
х = |
10 |
• 2 *„ = |
994,0; |
|
|
|
|
U=1 |
|
|
|
|
|
|
N |
|
|
|
|
|
sI = -т ^ -г 2 |
(** - |
994,0)2 = |
64,9; |
||
|
|
U=1 |
|
|
|
|
|
|
s ,= У 64,9. |
|
|
||
Для |
/ = N — 1 = 10 — 1 = 9 , |
9 |
= 5%, |
tT = 2,23. (Прило |
||
жение |
4). Тогда: |
|
|
|
|
|
| JC0 — л:| = | 1000 — 9941= 6,0;
2,23 / 64,9
5,69 < 6,0,
/То "
т. е. гипотеза принимается; среднее значение измерений 10 термо метров значимо отличается от стандартного термометра сопротив ления.
Проверка гипотез для дисперсий. Имеются две выборки объема
и N по которым рассчитываются оценки дисперсий s2 и s?. Необходимо определить, отличаются эти оценки дисперсий или меж ду ними существует случайное расхождение.
Выдвигается гипотеза Н0: о2 = с^, т. е. выборки взяты из гене ральной совокупности с одинаковой дисперсией, против гипотезы
а\ ф а|. Гипотеза Н0 принимается, если отношение оценок диспер сий удовлетворяет условию:
2 |
|
|
4 |
— l > h = N i — 1. <7 = <7з). |
(15) |
|
|
где Si > S2 и F — критерий Фишера для степеней свободы flf /2. Пример 6. Сравнивались точности химических анализов на со держание примеси в целевом продукте, сделанных двумя лаборан тами, один из которых (А) был новичком в работе, а другой (В) — опытным работником. Лаборант А выполнил 20 анализов, а лабо
рант В — 13. Результаты анализов следующие:
А |
4,40 |
4,56 |
4,42 |
4,59 |
4,55 |
4,45 |
4,55 |
4,39 |
4,75 |
4,72 |
4,53 |
В |
4,42 |
4,47 |
4,70 |
4,72 |
4,53 |
4,55 |
4,60 |
4,64 |
4,29 |
4,52 |
4,57 |
А |
4,66 |
4,90 |
4,50 |
4,45 |
4,66 |
4,80 |
4,36 |
4,75 |
4,22 |
|
|
В4,56 4,66
Определить разницу точности анализа для 5%-ного уровня зна чимости.
Решение:
20
A :xl = |
2 |
хи - |
4,57, s? = 0,0295; |
|
U — \ |
|
|
В: Зс2 = |
4,56, |
si = |
0,0139, s? > si |
Средние значения анализов у обоих лаборантов примерно равны,
однако рассеяние результатов анализов около средних (si и S2) разное. Сравним оценки дисперсий:
|
_ sf |
0,0295 |
_ 9 19. |
Р |
с2 |
0,0139 |
’ ’ |
|
ь2 |
|
|
= 20 — 1 = 19, /2 == 13 — 1 = 12, FT = 2,50. (Приложение 5). Поскольку Fp < FT гипотеза о принадлежности выборок
и JV2 к единой генеральной совокупности принимается. Таким об разом, с вероятностью Ре = 0,95 (уровень значимости q = 0,05) разница в точности анализа у лаборантов А и В несущественна.
Обнаружение и исключение аномальных значений. Аномаль ные (резко отличающиеся) значения в выборке отбрасываются с большой осторожностью. В работе [67, с. 179] предлагается такая процедура:
— находится Amax = *max —
где jCmax — аномальное значение в выборке;
— проводится оценка
| Атах | CSX, |
(1Q) |
где с — константа. Наблюдение xmax отбрасывается, если неравен ство (16) выполняется. Оценка может проводиться многократно;
среднеквадратичное отклонение sx рассчитывается каждый раз по
оставшейся |
выборке. |
через t — критерий Стью- |
Величину |
с предлагается находить |
|
дента по выражению: |
|
|
|
А/са (/ + /о -1 ) |
v/o-h/—1 |
|
|
*<7=0,05 I |
/(/ + /
(17)
где f = N — 1 — число степеней свободы оценки дисперсии s*;
f_любое число дополнительных степеней свободы (обычно /0 = 0). Пример 7. Получен ряд измерений состава продукта на газо
вом хроматографе. х-± 23,2, х2 23,4, х$ |
23,6, х^ |
24,1, х§ |
=25,5. Является ли значение хърезко выделяющимся (аномальным)
иследует ли выбросить его из данной выборки?
Решение. Вычисляем л; = |
23,55. |
|
|
|
|
|||||
Атах = |
125,5 — 23,55| = |
1,95. Оценка дисперсии по оставшимся |
||||||||
четырем |
значениям равна |
|
|
|
|
|
|
|||
|
|
|
|
|
4 |
|
|
|
|
|
|
|
4 = |
|
2 |
(хи - |
23,55)2 = |
0,45; |
|
||
|
|
|
sx = |
V 0,45 |
= |
0,67. |
|
|
||
Для |
q = |
0,05%, N = |
4, f |
= 4 по формуле (17) имеем: |
||||||
|
|
|
|
5с2 |
3 |
|
|
2.7763. |
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
) |
|
|
|
|
Методом проб и ошибок получаем |
с « 1 ,6 7 . Тогда, |
согласно |
||||||||
оценке (16): |
|
|
|
|
|
|
|
|
|
|
|
|
1,95 > |
с |
0,67 = 1,67 |
0,67 =1,12. |
|
||||
Поэтому |
наблюдение |
х5 отбрасывается. |
распределения слу |
|||||||
Проверка |
гипотезы |
нормальности |
закона |
|||||||
чайной величины. Если |
закон |
распределения |
случайной |
величины |
неизвестен, то по данным наблюдениям строится так называемая гистограмма. По оси абсцисс откладываются интервалы, соответст вующие группам совокупности случайной величины, и на каждом из них как на основании строится прямоугольник, высота которого
равна частоте данной группы |
ng/N, где ng — число |
измерений в |
|||
группе. Количество групп выбирается так, чтобы результаты изме |
|||||
рений были хорошо обозримы и содержали большое количество |
|||||
сведений. |
Можно |
предложить |
следующий |
алгоритм |
построения |
гистограммы: |
|
случайной величины в выборке хт\п -f- |
|||
1) |
диапазон |
изменения |
|||
-г- *тах делится на е интервалов; е выбирают |
по эмпирической фор |
||||
муле |
|
е = 1 + 3,2 lg N, |
|
|
|
|
|
|
(18) |
где N — объем выборки. Длины интервалов берут одинаковыми:
|
Д а = |
.*max ~ * min |
• |
(19) |
|
ь |
е |
’ |
|
2) |
определяют число |
ng (g = 1, 2, |
е) |
элементов выборки, |
попавших в каждый из интервалов Ag, и относительную частоту попадания случайной величины в соответствующий интервал:
Pg = т г ; |
<20> |
3) полученный вариационный ряд записывают в таблицу, при чем элементам выборки, попавшим в g -й интервал, приписывается среднее значение
• |
(хо- 1—Ч) |
(20а) |
||
*s = |
- i4 |
------ |
||
|
||||
4) строится гистограмма |
pg |
xg-\ -f- xg. |
|
После построения гистограммы выдвигается задача проверки гипотезы нормальности закона распределения полученного вариа ционного ряда. Проверка осуществляется с помощью критериев согласия, оценивающих расхождение между теоретическими и эм пирическим распределениями.
Наибольшее распространение получил критерий согласия Пир сона, который для данного вариационного ряда рассчитывают по
формуле: |
|
|
|
|
|
g=i |
, |
|
(го |
|
Npg |
|
|
|
где е — количество |
интервалов; |
N — объем |
выборки; |
ng — ко |
личество элементов |
выборки, попавших в g-й |
интервал; |
pg — ве |
роятность попадания в g-й интервал, вычисленная с помощью тео ретического распределения.
Критерий Пирсона имеет число степеней свободы f = &— / — 1,
где / = 2 для |
нормального закона распределения. Вероятность pg |
|
рассчитывают по формуле: |
|
|
|
Pg — Ф 0 (2g+i) |
( 22) |
где zg — левая |
Фо (Zg)y |
|
граница g-ro интервала относительно х в единицах |
||
s*: |
. |
_ |
|
|
(23) |
а Ф (z) — функция Лапласа
г
(24)
Номер |
Границы интервала |
Число измерений |
Среднее |
значение |
Относительная ча |
интервала g |
+ 1 |
в интервале ng |
|
* |
стота pg = ng /N |
|
|
на интервале xg |
|
||
1 |
-20-=— 15 |
7 |
—*17,5 |
0,035 |
|
2 |
—15 : 10 |
11 |
—12,5 |
0,055 |
|
3 |
—10-s— 5 |
15 |
— 7,5 |
0,075 |
|
4 |
—5-5-0 |
24 |
- |
2,5 |
0,120 |
5 |
0-н5 |
49 |
|
2,5 |
0,245 |
6 |
5ч-10 |
41 |
|
7,5 |
0,205 |
7 |
10ч-15 |
26 |
|
12,5 |
0,130 |
8 |
15ч-20 |
17 |
|
17,5 |
0,085 |
9 |
20ч-25 |
7 |
|
22,5 |
0,035 |
10 |
254-30 |
3 |
|
27,5 |
0,015 |
Наименьшее zg= zmin заменяют на — оо, а наибольшее zg = |
2max |
на + оо. Функции Лапласа находят из табл. IX [40, с. 504]. |
|
Если |
|
Хр < Хт , |
(25) |
то гипотеза о нормальном распределении случайной величины при нимается.
Пример 8. Произведено 200 замеров температуры в реакторе. Отклонения температуры от номинальной хт\п = — 20, хтах = 30 были разбиты на 10 интервалов и представлены в табл. 3. Точность измерения температуры ± 1 град. Определить с помощью критерия Пирсона гипотезу о согласии выборочного распределения при 5%-ном уровне значимости.
Решение. Заполняем табл. 3 исходными данными и расчетными значениями в соответствии с формулой (20) и (20а).
Находим оценки математического ожидания и дисперсии по формулам
ю
х= 2 х&Рё = 4,30° С; g=i
2 |
хеРе — х = 94,20 (°С)2; |
sх - 2 |
(£ = 9,7Г С.
По формулам (23) вычисляем нормированные значения случайной величины по приложению 7 или по табл. IX [40, с. 504] находим Ф0 (2e)f имея в виду, что zg < 0 и Ф0 (zg) = — ф0 ( \ Zg\).
Заносим результаты расчетов pg в табл. 4 и рассчитываем дан ные для Хр.
S |
|
г& |
Фп(Zg) |
|
N~Pg |
(ng — Npg)z |
|
н |
Npg |
||||
|
|
|||||
|
|
|
|
|
||
1 |
— оо |
—0,5000 |
0,0239 |
4,78 |
1,04 |
|
2 |
— 1,99 |
—0,4761 |
0,0469 |
9,38 |
0,28 |
|
3 |
- |
1,47 |
—0,4292 |
0,0977 |
19,54 |
1,05 |
4 |
|
0,96 |
—0,3315 |
0,1615 |
32,30 |
2,13 |
5 |
— 0,44 |
—0,1700 |
0,1979 |
39,58 |
2,24 |
|
6 |
|
0,07 |
0,0279 |
0,1945 |
38,90 |
0,11 |
7 |
|
0,59 |
0,2224 |
0,1419 |
28,38 |
0,20 |
8 |
|
1,10 |
0,3643 |
0,0831 |
16,62 |
0,01 |
9 |
|
1,62 |
0,4474 |
0,0526 |
10,52 |
0,03 |
10 |
+ |
2,13 |
0,4834 |
|
|
|
11 |
оо |
|
|
|
|
Интервал g = 10 ввиду его малочисленности объединяем с ин тервалом g = 9. Число степеней свободы при этом уменьшается
на |
единицу. |
По |
формуле (21) находим %р = |
7,09; / = е — I — 1 = |
= |
9 — 2 — |
1 = |
6. |
/ = 6 и q = 0,05 X? = |
= |
Из приложения 3 определяем, что для |
|||
12,59. Поскольку условие (25) выполняется, гипотеза о нормаль |
ности закона распределения измерений температуры принимается.
§ 5. Априорное ранжирование переменных объекта исследования
При оценке мнений специалистов о степени влияния факторов на переменные состояния в предварительном эксперимен те широко используются методы ранговой корреляции [42]. Суть метода в следующем. Специалистам, хорошо знакомым с исследуе мым объектом, предлагается расположить факторы в порядке убы вания степени их влияния на переменную состояния. Например, фактору Х 4 присваивается второе место (ранг 2), фактору Х0 — первое место (ранг 1) и т. д. Такую оценку называют ранжирова нием факторов. В процессе ранжирования можно факторы добав лять или отбрасывать; некоторые факторы могут не иметь количе ственной оценки. После сбора опросных листков (анкет специалис тов) составляется сводная таблица «номер специалиста — факторы», где элементом матрицы является ац — ранг каждого /-го фактора
/-го |
специалиста. |
|
|
|
|
Согласованность мнений экспертов по каждому фактору оцени |
|||
вается коэффициентом согласия W (или коэффициентом |
конкорда- |
|||
ции), который изменяется от 0 до 1. Принято, |
что если |
W = 0, |
||
то |
согласованности во мнениях нет; при W = |
1 имеется |
полная |
|
согласованность. |
|
|
|
|
Сводная матрица размерами т X п облегчает расчет коэффициен |
||||
та |
конкордации. Суммы по строкам всегда |
равны, |
поскольку |
содержат натуральный ряд чисел, расположенных в произвольном
порядке. Среднее натурального ряда равно |
(п + 1) и тогда сред |
|
нее по строкам для всей таблицы: |
|
|
а = \- т ( п |
+ 1). |
(26) |
Напишем сумму квадратов отклонений рангов от общего сред |
||
него |
|
|
п / т |
\ 2 |
|
s(<*2) = 2 |
— а) |
<27> |
/=1 w=1 |
) |
|
Очевидно, что при полной несогласованности мнений специали стов эта сумма будет максимально близка к величине а (при нечет ном т) или равна ей (при четном т):
S(d2)-* min.
При полной согласованности мнений специалистов
S(d2)-+- max.
Несложными преобразованиями [52, с. 101] можно получить общий член суммы:
S (d2) max = ——- т2 (п3— п) |
(28) |
||
и определить согласованность |
мнений специалистов |
(экспертов), |
|
т. е. коэффициент конкордации: |
|
|
|
W = |
S (d 2) |
|
|
|
|
(29) |
|
- i - m 2(rt3 — п) |
|||
Было установлено, что для п > |
7 величина т (п — 1) W имеет |
||
%2-раепределение. Тогда, если |
|
|
|
х £ = т ( /г |
— |
1 ) ^ > Х т |
(30) |
для f = п — 1 при заданном q, то считается, что мнения экспертов согласованы.
При наличии дробных рангов, т. е. такой ситуации, когда экс перт не может отдать предпочтение тому или иному фактору и при сваивает им равные дробные ранги, W рассчитывают по формуле:
S (d2)
W =
(31)
~ т * ( п 3 — п) — m 2 Ti t=i
где S (d2) — сумма квадратов отклонений рангов от общего сред него; т — число экспертов; п — число ранжируемых факторов; Т{ — показатель, учитывающий дробные ранги для одинаковых рангов в столбце;