Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Оптимизация эксперимента в химии и химической технологии

..pdf
Скачиваний:
31
Добавлен:
15.11.2022
Размер:
14.6 Mб
Скачать

определена каждая дисперсия: f = m —1. В табл. 8 приложения приведены квантили G i_p для уровней значимости р=0,05 и 0,01. Если найденное по выборочным дисперсиям значение критерия Кохрена окажется меньше табличного

0 < 0 i_ p (n t /) ,

(11.85)

где п —число суммируемых дисперсий; f = m — 1, расхождение между дисперсиями нужно считать случайным при выбранном уровне зна­ чимости р. Если при этом определяется оценка для дисперсии вос­

производимости, однородные дисперсии можно усреднить. Число степеней свободы f среднеарифметической дисперсии равно

}= п { т —1).

14.Сравнение двух среднйх. ,Д,ля сравнения между собой двух средних, полученных по выборкам из нормально распределенных генеральных совокупностей, применяется критерий Стьюдента или /-критерий. Пусть заданы две случайные выборки: х\, Хг, ..., хп, и

У\, У2, ..., Упг- Первая выборка взята из нормально распределенной

генеральной совокупности с параметрами т х и а 2,

вторая — из ге­

неральной совокупности с параметрами

т у

и а у2. По выборкам

получены оценки для этих параметров: х,

sx2

и у,

sy2. Требуется

проверить нулевую гипотезу: т х = т у при, условии а ? =

а у2= о 2. Рас­

смотрим случайную величину

 

z = х у .

(11.86)

По свойству линейности нормального распределения (см. гл. I, § 5) z распределена нормально с параметрами

шг = тх ту,

(11.87)

Составим нормированную случайную величину

гmz у} — (/тгх— ту)

(11.88)

которая имеет стандартное нормальное распределение.

Если генеральный стандарт а заменить выборочным, получится величина, имеющая распределение Стьюдента

( * — */) — (rnx — ту)

(11.89)

с числом степеней свободы равным f = n\ + n2—2.

Однородность выборочных дисперсий sx2 и sy2 можно проверить по критерию Фишера. При доверительной вероятности р=1—р имеем двустороннюю оценку для разности тхпгу:

X —& — tl-p/2S

 

< mx — ту < x — у -\r

 

П\

n2

 

 

 

+ ^l-p/25

n\ П2

(11.90)

 

или односторонние оценки

 

 

 

тх — ту < х — у

i\-ps

(11.91)

тх — ту > х у i \ —ps

(11.92)

В условиях нулевой гипотезы

тх— ту, и неравенства

(11.91) и

(11.92) дают критерий проверки этой гипотезы. Нулевая гипотеза отвергается при двустороннем критерии, если

\ х - у \ > ^_ р/2з

+

(11'93>

при одностороннем критерии, если

 

 

I х

 

(11.94)

Приведенными критериями нельзя пользоваться, если'генераль­ ные дисперсии Ох и ау2 не равны между собой. Для этого случая существует несколько приближенных критериев для сравнения двух средних. При п\ = П2 — п можно воспользоваться приближенным (-критерием

( Х - ' У ) У п

 

 

 

(11.95)

V

sl + sl

 

 

с числом степеней свободы

 

 

 

С2 — (1 — С)2

(11.96)

 

где

 

 

 

* = 4 /( 4 + 4 ) .

 

(11.97)

Если число степеней свободы sx2 равно f\ = tt\—1, a sy2 равно

?2 2 1, можно использовать

другой

приближенный критерий.

Вычислим отношения

 

 

 

Vl = S2J n U V2 = S yfn2.

По табл. 3 приложения

найдем квантили ti- p /2 ( / 1) и

ty^ / 2 ( / 2).

Вычислим величину

 

 

т_

( / 1) + г2<1-р/2 (/2) ^

(П д8)

 

V Vl + t/2

 

Нулевая гипотеза mx—my отвергается, если

 

 

| J —^ | > г .

(11.99)

Сформулированный критерий является двусторонним, он превра­ щается в односторонний при замене р/2 на р.

Пример 10. Исследовался процесс радикальной полимеризации солей на основе 4-винилпиридина и двух различных галоидных алкилов: йодистого бути­ ла — C4H9I и бромистого этила — С2НбВг. Сравнить реакционную способность

галоидных алкилов, если средний (я=8)

выход полимера при проведении синтеза

с C4H9I составил 67,72% (*), а средний

выход (п=8) с СгН5Вг — 91,61% (у )*

Ошибка воспроизводимости процесса

полимеризации равна 5=16,6%.

Р е ш е н и е . В качестве нулевой

гипотезы рассматривается гипотеза равен­

ства реакционных способностей галоидных алкилов. Число степеней свободы дисПерсии воспроизводимости равно

/ = 8 + 8 — 2 = 14.

Поскольку средние данные позволяют предположить, что реакционная способ-- ность бромистого этила выше, можно применить для оценки значимости разли­ чия односторонний критерий (11.95). При /= 14 и р = 0,05 /0,95= 1,76. Поэтому

h - p s

~ ~ + “

= 1,76-16,6 J / / - Y + ~ ^

= U ’15’

 

у х =23,89> 14,15.

Следовательно, при 5%-ном уровне

значимости

нулевая

гипотеза отвергается

и разницу

реакционных способностей

галоидных

алкилов

следует считать значимой. Если не делать предположения, что реакционная спо­ собность бромистого этила выше, для проверки нулевой^ гипотезы надо использо­ вать двусторонний критерий (11.94). При /= 1 4 и р=0,05 ^о,975= 2,15. Поэтому

',-,+^+^=215',м1/т+т=17’2;

V — Х = 23,89 > 17,2.

Таким образом, и при двустороннем критерии нулевая гипотеза отвергается.

Нередко на практике выборка наблюдений составляется из не­ скольких подгрупп, полученных в том или ином порядке (например из различных частей генеральной совокупности). Для объединения таких подгрупп в одну выборку необходимо убедиться в однород­

ности средних по подгруппам. Для этого

проверяют

значимость

различия между средними

подгрупп и общим средним всей вы­

борки по критерию Стьюдента.

случайной величины X

Пусть имеется

k подгрупп

значений

объемом гп\, m2 .......tnt,. По

этим данным

определены

средние

подгрупп xi, Х2 ,

, xf, , Xh,

среднее всей выборки х

и среднее

квадратичное отклонение всей выборки s;

 

 

 

mj

 

 

 

Z

xJt

i- 1

 

Xj =

/- 1

»

 

mj ". ■* =

П

г д е л = m i + /712 + . . . + а д

s =

Л — 1

Обозначим

yj =

(II. 100)

Можно доказать [12], что величина

 

У]Vт)(л —2)

t] =

(II.101)

 

п — m j mjijj

имеет распределение Стьюдента с f = n—2 степенями свободы. При помощи этого критерия проверяется нулевая гипотеза Но равенст­ ва математического ожидания в /-й подгруппе тj и математическо­ го ожидания всей, выборки т:

HQ\ mj = т.

Нулевая гипотеза отвергается, если не выполняются неравенства (11.55) для двустороннего критерия или неравенства (11.59) и

(11.60) для одностороннего. Обычно в качестве среднего Xj рас­ сматривают наибольшее (наименьшее) среднее среди'средних под­ групп.

15. Сравнение нескольких средних. При сравнении нескольких средних можно использовать ^-критерий, проводя сравнение попар­ но. Однако для использования при сравнении полной информации о всех средних такое сравнение проводят при помощи множествен­ ного рангового критерия Дункана [9]. Пусть по k выборкам разного объема получено k средних значений:

х\, х2,..., Xj......

xk,

п)

xj

*1

Генеральные дисперсии равны между собой, т. е.

„2 _

л _

__

2

„2

°1 =

°2 =

• • • =

°А =

• • • = °ДГ-

При применении критерия Дункана следует: 1) проранжировать А средних значений, расположив их в порядке возрастания; 2) опре­

делить ошибку воспроизводимости результатов sx с соответствую­ щим, числом степеней свободы fx\ 3) определить ошибку для каж­ дого среднего

S—

J= 1, 2,... k\

xi

 

4) выписать из таблицы Дункана

(табл. 9 приложения) значимых

рангов с выбранным уровнем значимости, числом tiD=fx и р = 2, 3,

..., k

(&—1) значений рангов; 5) умножить эти значения рангов на

S-,

и таким образом определить (k—1) наименьших значимых

рангов; 6) проверить значимость различия между средними, начи­ ная с крайних в ранжировочном ряду; разность максимального и минимального значений среднего сравнить с наименьшим значимым рангом при p = kf затем найти разность максимального среднего и второго среднего в ранжировочном ряду и сравнить ее с наимень­ шим значимым рангом при p = k—1 и т. д. Это сравнение продол­ жить для второго по величине среднего, которое сравнивается с наименьшим, и т. д., пока не будут исследованы на значимость раз­ личия между всеми k (k-^l)/2 парами.

Пример 11. Исследовался процесс радикальной полимеризации солей на

основе 4-винилпиридина и различных галоидных алкилов: G H 3I, C2H5I, C3H7I, C4H9I, СгНбВг, СзН7Вг, C4H9CI, C3H7CI. Средний выход полимера по восьми па­

раллельным опытам для каждого галоидного алкила приведен ниже:

№ п/п

0

1

2 3

4

5

*6

7

Галоидные

C2H5I C3H7I C4H9I С2Н5Вг С3Н7Вг C4H9CI С3Н7С1

алкилы

CH3I

Средний

% 95,12

85,46

87,77 67,72

91,61

76,04

13,28

11,72

выход,

Ошибка воспроизводимости при измерении выхода полимера sx= 16,6. Число сте­ пеней свободы fx= 56. В соответствии с правилом применения критерия Дункана расположим средние результаты в порядке возрастания:

11,72

13,28

67,72

76,04

85,46

87,77

91,61

95,12

(7)

(6)

(3)

ф)

( 1) ‘

(2)

(4)

(0)

Ошибка воспроизводимости sx= 16,3; /х—56.

 

 

 

Ошибка среднего равна 5— =

16,3

л

 

 

 

— 17

= 5,9 .

 

 

 

 

 

Jf

V s

 

 

 

 

Выпишем из таблицы Дункана (табл. 9 приложения) для п2=Ь6 и уровня значимости 0,05 значимые ранги:

р

2

3

4

5

6

7

8

ранги

2,85

3,0

3,09

3,12

3,21

3,25

3,29

Наименьшие значимые ранги (НЗР), умноженные на ошибку среднего, равны:

р

2

3

4

5

6

7

8

НЗР-Sj

16,96

17,85

18,39

18,56

19,1

19,34

19,58

(0)— (7) =95,12— 11,72 = 83,4 > 19,58 — различие значимое

(0)— (6) =95,12— 13,28 = 81,84> 19,34 — различие значимое

(0)-—(3) =95,12—67,72=27,4 > 19,1 — различие значимое

(0)— (5) =95,12—76,04 = 19,08> 18,56 — различие значимое

(0)— (1) =95,12—85,46=9,66< 18,39 — различие незначимое

(0)— (2) =95,12—87;77< 17,85 — различие незначимое

(0)— (4) =95,12—91,61 <16,96 — различие незначимое

(4) — (7) = 79,89> 19,34 — различие значимое

(4)— (6) =78133>19,1 — различие значимое

(4)— (3) =23,89> 18,56 — различие значимое (4)— (5) = 13,57<18,39 — различие незначимое

(4)— (1) =6,16< 17,85 — различие незначимое

(4) — (2) =3,84< 16,96 — различие незначимое

(2) — (7) =76,05> 19,1 — различие значимое

(2)— (6) =74,49> 18,56 — различие значимое

(2) —(3) =20,05> 18,39 — различие значимое <2) — (5) = 11,76< 17,85 — различие незначимое

(2) — ( 1) =2,31 <16,96 — различие незначимое

( 1)— (7) =73,74> 18,56

— различие

значимое

( 1)_ (6) = 72,18> 18,39

— различие

значимое

(1)— (3) = 17,74< 17,85 — различие незначимое

(1)— (5) =9,42<16,96 — различие незначимое

(5)— (7) ='64,32> 18,39 — различие значимое

(5)— (6) =62,76>17,85 — различие значимое..

(5)— (3) =8,32<16,96 — различие незначимое

(3)— (7) = 56,00> 17,85 — различие значимое

(3)— (6) =54,44> 16,96 — различие значимое

(6)— (7) = 1,56< 16,96 — различие незначимое

167 Проверка однородности результатов измерений. Грубые из­ мерения являются результатом'поломки прибора или недосмотра экспериментатора, и результат, содержащий грубую ошибку, резко отличается по величине. На этом основаны статистические крите­ рии оценки и исключения грубых измерений. Наличие грубой ошиб­ ки в выборке значений случайной величины X нарушает характер распределения, изменяет его параметры, т. е. нарушается однород­ ность наблюдений. Поэтому выявление грубых ошибок можно трактовать как проверку однородности наблюдений, т. е. проверку гипотезы о том, что все элементы выборки xi, *2 , ..., хп получены из одной и той же генеральной совокупности. Будем по-прежнему полагать, что случайная величина подчиняется нормальному рас­ пределению. Для решения этой задачи предложено несколько методов.

Имёется выборка хи *2 , ... »хп значений случайной величины X. Пусть хтах (*min)— наибольший (наименьший) результат измере­ ния. Величины

v

( 11. 102)

или

V

г

(11.103)

имеют специальное распределение, которое зависит только от чис­ ла степеней свободы f = n —2. В табл. 2 приведены значения v(v') для уровней значимости р = 0,10; 0,05; 0,025 и 0,01 при числе сте­ пеней свободы от 1 до 23.

Величина Xmax(*min) исключается из выборки как грубое изме­ рение (на уровне значимости р), если определенное по формулам

(11.102) и

(11.103) значение v или v' окажется больше табличного.

 

 

 

 

 

 

 

Т а б л и ц а 2

 

Значения v(v') для различных уровней значимости

 

 

Число сте­

Уровни значимости

Р

Число сте­

Уровни значимости р

пеней свобо­

0,10

0,05 |

0,025

0,01

пеней свобо­

0,10 |

0,05

0,025 |

0,01

ды /

ды / -

1

1,406

1,412

1,414

1,414

13

2,326

2,493

2,638

2,809

2

1,645

1,689

1,710

1,723

14

2,354

2,523

2,670

2,837

3

1,791

1,869

1,917

1,955

15

2,380

2,551

2,701

2,871

4

1,894

1,996

2,067

2,130

16

2,404

2,577

2,728

2,903

5

1,974

2,093

2,182

2,265

17

2,426

2,600

2,754

2,932

6

2,041

2,172

2,273

2,374

18

2,447

2,623

2,778

2,959

7

2,097

2,237

2,349

2,464

19

2,467

2,644

2,801

2,984

8

2,146

2,294

2,414

2,540

20

2,486

2,664

2,823

3,008

9

■2,190

2,343

2,470

2,606

21

.2,504

2,683

2,843

3,039

10

2,229

2,387

2,519

2,663

22

2,520

2,701

2,862

3,051

11

2,264

2,426

2,562

2,714

23

2,537

2,717

2,880

3,071

12

2,297

2,461

2,602

2,759

 

 

 

 

 

Если сомнение вызывают два или три элемента выборки, посту­ пают следующим образом. Для всех сомнительных элементов вы­ числяют v(v'), и исследование начинается с элемента, имеющего наименьшее значение v(v'). Остальные сомнительные элементы из выборки исключаются. Для этой уменьшенной выборки определяют х, « и новое значение v (v') для исследуемого элемента. Если иссле­ дуемый элемент является грубым измерением, еще с большим осно­ ванием можно считать грубыми измерениями ранее исключенные элементы. Если исследуемый элемент не является грубым измере­ нием, его присоединяют к выборке и начинают исследовать следую­ щий по величине v (o'), элемент выборки, при этом снова вычисля­ ют новые значения х, s и т. п.

Пример 12. При пятикратном определении степени извлечения алкалоидов из

растительного сырья получено среднее значение степени извлечения х=85%, при­ чем sx=2%. Максимальное значение 92%, полученное в одном из параллельных

опытов, вызывает сомнение. Проверить, не является ли значение степени извле­

чения, равное 92%, грубым измерением.

 

Р е ш е н и е , По формуле (11.102)

посчитаем v для сомнительного элемента:

92 —85

7

 

Г ~

~ 2-0,895 ” 3, '

г У

т

 

По табл. 2 находим для f—л—2=3, t>o,96=1,869 и о=3,9>о0,в5-

Следовательно, на уровне значимости р = 0,05 значение степени извлечения» равное 92%, надо_считать ошибочным, его следует из выборки исключить и за-

ново пересчитать х и s*.

17. Сравнение выборочного распределения и распределения ге^ неральной совокупности. Проверку гипотез относительно параметров распределения генеральной совокупности проводили в предположении нормального распределения наблюдаемой случайной величины. Гипотезу о нормальности изучаемого распределения И математической статистике называют основной гипотезой. Проверь ку этой гипотезы по выборке проводят при помощи критериев со- гласия. Критерии согласия применяются для проверки гипотезы о предполагаемом виде закона распределения. Критерии согласия позволяют определить вероятность того, что при гипотетическом законе распределения наблюдающееся в рассматриваемой выборке отклонение вызывается случайными причинами, а не ошибкой В гипотезе. Если эта вероятность велика, то отклонение от гипотети­ ческого закона распределения следует признать случайным и счи­ тать, что гипотеза о предполагаемом законе распределения не опровергается.

Вероятностный характер критериев не позволяет однозначно принять или отвергнуть проверяемую гипотезу. Критерий позволяет утверждать, что гипотеза не противоречит опытным данным, если вероятность наблюдаемого отклонения от гипотетического закона велика, или что гипотеза не согласуется с опытными данными, если эта вероятность мала. Чаще всего используется один из двух критериев согласия: критерий Пирсона (критерий %2) и критерий Колмогорова.

Для применения критерия %2 (хи-квадрат) весь диапазон изме­ нения случайной величины в выборке объема п разбивается на к интервалов. Число интервалов к берут обычно в зависимости от объема выборки в пределах от 8 до 20. Число интервалов можно определить по полуэмпирической формуле (11.22). Число элементов выборки, попавших в i-й интервал, обозначим через н*. Построен­ ная гистограмма (см. гл. II, 1) выборочного распределения или общие соображения о механизме возникновения случайной величи­ ны служат основанием для выбора типа закона распределения. Параметры этого закона могут быть определены или из теоретиче­ ских соображений, или нахождением их оценок по выборке. На основании принятого закона распределения вычисляются вероят­ ности р{ попадания случайной величины X в /-й интервал. Величи­ на, характеризующая отклонение выборочного распределения ют предполагаемого, определяется формулой

I2

(rii — npi) 2

(Н.104)

npi

 

 

где к — число интервалов; п — объем выборки.

Сумма

(11.104) имеет приближенно ^'распределение с / =

= kс—1

степенями свободы, где с — число параметров гипотети­

ческого закона распределения, определяемых по выборке.

Для нормального распределения с=з2, если.и х , и sx определяют­ ся по данной выборке. Гипотеза о принятом типе закона распреде­ ления принимается на данном уровне значимости р, если

г 2 < 1 1 - р , ' (»• Ю5)

где x2i-p определяется по табл. 4 приложения для выбранного уров­ ня значимости и числа степеней-свободы /. Если X2>X2I- P>делает­ ся вывод, что гипотеза не согласуется с выборочным распределе­ нием.

При использовании критерия х2 желательно, чтобы объем вы­ борки был достаточно велик: п~^ 50-г 150, а количество элементов п^Ъ-г-Ъ. Если какое-либо из nj<5, то два или несколько соседних интервалов должны быть объединены в один. При этом соответст­ венно уменьшается число степеней свободы.

Вероятности р» попадания значений случайной величины в г-й интервал для нормального закона распределения можно' опреде­ лить по формуле (1.64):

Р ( Л < *

<#) _ Ф(

^ ) _

Ф(

^

) .

(11.106)

При подсчете теоретических вероятностей

р* нужно

считать, что

крайний левый интервал простирается до —оо;

крайний правый —

•до + о о .

критерия

согласия

Колмогорова

необходимо

Для применения

определить наибольшее абсолютное отклонение выборочной функ­

ции распределения Fn(x)

от генеральной F(x):

 

D =

шах 1 Fn (х) — F(x) | .

(11.107)

Затем вычисляется величина X:

 

 

\ = V~nD.

(11.108)

В табл. 3 приведены квантили X\-v распределения Колмогорова.

 

 

 

 

 

Т а б л и ц а 3

 

Квантили распределения Колмогорова

 

 

р

х1—р

р

xi —р

р

Х1- р

0,99

0,44

0,50

0,83

0,15

1,14

0,90

0,57

0,40

0,89

0,10

1,22

0,80

0,64

0,30

0,97

0,05

1,35

0,70

0,71

0,25

1,02

0,02

1,52

0,60

0,77

0,20

1,07

0,01

1,63

Если вычисленное значение X меньше табличного Xi-P, то гипо­ теза о совпадении теоретического закона распределения F(x) с выборочным Fn(x)' не отвергаете^. При Х ^Х \-Р гипотеза отклоня­ ется (или считается сомнительной). Уровень значимости р при при­ менении критерия Колмогорова выбирают обычно равным 0,2-^0,3. Критерий Колмогорова может быть применен также для проверки гипотезы о том, принадлежат ли две выборки объемов п\ и « 2 одной генеральной совокупности. При этом величина определяется из выражения

Dnг, п, = max I Fn, (•*) — Л», (■*) I •

(II. 109)

где Fn,(x) и Fni(x) — выборочные функции распределения, пост­ роенные для первой и второй выборок соответственно; а величина X— по формуле

х=

+ л 2

(11.110)

п 1

 

Для нормального распределения функция

F(x) определяется

по формуле

 

 

F

 

( 11. 111)

В случае выборок небольшого объема /г<20 для проверки ги­ потезы о законе распределения можно использовать простые кри­ терии, основанные на сравнении генеральных параметров распре­ деления и их оценок, полученных по выборке. В качестве оцени­ ваемых параметров удобнее всего брать моменты.

Нормальное распределение полностью определяется двумя па­ раметрами— математическим ожиданием тх и стандартом а*. Все остальные моменты нормального распределения выражаются через математическое ожидание и стандарт. Для нормального распреде­ ления коэффициент асимметрии, определяемый по формуле (1.28), равен

Yi =

(Н.112)

так как рз=0.

Коэффициент эксцесса, определяемый по формуле (1.24), также равен нулю

Y2= J y - - 3 = 0,

(П.113)

так как для нормального распределения

щ = Зо£.

(11.114)