книги / Оптимизация эксперимента в химии и химической технологии
..pdfуровню значимости для двустороннего критерия соответствует кри
тическое значение 6 0 ,9 7 5 . |
Но |
0 о,9 5 < |
6 о,9 75 , |
значит при одностороннем |
|||||||||||||
критерии большее число гипотез будет отвергнуто и, следовательно, |
|||||||||||||||||
меньше будет ошибка второго рода. |
|
|
|
|
|
|
|
|
|
||||||||
10. |
Оценка математического ожидания нормально распределен |
||||||||||||||||
ной случайной величины. При отсутствии грубых и систематических |
|||||||||||||||||
ошибок |
математическое |
ожидание |
случайной |
величины |
совпадает |
||||||||||||
с истинным результатом наблюдений. Поэтому оценка математиче |
|||||||||||||||||
ского ожидания имеет важное значение при обработке |
наблюде |
||||||||||||||||
ний. Легче всего оценить мате |
|
|
|
|
|
|
|
|
|
|
|||||||
матическое ожидание |
При из |
|
|
|
|
|
|
|
|
|
|
||||||
вестной дисперсии генеральной |
|
|
|
|
|
|
|
|
|
|
|||||||
совокупности |
(см. |
гл. II, |
8). |
|
|
|
|
|
|
|
|
|
|
||||
Генеральную дисперсию о2 по |
|
|
|
|
|
|
|
|
|
|
|||||||
лучить, нельзя |
из |
наблюдений, |
|
|
|
|
|
|
|
|
|
|
|||||
ее можно только |
оценить при |
|
|
|
|
|
|
|
|
|
|
||||||
помощи выборочной дисперсии |
|
|
|
|
|
|
|
|
|
|
|||||||
s2. Ошибка от замены генераль |
|
|
|
|
|
|
|
|
|
|
|||||||
ной дисперсии |
выборочной |
бу |
|
|
|
|
|
|
|
|
|
|
|||||
дет |
тем |
меньше, |
чем |
больше |
|
|
|
|
|
|
|
|
|
|
|||
объем выборки п. На практике |
Рис. |
18. |
Плотность |
распределения |
|||||||||||||
эту |
погрешность не учитывают |
||||||||||||||||
при |
|
50 и в формуле |
(11.49) |
|
|
|
|
Стьюдента" |
|
|
|
||||||
для доверительного |
интервала |
|
|
выборочным |
|
стандартом. |
|||||||||||
генеральный |
параметр |
_ах |
заменяют |
|
|||||||||||||
В дальнейшем предполагается, что наблюдаемая случайная вели |
|||||||||||||||||
чина имеет нормальное распределение. |
|
|
|
|
|
|
|
|
|||||||||
|
При небольших объемах выборок для построения |
|
доверитель |
||||||||||||||
ного интервала математического ожидания |
используют |
|
распреде |
||||||||||||||
ление Стьюдента, или ^-распределение. Распределение Стьюдента |
|||||||||||||||||
имеет случайная величина t: |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
5дг |
|
|
|
|
|
|
|
|
|
(11.53) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Плотность вероятности ее имеет вид |
|
|
|
|
|
|
|
|
|||||||||
|
|
/( 0 = |
1 |
|
|
|
|
|
|
|
|
—с» < t < |
+ |
0 |
0 |
(11.54) |
|
|
|
' W |
f |
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
где |
T (f)— гамма-функция; |
/ — число степеней |
свободы |
|
выборки. |
||||||||||||
|
Если дисперсия sx2 и среднее х |
определяются по одной.и той |
|||||||||||||||
же выборке, то f= n —1. |
|
|
|
Стьюдента |
зависит |
только от |
|||||||||||
|
Таким образом, |
распределение |
|||||||||||||||
числа степеней свободы f, с которым была определена выборочная |
|||||||||||||||||
дисперсия (рис. 18). На рис.'18 приведены графики |
|
плотности t- |
|||||||||||||||
распределения для /= 1 , f = 5 и нормальная кривая. Кривые £-рас- |
|||||||||||||||||
пределения по своей форме напоминают |
нормальную |
кривую, но |
при малых f они медленнее сближаются с осью абсцисс при |/|->оо. При f—^oo дисперсия выборочная s2-*o2, поэтому распределение Стьюдента сближается с нормальным; /=оо соответствует нормаль ному, распределению. Вероятность того, что случайная величина попадет в некоторый интервал {tP/2; ti-p/2), определяется выра жением
р Vpl2 < t < *1-PJ2) = 1 “ Р = Р. |
(Н.55) |
Распределение Стьюдента симметрично относительно нуля, поэтому
*/?/2 = —*1-р/2» |
(И.56) |
Учитывая симметрию /-распределения, часто пользуются обозна чением /р>/, где / — число степеней свободы, а р — вероятность того,
что / находится за пределами интервала |
[tp/2 , /i-p/2). |
Подстав |
||
ляя в (11.56) выражение (11.53) для /, получим неравенство |
||||
—t1-Р/2 |
х — тх |
^ |
—/7/2, |
(И-57) |
' |
||||
откуда после преобразований получим |
|
|
|
|
|
— |
|
5 |
(11.58) |
— ^1—р/2 ^ тх < х ■ |
|
h - p f t - |
У п
Значения квантилей ii-p/г для различных чисел степеней свобо ды / и уровней значимости р приведены в табл. 3 приложения.
В некоторых задачах требуется найти одностороннюю оценку математического ожидания, т. е. оценку только сверху или только снизу. При доверительной вероятности р=1—р оценка для слу чайной величины t сверху имеет вид
t ^ t\—р ,
ИЛИ
х — тх т / |
|
----------— у п < ti -pl |
|
Sx |
|
оценка для t снизу имеет вид |
|
^ > |
^1—/7 1 |
ИЛИ |
|
х тх |
> — t\ - p . |
V п |
|
Sx |
|
(11.59)
(II. (Ю)
Из неравенств (11.59) и (11.60) получим односторонние доверитель ные оценки для математического ожидания сверху:
тх < х + |
t\—p |
(Н.61) |
и снизу: |
У п |
|
|
|
|
тх > X -------- j b r h - p . |
(11.52) |
У п
Пример 4. Вредной примесью в кормовых фосфатах является примесь'фтора. Необходимо найти возможный верхний предел содержания фтора в фосфатах по
следующим результатам анализов |
содержания фтора в 100 кг готового |
продук |
та (%): 0,18; 0,12; 0,13; 0,15. Доверительная вероятность (3 = 0,95. |
фтора в |
|
Р е ш е н и е . Обозначим через |
X результат анализа содержания |
100 кг кормовых фосфатова Среднее содержание фтора по четырем параллельным
определениям равно *=0,15%. Ошибка воспроизводимости sx= 0,03. Число сте пеней свободы ошибки воспроизводимости равно 3. Для определения возможного верхнего предела содержания фтора в готовом продукте (тх) воспользуемся
формулой |
(11.61). При Р=0,95 и f = 3 по табл. 3 приложения для 2/7= 0,10 имеем |
/о,95= 2,35. |
Отсюда |
0,03 |
|
тх < 0,015 + |
2,35 = 0,19. |
4 |
|
Пример 5. Диаммонийфосфат марки |
«ч. д. а» должен содержать не менее |
99% основного вещества. Требуется проверить гипотезу статистической значимо сти различия между паспортными данными, и следующими результатами трех определений содержания диаммонийфосфата в реактиве (%): 98,0; 97,3; 97,5.
Р е ш е н и е . Обозначим через X результат анализу Среднее значение трех
параллельных измерений равно *=97,8% . Ошибка воспроизводимости (выбороч ный стандарт) sx равна 0,52. Число степеней свободы ошибки воспроизводимости /= 2 . В качестве нулевой гипотезы рассмотрим гипотезу Я0:тх=99% ; следова
тельно, исследуемый реактив доброкачествен. Альтернативная гипотеза Е:. тхф =5^=99. Используя распределение Стьюдента, определим вначале критическую
область при двустороннем критерии. При (3 = 0,95 р=0,05 и квантиль / 1 ppi =4,30
при f = 2 (табл. 3 приложения). Критические значения нулевой гипотезы согласно (11.58) будут
— |
SX |
|
* ^ ТПх |
h~P/2> |
|
|
V n |
|
_ |
Sx |
|
х >тх -\ |
||
h-p/2- |
||
|
V 7 |
Физический смысл имеет только первое неравенство:
х < 99 — ^ 4 , 3 0 = 97,71.
Значение *=97,8 не попадает в эту критическую область; следовательно, двусто ронний критерий не позволяет отвергнуть нулевую гипотезу и считать реактив недоброкачественным. По физическому смыслу задачи здесь можно применить
односторонний критерий — диаммонийфосфат разлагается при |
хранении на све |
||
ту, поэтому выборочную оценку нужно сравнивать |
только с |
«теми значениями, |
|
которые меньше 99. |
для |
2/?=0,10 |
имеем /0,95=2,92. |
При Р=0,95 и f = 2 по табл. 3 приложения |
|||
Критическое значение нулевой гипотезы: |
|
|
|
х < тх |
-Р* |
|
|
V 7 |
|
|
|
0,52 х < 99 — —7—2,92 = 98,1.
Значение *=97,8 меньше критического значения и, следовательно, попадает в критическую область. Таким образом, односторонний критерий как более точный сумел при тех же исходных данных выявить недоброкачественность реактива.
11. Оценка дисперсии нормально распределенной случайной'ве личины. Дисперсию генеральной совокупности а*2 нормально рас пределенной случайной величины можно оценить, если известно распределение ее оценки — выборочной дисперсии s x2. Распределе ние выборочной дисперсии можно получить при помощи распреде ления Пирсона или ^-распределения. Если имеется выборка п не зависимых наблюдений Х\, Хг, ..., х п над нормально распределенной случайной величиной, то можно показать, что сумма
|
|
(11.63) |
имеет распределение |
f = t i —1 степенями свободы. |
|
Плотность х2 распределения зависит только от числа степеней |
||
свободы /: |
|
|
|
2m r\ , n W )lTe~xV' |
<UM> |
где T(f) — гамма-функция.
На рис. 19 приведены кривые плотности вероятности х2-распре-
деления при некоторых значениях f. Кривые асимметричны, степень асимметрии уменьшается с уве
личением f. При доверительной вероятности р= 1— р двусторон няя доверительная оценка для
X имеет вид |
|
|
У.р/2< X2 < Ул—р/2> |
(11.65) |
|
одностронние |
оценки |
имеют |
вид |
|
|
„2 |
12 >%р- |
( 11.66) |
Х2<ХГ-р> |
Квантили x2i-p ПРИ различ ных р и / приведены в табл. 4 приложения. Так как выбороч
ная дисперсия s 2 через элементы выборки определяется по фор муле
4= - |
;-i______ _ |
|
f-i_______ |
|
л - 1 |
~ |
/ |
||
|
||||
из (11.63) имеем |
|
|
|
(11.67)
Подставляя (IL67) в (11.65), получим
4/2 < |
< ll - p /2 - |
(11. 68) |
Решая неравенство отнрсительно о*2, получим доверительные дву сторонние границы для генеральной дисперсии о*2:
/4 |
< 4 < |
(11.69) |
V 2 |
|
|
h - p / 2 |
|
|
Аналогично получаются односторонние доверительные оценки:
/4 |
/4 |
•4 |
(11.70) |
'й - р |
Пример 6. Оценить ошибку воспроизводимости определения усвояемой Р20 5
в сложном удобрении сернокислотным методом по результатам трех параллель ных опытов: 17,2; 16,3; 15,5.
Р е ш е н и е . Выборочная оценка для дисперсии воспроизводимости равна
3
2 (Xi-X)*
2 _ |
/ - 1 |
|
5X |
3 — 1 |
0,73. |
Число степеней свободы дисперсии воспроизводимости /*= 2 . Задавшись довери тельной вероятностью р= 0,90, по табл. 4 приложения при числе степеней свобо
ды / = 2 находим X о,05 ^=6,0 и х$95 =0,103. По формуле (11.69) определим дву стороннюю доверительную оценку для дисперсии воспроизводимости:
0,73 - 2 |
о |
0,73-6 |
------6,0 |
< at < |
-----:---, |
х |
0,103 |
|
0,24 |
< |
14,1. |
Извлекая из всех частей неравенств квадратный корень, получим оценку для ошибки воспроизводимости 0,49^ 0x^ 3,61 . В связи с малым числом степеней свободы доверительные границы получились резко асимметричными.
С ростом числа степеней свободы асимметрия кривых распреде ления уменьшается, соответственно уменьшается и асимметрия до верительных границ. Можно показать, что при я^ЗО выборочный стандарт 5 распределен приближенно нормально с математическим ожиданием т 8= о и среднеквадратичной ошибкой
°s=°xlV2f. |
/ |
(11.71) |
Неизвестный генеральный стандарт в выражении (11.71) при я ^ 30 заменяют выборочным:
В соответствии с (11.50) доверительные границы для генерального стандарта определяются неравенством
*—ul—p/2 < ах < sx + |
sx |
(11.73) |
“l-p/2- |
||
У 2 / |
V 57 |
|
Пример 7. Оценить ошибку воспроизводимости ох для выборки из 31 наблю дения с выборочным стандартом $*=0,85. Доверительную вероятность р принять
равной 0,9.
Р еш ен и е . Построим доверительный интервал для ошибки воспроизводимо сти, используя ^-распределение. По табл. 4 приложения при числе степеней сво
боды f =30 и доверительной вероятности Р=0,9 находим Хо,05= 43,8 и Хо,95 —
= 18,5.
По формуле (11.69) определим двустороннюю доверительную оценку для
дисперсии воспроизводимости: |
|
2 |
|
||
|
0,852-30 |
|
0,852-30 |
||
|
—--------< |
at < -----------, |
|||
|
|
43,8 |
|
* |
18,5 * |
|
|
0,48 |
< |
< |
1,13. |
Доверительные границы |
для ошибки воспроизводимости определятся нера |
||||
венством: 0,69 ^ |
Ох^ 1,05. |
|
|
|
а*, воспользовавшись нормальным |
Определим |
доверительные границы для |
||||
распределением. По формуле |
(11.72) |
определим аа: |
|||
|
|
sx |
|
0,85 |
|
|
|
V v |
|
|
0 , 11. |
|
|
|
1/2-30 |
По табл. 2 приложения для доверительной вероятности Р=0,9 находим «0,95=1,64. В соответствии с (11.73) доверительные границы для ошибки воспроизводимости определяются неравенством
0,85 — 0,11-1,64 < < 0,85 + 0,11-1,64;
окончательно 0 , 6 7 1 , 0 3 . Полученные с использованием нормального рас пределения доверительные границы мало отличаются от приведенных выше.
12. Сравнение двух дисперсий. При обработке наблюдений часто возникает необходимость сравнить две или несколько выборочных дисперсий. Основная гипотеза, которая при этом проверяется: можно ли считать сравниваемые выборочные дисперсии оценками одной и той же генеральной дисперсии. Рассмотрим две выборки
x \ j |
Х 2 ....... |
Х 'пх |
х1* |
х2* •**»хп»* |
средние значения которых соответственно равны х\ и Х2 . Выбороч ные дисперсии
9 |
2 |
|
W - *1? |
i -1 |
|
||
,2 |
2 |
|
К -■хУ |
|
________ |
||
|
|
|
«2 — 1 |
определяются со степенями свободы
/1 = Л1— 1, / 2= л2— 1.
Требуется выяснить, являются ли выборочные дисперсии Si2 и з22 значимо различными или же полученные выборки можно рассмат ривать как взятые из генеральных совокупностей с равными дис персиями. Предположим, что первая выборка сделана из генераль ной совокупности с дисперсией аД а вторая — из генеральной сово купности с дисперсией сг22. Проверя ется нулевая гипотеза о равенстве
генеральных дисперсий Н0: ai2 = cr22. Чтобы отвергнуть эту гипотезу, нужно доказать значимость разли чия между Si2 и s22 при выбранном уровне значимости р. В качестве критерия значимости обычно ис пользуется критерий Фишера. Рас пределением Фишера (F — распре деление, v2— распределение) назы вается распределение случайной ве личины:
F=(.s2lo2):(sh4). (11.74)
Плотность вероятности /^-распределения определяется выражением
f(f,~ 2.)/2
(11.75)
где T{f) - гамма-функция.
^-распределение зависит только от числа степеней свободы fj и f2. На рис. 20 приведены кривые плотности вероятности F-распреде ления для некоторых значений fi и /2 . Кривые имеют асимметрич ную форму. В табл. 5 приложения приведены квантили Fj_p для разных уровней значимости р, чисел степеней свободы f 1 и /2 . Для определения квантилей Fp для значений р, не вошедших в табл. 5 приложения, используется соотношение
F P U 1 , / 2) = |
|
1 |
|
(11.76) |
|
F I - P ( / 2. / 1) |
|||||
|
|
||||
В условиях нулевой гипотезы |
2 2 |
и |
оГ |
и, следователь- |
|
0 1 = 0 2 |
---- = 1 , |
||||
|
|
|
°2 |
|
|
но, F-распределение может быть непосредственно использовано для |
|||||
оценки отношения выборочных дисперсий |
s2 |
При доверитель- |
|||
---- . |
ной вероятности |
1 —р двусторонняя доверительная оценка величи |
|||
ны F имеет вид |
|
|
|
|
|
Fр/2 (/ь |
/ 2) < F ^F1—р/2 (Л» / 2)* |
|
|
С учетом (11.76) |
|
|
|
|
|
|
^ F ^ F 1—п/2 (Л* Л). |
(11.77) |
|
В условиях |
нулевой |
_ |
О1 |
следовательно, с |
гипотезы г = |
2 » |
|||
|
|
|
s2 |
|
вероятностью 1—р должно выполняться двустороннее неравенство
|
1 |
si |
|
|
(11.78) |
|
р |
i-t 4 \ |
^ 2 |
^ ^*1—р/2 |
*^2) |
||
Л-/7/2 (/2. /l) |
5^ |
|
|
|
||
или одно из односторонних неравенств |
|
|
||||
s\ls\ < Fi-P Uu |
Si) |
(оценка |
сверху), |
(11.79) |
||
S?/52 > i/^ i-p (/2 . Л) (оценка |
снизу).- |
|||||
|
||||||
Вероятность |
неравенств, |
противоположных (11.78) и |
(11.79), |
|||
равна уровню значимости р, |
они |
образуют критическую |
область |
для нулевой гипотезы. Если полученное дисперсионное отношение попадает в критическую область, различие между дисперсиями надо считать значимым. Будем для удобства обозначать через sj2 боль
шую выборочную дисперсию. При проверке |
нулевой гипотезы |
ai2 = 0 2 2 односторонний критерий применяется, |
если альтернатив |
ной гипотезой является гипотеза <XI2> 0 2 2, т. е. если большей выбо рочной дисперсии Si2 заведомо не может соответствовать меньшая.,
генеральная. При этом различие между |
дисперсиями согласно |
||
(11.79) следует считать значимым, если |
|
|
|
s\ls\> F ^ p i f u /а ). |
(П.80) |
||
Значение Fi-P(fu fi) определяют по табл. 5—7 приложения. |
|||
Двусторонний критерий |
значимости |
(11.78) применяется для |
|
альтернативной гипотезы арф е#, т. е. когда |
соотношение между |
||
генеральными дисперсиями |
неизвестно. |
При |
этом в неравенстве |
(11.78) надо проверять только правую часть, так как левая часть
*i |
1 |
всегда выполняется: по условию —— > 1 , а |
------- — г г < 1 |
«2 |
Fl-p/2 (/2. /1) |
для небольших р. При этом различие между дисперсиями следует считать значимым, если
Пример 8. При |
оценке точности |
определения |
содержания усвояемой Р2Об |
||
в сложном |
удобрении сернокислотным методом |
дисперсия |
воспроизводимости |
||
составила |
Si2=0,73; |
fi=2. Требуется |
сравнить этот метод |
анализа усвояемой |
Р2Об с более точным нитратным методом по результатам четырех параллельных определений Р2Об: 16,5; 15,9; 16,6; 15,8.
Р е ш е н и е . Дисперсия воспроизводимости нитратного метода
4 _
2 с* /-* )2 ,2 __________ п
при числе степеней свободы f2=3. По условиям задачи для оценки значимости различия между дисперсиями Si2 и s22 можно использовать односторонний крите
рий значимости (11.80). Дисперсионное отношение
/? == 0,73/0,16 = 4,5
надо сравнить с табличным для уровня значимости р = 0,05 и чисел степеней сво боды fi= 2 и f2= 3.
Л - р ( / ь / 2) = 9,6 .
Таким образом, выборочное дисперсионнре отношение меньше табличного и дан
ные опытов не позволяют считать точность методов значимо, различной.
%
Критерий Фишера можно использовать для сравнения диспер сий, если одна из дисперсий является генеральной. Число степеней свободы генеральной дисперсии считается равным оо.
13. Сравнение нескольких дисперсий. При определении оценки дисперсии по текущим измерениям по формуле
|
|
П |
^ |
f\s\ + /2*2 + •+ fnS\ |
Ж fiSl |
У |
f l + / 2 + • • • + fn |
f |
была принята нулевая гипотеза равенства соответствующих гене ральных дисперсий. Проверить эту гипотезу для выборок разного объема можно по критерию Бартлета. Бартлет показал, что в усло виях нулевой гипотезы отношение В/С, где
В = 2,303 { / 1 * 4 - 2 / / 1 * 4
\1 -1
|
1 |
(11.82) |
|
С = 1 |
+ . 3(л — 1) |
||
|
|||
распределено приближенно как х2 с л—1 |
степенями свободы, если |
||
все f { > 2. |
генеральных дисперсий принимается, если |
||
Гипотеза равенства |
|||
|
< Х?_р |
(11.83) |
при выбранном уровне значимости р. Различие между выборочны ми дисперсиями можно считать незначимым, а сами выб'орочные
дисперсии — однородными. Так как всегда С>1, |
если окажется |
В XI- P> нулевую гипотезу следует принять; если |
В > yj_p, |
критерий Бартлета вычисляют полностью.. |
|
Пример 9. При получении фосфора возгонкой из фосфатов измерялась сте- |
|
пень восстановления фосфата при четырех различных температурах. В таблице |
приведены результаты статистического анализа однородности дисперсий воспро изводимости результатов при разных температурах.
Температура |
4 |
// |
fis] |
lg«? |
//I g s? |
i |
|
ti |
|||||||
|
|||||||
тх |
1,72 |
5 |
8,60 |
■ 0,2355 |
1,177 |
0,200 |
|
т\ |
1,60 |
4 |
6,40 |
0,2041 |
0,816 |
0,250 |
|
Т3 |
1,97 |
6 |
11,82 |
0,2945 |
1,767 |
0,167 |
|
Та |
2,37 |
8 |
18,96 |
0,3747 |
2,995 |
0,125 |
|
2 |
|
23 |
45,78 |
|
6,755 |
0,742 |
|
|
|
|
Определить, не меняется ли точность анализа с температурой.
Р еш ен и е . По данным таблицы дисперсия воспроизводимости равна
s |
2 |
45,78 |
1,99, |
|
у |
23 |
|
||
|
ig4= °> 2889- |
|
||
/I g s * |
= |
23-0,2889*= 6,874, |
|
|
1/ / = 1/23 = |
0,0435, |
|
||
В = 2,303 (6,874 — 6,755) = 0,278, |
||||
0,742 - |
0,0435 |
1 + 0 ,0 7 7 = |
1,077. |
|
|
|
= |
||
3 ( 4 - 1 ) |
|
|
||
По табл. 4 приложения находим |
при трех |
степенях |
свободы и уровне значи |
мости р=0,05, Хо,95 =7,8. Величина В<%Q,95 и» следовательно, на уровне значи
мости р=0,05 можно принять гипотезу о равенстве генеральных дисперсий. Be-" личину С можно было не вычислять.
Таким обрааом, критерий Бартлета позволяет считать, что точность анализа не зависит от температуры. Выборочные дисперсии однородны, поэтому в каче стве оценки для дисперсии воспроизводимости можно взять средневзвешенную дисперсию sv2 с числом степеней свободы f равным 23.
Если выборочные дисперсии получены по выборкам одинаковых объемов m.\ — rri2 = =m n= m, для их сравнений используют более удобный и точный критерий Кохрена. Кохрен исследовал распреде ление максимальной выборочной дисперсии к сумме всех диспер сий:
0 = 4 а х / £ * ? - |
(Н.84) |
/ / - 1
Распределение случайной величины G зависит только от числа суммируемых дисперсий п и числа степеней свободы /, с которым