Основы научных и инженерных исследований
..pdfтельного значения. В результате отбраковки может быть исключено не более одной трети всех определений. Если исключению подлежит большее число определений, то все экспериментальные данные считаются неудовлетворительными.
5.2. Определение и исключение случайной ошибки
Источники случайных погрешностей очень многообразны, их нельзя заранее предусмотреть и устранить. Эти погрешности приводят к тому, что результаты нескольких параллельных определений практически никогда не совпадают; они рассеиваются вокруг некоторого среднего значения. Степень рассеивания результатов характеризует воспроизводимость анализа. Большая разница результатов параллельных определений свидетельствует о плохой воспроизводимости.
Для определения и исключения случайных ошибок используют метод математической статистики, предусматривающий многократные параллельные измерения искомой величины. Математическая статистика позволяет оценить надежность полученных результатов, т.е. степень их соответствия истинному содержанию определяемого компонента в пробе.
Рассмотрим влияние случайных погрешностей на результаты параллельных определений [18]. Предположим, что выполнено 16 параллельных анализов и что имеется 4 источника погрешностей, которые приводят к положительным или отрицательным ошибкам одинакового значения. Положительные и отрицательные погрешности могут компенсироваться, поэтому в некоторых случаях будет наблюдаться отсутствие погрешности, в других случаях погрешности (одинакового знака) складываются и возрастают. Возможны и другие сочетания погрешностей. В табл. 5.1 приведены все возможные комбинации погрешностей для идеализированного примера.
151
Таблица 5.1
Возможные комбинации погрешностей при проведении анализа
Номер па- |
Комбинация |
Значение |
Относительная |
раллельного |
погрешно- |
случайной |
частота |
определения |
стей |
погрешности |
погрешности |
1 |
+ + + + |
4 |
1 |
2 |
+ − + + |
|
|
3 |
+ − + + |
|
|
4 |
+ + − + |
2 |
4 |
5 |
+ + + − |
|
|
6 |
− − + + |
|
|
7 |
− + + − |
|
|
8 |
+ − − + |
0 |
6 |
9 |
+ − − + |
|
|
10 |
+ − + − |
|
|
11 |
− + − + |
|
|
12 |
+ − − − |
|
|
13 |
− + − − |
–2 |
4 |
14 |
− − + − |
|
|
15 |
− − − + |
|
|
16 |
− − − − |
–4 |
1 |
Данные табл. 5.1 и рис. 5.1 показывают, что чем меньше случайная погрешность, тем чаще она появляется. Так, нулевая погрешность появляется в 6 случаях из 16 определений (вероятность 0,375). Чем больше случайная погрешность, тем меньше частота ее появления. Так, погрешность в 2 единицы наблюдается 4 раза из 16 определений (вероятность 0,250), в 4 единицы – один раз (вероятность 0,0625). Вероятность появления положительных и отрицательных ошибок одинакова. Для небольшого количества наблюдений эти зависимости не всегда четко соблюдаются.
152
Для большого числа измерений случайные ошибки распределяются по определенным законам:
1) нулевые или близкие к ним ошибки имеют максимальную частоту появления;
Относительная частота |
погрешностей |
7
6
5
4
3
2
1
0 -6 -4 -2 0 2 4 6
Погрешность
2) |
вероятность |
|
появ- |
Рис. 5.1. Кривая распределения |
||||||||
ления |
отклонений |
разного |
|
|
ошибок |
|||||||
знака (положительного и от- |
|
|
|
|
|
|||||||
рицательного) одинакова; |
|
|
|
|
|
|||||||
3) |
с |
ростом |
ошибки |
|
р(х) |
|
|
|
||||
вероятность |
ее |
появления |
|
|
|
|
|
|||||
|
|
|
|
|
||||||||
экспоненциально |
|
|
умень- |
|
|
|
|
|
||||
шается. |
|
|
|
|
|
|
|
|
|
|
||
Графически |
эти |
зако- |
|
|
|
|
|
|||||
номерности можно предста- |
|
|
|
|
|
|||||||
вить в виде кривой Гаусса, |
|
|
|
|
|
|||||||
или кривой |
нормального |
|
|
|
х |
|
||||||
Рис. 5.2. Кривая распределения |
||||||||||||
распределения |
погрешно- |
|||||||||||
стей, |
построенной |
по ре- |
Гаусса при большом числе наб- |
|||||||||
зультатам |
большого |
числа |
|
|
людений |
|||||||
|
|
|
|
|
наблюдений (рис. 5.2).
Кривая распределения Гаусса описывается уравнением
Y = |
exp(−(x |
−µ) |
2 / 2σ2 ) |
, |
(5.1) |
σ |
2π |
|
|||
|
|
|
|
где Y – частота появления каждого значения; х – единичное измерение;
µ – истинное значение измеряемой величины (или среднеарифметическое для бесконечно большого числа измерений;
σ = |
∑(xi −µ)2 |
– среднеквадратичное (стандартное) |
|
n |
|||
|
|
отклонение, представляет собой количественную меру вос-
153
производимости, т.е. близости отдельных результатов к среднему значению. Квадрат величины стандартного отклонения σ2 называют дисперсией; n – число измерений (наблюдений, определений).
Введем обозначение Z = (x – µ)/σ в уравнение (5.1). Если принять µ за условный нуль (µ = 0) и отсчитывать отклонения в единицах стандартного отклонения (т.е. при σ = 1), тогда уравнение (5.1) преобразуется в следующее
уравнение: |
exp(−Z 2 |
/ 2) |
|
|
|
Y = |
. |
(5.2) |
|||
2π |
|
||||
|
|
|
|
Площадь s, заключенная между кривой Гаусса и осью абсцисс, представляет интеграл:
|
1 |
+∞ |
2 /2dZ . |
|
|
s = |
∫ å – Z |
(5.3) |
|||
|
|||||
|
2π −∞ |
|
|
||
|
|
|
+∞ |
|
|
Из математики известно, что |
∫ å−Z 2 /2dZ = |
2π, поэто- |
−∞
му интеграл (5.3) равен 1. Это означает достоверность появления значения измерения, лежащего в области от –∞ до +∞, т.е. вероятность такого события равна единице.
Проинтегрировав уравнение (5.3) в пределах от (1 – σ) до (1 + σ), получаем
s = |
1 |
|
|
Z =+1 |
å−Z 2 /2dZ = 0,683 или 68,3 %. |
|
|
|
|
∫ |
(5.4) |
||||
|
|
||||||
|
|
2π Z =−1 |
|
|
|||
Аналогично |
|
после интегрирования уравнения |
(5.3) |
||||
в пределах от Z = –2 до Z = 2 и от Z = –3 до Z = 3 получаем |
|||||||
|
|
1 |
|
|
Z =+2 |
|
|
s = |
|
|
∫ |
å−Z 2 /2dZ = 0,955 или 95,5 % |
(5.5) |
||
|
|
|
|||||
и |
2π Z =−2 |
|
|||||
|
|
|
|
|
|
||
s = |
|
1 |
|
|
Z =+3 |
å−Z 2 /2dZ = 0,997 или 99,7 %. |
|
|
|
|
∫ |
(5.6) |
|||
|
|
|
|
||||
|
|
2π Z =−3 |
|
|
|||
|
|
|
|
|
|
154 |
|
Из уравнения (5.4) следует, что вероятность (так называемая доверительная вероятность) появления измерения, лежащего в области ±σ, равна 68,3 %, т.е. в 68,3 случаях из 100 случайная погрешность любого данного единичного измерения меньше (или равна) ±σ. Аналогично из (5.5) и (5.6) выводим, что в 95,5 случаях и, соответственно, в 99,7 случаях из 100 случайные погрешности любого данного единичного измерения меньше (или равны) ±2σ или ±3σ.
Таким образом, доверительная вероятность – это отношение площади под кривой нормального распределения для каждого значения Z к общей площади. Иными словами, доверительная вероятность 68,3 % означает, что Z = 1σ и, следовательно, в 68,3 случаях из 100 случайная погрешность любого данного единичного определения (измерения, наблюдения) будет меньше (или равна) 1σ. При доверительной вероятности 95,5 % Z = 2σ и, следовательно, в 95,5 случаях из 100 случайная погрешность любого данного единичного определения будет меньше (или равна) 2σ.
Следовательно, доверительная вероятность определяется числом единиц стандартного отклонения, т.е. величиной Z; в свою очередь, каждому значению доверительной вероятности соответствует определенное значение Z, т.е. Z зависит от заданной доверительной вероятности. Часто в иностранной литературе вместо доверительной вероятности Р используют величину α = 1 – Р (обозначаемая в долях), которая называется уровнем значимости. Некоторые другие значения доверительной вероятности при разных значениях Z приведены в табл. 5.2.
|
|
|
|
|
|
Таблица 5.2 |
|
Значения доверительной вероятности Р в зависимости |
|||||||
|
|
от величины Z |
|
|
|
||
|
|
|
|
|
|
|
|
Р, % |
α |
Z |
|
Р, % |
α |
|
Z |
50 |
0,05 |
±0,67 |
|
95 |
0,05 |
|
±1,96 |
68 |
0,32 |
±1,00 |
|
96 |
0,04 |
|
±2,00 |
80 |
0,20 |
±1,29 |
|
99,7 |
0,003 |
|
±3,00 |
90 |
0,10 |
±1,64 |
|
99,9 |
0,001 |
|
±3,29 |
|
|
|
155 |
|
|
|
Все изложенное выше относится к генеральной совокупности наблюдений (измерений). Однако в действительности в условиях анализа никогда не бывает слишком большого числа параллельных определений. В обычных условиях проводят 3–5 параллельных анализов. Кроме того, истинное значение измеряемой величины µ также очень редко известно точно. Поэтому вместо µ берут среднее арифметическое значение из нескольких определений õ :
õ = |
x1 + x2 + x3 + x4 +... |
. |
(5.7) |
|
|||
|
n |
|
Далее вычисляют среднеквадратичное отклонение (СКО) так называемой малой выборки из генеральной совокупности S:
S = |
∑(xi − x)2 |
(5.8) |
n −1 . |
Среднеквадратичное отклонение S – это количественная характеристика воспроизводимости результатов измерений для малых выборок. Оно может быть равно нулю
только в том случае, когда равна нулю сумма (xi − õ)2 =0,
т.е. если каждое единичное измерение равно среднему значению и отклонения от среднего отсутствуют. Такая идеальная воспроизводимость никогда не может быть реализована.
Под оценкой надежности результатов понимают на-
хождение доверительных границ. Доверительные границы – это пределы области вокруг экспериментально найденного единичного или среднего результата, внутри которой следует ожидать с заданной степенью доверительной вероятности нахождения истинного значения единичного или среднего результата. Интервал, ограниченный этими пределами, называют доверительным интервалом.
Доверительные границы единичного определения х находят следующим образом. Из выражения Z = (x – µ)/σ следует, что
156
µ = х ± Zσ, |
(5.9) |
где нижняя доверительная граница представляют величину х – Zσ, а верхняя – величину х + Zσ. Обычно оценивают доверительные границы при некоторой заданной доверительной вероятности, чаще всего при 95 %. Для большого числа повторных измерений (n > 30) доверительная вероятность 95 % соответствует Z = 1,96 (см. табл. 5.2). Поэтому
µ = х ± 1,96Z.
Эти границы обозначают, что в 95 случаях из 100 истинный результат единичного определения будет находиться в пределах от (х – 1,96Z) до (х + 1,96Z), а в 5 случаях из 100 он может выходить за эти пределы. Иными словами, вероятность того, что истинный результат находится в указанных границах, составляет 95 %, т.е. нельзя дать 100%-ной гарантии того, что правильный результат находится в указанных пределах.
Если имеется несколько параллельных определений, то оценивают надежность – доверительные границы – среднего результата. При этом доверительный интервал
уменьшается в n раз для среднего из n параллельных измерений, т.е.
|
|
µ = x ± |
Zσ . |
(5.10) |
|
|
|
n |
|
Величину |
σ |
называют стандартной ошибкой. Если |
||
|
n |
|
|
|
задаются большей доверительной вероятностью, например равной 99,7 %, тогда Z = 3 (см. табл. 5.2) и
µ = õ ± |
3σ . |
(5.11) |
|
n |
|
Видно, что с чем большей вероятностью мы хотим получить ответ, тем шире раздвигаются доверительные границы.
157
Для малых выборок (небольшое число n) необходимо пользоваться стандартным отклонением малой выборки S. Но если S найдено всего из нескольких параллельных определений, тогда приведенное выше соответствие между Z и Р нарушается. Определенному значению доверительной вероятности Р будет теперь отвечать не величина Z, а функция, имеющая большие, чем Z значения. Эту функцию обозначают буквой t, она изменяется не только в зависимости от доверительной вероятности, но и от числа параллельных определений или от числа степеней свободы (n – 1). Число t будет тем больше, чем больше заданная доверительная вероятность и чем меньше число степеней свободы. При большом числе степеней свободы (большом числе параллельных определений) t стремится к Z и в конце концов совпадает с Z, тогда данную выборку можно считать генеральной совокупностью.
В случае малой выборки, характеризующейся функцией t, речь идет не о нормальном распределении Гаусса, а о t-распределении (распределении Стьюдента). Численные значения t получают интегрированием сложной
функции: |
|
|
|
|
dt = |
Γ(0,5(d |
+1))(1+ x2 / d)−0,5(d +1) |
(5.12) |
|
|
|
, |
||
|
|
|
Γ(0,5d) πd |
|
∞ |
|
|
|
|
где Γ(x) = ∫t x−1e−tdt |
– гамма-функция Эйлера. |
|
||
0 |
|
|
|
|
Численные значения функции t имеют большие величины, чем значения, определенные по кривой распределения Гаусса и приведены в статистической таблице (см. табл. 5.3), как функции от числа степени свободы f = n – 1 и величины доверительной вероятности.
При t-распределении доверительные границы находят из уравнений (5.13) и (5.14). Для единичного определения
µ = х ± tS. |
(5.13) |
Для среднего из нескольких определений: 158
µ = õ ± |
tS . |
(5.14) |
|
n |
|
При t-распределении доверительные границы при одной и той же доверительной вероятности получаются более широкими, чем при нормальном распределении.
Формулы (5.10), (5.11) для определения доверительного интервала справедливы лишь в том случае, если исследуемая величина имеет нормальное распределение. Для характеристики нормальности распределения служат коэффициенты асимметрии А и эксцесса Е, которые вычисляют по формулам:
A = |
|
∑n (xi − x)3 |
|
|
|
|
i =1 |
, |
(5.15) |
||
|
nS3 |
||||
|
|
|
|
|
|
E = |
∑n (xi − x)4 |
|
|
|
|
i=1 |
|
. |
(5.16) |
||
nS 4 |
|
||||
|
|
|
|
|
Коэффициент А показывает степень асимметричности кривой распределения относительно центра распределения – математического ожидания. Коэффициент Е отражает степень смещения кривой распределения. В случае, если
А≠ 0 и Е ≠ 0, распределение отличается от нормального.
5.3.Определение систематической (инструментальной)
ошибки
Результаты статистической обработки можно использовать для выявления систематической погрешности методик анализа. Для этого необходимо располагать стандартным образцом с аттестованным содержанием определяемого элемента, которое принимается равным истинному содержанию µ.
Выполняют несколько параллельных анализов стандартного образца и находят среднее значение õ.
159
Из уравнения (5.14) следует, что
µ− õ = |
tS . |
(5.17) |
|
n |
|
Если среднее значение õ отличается от истинного значения µ только из-за допущенных случайных погрешностей, тогда разность µ− õ при заданной доверительной ве-
роятности должна быть равна или меньше tS / n, т.е.
µ− õ ≤ |
tS . |
(5.18) |
|
n |
|
В противном случае, когда
µ− õ > |
tS |
, |
(5.19) |
|
n |
|
|
следует заключить, что кроме случайных погрешностей методика дает также систематическую погрешность, причину которой следует установить постановкой специального эксперимента.
Сравнение среднеквадратичных отклонений S (СКО)
и дисперсий S2 при анализе какого-либо образца, выполненного в двух различных лабораториях, дает возможность оценить качество выполнения анализов. Так, например, в двух различных лабораториях [18] были получены следующие результаты определения компонента (в %):
в 1-й лаборатории – 5,24; 5,37; 5,33; 5,38; 5,28
õ = |
26,6 |
= 5,32; |
|
5 |
|
во 2-й лаборатории – 5,26; 5,41; 5,49; 5,22; 5,48
õ = |
26,9 |
= 5,37. |
|
5 |
|
Средние результаты, полученные в обеих лабораториях, очень близки; это может свидетельствовать о правиль-
160