Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Основы научных и инженерных исследований

..pdf
Скачиваний:
22
Добавлен:
15.11.2022
Размер:
2.35 Mб
Скачать

тельного значения. В результате отбраковки может быть исключено не более одной трети всех определений. Если исключению подлежит большее число определений, то все экспериментальные данные считаются неудовлетворительными.

5.2. Определение и исключение случайной ошибки

Источники случайных погрешностей очень многообразны, их нельзя заранее предусмотреть и устранить. Эти погрешности приводят к тому, что результаты нескольких параллельных определений практически никогда не совпадают; они рассеиваются вокруг некоторого среднего значения. Степень рассеивания результатов характеризует воспроизводимость анализа. Большая разница результатов параллельных определений свидетельствует о плохой воспроизводимости.

Для определения и исключения случайных ошибок используют метод математической статистики, предусматривающий многократные параллельные измерения искомой величины. Математическая статистика позволяет оценить надежность полученных результатов, т.е. степень их соответствия истинному содержанию определяемого компонента в пробе.

Рассмотрим влияние случайных погрешностей на результаты параллельных определений [18]. Предположим, что выполнено 16 параллельных анализов и что имеется 4 источника погрешностей, которые приводят к положительным или отрицательным ошибкам одинакового значения. Положительные и отрицательные погрешности могут компенсироваться, поэтому в некоторых случаях будет наблюдаться отсутствие погрешности, в других случаях погрешности (одинакового знака) складываются и возрастают. Возможны и другие сочетания погрешностей. В табл. 5.1 приведены все возможные комбинации погрешностей для идеализированного примера.

151

Таблица 5.1

Возможные комбинации погрешностей при проведении анализа

Номер па-

Комбинация

Значение

Относительная

раллельного

погрешно-

случайной

частота

определения

стей

погрешности

погрешности

1

+ + + +

4

1

2

+ + +

 

 

3

+ + +

 

 

4

+ + +

2

4

5

+ + +

 

 

6

− − + +

 

 

7

+ +

 

 

8

+ − − +

0

6

9

+ − − +

 

 

10

+ +

 

 

11

+ +

 

 

12

+ − − −

 

 

13

+ − −

–2

4

14

− − +

 

 

15

− − − +

 

 

16

− − − −

–4

1

Данные табл. 5.1 и рис. 5.1 показывают, что чем меньше случайная погрешность, тем чаще она появляется. Так, нулевая погрешность появляется в 6 случаях из 16 определений (вероятность 0,375). Чем больше случайная погрешность, тем меньше частота ее появления. Так, погрешность в 2 единицы наблюдается 4 раза из 16 определений (вероятность 0,250), в 4 единицы – один раз (вероятность 0,0625). Вероятность появления положительных и отрицательных ошибок одинакова. Для небольшого количества наблюдений эти зависимости не всегда четко соблюдаются.

152

Для большого числа измерений случайные ошибки распределяются по определенным законам:

1) нулевые или близкие к ним ошибки имеют максимальную частоту появления;

Относительная частота

погрешностей

7

6

5

4

3

2

1

0 -6 -4 -2 0 2 4 6

Погрешность

2)

вероятность

 

появ-

Рис. 5.1. Кривая распределения

ления

отклонений

разного

 

 

ошибок

знака (положительного и от-

 

 

 

 

 

рицательного) одинакова;

 

 

 

 

 

3)

с

ростом

ошибки

 

р(х)

 

 

 

вероятность

ее

появления

 

 

 

 

 

 

 

 

 

 

экспоненциально

 

 

умень-

 

 

 

 

 

шается.

 

 

 

 

 

 

 

 

 

 

Графически

эти

зако-

 

 

 

 

 

номерности можно предста-

 

 

 

 

 

вить в виде кривой Гаусса,

 

 

 

 

 

или кривой

нормального

 

 

 

х

 

Рис. 5.2. Кривая распределения

распределения

погрешно-

стей,

построенной

по ре-

Гаусса при большом числе наб-

зультатам

большого

числа

 

 

людений

 

 

 

 

 

наблюдений (рис. 5.2).

Кривая распределения Гаусса описывается уравнением

Y =

exp((x

−µ)

2 / 2σ2 )

,

(5.1)

σ

2π

 

 

 

 

 

где Y – частота появления каждого значения; х – единичное измерение;

µ – истинное значение измеряемой величины (или среднеарифметическое для бесконечно большого числа измерений;

σ =

(xi −µ)2

– среднеквадратичное (стандартное)

n

 

 

отклонение, представляет собой количественную меру вос-

153

производимости, т.е. близости отдельных результатов к среднему значению. Квадрат величины стандартного отклонения σ2 называют дисперсией; n – число измерений (наблюдений, определений).

Введем обозначение Z = (x µ)/σ в уравнение (5.1). Если принять µ за условный нуль (µ = 0) и отсчитывать отклонения в единицах стандартного отклонения (т.е. при σ = 1), тогда уравнение (5.1) преобразуется в следующее

уравнение:

exp(Z 2

/ 2)

 

 

Y =

.

(5.2)

2π

 

 

 

 

 

Площадь s, заключенная между кривой Гаусса и осью абсцисс, представляет интеграл:

 

1

+∞

2 /2dZ .

 

s =

å Z

(5.3)

 

 

2π −∞

 

 

 

 

 

+∞

 

Из математики известно, что

åZ 2 /2dZ =

2π, поэто-

−∞

му интеграл (5.3) равен 1. Это означает достоверность появления значения измерения, лежащего в области от – до +, т.е. вероятность такого события равна единице.

Проинтегрировав уравнение (5.3) в пределах от (1 – σ) до (1 + σ), получаем

s =

1

 

 

Z =+1

åZ 2 /2dZ = 0,683 или 68,3 %.

 

 

 

(5.4)

 

 

 

 

2π Z =−1

 

 

Аналогично

 

после интегрирования уравнения

(5.3)

в пределах от Z = –2 до Z = 2 и от Z = –3 до Z = 3 получаем

 

 

1

 

 

Z =+2

 

s =

 

 

åZ 2 /2dZ = 0,955 или 95,5 %

(5.5)

 

 

 

и

2π Z =−2

 

 

 

 

 

 

 

s =

 

1

 

 

Z =+3

åZ 2 /2dZ = 0,997 или 99,7 %.

 

 

 

 

(5.6)

 

 

 

 

 

 

2π Z =−3

 

 

 

 

 

 

 

 

154

 

Из уравнения (5.4) следует, что вероятность (так называемая доверительная вероятность) появления измерения, лежащего в области ±σ, равна 68,3 %, т.е. в 68,3 случаях из 100 случайная погрешность любого данного единичного измерения меньше (или равна) ±σ. Аналогично из (5.5) и (5.6) выводим, что в 95,5 случаях и, соответственно, в 99,7 случаях из 100 случайные погрешности любого данного единичного измерения меньше (или равны) ±2σ или ±3σ.

Таким образом, доверительная вероятность – это отношение площади под кривой нормального распределения для каждого значения Z к общей площади. Иными словами, доверительная вероятность 68,3 % означает, что Z = 1σ и, следовательно, в 68,3 случаях из 100 случайная погрешность любого данного единичного определения (измерения, наблюдения) будет меньше (или равна) 1σ. При доверительной вероятности 95,5 % Z = 2σ и, следовательно, в 95,5 случаях из 100 случайная погрешность любого данного единичного определения будет меньше (или равна) 2σ.

Следовательно, доверительная вероятность определяется числом единиц стандартного отклонения, т.е. величиной Z; в свою очередь, каждому значению доверительной вероятности соответствует определенное значение Z, т.е. Z зависит от заданной доверительной вероятности. Часто в иностранной литературе вместо доверительной вероятности Р используют величину α = 1 – Р (обозначаемая в долях), которая называется уровнем значимости. Некоторые другие значения доверительной вероятности при разных значениях Z приведены в табл. 5.2.

 

 

 

 

 

 

Таблица 5.2

Значения доверительной вероятности Р в зависимости

 

 

от величины Z

 

 

 

 

 

 

 

 

 

 

 

Р, %

α

Z

 

Р, %

α

 

Z

50

0,05

±0,67

 

95

0,05

 

±1,96

68

0,32

±1,00

 

96

0,04

 

±2,00

80

0,20

±1,29

 

99,7

0,003

 

±3,00

90

0,10

±1,64

 

99,9

0,001

 

±3,29

 

 

 

155

 

 

 

Все изложенное выше относится к генеральной совокупности наблюдений (измерений). Однако в действительности в условиях анализа никогда не бывает слишком большого числа параллельных определений. В обычных условиях проводят 3–5 параллельных анализов. Кроме того, истинное значение измеряемой величины µ также очень редко известно точно. Поэтому вместо µ берут среднее арифметическое значение из нескольких определений õ :

õ =

x1 + x2 + x3 + x4 +...

.

(5.7)

 

 

n

 

Далее вычисляют среднеквадратичное отклонение (СКО) так называемой малой выборки из генеральной совокупности S:

S =

(xi x)2

(5.8)

n 1 .

Среднеквадратичное отклонение S – это количественная характеристика воспроизводимости результатов измерений для малых выборок. Оно может быть равно нулю

только в том случае, когда равна нулю сумма (xi õ)2 =0,

т.е. если каждое единичное измерение равно среднему значению и отклонения от среднего отсутствуют. Такая идеальная воспроизводимость никогда не может быть реализована.

Под оценкой надежности результатов понимают на-

хождение доверительных границ. Доверительные границы – это пределы области вокруг экспериментально найденного единичного или среднего результата, внутри которой следует ожидать с заданной степенью доверительной вероятности нахождения истинного значения единичного или среднего результата. Интервал, ограниченный этими пределами, называют доверительным интервалом.

Доверительные границы единичного определения х находят следующим образом. Из выражения Z = (x µ)/σ следует, что

156

µ = х ± Zσ,

(5.9)

где нижняя доверительная граница представляют величину х Zσ, а верхняя – величину х + Zσ. Обычно оценивают доверительные границы при некоторой заданной доверительной вероятности, чаще всего при 95 %. Для большого числа повторных измерений (n > 30) доверительная вероятность 95 % соответствует Z = 1,96 (см. табл. 5.2). Поэтому

µ = х ± 1,96Z.

Эти границы обозначают, что в 95 случаях из 100 истинный результат единичного определения будет находиться в пределах от (х – 1,96Z) до (х + 1,96Z), а в 5 случаях из 100 он может выходить за эти пределы. Иными словами, вероятность того, что истинный результат находится в указанных границах, составляет 95 %, т.е. нельзя дать 100%-ной гарантии того, что правильный результат находится в указанных пределах.

Если имеется несколько параллельных определений, то оценивают надежность – доверительные границы – среднего результата. При этом доверительный интервал

уменьшается в n раз для среднего из n параллельных измерений, т.е.

 

 

µ = x ±

Zσ .

(5.10)

 

 

 

n

 

Величину

σ

называют стандартной ошибкой. Если

 

n

 

 

 

задаются большей доверительной вероятностью, например равной 99,7 %, тогда Z = 3 (см. табл. 5.2) и

µ = õ ±

3σ .

(5.11)

 

n

 

Видно, что с чем большей вероятностью мы хотим получить ответ, тем шире раздвигаются доверительные границы.

157

Для малых выборок (небольшое число n) необходимо пользоваться стандартным отклонением малой выборки S. Но если S найдено всего из нескольких параллельных определений, тогда приведенное выше соответствие между Z и Р нарушается. Определенному значению доверительной вероятности Р будет теперь отвечать не величина Z, а функция, имеющая большие, чем Z значения. Эту функцию обозначают буквой t, она изменяется не только в зависимости от доверительной вероятности, но и от числа параллельных определений или от числа степеней свободы (n – 1). Число t будет тем больше, чем больше заданная доверительная вероятность и чем меньше число степеней свободы. При большом числе степеней свободы (большом числе параллельных определений) t стремится к Z и в конце концов совпадает с Z, тогда данную выборку можно считать генеральной совокупностью.

В случае малой выборки, характеризующейся функцией t, речь идет не о нормальном распределении Гаусса, а о t-распределении (распределении Стьюдента). Численные значения t получают интегрированием сложной

функции:

 

 

 

 

dt =

Γ(0,5(d

+1))(1+ x2 / d)0,5(d +1)

(5.12)

 

 

,

 

 

 

Γ(0,5d) πd

 

 

 

 

 

где Γ(x) = t x1etdt

– гамма-функция Эйлера.

 

0

 

 

 

 

Численные значения функции t имеют большие величины, чем значения, определенные по кривой распределения Гаусса и приведены в статистической таблице (см. табл. 5.3), как функции от числа степени свободы f = n – 1 и величины доверительной вероятности.

При t-распределении доверительные границы находят из уравнений (5.13) и (5.14). Для единичного определения

µ = х ± tS.

(5.13)

Для среднего из нескольких определений: 158

µ = õ ±

tS .

(5.14)

 

n

 

При t-распределении доверительные границы при одной и той же доверительной вероятности получаются более широкими, чем при нормальном распределении.

Формулы (5.10), (5.11) для определения доверительного интервала справедливы лишь в том случае, если исследуемая величина имеет нормальное распределение. Для характеристики нормальности распределения служат коэффициенты асимметрии А и эксцесса Е, которые вычисляют по формулам:

A =

 

n (xi x)3

 

 

 

 

i =1

,

(5.15)

 

nS3

 

 

 

 

 

E =

n (xi x)4

 

 

 

i=1

 

.

(5.16)

nS 4

 

 

 

 

 

 

Коэффициент А показывает степень асимметричности кривой распределения относительно центра распределения – математического ожидания. Коэффициент Е отражает степень смещения кривой распределения. В случае, если

А0 и Е 0, распределение отличается от нормального.

5.3.Определение систематической (инструментальной)

ошибки

Результаты статистической обработки можно использовать для выявления систематической погрешности методик анализа. Для этого необходимо располагать стандартным образцом с аттестованным содержанием определяемого элемента, которое принимается равным истинному содержанию µ.

Выполняют несколько параллельных анализов стандартного образца и находят среднее значение õ.

159

Из уравнения (5.14) следует, что

µ− õ =

tS .

(5.17)

 

n

 

Если среднее значение õ отличается от истинного значения µ только из-за допущенных случайных погрешностей, тогда разность µ− õ при заданной доверительной ве-

роятности должна быть равна или меньше tS / n, т.е.

µ− õ

tS .

(5.18)

 

n

 

В противном случае, когда

µ− õ >

tS

,

(5.19)

 

n

 

 

следует заключить, что кроме случайных погрешностей методика дает также систематическую погрешность, причину которой следует установить постановкой специального эксперимента.

Сравнение среднеквадратичных отклонений S (СКО)

и дисперсий S2 при анализе какого-либо образца, выполненного в двух различных лабораториях, дает возможность оценить качество выполнения анализов. Так, например, в двух различных лабораториях [18] были получены следующие результаты определения компонента (в %):

в 1-й лаборатории – 5,24; 5,37; 5,33; 5,38; 5,28

õ =

26,6

= 5,32;

 

5

 

во 2-й лаборатории – 5,26; 5,41; 5,49; 5,22; 5,48

õ =

26,9

= 5,37.

 

5

 

Средние результаты, полученные в обеих лабораториях, очень близки; это может свидетельствовать о правиль-

160