- •2.1.Единицы количества вещества и способы выражения концентраций
- •Единицы количества вещества.
- •**** Массовую концентрацию, выраженную в граммах вещества в миллилитре, называют титром. Эта единица дала название классическому методу анализа — титриметрия.
- •2.2. Выбор метода анализа
- •2.3. Аналитический сигнал. Измерение
- •Аналитическим сигналом служит среднее из измерений физической величины на заключительной стадии анализа, функционально связанной с содержанием определяемого компонента.
- •2.4.Погрешности химического анализа. Обработка результатов измерений
- •2.4.1. Систематические погрешности
- •2.4.2. Случайные погрешности
- •Значения q-критерия (доверительная вероятность 0,90)
- •2.5. Предел обнаружения. Диапазон определяемых содержаний
- •2.6. Значащие цифры и правила округления
- •Сложение и вычитание.
- •Умножение и деление.
- •Вопросы
2.4.2. Случайные погрешности
К началу обработки результатов химического анализа методами математической статистики систематические погрешности должны быть выявлены и устранены или переведены в разряд случайных. При этом данные анализа — случайные величины с определенным распределением вероятности. Прежде чем рассматривать оценку случайных погрешностей, остановимся на двух понятиях: генеральная совокупность — гипотетическая совокупность всех мыслимых результатов от -∞ до +∞; выборочная совокупность (выборка) — реальное число (n) результатов, которое имеет исследователь.
Под генеральной совокупностью результатов химического анализа понимают все мыслимые результаты, которые могли бы быть получены при анализе одного и того же объекта различными методами, на различных приборах, разными аналитиками. Обычно же при проведении анализа одного и того же объекта имеем 3—7 результатов (выборочная совокупность). Вопрос о близости параметров выборочной совокупности к параметрам генеральной совокупности связан с объемом выборки и функцией распределения случайных величин. Как правило, для результатов химического анализа при n>20—30 с достаточной степенью надежности и при n>50—100 с хорошим приближением можно считать, что выборка представляет собой генеральную совокупность.
Одна из основных задач аналитика при оценке случайных погрешностей химического анализа — нахождение функции распределения, которой описываются экспериментальные данные. Из математической статистики следует, что случайная величина считается заданной, если известна ее функция распределения. Эта функция может быть представлена графически, в виде алгебраической зависимости или таблицы. Используют интегральную и дифференциальную функции распределения случайной величины. Интегральная функция F(x) — вероятность того, что случайная величина х принимает любые значения, меньшие некоторой заданной величины а:
F(a)=P(x<a).
Дифференциальная функция распределения случайной величины ((х) или плотность вероятности, определяется соотношением
где х = хb – xa. Таким образом плотность вероятности есть производная интегральной функции F(x).
Многочисленными исследованиями показано, что данные большинства аналитических определений при наличии генеральной совокупности результатов химического анализа подчиняются закону нормального распределения (распределение Гаусса). Плотность вероятности нормального закона распределения имеет вид
где и 2 — математическое ожидание и дисперсия (постоянные параметры).
Математическое ожидание (истинное) для непрерывной случайной величины задается интегралом
Оно представляет собой тот предел, к которому стремится среднее х при неограниченном увеличении объема выборки. Таким образом, математическое ожидание является как бы средним значением для генеральной совокупности в целом, почему и называется иногда генеральным средним. При отсутствии систематических погрешностей математическое ожидание равно истинному значению хист.
Дисперсия 2 характеризует рассеяние случайной величины относительно и определяется как математическое ожидание квадратов отклонений х от :
Положительное значение корня квадратного дисперсии а называют стандартным отклонением и также используют для характеристики рассеяния случайной величины х в генеральной совокупности относительно .
Графическое изображение нормального распределения случайной величины х показано на рис. 2.7. Вид колоколообразных кривых, симметричных относительно вертикальной линии проходящей через , зависит от величины дисперсии и, следовательно, от стандартного отклонения. Чем больше стандартное отклонение, тем более пологой становится кривая.
При обработке данных химического анализа используют обычно нормированный закон нормального распределения, который получают при переходе от величины х к величине
Так как при этом u = 0, а 2 = 1, то выражение (2.1) преобразуется в
Чаще используют интегральную нормированную функцию нормального распределения
При обработке результатов многократного химического анализа и сопутствующих им случайных погрешностей принято приводить два статистических параметра — ширину доверительного интервала, внутри которого могут лежать результаты отдельных анализов, и доверительную вероятность того, что они попадают в этот интервал. Значения интегральной функции распределения (2.2) представлены в таблицах, пользуясь которыми можно найти вероятность, с которой величина u не превзойдет заданного значения. Чаще при статистической обработке данных пользуются табулированными значениями интеграла
который называют нормированной функцией Лапласа. В табл. 2.2 приведены доверительные вероятности только для положительных значений u, поскольку нормированное нормальное распределение симметрично. Для нахождения доверительной вероятности того, что случайная величина (случайная погрешность) попадает в заданный интервал, табличные значения вероятности следует увеличить вдвое. Так, пользуясь табл. 2.2, можно показать, что если случайная погрешность при многократном химическом анализе (генеральная совокупность результатов химического анализа!) не превышает ±, ±2 и ±3, то доверительные вероятности равны 0,6826 (0,3413 • 2); 0,9544 (0,4772•2) и 0,9973 (0,49865•2). Так как , то рассматриваемые интервалы составляют соответственно u=±1, u=±2 и u=±3.
Таблица 2.2. Значения функции Лапласа
u |
|
|
u |
|
|
u |
|
0,01 |
0,0040 |
0,90 |
0,3159 |
1,90 |
0,4713 |
||
0,03 |
0,0120 |
0,95 |
0,3289 |
1,95 |
0,4744 |
||
0,05 |
0,0199 |
1,00 |
0,3413 |
2,00 |
0,4772 |
||
0,07 |
0,0279 |
1,05 |
0,3531 |
2,10 |
0,4821 |
||
0,10 |
0,0398 |
1,10 |
0,3643 |
2,20 |
0,4861 |
||
0,15 |
0,0596 |
1,15 |
0,3749 |
2,30 |
0,4893 |
||
0,20 |
0,0793 |
1,20 |
0,3849 |
2,40 |
0,4918 |
||
0,25 |
0,0987 |
1,25 |
0,3944 |
2,50 |
0,4938 |
||
0,30 |
0,1179 |
1,30 |
0,4032 |
2,60 |
0,4953 |
||
0,35 |
0,1368 |
1,35 |
0,4115 |
2,70 |
0,4965 |
||
0,40 |
0,1554 |
1,40 |
0,4192 |
2,80 |
0,4974 |
||
0,45 |
0,1736 |
1,45 |
0,4265 |
2,90 |
0,4981 |
||
0,50 |
0,1915 |
1,50 |
0,4332 |
3,00 |
0,49865 |
||
0,55 |
0,2088 |
1,55 |
0,4394 |
3,20 |
0,49931 |
||
0,60 |
0,2257 |
1,60 |
0,4452 |
3,40 |
0,49966 |
||
0,65 |
0,2422 |
1,65 |
0,4505 |
3,60 |
0,49984 |
||
0,70 |
0,2580 |
1,70 |
0,4554 |
3,80 |
0,499928 |
||
0,75 |
0,2734 |
1,75 |
0,4599 |
4,00 |
0,499968 |
||
0,80 |
0,2881 |
1,80 |
0,4641 |
5,00 |
0,499997 |
||
0,85 |
0,3023 |
1,85 |
0,4678 |
|
|
Закон нормального распределения для обработки результатов химического анализа применяют только в том случае, если имеется большое число данных (n>50). Данные химического анализа обычно подчиняются закону нормального распределения. Однако следует с осторожностью относиться к результатам, полученным радиохимическими или биологическими методами и при анализе относительно неоднородных проб. Если возникает сомнение в правомерности применения закона нормального распределения, то следует, используя различные, описанные в специальной литературе способы, установить, что результаты химического анализа распределены именно по этому закону. В противном случае следует применить другой вид распределения.
Закон нормального распределения неприменим для обработки малого числа измерений выборочной совокупности (n<20). Для обработки таких совокупностей в химическом анализе используют распределение Стьюдента (t-распредление), которое связывает между собой три основные характеристики: ширину доверительного интервала, соответствующую ему вероятность и объем выборочной совокупности. Прежде чем рассматривать распределение Стьюдента и его применение для обработки данных химического анализа, остановимся на некоторых основных характеристиках выборочной совокупности.
Для выборки в n результатов рассчитывают среднее
и дисперсию, характеризующую рассеяние результатов относительно среднего,
Введем понятие числа степеней свободы f. Это число независимых переменных в выборочной совокупности за вычетом числа связей между ними. В уравнении (2.4) =n-1, так как рассматривается рассеяние данных относительно среднего, т. е. на результаты наложена одна связь. Если известно генеральное среднее , то можно рассматривать рассеяние данных относительно и тогда дисперсия равна
Для характеристики рассеяния результатов в выборочной совокупности используют также стандартное отклонение
и относительное стандартное отклонение
Важно отметить, что все три величины — дисперсия, стандартное отклонение и относительное стандартное отклонение — характеризуют воспроизводимость результатов химического анализа. Иногда дисперсию выборочной совокупности обозначают не символом V (от англ. variance), a s2 (от англ. standard).
Показано, что если имеется несколько выборочных совокупностей из n результатов, являющихся составными частями одной генеральной совокупности, случайные величины которой распределены нормально с параметрами и 2, то средние этих выборок подчиняются также закону нормального распределения с параметрами и 2/n. Отсюда дисперсия среднего
и стандартное отклонение среднего
Распределение Стьюдента — это распределение нормированной случайной величины t
поэтому его часто называют t-распределением. Плотность вероятности t-распределения имеет вид
где Г() — функция Эйлера; = n-1 — число степеней свободы.
Из рис.2.8 видно, что чем меньше число степеней свободы, т.е. чем меньше объем выборочной совокупности, тем больше рассеяние результатов.
При обработке данных нас интересует интервал, в который при имеющейся выборке в n результатов с заданной вероятностью попадают результаты химического анализа. Графическая зависимость трех параметров показана
на рис. 2.9 (кривая описывает t-распределение при определенном объеме выборочной совокупности). Доверительная вероятность Р показывает вероятность попадания случайного значения в заданный интервал (tp/2 – t1-p/2), а уровень значимости p — вероятность выхода за его пределы.
Очевидно, что Р= 1—р. Значения связанных между собой величин t, Р (или p), (или n) представлены в табл. 2.3. Пользуясь этими данными, можно обрабатывать результаты химического анализа при объемах выборочной совокупности < 20. Напомним, что случайная величина х, которая оценивается с применением методов математической статистики, может быть результатом химического анализа, аналитическим сигналом, случайной погрешностью определяемой величины и т. п.
Таким образом, чтобы оценить случайные погрешности химического анализа, рассчитывают среднее по уравнению (2.3) и характеризуют воспроизводимость дисперсией, стандартным отклонением или относительным стандартным отклонением [см. уравнения (2.4) — (2.6)].
Стандартное отклонение имеет ту же размерность что и х. Чаще других характеристик воспроизводимости используют относительное стандартное отклонение sr, выраженное в долях определяемой величины. Обычно при обработке данных химического анализа определяют также интервал, в котором при заданной вероятности (и при отсутствии систематических погрешностей) лежит истинное значение. Этот интервал можно рассчитать, пользуясь выражением (2.7), откуда
Таблица 2.3. Значения t для различной доверительной вероятности
Число степеней свободы f |
Доверительная вероятность Р |
|||
0,90 |
0,95 |
0,99 |
0,999 |
|
1 |
6,31 |
12,7 |
63,66 |
636 |
2 |
2,92 |
4,30 |
9,93 |
31,6 |
3 |
2,35 |
3,18 |
5,84 |
12,9 |
4 |
2,13 |
2,78 |
4,60 |
8,61 |
5 |
2,02 |
2,57 |
4,03 |
6,86 |
6 |
1,94 |
2,45 |
3,71 |
5,96 |
7 |
1,90 |
2,37 |
3,50 |
5,41 |
8 |
1,86 |
2,31 |
3,36 |
5,04 |
9 |
1,83 |
2,26 |
3,25 |
4,78 |
10 |
1,81 |
2,23 |
3,17 |
4,59 |
11 |
1,80 |
2,20 |
3,11 |
4,44 |
12 |
1,78 |
2,18 |
3,06 |
4,32 |
13 |
1,77 |
2,16 |
3,01 |
4,22 |
14 |
1,76 |
2,15 |
2,98 |
4,14 |
15 |
1,75 |
2,13 |
2,95 |
4,07 |
20 |
1,73 |
2,09 |
2,85 |
3,85 |
30 |
1,70 |
2,04 |
2,75 |
3,65 |
40 |
1,68 |
2,02 |
2,70 |
3,55 |
60 |
1,67 |
2,00 |
2,66 |
3,46 |
00 |
1,66 |
1,96 |
2,58 |
3,29 |
где s — стандартное отклонение выборочной совокупности из n обрабатываемых величин ( = п-1).
Вероятность Р попадания внутрь рассматриваемого интервала обычно принимают равной 0,95, хотя в зависимости от решаемых задач она может быть равна 0,90; 0,99 и какой-то другой величине. Доверительный интервал [см. уравнение (2.8)] характеризует воспроизводимость и в определенной степени правильность результатов химического анализа.
С использованием описанных понятий можно рассчитать доверительный интервал для параметров градуировочного графика, построенного с применением МНК. При этом дисперсия, характеризующая рассеяние yi относительно прямой
Y = a + bX .
определяется выражением
где
m — число образцов сравнения, по которым строится градуировочный график; yi — текущее значение аналитического сигнала; Yi — та же величина, рассчитанная методом наименьших квадратов.
Дисперсии параметров a и b градуировочного графика получаем по формулам
и
где
- среднее из всех значений xi
:
Зная стандартные отклонения, вычисляют доверительный интервал для а и Ь:
a = tp,sa
b = tp,sb
Число степеней свободы = т - 2. Вследствие неизбежной ошибки при определении параметров а и Ь необходимо рассматривать YK для одного заданного xK так же, как случайную величину. Интервал для вычисленного значения YK'.
Заметим, что доверительный интервал при этом зависит от разности (хk - ) и становится тем больше, чем дальше лежит хK от среднего .
Прежде чем обрабатывать данные с применением методов математической статистики, необходимо выявить промахи и исключить их из числа рассматриваемых результатов выборочной совокупности. Заметим, что единственный, вполне надежный, метод выявления промаха — детальное рассмотрение условий эксперимента, позволяющее исключить наблюдения, при которых были нарушены стандартные условия измерения. Тем не менее существует несколько статистических способов оценки промаха. Один из наиболее простых — метод с применением Q-критерия. Суть этого метода заключается в следующем. Рассчитывают Qэкспер равное отношению разности выпадающего и ближайшего к нему результата на размах варьирования, т.е. разности наибольшего и наименьшего из результатов выборочной совокупности. Полученное Qэкспер сравнивают с критическим значением Qкрит при доверительной вероятности 0,90 (табл. 2.4). Если Qэкспер>Qкрит то выпадающий результат является промахом, его отбрасывают; если Qэкспер<Qкрит то исключить результат нельзя — он принадлежит выборочной совокупности.
Таблица 2.4.
