Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЕТРОЛ_ОСН_АНАЛ_ХИМИИ_Зол_гот.doc
Скачиваний:
0
Добавлен:
01.07.2025
Размер:
750.59 Кб
Скачать

2.4.2. Случайные погрешности

К началу обработки результатов химического анализа методами матема­тической статистики систематические погрешности должны быть выявлены и устранены или переведены в разряд случайных. При этом данные анализа — случайные величины с определенным распределением вероятности. Прежде чем рассматривать оценку случайных погрешностей, остановимся на двух понятиях: генеральная совокупность гипотетическая совокупность всех мыслимых результатов от -∞ до +∞; выборочная совокупность (выборка) — реальное число (n) результатов, которое имеет исследователь.

Под генеральной совокупностью результатов химического анализа по­нимают все мыслимые результаты, которые могли бы быть получены при анализе одного и того же объекта различными методами, на различных при­борах, разными аналитиками. Обычно же при проведении анализа одного и того же объекта имеем 3—7 результатов (выборочная совокупность). Вопрос о близости параметров выборочной совокупности к параметрам генеральной совокупности связан с объемом выборки и функцией распределения случай­ных величин. Как правило, для результатов химического анализа при n>20—30 с достаточной степенью надежности и при n>50—100 с хоро­шим приближением можно считать, что выборка представляет собой гене­ральную совокупность.

Одна из основных задач аналитика при оценке случайных погрешностей химического анализа — нахождение функции распределения, которой опи­сываются экспериментальные данные. Из математической статистики следу­ет, что случайная величина считается заданной, если известна ее функция распределения. Эта функция может быть представлена графически, в виде алгебраической зависимости или таблицы. Используют интегральную и дифференциальную функции распределения случайной величины. Инте­гральная функция F(x) — вероятность того, что случайная величина х при­нимает любые значения, меньшие некоторой заданной величины а:

F(a)=P(x<a).

Дифференциальная функция распределения случайной величины ((х) или плотность вероятности, определяется соотношением

где х = хb – xa. Таким образом плотность вероятности есть производная интегральной функции F(x).

Многочисленными исследованиями показано, что данные большинства аналитических определений при наличии генеральной совокупности резуль­татов химического анализа подчиняются закону нормального распределения (распределение Гаусса). Плотность вероятности нормального закона распре­деления имеет вид

где  и 2 математическое ожидание и дисперсия (постоянные параметры).

Математическое ожидание (истинное)  для непрерывной случайной величины задается интегралом

Оно представляет собой тот предел, к которому стремится среднее х при неограниченном увеличении объема выборки. Таким образом, математиче­ское ожидание является как бы средним значением для генеральной сово­купности в целом, почему и называется иногда генеральным средним. При отсутствии систематических погрешностей математическое ожидание  равно истинному значению хист.

Дисперсия 2 характеризует рассеяние случайной величины относи­тельно  и определяется как математическое ожидание квадратов отклоне­ний х от :

Положительное значение корня квадратного  дисперсии а называют стандартным отклонением и также используют для характеристики рассея­ния случайной величины х в генеральной совокупности относительно .

Графическое изображение нор­мального распределения случайной величины х показано на рис. 2.7. Вид колоколообразных кривых, симметрич­ных относительно вертикальной линии проходящей через , зависит от вели­чины дисперсии и, следовательно, от стандартного отклонения. Чем больше стандартное отклонение, тем более по­логой становится кривая.

При обработке данных химическо­го анализа используют обычно норми­рованный закон нормального распре­деления, который получают при пере­ходе от величины х к величине

Так как при этом u = 0, а 2 = 1, то выражение (2.1) преобразуется в

Чаще используют интегральную нормированную функцию нормального рас­пределения

При обработке результатов многократного химического анализа и со­путствующих им случайных погрешностей принято приводить два статисти­ческих параметра — ширину доверительного интервала, внутри которого могут лежать результаты отдельных анализов, и доверительную вероятность того, что они попадают в этот интервал. Значения интегральной функции распределения (2.2) представлены в таблицах, пользуясь которыми можно найти вероятность, с которой величина u не превзойдет заданного значения. Чаще при статистической обработке данных пользуются табулированными значениями интеграла

который называют нормированной функцией Лапласа. В табл. 2.2 приведены доверительные вероятности только для положительных значений u, посколь­ку нормированное нормальное распределение симметрично. Для нахождения доверительной вероятности того, что случайная величина (случайная по­грешность) попадает в заданный интервал, табличные значения вероятности следует увеличить вдвое. Так, пользуясь табл. 2.2, можно показать, что если случайная погрешность при многократном химическом анализе (генеральная совокупность результатов химического анализа!) не превышает ±, ±2 и ±3, то доверительные вероятности равны 0,6826 (0,3413 • 2); 0,9544 (0,4772•2) и 0,9973 (0,49865•2). Так как , то рассматриваемые интервалы составляют соответственно u=±1, u=±2 и u=±3.

Таблица 2.2. Значения функции Лапласа

u

u

u

0,01

0,0040

0,90

0,3159

1,90

0,4713

0,03

0,0120

0,95

0,3289

1,95

0,4744

0,05

0,0199

1,00

0,3413

2,00

0,4772

0,07

0,0279

1,05

0,3531

2,10

0,4821

0,10

0,0398

1,10

0,3643

2,20

0,4861

0,15

0,0596

1,15

0,3749

2,30

0,4893

0,20

0,0793

1,20

0,3849

2,40

0,4918

0,25

0,0987

1,25

0,3944

2,50

0,4938

0,30

0,1179

1,30

0,4032

2,60

0,4953

0,35

0,1368

1,35

0,4115

2,70

0,4965

0,40

0,1554

1,40

0,4192

2,80

0,4974

0,45

0,1736

1,45

0,4265

2,90

0,4981

0,50

0,1915

1,50

0,4332

3,00

0,49865

0,55

0,2088

1,55

0,4394

3,20

0,49931

0,60

0,2257

1,60

0,4452

3,40

0,49966

0,65

0,2422

1,65

0,4505

3,60

0,49984

0,70

0,2580

1,70

0,4554

3,80

0,499928

0,75

0,2734

1,75

0,4599

4,00

0,499968

0,80

0,2881

1,80

0,4641

5,00

0,499997

0,85

0,3023

1,85

0,4678

Закон нормального распределения для обработки результатов химиче­ского анализа применяют только в том случае, если имеется большое число данных (n>50). Данные химического анализа обычно подчиняются закону нормального распределения. Однако следует с осторожностью относиться к результатам, полученным радиохимическими или биологическими методами и при анализе относительно неоднородных проб. Если возникает сомнение в правомерности применения закона нормального распределения, то следует, используя различные, описанные в специальной литературе способы, уста­новить, что результаты химического анализа распределены именно по этому закону. В противном случае следует применить другой вид распределения.

Закон нормального распределения неприменим для обработки малого числа измерений выборочной совокупности (n<20). Для обработки таких совокупностей в химическом анализе используют распределение Стьюдента (t-распредление), которое связывает между собой три основные характери­стики: ширину доверительного интервала, соответствующую ему вероят­ность и объем выборочной совокупности. Прежде чем рассматривать рас­пределение Стьюдента и его применение для обработки данных химического анализа, остановимся на некоторых основных характеристиках выборочной совокупности.

Для выборки в n результатов рассчитывают среднее

и дисперсию, характеризующую рассеяние результатов относительно среднего,

Введем понятие числа степеней свободы f. Это число независимых пе­ременных в выборочной совокупности за вычетом числа связей между ними. В уравнении (2.4) =n-1, так как рассматривается рассеяние данных отно­сительно среднего, т. е. на результаты наложена одна связь. Если известно генеральное среднее , то можно рассматривать рассеяние данных относи­тельно и тогда дисперсия равна

Для характеристики рассеяния результатов в выборочной совокупности используют также стандартное отклонение

и относительное стандартное отклонение

Важно отметить, что все три величины — дисперсия, стандартное от­клонение и относительное стандартное отклонение — характеризуют вос­производимость результатов химического анализа. Иногда дисперсию выбо­рочной совокупности обозначают не символом V (от англ. variance), a s2 (от англ. standard).

Показано, что если имеется несколько выборочных совокупностей из n результатов, являющихся составными частями одной генеральной совокуп­ности, случайные величины которой распределены нормально с параметрами  и 2, то средние этих выборок подчиняются также закону нормально­го распределения с параметрами  и 2/n. Отсюда дисперсия среднего

и стандартное отклонение среднего

Распределение Стьюдента — это распределение нормированной слу­чайной величины t

поэтому его часто называют t-распределением. Плотность вероятности t-распределения имеет вид

где Г() — функция Эйлера;  = n-1 — число степеней свободы.

Из рис.2.8 видно, что чем меньше число степеней свободы, т.е. чем меньше объем выборочной совокупности, тем больше рассеяние результатов.

При обработке данных нас интересует интервал, в который при имею­щейся выборке в n результатов с заданной вероятностью попадают результа­ты химического анализа. Графическая зависимость трех параметров показана

на рис. 2.9 (кривая описывает t-распределение при определенном объеме выборочной совокупности). Доверительная вероятность Р показывает ве­роятность попадания случайного значения в заданный интервал (tp/2 – t1-p/2), а уровень значимости p вероятность выхода за его пределы.

Очевидно, что Р= 1—р. Значения связанных между собой величин t, Р (или p), (или n) представлены в табл. 2.3. Пользуясь этими данными, можно обраба­тывать результаты химического анализа при объемах выборочной совокуп­ности < 20. Напомним, что случайная величина х, которая оценивается с применением методов математической статистики, может быть результатом химического анализа, аналитическим сигналом, случайной погрешностью определяемой величины и т. п.

Таким образом, чтобы оценить случайные погрешности химического анализа, рассчитывают среднее по уравнению (2.3) и характеризуют воспро­изводимость дисперсией, стандартным отклонением или относительным стандартным отклонением [см. уравнения (2.4) — (2.6)].

Стандартное отклонение имеет ту же размерность что и х. Чаще других характеристик воспроизводимости используют относительное стандартное отклонение sr, выраженное в долях определяемой величины. Обычно при обработке данных химического анализа определяют также интервал, в кото­ром при заданной вероятности (и при отсутствии систематических погреш­ностей) лежит истинное значение. Этот интервал можно рассчитать, пользу­ясь выражением (2.7), откуда

Таблица 2.3. Значения t для различной доверительной вероятности

Число степеней

свободы f

Доверительная вероятность Р

0,90

0,95

0,99

0,999

1

6,31

12,7

63,66

636

2

2,92

4,30

9,93

31,6

3

2,35

3,18

5,84

12,9

4

2,13

2,78

4,60

8,61

5

2,02

2,57

4,03

6,86

6

1,94

2,45

3,71

5,96

7

1,90

2,37

3,50

5,41

8

1,86

2,31

3,36

5,04

9

1,83

2,26

3,25

4,78

10

1,81

2,23

3,17

4,59

11

1,80

2,20

3,11

4,44

12

1,78

2,18

3,06

4,32

13

1,77

2,16

3,01

4,22

14

1,76

2,15

2,98

4,14

15

1,75

2,13

2,95

4,07

20

1,73

2,09

2,85

3,85

30

1,70

2,04

2,75

3,65

40

1,68

2,02

2,70

3,55

60

1,67

2,00

2,66

3,46

00

1,66

1,96

2,58

3,29

где s стандартное отклонение выборочной совокупности из n обрабаты­ваемых величин ( = п-1).

Вероятность Р попадания внутрь рассматриваемого интервала обычно принимают равной 0,95, хотя в зависимости от решаемых задач она может быть равна 0,90; 0,99 и какой-то другой величине. Доверительный интервал [см. уравнение (2.8)] характеризует воспроизводимость и в определенной степени правильность результатов химического анализа.

С использованием описанных понятий можно рассчитать доверительный интер­вал для параметров градуировочного графика, построенного с применением МНК. При этом дисперсия, характеризующая рассеяние yi относительно прямой

Y = a + bX .

определяется выражением

где

m число образцов сравнения, по которым строится градуировочный график; yiтекущее значение аналитического сигнала; Yi та же величина, рассчитанная мето­дом наименьших квадратов.

Дисперсии параметров a и b градуировочного графика получаем по формулам

и

где - среднее из всех значений xi :

Зная стандартные отклонения, вычисляют доверительный интервал для а и Ь:

a = tp,sa

b = tp,sb

Число степеней свободы  = т - 2. Вследствие неизбежной ошибки при опре­делении параметров а и Ь необходимо рассматривать YK для одного заданного xK так же, как случайную величину. Интервал для вычисленного значения YK'.

Заметим, что доверительный интервал при этом зависит от разности k - ) и становится тем больше, чем дальше лежит хK от среднего .

Прежде чем обрабатывать данные с применением методов математиче­ской статистики, необходимо выявить промахи и исключить их из числа рас­сматриваемых результатов выборочной совокупности. Заметим, что единст­венный, вполне надежный, метод выявления промаха — детальное рассмот­рение условий эксперимента, позволяющее исключить наблюдения, при ко­торых были нарушены стандартные условия измерения. Тем не менее существует несколько статистических способов оценки промаха. Один из наибо­лее простых — метод с применением Q-критерия. Суть этого метода заклю­чается в следующем. Рассчитывают Qэкспер равное отношению разности выпа­дающего и ближайшего к нему результата на размах варьирования, т.е. раз­ности наибольшего и наименьшего из результатов выборочной совокупно­сти. Полученное Qэкспер сравнивают с критическим значением Qкрит при дове­рительной вероятности 0,90 (табл. 2.4). Если Qэкспер>Qкрит то выпадающий результат является промахом, его отбрасывают; если Qэкспер<Qкрит то исклю­чить результат нельзя — он принадлежит выборочной совокупности.

Таблица 2.4.