Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

БТПп2 / химия 3 семестр . Аналитика / Новая папка / статистическая обработка результатов количественного анализа

.docx
Скачиваний:
51
Добавлен:
25.07.2020
Размер:
106.55 Кб
Скачать

1. Статистическая обработка и представление

результатов количественного анализа

Выборка (выборочная совокупность) — совокупность ограниченного числа статистически эквивалентных вариант, рассматриваемая как случайная выборка из генеральной совокупности. Другими словами, выборочная совокупность — это совокупность результатов измерений аналитических сигналов или определяемых содержаний, рассматриваемая как случайная выборка из генеральной совокупности, полученной в указанных условиях.

Объем выборки — число вариант n составляющих выборку.

При статистической обработке результатов количественного анализа используют выборку, описываемую распределением Стьюдента. Распределением Стьюдента предпочтительно пользоваться при объеме выборки п<20

Расчет метрологических параметров.

На практике в количественном анализе обычно проводят не бесконечно большое число определений, а п = 5—6 независимых определений, т. е. имеют выборку (выборочную совокупность) объемом 5—6 вариант. В оптимальном случае (при анализе, например, лекарственных препаратов) рекомендуется проводить 5 параллельных определений, т. е. оптимальный рекомендуемый объем выборки n=5.

При наличии выборки рассчитывают следующее метрологические параметры в соответствии с распределением Стьюдента.

Среднее, т. е. среднее значение определяемой величины, согласно (1.1),

(1.1)

Среднее из конечной выборки отличается от действительного значения а (которое обычно не известно) и зависит от объема выборки

lim а, при n→ ∞

Отклонение:

di = xi - (1.4)

di — случайное отклонение i варианты xi от среднего .

Дисперсия V (иногда ее обозначают как s2) показывает рассеяние ва­риант относительно среднего и характеризует воспроизводимость анализа. Рассчитывается по формуле (1.5):

где f= п-1 — число степеней свободы.

Если известно действительное значение определяемой, величины а (или истинное значение определяемой величины µ), например, при работе со стандартным образцом, то среднее принимают равным а (или µ); тогда число степеней свободы f = п.

Дисперсия среднего V равна:

V = V/n

Стандартное отклонение (или среднее квадратичное отклонение) s — характеристика рассеяния вариант относительно среднего. Она рассчитывается как корень квадратный из дисперсии V, взятый со знаком плюс:

Очевидно, V = s2. Стандартное отклонение s, как и дисперсия V ха­рактеризует воспроизводимость результатов количественного анализа.

Стандартное отклонение среднего s определяется как

s =

(«старое» название — средняя квадратичная ошибка среднего арифметического).

Относительное стандартное отклонение sr — это отношение стан­дартного отклонения к среднему значению:

sr = s/

Чем меньше sr тем лучше воспроизводимость анализа.

Доверительный интервал (доверительный интервал среднего) — интервал, в котором с заданной доверительной вероятностью Р находится действительное значение определяемой величины (генеральное среднее):

± ∆, (1.7)

где ∆ —полуширина доверительного интервала.

Доверительная вероятность Р — вероятность нахождения действительного значения определяемой величины а в пределах доверитель­ного интервала. Изменяется от 0 до 1 или от 0% до 100%. В количественном анализе при контроле качества препаратов доверительную вероятность чаще всего принимают равной P= 0,95 = 95% и обозначают как Р0,95. При оценке правильности методик или методов анализа доверительную вероятность обычно считают равной Р= 0,99=99%.

Полуширину доверительного интервала находят по формуле (1.8):

= (1.8)

где tP,f — коэффициент нормированных отклонений (коэффициент Стьюдента, функция Стьюдента, критерий Стьюдента), который зависит от доверительной вероятности Р и числа степеней свободы f= п - 1, т. е. от числа проведенных определений.

Численные значения tP,f рассчитаны для различных возможных величин Р и n и табулированы в справочниках.

В табл. 1.1 приведены численные значения коэффициента Стьюдента, рассчитанные при разных величинах п и Р.

Чем больше n, тем меньше tP,f . Однако при n > 5 уменьшение tP,f уже сравнительно невелико, поэтому на практике обычно считают достаточным проведение пяти параллельных определений (п = 5).

Относительная (процентная) ошибка среднего результата ε рассчитывается по формуле (1.9):

ε = (/)∙100%. ; (1.9)

Исключение грубых промахов.

Некоторые из результатов единичных определений (вариант), входящих в выборочную совокупность, могут заметно отличаться от величин остальных вариант и вызывать сомнения в их достоверности. Для того чтобы статистическая обработка результатов количественного анализа была достоверной, выборка должна быть однородной, т.е. она не должна быть содержать сомнительные варианты — так называемые грубые промахи. Грубые промахи необходимо исключить из общего объема выборки, после чего можно проводить окончательное вычисление статистических характеристик.

Если объем выборки невелик 5< п < 10, то выявление сомнительных результатов анализа — исключение грубых промахов — чаще всего проводят с помощью так называемого Q-критерия (контрольного критерия Q), или Q –теста.

Для этого варианты xi вначале располагают в порядке возрастания их численного значения от x1 до хn где n — объем выборки, т. е. представляют в виде упорядоченной выборки. Затем для крайних вариант — минимальной x1 и максимальной хn — вычисляют величину Q по формулам (1.10):

Q1 =(x2-x1)/R; Qn = (xn – xn-1)/R (1.10)

где х2 и xn-1 — значения вариант, ближайших по величине к крайним вариантам, а R = (xnx1)

R размах варьирования, т. е. разность между максимальным хn и минимальным x1 значениями вариант, составляющих выборку.

Рассчитанные значения Q1 и Qn сравнивают с табличными при заданных n и доверительной вероятности Р. Если рассчитанные значения Q1 или Qn (или оба) оказываются больше табличных

Q1 > Qтабл или Qn > Qтабл

то варианты х1 или хп (или обе) считаются грубыми промахами и исключаются из выборки.

Для полученной выборки меньшего объема проводят аналогичные расчеты до тех пор, пока не будут исключены все грубые промахи, так что окончательная выборка окажется однородной и не будет содержать грубые промахи.

В табл. 1.2 приведены численные величины контрольного критерия Q для Р = 0,90—0,99 и п= 3—10.

Таблица 1.1. Численные значения коэффициента Стьюдента tP,f для расчета границ доверительного интервала при доверительной вероятности P, объеме выборки n, числе степеней свободы f= п -1

п

f

Значение tP,f при доверительной вероятности

0,80

0,90

0,95

0,99

0,999

2

1

3,08

6,31

12,07

63,7

636,62

3

2

1,89

2,92

4,30

9,92

31,60

4

3

1,64

2,35

3,18

5,84

12,94

5

4

1,53

2,13

2,78

4,60

8,61

6

5

1,48

2,02

2,57

4,03

6,86

7

6

1,44

1,94

2,45

3,71

5,96

8

7

1,42

1,90

2,36

3,50

5,41

9

8

1,40

1,86

2,31

3,36

5,04

10

9

1,38

1,83

2,26

3,25

4,78

11

10

1,37

1,81

2,23

3,17

4,59

12

11

1,36

1,80

2,20

3,11

4,49

13

12

1,36

1,78

2,18

3,06

4,32

14

13

1,35

1,77

2,16

3,01

4,22

15

14

1,35

1,76

2,14

2,98

4,14

16

15

1,34

1,75

2,12

2,95

4,07

17

16

1,34

1,75

2,11

2,92

4,02

18

17

1,33

1,74

2,10

2,90

3,97

19

18

1,33

1,73

2,09

2,88

3,92

20

19

1,33

1,73

2,09

2,86

3,88

21

20

1,33

1,73

2,09

2,85

3,85

22

21

1,32

1,72

2,08

2,83

3,82

23

22

1,32

1,72

2,07

2,82

3,79

24

23

1,32

1,71

2,07

2,81

3,77

25

24

1,32

1,71

2,06

2,80

3,75

26

25

1,32

1,71

2,06

2,79'

3,73

27

26

1,32

1,71

2,06

2,78

3,71

28

27

1,31

1,70

2,05

2,77

3,70

29

28

1,31

1,70

2,05

2,76

3,67

30

29

1,31

1,70

2,05

2,76

3,66

31

30

1,31

1,70

2,04

2,75

3,65

41

40

1,30

1,68

2,02

2,70

3,55

61

60

1,30

1,67

2,00

2,66

3,46

121

120

1,29

1,66

1,98

2,62

3,37

1,28

1,64

1,96

2,58

3,29

При проведении Q-mecma доверительную вероятность чаще всего принимают равной Р=0,90 = 90%.

Если из двух крайних вариант х1 и хп только одна вызывает сомнение, то Q-тест можно проводить лишь в отношении этой сомнительной варианты.

Таблица 1.2. Численные значения Q-критерия при доверительной вероятности Р и объеме выборки п

п

3

4

5

6

7

8

9

10

0,90

0,94

0,76

0,64

0,56

0,51

0,47

0,44

0,41

0,95

0,98

0,85

0,73

0,64

0,59

0,54

0,51

0,48

0,99

0,99

0,93

0,82

0,74

0,68

0,63

0,60

0,57

Примечание. В некоторых источниках приводимые численные значения Q слегка отличаются от величин, представленных в табл. 1.2.

Пример. Пусть при проведении 5 параллельных анализов содержание определяемого компонента в анализируемом образце найдено равным, %: 3,01; 3,03; 3,04; 3,05 и 3,11. Установите, имеются ли грубые промахи или же рассматриваемая выборка однородна.

Решение. Очевидно, что сомнительным значением может быть только одно, равное 3,11. Используем Q -тест. Согласно (1.10), можно записать:

Qрассч = (3,11 - 3,05) / (3,11 - 3,01) = 0,60.

Из табл. 1.2 при п = 5 и Р = 0,90 находим Qтa = 0,64. Поскольку

Qрассч = 0,60 < Qтабл = 0,64,

то значение варианты 3,11 не является грубым промахом и не отбрасывается.

Как отмечалось выше, обычно при проведении количественного анализа (например, лекарственных препаратов и т. п. образцов) рекомен­дуется объем выборки (число единичных параллельных определений), равный п = 5. В таких случаях грубые промахи устраняют с использованием Q-теста, как вписано выше.

Если объем выборки равен 3 или 4,. т. е., n < 5, то применение Q-теста не рекомендуется.

Если объем выборки п ≥ 10, то для устранения грубых промахов (для проверки однородности выборки) поступают следующим образом.

Вначале по результатам единичных независимых определений пред­варительно рассчитывают по формулам (1.1), (1.4), (1.6) среднее значение, отклонения di для всех вариант, стандартное отклонение s. Затем сравнивают абсолютную величину |di|, и численное значение 3s. Если для всех вариант окажется, что

|di|3s (1.11)

то грубые промахи отсутствуют; выборка однородна. Если же условие (1.11) выполняется не для всех вариант, то те варианты, для которых это условие не выполняется, признаются грубыми промахами при Р = 0,95 = 95% и исключаются из общей выборочной совокупности. Получают выборку меньшего объема, для которой снова повторяют весь цикл вычислений и с использованием соотношения (1.11) снова выясняют наличие или отсутствие грубых промахов. Так поступают до тех пор, пока не устранят все грубые промахи и выборка окажется однородной.

Объем выборки больше десяти (п > 10) используют чаще всего тогда, когда оценивают воспроизводимость методик или методов анализа.

Представление результатов количественного анализа.

При представлении результатов количественного анализа обычно указывают и рассчитывают следующие статистические характеристики:

xi , — результаты единичных определений (варианты);

п — число независимых параллельных определений (объем выборки);

— среднее значение определяемой величины;

s — стандартное отклонение;

— полуширину доверительного интервала (с указанием значения доверительной вероятности Р);

± ∆— доверительный интервал (доверительный интервал среднего);

ε —относительную (процентную) ошибку среднего результата.

Эти характеристики составляют необходимый и достаточный минимум величин, описывающих результаты количественного анализа, при условии, что систематические ошибки устранены или они меньше случайных.

Иногда дополнительно указывают также

дисперсию V = s2,

дисперсию среднего V

стандартное отклонение среднего s,

относительное стандартное отклонение sr.

Однако их перечисление необязательно, так как все они легко вычисляются из величин, приведенных выше.

Пример статистической обработки и представления результатов количественного анализа.

Пусть содержание определяемого компонента в анализируемом образце, найденное в пяти параллельных единичных определениях (п = 5), оказалось равным, %: 3,01; 3,04; 3,08; 3,16 и 3,31. Известно, что систематическая ошибка отсутствует. Требуется провести статистическую обработку результатов количественного анализа (оценить их воспроизводимость) при доверительной вероятности, равной Р = 0,95.