Объединение выборок по воспроизводимости
Оценка воспроизводимости тем надежнее, чем больше число измерений. Число легко выполнимых измерений увеличить нетрудно. При сложных и трудоемких измерениях можно объединить результаты разных выборок, если они получены в идентичных условиях для проб, не очень сильно различающихся по составу. Число степеней свободы объединенной выборки равно суммарному числу вариант объединяемых выборок минус число этих выборок, так как в каждой выборке число степеней свободы на единицу меньше, чем число измерений.
Для объединенной выборки
где m — число объединяемых выборок и
пример 11. Для определения содержания калия в морской воде пламенно-фотометрическим методом отобраны 6 проб. Найдите дисперсию и стандартное отклонение по объединенным результатам:
№ пробы |
К, г/л |
||||
1 |
3.44 |
3.58 |
3.30 |
|
|
2 |
2.35 |
2.43 |
2.71 |
2.48 |
|
3 |
1.11 |
1.05 |
|
|
|
4 |
1.03 |
0.95 |
1.04 |
|
|
5 |
1.80 |
1.95 |
1.83 |
|
|
6 |
2.06 |
2.16 |
2.10 |
2.21 |
2.06 |
Решение. Находим среднее, отклонения от среднего, сумму квадратов отклонений и дисперсию для каждой пробы:
№ пробы |
|
d |
|
V |
1 |
3.44 |
3.44 - 3.44 = 0.00 3.58 - 3.44 = 0.14 3.30 - 3.44 = 0.14 |
0.0000 0.0196 0.0196 Σ = 0.0392 |
0.0196 |
2 |
2.49 |
2.35 - 2.49 = 0.14 2.43 - 2.49 = 0.06 2.71 - 2.49 = 0.22 2.48-2.49 = 0.01 |
0.0196 0.0036 0.0484 0.0001 Σ = 0.0717 |
0.0239 |
3 |
1.08 |
1.11 - 1.08 = 0.03 1.05 - 1.08 = 0.03 |
0.0009 0.0009 Σ = 0.0018 |
0.0018 |
4 |
1.01 |
1.03-1.01 = 0.02 0.95 - 1.01 = 0.06 1.04 - 1.01 = 0.03 |
0.0004 0.0036 0.0009 Σ = 0.0049 |
0.00245 |
5 |
1.86 |
1.80 - 1.86 = 0.06 1.95 - 1.86 = 0.09 1.83 - 1.86 = 0.03 |
0.0036 0.0081 0.0009 Σ = 0.0126 |
0.0063 |
6 |
2.10 |
2.06 - 2.10 = 0.04 2.16 - 2.10 = 0.06 2.10 - 2.10 = 0.00 2.21 - 2.10 = 0.11 2.06 - 2.10 = 0.04 |
0.0016 0.0036 0.0000 0.0121 0.0016 Σ = 0.0189 |
0.0047 |
Оценка правильности
Если истинное значение известно, то правильность характеризуется разностью между полученным результатом и истинным. Чаще всего истинное значение неизвестно. Тогда оценка правильности производится с использованием данных по воспроизводимости (при условии отсутствия систематической погрешности, что заранее устанавливают специальными приемами). Оценка правильности при этом заключается в нахождении доверительных границ (доверительного интервала 6), в пределах которых с определенной доверительной вероятностью находится истинное значение. Доверительная вероятность Р показывает, сколько вариант из 100 попадает в данный интервал. Иногда вместо доверительной вероятности используют уровень значимости :
= 1- Р
Величина Р может выражаться в процентах.
Величина доверительного интервала определяется воспроизводимостью результатов, числом их и доверительной вероятностью. Связь между всеми этими величинами выводится на основе законов нормального распределения для генеральной совокупности и t-распределения для выборочной совокупности.
Для выборки (ряда из n вариант)
где s — стандартное отклонение выборки; tp — коэффициент Стьюдента, приводимый в таблицах для разных доверительных вероятностей Р и разных степеней свободы:
Следовательно,
Для генеральной совокупности
где — стандартное отклонение генеральной совокупности:
zp — табулированный коэффициент, зависящий от доверительной вероятности Р:
Отсюда
При одной и той же доверительной вероятности коэффициент z меньше, чем коэффициент t, поэтому при использовании z и получают более узкий доверительный интервал, чем при использовании t и s. При увеличении числа вариант в выборке t z. Если предварительно определить , проделав большое число измерений ( 20), можно пользоваться коэффициентом z вместо t для оценки доверительного интервала. Такой прием целесообразен при проведении серийных анализов, так как, однажды затратив время и труд на оценку , можно в дальнейшем ограничиться малым количеством однотипных измерений, сохраняя при этом достаточно узкий доверительный интервал. Помогает в оценке и объединение выборок.
Располагая статистическими критериями, можно решить вопрос о необходимом и достаточном числе параллельных измерений для получения надежного результата или оценить вероятность попадания результата в определенный интервал при заданном числе измерений.
пример 12. Найдите доверительный интервал и доверительные границы по результатам, приведенным в примере 4 (Р = 0.90).
Решение. Рассчитываем стандартное отклонение, воспользовавшись значениями отклонений от среднего, найденными в примере 4:
Находим по таблицам коэффициент Стьюдента для = n—1 = 5—1 = 4
и Р = 0.90 и вычисляем доверительный интервал:
Используя значение среднего (см. пример 4), находим доверительные границы
50.05 + 0.10 = 50.15
50.05 - 0.10 = 49.95
Поскольку недостоверна уже первая цифра после запятой, округляем среднее до 50.0. Итак, доверительные границы результата: 50.1 мл и 49.9 мл.
пример 13. Вернемся к условию примера 11. Найдите доверительные границы и доверительный интервал для среднего первой пробы с доверительной вероятностью 90 и 95%.
Решение. Число результатов в объединенной выборке равно 20, поэтому можно считать ее генеральной совокупностью с достаточным приближением и принять рассчитанное стандартное отклонение s равным . Находим коэффициент z (при Р = 0.90, Р = 0.95 и = 2) по таблицам. Следовательно, доверительные интервалы равны:
пример 14. При определении калия в морской воде пламенно-фотометрическим методом получены следующие результаты (г/л): 0.94; 0.84; 1.05. Найдите доверительный интервал для среднего с доверительной вероятностью 90%: а) используя только приведенные здесь данные; б) привлекая также данные, приведенные в примере 11.
Решение, а) Вычисляем среднее и стандартное отклонения выборки:
Для выборки из трех вариант следует использовать t-распределение. По таблицам находим коэффициент Стьюдента при Р = 0.90.
б) Учитывая, что стандартное отклонение объединенной выборки (см. пример 11) можно считать стандартным отклонением генеральной совокупности , используем коэффициент Z:
Пример 15. Сколько измерений необходимо при определении рН сыворотки крови с доверительным интервалом 0.01 единицы рН и доверительной вероятностью 95%, если предварительно установлено, что = 0.0065?
Решение. Поскольку известно , используем коэффициент z:
отсюда
Таким образом, достаточно сделать два измерения.
пример 16. Стандартное отклонение атомно-абсорбционного определения кальция в сыворотке крови, полученное на основании пяти измерений, равно 0.010 мкг/мл. Сколько параллельных определений нужно сделать, чтобы с вероятностью 95% результат определения кальция попал в доверительный интервал 0.020 мкг/мл?
Решение. Запишем выражение для доверительного интервала:
Как видно, в выражение входят две неизвестные величины. Применяем метод подбора: пользуясь таблицами значений t-коэффициентов, подбираем такое n, чтобы соблюдалось условие
При n=2
При n=3
При n=4
Следовательно, чтобы результат анализа попал в заданный доверительный интервал, необходимо сделать не менее четырех измерений (n 4).
