
- •Глава 2. Теоретические основы органолептического анализа
- •2.3. Методы органолептического анализа
- •2.3.2. Обобщенный алгоритм органолептической оценки
- •2.7. Обработка результатов органолептического анализа
- •2.7.1. Измерение в сенсорном анализе
- •2.7.2. Математико-статистическая обработка результатов органолептического анализа
- •2.8. Органолептические показатели продуктов питания
2.7.2. Математико-статистическая обработка результатов органолептического анализа
Погрешности и неопределенности измерений. Процедура органолептической оценки по существу является процессом измерения, в котором испытатель выполняет функции измерительного прибора. Любой измерительный процесс подвержен действию множества факторов, искажающих результаты измерения.
Отличие результата измерения от истинного значения измеряемой величины называется погрешностью. Ввиду того, что любой результат измерения, вообще говоря, содержит погрешность, точное значение измеряемой величины никогда не может быть установлено. Однако возможно указать некоторый диапазон значений, в пределах которого может, с той или иной степенью достоверности, находиться истинное значение. Этот диапазон называется неопределенностью результата измерения.
Погрешность — количественная характеристика неопределенности, или неоднозначности, результата измерения. Ее оценивают, исходя из всей информации, накопленной при подготовке и выполнении измерений. Эту информацию обрабатывают для совместного одновременного определения окончательного результата измерения и его погрешности. Окончательный результат нельзя расценивать как «истинное значение» измеряемой физической величины, так как в этом нет смысла из-за наличия погрешности.
Погрешность
может быть выражена в единицах измеряемой
величины х, в таком случае она
обозначается
х
и носит название абсолютной
погрешности. Однако
абсолютная погрешность зачастую не
отражает качества измерений.
Действительно, абсолютная погрешность
1 метр при измерении расстояния от Земли
до Луны свидетельствует о высоком
качестве измерения, та же погрешность
совершенно неприемлема при измерении
роста человека.
Критерием качества измерения является отношение абсолютной погрешности к окончательному результату измерения:
dx=
. (1)
Это отношение безразмерно, a dx называют относительной погрешностью и используют как в абсолютном, так и в процентном выражении. Высокой точности измерения соответствует малое значение относительной погрешности. Наоборот, существенная относительная погрешность характеризует малую точность.
Относительная погрешность органолептического анализа не должна превышать 5 %.
Промахи или аномальные результаты органолептической оценки (Ψ) возникают вследствие болезни, плохого самочувствия оценщиков или ошибок в эксперименте, сделанных по невнимательности. Естественно стремление избегать промахов, но если стало понятно, что они все-таки допущены, соответствующие им результаты измерений просто отбрасывают.
В процессе непосредственного проведения органолептического анализа бывает сложно определить, содержит ли полученный результат промах. Разработаны количественные критерии, позволяющие отсеивать такие результаты.
Систематические погрешности (δ), присутствующие в результатах органолептического анализа, оцениваются путем сравнения с «результатами, принятыми за эталон».
Из
названия случайные
погрешности (
)
следует, что при повторных оценках
погрешности этого типа демонстрируют
свою случайную природу. Возникают
они вследствие множества причин,
совместное воздействие которых на
каждую отдельную оценку невозможно
учесть или заранее установить. Единственно
возможный способ объективного учета
случайных погрешностей состоит в
определении их статистических
закономерностей, проявляющихся в
результатах многократных оценок.
Рассчитанные статистические оценки
вносят в окончательный результат
анализа:
Ψ+
δ+
В суммарную неопределенность результата измерения вносят вклад погрешности двух различных типов: систематические и случайные.
Происхождение систематических и случайных погрешностей связано с различной природой факторов, воздействующих на измерительный процесс. Факторы постоянного характера или мало изменяющиеся от измерения к измерению вызывают систематические погрешности, быстро изменяющиеся факторы — случайные погрешности.
С понятиями систематической и случайной погрешностей тесно связаны два важнейших метрологических понятия — правильность и воспроизводимость. Правильностью называется качество результатов измерения (или измерительной процедуры в целом), характеризующее малость систематической погрешности, воспроизводимостью — качество, характеризующее малость случайной погрешности. Иными словами, правильность результатов — это их несмещенность, а воспроизводимость — их стабильность. Обобщающее понятие, характеризующее малостьлюбой составляющей неопределенности, как систематической, так и случайной, называется точностью. Мы назовем результаты точными только в том случае, если для них мала как систематическая, так и случайная погрешность. Таким образом, правильность и воспроизводимость — это две составляющие точности, называемые поэтому точностными характеристиками.
Поскольку
воспроизводимость характеризует
степень рассеяния данных относительно
среднего значения, для оценки
воспроизводимости необходимо
предварительно вычислить среднее
из серии результатов повторных
(параллельных) измеренийх х1,x2...хn
:
(2)
В обрабатываемой серии должны отсутствовать промахи — отдельные значения, резко отличающиеся от остальных и, как правило, полученные в условиях грубого нарушения измерительной процедуры (аналитической методики). Поэтому прежде всего (еще до вычисления среднего) следует с помощью специальных статистических тестов и, если возможно, путем детального изучения условий эксперимента проверить серию данных на наличие промахов и, при обнаружении таковых, исключить их из рассмотрения.
В качестве меры разброса данных относительно среднего чаще всего используют дисперсию:
V(x)=s2(x)=
(3)
и
производные
от нее
величины
— (абсолютное) стандартное
отклонение:
s(x)-
(4)
sr(x)=
(5)
В органолептическом анализе для характеристики воспроизводимости обычно используют абсолютное или — чаще всего — относительное стандартное отклонение. Это объясняется соображениями практического удобства. Размерности s(x) и х совпадают, поэтому абсолютное стандартное отклонение можно непосредственно сопоставлять с результатом анализа. Величина же sr(x) — безразмерная и потому наиболее наглядная.
Случайная погрешность, интервальная оценка. Вклад случайной погрешности в общую неопределенность результата измерения можно оценить с помощью методов теории вероятностей и математической статистики.
Ввиду
наличия случайной погрешности одна и
та же величина x
при каждом последующем измерении
приобретает новое, непрогнозируемое
значение. Такие величины называются
случайными. Случайными величинами
являются не только отдельные результаты
измерений хi,
но и средние
(а также дисперсии s2(x)
и
все производные от них величины).
Поэтому
может служить лишь приближенной оценкой
результата измерения. В то же время,
используя величины
и
s2(x),
возможно
оценить диапазон значений, в котором
с заданной вероятностью Р
может
находиться результат. Эта вероятность
Р
называется
доверительной вероятностью, а
соответствующий ей интервал значений
— доверительным интервалом.
Доверительная вероятность P
для обработки результатов
органолептического анализа принимается
равной 95 % (или 0,95), а уровень значимости
= 1 - Р
=
1 - 0,95 = 0,05 (или 5 %).
Строгий расчет границ доверительного интервала случайной величины возможен лишь в предположении, что эта величина подчиняется некоторому известному закону распределения. Закон распределения случайной величины — одно из фундаментальных понятий теории вероятностей. Он характеризует относительную долю (частоту, вероятность появления) тех или иных значений случайной величины при ее многократном воспроизведении. Математическим выражением закона распределения случайной величины служит ее функция распределения (функция плотности вероятности) р(х).
В предположении подчинения случайной величины х нормальному закону распределения ее доверительный интервал рассчитывается как
x±t(P,f)s(x) или х± . (6)
Ширина доверительного интервала нормально распределенной случайной величины пропорциональна величине ее стандартного отклонения. Численные значения коэффициентов пропорциональности tp были впервые рассчитаны английским математиком В. Госсетом, подписывавшим свои труды псевдонимом Стьюдент, и потому называются коэффициентами Стьюдента. Они зависят от двух параметров: доверительной вероятности Р и числа степеней свободы f, соответствующего стандартному отклонению s(x).
Причина зависимости tp от Р очевидна: чем выше доверительная вероятность, тем шире должен быть доверительный интервал с тем, чтобы можно было гарантировать попадание в него значения величины х. Поэтому с ростом Р значения tp возрастают. Зависимость tp от Р от объясняется следующим образом. Поскольку s(x) — величина случайная, то в силу случайных причин ее значение может оказаться заниженным. В этом случае и доверительный интервал окажется более узким, и попадание в него значения величины х уже не может быть гарантировано с заданной доверительной вероятностью. Чтобы «подстраховаться» от подобных неприятностей, следует расширить доверительный интервал, увеличить значение tp — тем больше, чем менее надежно известно значение s(x), то есть чем меньше число его степеней свободы. Поэтому с уменьшением f величины tp возрастают.
Если единичные значения xi имеют нормальное распределение, то и среднее тоже имеет нормальное распределение. Поэтому формулу Стьюдента для расчета доверительного интервала можно записать и для среднего:
±t(P,f)s( ) . (7)
Величина
s(
)
меньше,
чем s(x)
(среднее
точнее единичного) и для серии из п
значений
s(
)
-
s(x)/
Поэтому
доверительный интервал для величины,
рассчитанной из серии п
параллельных
измерений, можно записать как
(8)
где = п — 1, а величины и s(x) рассчитывают по формулам (2), (4) и (5).
Пример 1. Результаты органолептической оценки вкуса, данные пятью экспертами, следующие: 47, 48, 48, 48, 49 баллов. Рассчитать среднее и доверительный интервал среднего при Р = 0,95.
Решение. Среднее значение равно
=240/5=48 баллов
Стандартное отклонение равно
s(x)=
=0,707
балла
Табличное значение коэффициента Стьюдента t(Р=0,95, f=4) = 2,776.
Доверительный интервал составляет (48 ±2,776-0,707) = (48,00 ± 1,96) = (48 ± 2) балла.
Относительная погрешность приведенных в примере результатов органолептического анализа составляет:
=
При расчете доверительного интервала встает вопрос о выборе доверительной вероятности Р. При слишком малых значениях Р выводы становятся недостаточно надежными. Слишком большие (близкие к 1) значения брать тоже нецелесообразно, так как в этом случае доверительные интервалы оказываются слишком широкими, малоинформативными. Для органолептического анализа оптимальным значением P является 0,95.
Величина доверительного интервала сама по себе позволяет охарактеризовать лишь случайную составляющую неопределенности. В табл. 2 приведены значения коэффициентов Стьюдента для различных чисел степеней свободы/и значений доверительной вероятности Р =0,95 и Р = 0,99.
Таблица 2 - Значения t—критерия Стьюдента при уровне значимости
= 0,10; 0,05; 0,01 (двухсторонний)
Число степеней свободы, f |
|
Число степеней свободы, f |
|
||||
0,10 |
0,05 |
0,01 |
0,10 |
0,05 |
0,01 |
||
1 |
6,3138 |
12,706 |
63,657 |
18 |
1,7341 |
2,1009 |
2,8784 |
2 |
2,9200 |
4,3027 |
9,9248 |
19 |
1,7291 |
2,0930 |
2,8609 |
3 |
2,3534 |
3,1825 |
5,8409 |
20 |
1,7247 |
2,0860 |
2,8453 |
4 |
2,1318 |
2,7764 |
4,6041 |
21 |
1,7207 |
2,0796 |
2,8314 |
5 |
2,0150 |
2,5706 |
4,0321 |
22 |
1,7171 |
2,0739 |
2,8188 |
6 |
1,9432 |
2,4469 |
3,7074 |
23 |
1,7139 |
2,0687 |
2,8073 |
7 |
1,8946 |
2,3646 |
3,4995 |
24 |
1,7109 |
2,0639 |
2,7969 |
8 |
1,8595 |
2,3060 |
3,3554 |
25 |
1,7081 |
2,0595 |
2,7874 |
9 |
1,8331 |
2,2622 |
3,2498 |
26 |
1,7056 |
2,0555 |
2,7787 |
I0 |
1,8125 |
2,2281 |
3,1693 |
27 |
1,7033 |
2,0518 |
2,7707 |
II |
1,7959 |
2,2010 |
3,1058 |
28 |
1,7011 |
2,0484 |
2,7633 |
12 |
1,7823 |
2,1788 |
3,0545 |
29 |
1,6991 |
2,0452 |
2,7564 |
13 |
1,7709 |
2,1604 |
3,0123 |
30 |
1,6973 |
2,0423 |
2,7500 |
14 |
1,7613 |
2,1448 |
2,9768 |
40 |
1,6839 |
2,0211 |
2,7045 |
15 |
1,7530 |
2,1315 |
2,9467 |
60 |
1,6707 |
2,0003 |
2,6603 |
16 |
1,7459 |
2,1199, |
2,9208 |
120 |
1,6577 |
1,9799 |
2,6174 |
17 |
1,7396 |
2,1098 |
2,8982 |
|
1,6449 |
1,9600 |
2,5758 |
Метод статистической обработки результатов прямых многократных измерений регламентирован ГОСТ и предусматривает следующие операции.
Исключение известных систематических погрешностей из результатов измерений.
Проверка наличия грубых ошибок (промахов, аномальных значений) по какому-либо критерию проверки на аномальность в результатах проведенных измерений и их исключения из результатов.
[Проверка на аномальность по критерию Диксона. Критерий эффективен при числе измерений п < 30. Полученные результаты измерений xi. записывают в вариационный возрастающий ряд х1 , х2,..., хп (х1 <х2< ... < xn).
Критерий Диксона рассчитывается по формуле (9) и его сравнивают с табличным значением (табл. 3).
Таблица 3 - Значения критерия Диксона при Р = 95 % (0,95) или уровне значимости а = 1 - Р = 1 - 0,95 = 0,05
Число измерений n |
Значения критерия Диксона при Р= 0,95 |
4 |
0,76 |
5 |
0,64 |
6 |
0,56 |
7 |
0,51 |
8 |
0,47 |
9 |
0,44 |
10 |
0,41 |
12 |
0,38 |
14 |
0,35 |
16 |
0,33 |
18 |
0,31 |
20 |
0,30 |
25 |
0,28 |
30 |
0,26 |
Если
>
,
то с вероятностью Р-95%
проверяемое
значение является грубой ошибкой и его
следует исключить из ряда полученных
результатов.
Пример. По 100-балльной шкале семь экспертов оценивали Российский сыр. По вкусу и запаху получены следующие результаты: 40, 42, 45, 45, 45, 45, 45 баллов. Имеется подозрение, что оценки, данные первыми двумя экспертами (40 и 42 балла), аномальны. Сначала проверим на аномальность второе значение (42 балла), как более близкое к выборочному среднему. Первое значение считаем аномальным сразу же и отбрасываем. Если проверяемое значение 42 балла окажется нормальным, его учитывают, а на аномальность проверяют первое.
Рассчитываем критерий Диксона:
=
Табличное значение критерия Диксона для п = 6 составляет 0,56. Расчетное значение критерия Диксона больше табличного и следовательно, с вероятностью 95% проверяемое значение 42 является аномальным, и его следует исключить из ряда полученных значений измеряемой величины, оставшиеся результаты повторно обработать.
3. Вычисление среднего арифметического исправленных результатов измерений х, принимаемого за результат серии измерений:
Вычисление среднего квадратического отклонения (СКО) результата одного измерения (ряда измерений) S(x) по формуле:
Вычисление СКО результата многократных измерений по формуле:
S(
Расчет границ доверительного интервала
по формуле вида:
Запись результата измерений в виде доверительного интервала:
при Р= 0,95; n = с; f=n- 1.
Сравнение результатов анализов. Значимое и незначимое различие случайных величин. Любой результат измерения (в том числе среднее значение) представляет собой случайную величину. Поэтому численное различие двух результатов может быть вызвано случайными причинами и вовсе не свидетельствовать о том, что эти результаты действительно разные. Так, если средние результаты органолептических оценок двух комиссий одного и того же продукта равны, к примеру. 42 и 44 балла, то из этого нельзя заключить, что оцениваемые образцы имеют разное качество, поскольку случайная погрешность оценок составляет несколько баллов.
Подобное различие случайных величин, которое (при некоторой доверительной вероятности) может быть обусловлено только случайными причинами, в математической статистике называется незначимым. Очевидно, что если две величины различаются незначимо, то их можно рассматривать как два приближенных значения одного и того же общего результата измерения. Напротив, значимое, то есть превышающее уровень случайных погрешностей, различие свидетельствует о том, что соответствующие величины представляют собой два действительно разных результата. Естественно, различие можно считать значимым только тогда, когда оно достаточно велико. Граница, отделяющая значимые различия от незначимых, называется критической величиной. Ее можно рассчитать с помощью методов теории вероятностей.
Таким образом, задача сравнения результатов органолептического анализа состоит в том, чтобы выяснить, является ли различие между ними значимым.
При оценке достоверности различий между двумя результатами измерений при малом числе наблюдений определяется критерий Стьюдента-Фишера (tрасч) (критерий достоверности разности) по формуле вида:
,
(10)
где
—
средние арифметические значения
полученных данных;
т1, и т2 — средние ошибки измерений, определяемые по формуле вида:
,
(11)
Значение нормируемого критерия достоверности разности tp берется из табл. 2 при выбранной доверительной вероятности Р = 95% и числе степеней свободы f= n1 + п2 - 2.
Разность
считается достоверной, если tрасч
равен или превышает принятый в данном
исследовании показатель вероятности
безошибочного суждения, то есть если
tрасч
t
—
разность достоверна, не случайна и
зависит от какой-то причины, а если
tрасч<
t
— разность
не достоверна.
Пример. Один и тот же продукт оценивали две комиссии, в составе которых было по восемь человек. Результаты приведены в табл. 4.
Таблица 4-Результаты оценки продукта двумя комиссиями
Комиссия |
Общие оценки, данные членами комиссии, баллы |
Среднее общих балльных оценок |
||||||||
Первая |
90 |
92 |
91 |
96 |
93 |
96 |
95 |
90 |
93 |
|
Вторая |
91 |
88 |
92 |
89 |
91 |
87 |
88 |
90 |
90 |
Требуется определить, случайно ли различие средних оценок данных первой и второй комиссией или нет.
Рассчитываем среднее арифметическое по двум комиссиям:
Рассчитываем средние случайные погрешности по двум комиссиям:
=
2,54,
S2 =1,85 ;
m1=
m2=
Рассчитываем критерий достоверности различий:
Критерий достоверности различий, равный 2,53, больше табличного, равного 2,145 (при f=n1 + n2-2 = 8 + 8- 2= 14 иP = 0,95), а следовательно, разность достоверна, не случайна, на результаты одной из комиссий повлияли какие-то неучтенные факторы — исследования необходимо повторить.
В случае оценки одной комиссией двух схожих образцов для определения достоверности разности полученных средних оценок этих образцов используют алгоритм следующего вида для расчета tрасч.
Пример. Комиссия в составе 5 человек оценивала два образца светлого пива одной группы разных заводов по 25-балльной шкале. -Результаты представлены в табл. 5. Требуется оценить достоверность различия средних оценок исследуемых образцов.
Таблица 5 - Результаты оценки комиссией образцов пива
Испытатели |
Оценка образцов |
Разность оценок образцов 1 и 2 |
Квадрат разности оценок образцов |
|
1 |
2 |
|||
1 |
23 |
25 |
-2 |
4 |
2 |
22 |
23 |
-1 |
1 |
3 |
23 |
25 |
-2 |
4 |
4 |
22 |
25 |
-3 |
9 |
5 |
23 |
22 |
1 |
1 |
Сумма |
113 |
120 |
-7 |
19 |
1. Рассчитывают среднее оценок продуктов А и Б по уравнению (2).
=22,6
=23,4
.
Рассчитывают сумму разностей оценок исследуемых образцов данных каждым испытателем.
Рассчитывают сумму квадратов разностей оценок исследуемых образцов.
Рассчитывают вариантность средних значений оценок исследуемых образцов:
5. Рассчитывают стандартную погрешность разности средних значений оценок исследуемых образцов:
Рассчитывают tрасч:
=
7. Определяют значение нормируемого критерия достоверности разности tp из табл. 2 при f=n-1=5-1. Для нашего примера tp при Р = 0,95 равно 2,7764.
Таким образом, tрасч значительно больше tp, а следовательно, различие между двумя результатами оценок двух образцов пива при доверительной вероятности 95 % не случайно, а обусловлено какими-то причинами.