- •Дисциплина «Мониторинг загрязнения опс»
- •Содержание
- •Введение
- •1. Погрешности. Общая характеристика и классификация
- •2. Случайные величины. Частота и вероятность появления результата
- •3. Нормальное распределение Гаусса и t-распределение
- •4. Порядок статистической обработки результатов измерений
- •Вычисление выборочных характеристик.
- •Вычисление доверительного интервала.
- •4.1. Исключение известных систематических погрешностей
- •4.2. Вычисление выборочных характеристик
- •4.3. Проверка распределения на нормальность методом асимметрии и эксцесса
- •4.4. Оценка наличия грубых измерений
- •4.5. Вычисление доверительного интервала
- •5. Проверка значимости гипотез
- •5.1. Применение доверительного интервала разности средних
- •5.2. Использование f – критерия. Сравнение дисперсий двух выборок
- •Приложение
- •Литература
2. Случайные величины. Частота и вероятность появления результата
Любой результата мониторинга представляется собой случайную величину (СВ) – величину, которая в результате испытаний принимает одно и только одно возможное значение, наперед не известное и зависящее от случайных причин, которые заранее не могут быть учтены (например, рН воды в реке может принимать значения: 7,24; 6,52; 5,13; 8,03).
Различают дискретные и непрерывные СВ, причем в практике мониторинга, как правило, имеют дело с последними.
Дискретной (прерывной) называют СВ, которая принимает отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений дискретной СВ может конечным или бесконечным. Примером дискретной СВ является численность видов-индикаторов в биологическом мониторинге.
Непрерывной называют СВ, которая может принимать все значения из некоторого конечного промежутка. Очевидно, число возможных значений непрерывной СВ бесконечно (пример – концентрация любого загрязняющего вещества).
В математической статистике поведение СВ принято описывать специальными функциями (х), связывающими значение, которое принимает случайная величина х, с вероятностью ее появления. Функцию (х) называют дифференциальной функцией распределения случайной величины, или функцией плотности вероятности.
При проведении мониторинга одного и того же объекта ОС возможно получение как абсолютно одинаковых результатов параллельных измерений, так и некоторого разброса данных. Если известно общее количество результатов анализа m, среди которых n результатов имеют одинаковое значение, то отношение n/m будет называться частотой появления результата. При m0 частота появления результата преобразуется в вероятность его появления Р, величина которой колеблется от 0 до 1 (100%).
Значимость события помимо вероятности его появления определяется уровнем значимости . Если при решении поставленной задачи выявляют две критические области, то = (1 – Р)/2. Если в задаче решается вопрос, будет ли значение какого-либо параметра больше или меньше определенного значения (т.е. критическая область одна), то = 1 – Р.
3. Нормальное распределение Гаусса и t-распределение
Среди законов распределения, которым подчиняются встречающиеся на практике СВ, чаще всего приходится иметь дело с нормальным законом распределения, которое ввел и исследовал Гаусс.
Функция плотности вероятности гауссова распределения представляется в виде:
(1)
где , - числовые константы, определяющие поведение непрерывной случайной величины, х – ее значение.
- математическое ожидание, равное истинному значению измеряемой случаной величины при отсутствии систематической погрешности:
(2)
где xi – i-тое значение случайной величины, n – количество случайных величин (n).
- стандартное отклонение случайной величины. Квадрат случайного отклонения 2 называют дисперсией случайной величины.
(3)
График функции нормального распределения представлен на рис. 1.
(х)
х
Рис. 1. Кривая нормального распределения.
Кривая нормального распределения (нормальная кривая) обладает следующими свойствами:
-
Максимум кривой распределения приходится на х = . График представляет собой колоколообразную кривую, симметричную относительно максимума.
-
При любых значениях и площадь, ограниченная нормальной кривой и осью х, равна единице.
-
Возможные значения нормально распределенных величин группируются вокруг истинного значения. Расчеты показывают, что площадь фигуры с границами составляет 0,6826, с границами 2 - 0,9544, с границами 3 - 0,9973. То есть можно достаточно надежно (с вероятностью, равной 99,73%) утверждать, что все значения СВ, подчиняющейся нормальному распределению Гаусса, отклоняются от истинного значения не более чем на 3. Это утверждение получило название правила трех сигм.
При = 0 и = 1 нормальную кривую называют нормированной. График этой кривой симметричен относительно оси ординат.
Множество всех результатов анализа (бесконечное большое число измерений), подчиняющихся нормальному распределению, называют генеральной совокупностью. В практике мониторинга часто имеют дело не с генеральной совокупностью, а с гораздо меньшим объемом данных, извлекаемых из нее случайным образом, т.е. с выборкой (выборочной совокупностью). Выборку следует подбирать так, чтобы она как можно лучше характеризовала (представляла) генеральную совокупность. Этой цели можно добиться тем скорее, чем лучше удался случайный отбор конкретных измерений.
Большие выборки (n20) подчиняются тем же закономерностям, что и генеральная совокупность. Для работы с малыми выборками вместо нормального распределения используют распределение Стьюдента (t-распределение случайной величины):
(4)
где х – среднее арифметическое выборочных значений, s – стандартное отклонение выборки (s2 – дисперсия случайной величины).
(5)
(6)
Величина n-1 в знаменателе формулы (6) является числом степеней свободы , которое равно числу независимых переменных в выборочной совокупности за вычетом числа связывающих их уравнений. Так как отклонение параллельных измерений (xi -x) рассчитывают относительно среднего значениях, то между ними имеет место одна связь и число степеней свободы на единицу меньше, чем число измерений в выборке.
Стандартное отклонение s, характеризующее рассеяние результатов в выборке, имеет размерность измеряемой величины и характеризует случайную погрешность анализа.
