
- •Метрология
- •Модель погрешности си. Погрешности си: абсолютные, относительные и приведенные, основные и дополнительные, статические и динамические, аддитивные и мультипликативные, систематические и случайные.
- •2.Нормируемые метрологические характеристики.
- •2.2. Оценки параметров распределения и их свойства
- •1. Равномерный закон распределения.
- •2. Нормальный закон распределения.
- •2.1.Интегральная и дифференциальная функции распределения. Вероятность попадания в заданный интервал.
- •2.2. Вычисление вероятности заданного отклонения
- •2.3. Правило трех сигм
- •3. Показательное распределение.
- •3.1. Интегральная и дифференциальная функции распределения.
- •3.2. Числовые характеристики.
- •3.3. Функция надежности.
2.2. Оценки параметров распределения и их свойства
|
|
|
Значение параметра, вычисленное по ограниченному объему эмпирических данных (ЭД), является случайной величиной, т. е. значение такой величины от выборки к выборке может меняться заранее не предвиденным образом. Следовательно, в результате обработки ЭД определяется не значение параметра T, а только лишь его приближенное значение – статистическая оценка параметра . Получить статистическую оценку параметра теоретического распределения означает найти функцию от имеющихся результатов наблюдения, которая и даст приближенное значение искомого параметра. Различают два вида оценок – точечные и интервальные. Точечными называют такие оценки, которые характеризуются одним числом. При малых объемах выборки точечные оценки могут значительно отличаться от истинных значений параметров, поэтому их применяют при большом объеме выборки. Интервальные оценки задаются двумя числами, определяющими вероятный диапазон возможного значения параметра. Эти оценки применяются для малых и для больших выборок. Рассмотрим вначале точечные оценки.
Применительно к каждому оцениваемому параметру закона распределения генеральной совокупности существует множество функций, позволяющих вычислить искомые значения. Например, оценку математического ожидания можно вычислить, взяв среднее арифметическое выборочных значений, половину суммы крайних членов вариационного ряда, средний член выборки и т.д. Указанные функции отличаются качеством оценок и трудоемкостью реализации.
Качество оценок характеризуется такими свойствами, как состоятельность, несмещенность, эффективность и достаточность [3, 5, 9].
Состоятельность характеризует сходимость по вероятности оценки q к истинному значению параметра T при неограниченном увеличении объема выборки n. Для состоятельности оценки достаточно, но не обязательно, чтобы математическое ожидание квадрата отклонения оценки от параметра M(T – )2 стремилось к нулю с увеличением объема выборки (здесь и далее символ М означает математическое ожидание). Свойство состоятельности проявляется при неограниченном увеличении n, а при небольших объемах ЭД наличие этого свойства еще недостаточно для применения оценки.
Несмещенность характеризует отсутствие систематических (в среднем) отклонений оценки от параметра при любом конечном, в том числе и малом, объеме выборки, т. е. M() = T. Использование статистической оценки, математическое ожидание которой не равно оцениваемому параметру, приводит к систематическим ошибкам. Не всегда наличие смещения плохо. Оно может быть существенно меньше погрешности регистрации значений параметра или давать дополнительную гарантию выполнения требований к значению параметра (если даже при положительном смещении оценка меньше предельно допустимого значения, то несмещенное значение тем более будет отвечать этому условию). В таких ситуациях допустимо применение смещенных оценок, если они вычисляются проще, чем несмещенные. Но даже несмещенная оценка может быть удалена от истинного значения.
Эффективность характеризует разброс случайных значений оценки около истинного значения параметра. Среди всех оценок следует выбрать ту, значения которой теснее сконцентрированы около оцениваемого параметра. Для многих применяемых способов оценивания выборочные распределения параметров асимптотически нормальны, поэтому часто мерой эффективности служит дисперсия оценки. В таком понимании эффективная оценка – это оценка с минимальной дисперсией. При неограниченном увеличении n эффективная оценка является и состоятельной. В случае оценивания одного параметра дисперсия несмещенной оценки отвечает условию Рао – Крамера,
где f(x, T) – плотность распределения варианты; п – количество наблюдений.
Сравнительная эффективность оценки с дисперсией Dk(q) измеряется коэффициентом эффективности
= D()/Dk(),
который не превышает единицы. Чем ближе коэффициент к единице, тем эффективнее оценка. Отмеченное ограничение применимо и к дискретным распределениям, если вместо плотности распределения подставить в него функцию вероятности.
Достаточность характеризует полноту использования информации, содержащейся в выборке. Другими словами, оценка будет достаточной, если все другие независимые оценки на основе данной выборки не дают дополнительной информации об оцениваемом параметре. Эффективная оценка обязательно является и достаточной.
Рассмотренные свойства применимы также и к ЭД, которые характеризуются многомерными распределениями вероятностей.
Подходы к формированию оценок разработаны в теории несмещенных оценок , предложенной А. Н. Колмогоровым и С. Рао. В данной теории предполагается известным с точностью до параметра T вид функции плотности распределения наблюдаемой величины f(x, Т). Вид распределения устанавливается исходя из априорных соображений, например, на основе общепринятых суждений о характере безотказной работы технических средств. Тогда задача сводится к нахождению такой функции от результатов наблюдений, которая дает несмещенную и эффективную оценку.
Итак, для построения гистограммы необходимо:
составить вариационный ряд
разбивается диапазон на поддиапазоны, и определяем ширину поддиапазона ∆х
∆х = (хmax – xmin )/k
K=√n, где n – количество наблюдений. Чаще берется 9-10 диапазонов. Подсчитываем количество результатов наблюдений, попавших в nк диапазон.
Определяем относительную частоту
Рi=nк/n – плотность вероятности появления i-го события.
Плотность вероятности больше в центре.
Затем на каждом интервале строим прямоугольник. Обводим по точкам, получаем полигон.
Необходимо определить к какому виду законов относится данный полигон.
Например, докажем, что получившаяся кривая подчиняется нормальному з-ну.
РИ=ЦР+tрS,
Где ЦР – центр распределения, РИ – рез. измерен., tр – квантиль.
Затем запишем формулу нормального закона распределения и докажем, что результаты экспериментального исследования подчиняются нормальному з-ну.
Критерий Пирсона (критерий согласия) – Z.
Z=∑(Pi эксперим. – Pi теор.)/Pi эксперимент. = λ2.
Если погрешность маленькая, то данный полигон соответствует нормальному закону распределения, если большая, то нет.
Х = mx±tpN×S,
tpN – квантиль нормального закона
Обработка измерений при неизвестном законе распределения (нахождение квантильи Стьюдента)
Выводы:
С увеличением количества измерений, точность измерений увеличивается.
С увеличением степени доверия, количество измерений уменьшается.
Методы оценки результатов измерений
Точечная оценка результатов измерений. В практике измерений наибольшее распространение получили точечные и интервальные оценки результатов измерений.
Оценку X - числовой характеристики закона распределения случайной величины X,, изображаемую точкой на числовой оси, называют точечной оценкой [9]. В отличие от числовых характеристик, оценки являются случайными величинами, значения которых зависят от числа измерений.
Для производственных условий наиболее характерными являются однократные измерения либо многократные измерения, причем количество многократных измерений одной и той же величины невелико (п = 5 - 6 измерений).
Можно говорить лишь о точечной оценке результата измерения. Число измерений невелико, поэтому отделить случайную погрешность от систематической не представляется возможным. Поскольку измерения осуществляют, как правило, в нормальных условиях, то вероятность промахов можно считать достаточно малой. 1
Результат измерения или его среднее значение (при п = 5-6 измерений) принимается в качестве истинного, а решение о годности размера выбирают исходя из условия, что результат измерения не выходит за предел некоторой заранее заданной величины, например допуска на изготовление.
Интервальные оценки результатов наблюдений. Действительный размер - это размер, полученный в результате измерения с допустимой погрешностью измерения. Точечные оценки результатов измерения не позволяют в должной мере оценить достоверность измерения. Формулы (3.1) -(3.3) определяют статистические оценки размеров, т. е. приближенные значения их истинных величин, имеющих место в действительности. Степень приближения истинных величин, или точность каждой из оценок, определяется половиной ширины построенного для нее доверительного интервала.
Методы проверки нормального закона распределения случайных величин. При статистической обработке результатов измерений особую роль играет проверка соответствия распределения случайных величин нормальному закону, которому чаще всего подчиняются результаты большинства случайных измерений, что необходимо для обоснованного выбора доверительных границ результатов измерений и оценки точности измерений [9]. В наибольшей степени этой цели соответствует критерий у} (критерий Пирсона).
Для этой цели необходимо количество измерений 40 и более.
Обычно принимается следующий порядок решения задачи.
1.Диапазон полученных результатов измерений делят на r интервалов шириной Хi,(i=1,2, ...r)
2.Для каждого интервала подсчитывают частоты mi равные количеству результатов, лежащих в каждом i-м интервале.
3.Определяют частость появления величин Рi в каждом интервале:
4.Находят оценку средней плотности распределения pi случайной величины Xi в каждом интервале.
5.Строят гистограмму распределения величины Хi откладывая по оси абсцисс результаты наблюдений в виде интервалов Dв порядке возрастания индекса i, а по оси ординат - оценку средней плотности распределения Р*i, получая тем самым прямоугольник с высотой pi. При построении гистограммы число интервалов г выбирают в зависимости от числа измерений n исходя из соотношений: при n=40...100 r= 7...9, а при n= 100...500 r= 8... 12, а масштабы по осям гистограммы рекомендуется принимать такими, чтобы отношение ее высоты к основанию составляло 5: 8.
6.Соединяя середины отрезков, получают полигон распределения. Характер ломаной линии позволяет сделать предположение о виде распределения, что дает возможность с большей долей вероятности подобрать соответствующую кривую распределения.
Если СКО и математическое ожидание полигона распределения близки к значениям СКО и математическому ожиданию кривой нормального распределения, то этот вид распределения можно положить в основу гипотезы о правомерности такого предположения.
Поскольку предположение основано на результатах опытных Данных случайных величин, оно должно быть подтверждено обычными методами математической статистики по критериям согласия. При числе наблюдений более 40 рекомендуется принимать критерий согласия %2 - Пирсона.
При этом возможны два вида ошибок: ошибка первого рода, состоящая в том, что в силу случайного характера результатов измерений отвергают верную гипотезу. Вероятность ошибки первого рода называют уровнем значимости q = 1 - а. Ее выбирают в пределах 0,05...0,10.
Принимая неверную гипотезу, совершают ошибку второго рода, - qu значение которой колеблется в пределах 0,95... 0,9 соответственно. Физический смысл которой состоит в том, что принимают ошибочное решение о несоответствии распределения случайной величины Xj правильно выбранному теоретическому распределению.
Методы обработки результатов измерений. Все рассмотренные ранее методы обработки результатов измерений относятся к оценке прямых равноценных измерений, т.е. измерений с одной и той же точностью и одними и теми же приборами. Однако на практике встречаются и другие методы оценки результатов измерений: методы оценки неравноточных измерений, косвенных измерений, суммирования результатов измерений и др. Эти методы относятся к специальным разделам метрологии и достаточно подробно изложены в специальных курсах. Рассмотрим лишь общие подходы к некоторым методам оценки.
Неравноточные измерения. Неравноточными называются измерения одной и той же физической величины, выполняемые с разной точностью, в различных условиях, разными измерительными средствами и т.д.
Особенности обработки результатов косвенных измерений.
При косвенных измерениях значение искомой величины получают на основании известной зависимости, связывающей ее с другими величинами, определяемыми прямыми измерениями, т.е. косвенные измерения предполагают наличие функциональной связи.
При взаимной зависимости аргументов используют обычные методы корреляционного анализа.
Оценка методов обработки результатов косвенных измерений является достаточно трудоемкой, а коэффициенты влияния аргументов на погрешность результата косвенных измерений незначительны, поэтому в технических измерениях влиянием этих погрешностей можно пренебречь.
Суммирование погрешностей. Суммированием погрешностей называется определение расчетным путем оценки результирующей погрешности по известным оценкам ее составляющих.
При суммировании все составляющие погрешности должны рассматриваться как случайные величины, что на практике не со-; ответствует действительности (например, есть неустранимая систематическая погрешность и другие составляющие). В ряде случаев систематические погрешности могут обладать взаимной корреляционной зависимостью.
Суммирование случайных погрешностей производится по-разному, в зависимости от наличия корреляции, а учет систематических погрешностей производится при помощи вводимых поправочных коэффициентов. Это позволяет перевести систематическую погрешность в разряд случайных.
Критерием согласия (критерием Пирсона) называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Виды законов распределения