Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Тема 4. Погрешность и неопределенность измерени...doc
Скачиваний:
1
Добавлен:
01.04.2025
Размер:
783.87 Кб
Скачать

Вопрос 2. Случайные погрешности

Случайные погрешности возникают из-за наличия случайных погрешностей у применяемых средств измерений, из-за колебаний влияющих факторов, из-за ограниченных возможностей органов чувств человека и др.

Присутствие случайных погрешностей в результатах измерений обнаруживается по разбросу значений относительно некоторого значения.

Вследствие того, что результат измерения содержит случайную погрешность , он сам является случайной величиной, так как . Предсказать результат отдельного единичного измерения невозможно, можно лишь, зная закономерности поведения результатов, с определенной уверенностью утверждать, что истинное значение находится в определенных пределах.

Дать количественные оценки результата измерения и его случайной погрешности позволяет теория вероятностей и математическая статистика.

Случайной величиной называется переменная, которая может принимать любое значение из заданного множества значений и с которой связано распределение вероятностей. Она может принимать дискретные и непрерывные значения.

Случайную величину, которая может принимать только отдельные значения, называют дискретной .

Случайную величину, которая может принимать любые значения из конечного или бесконечного интервала, называют непрерывной. Измеренные значения физических величин и их случайные погрешности рассматриваются как непрерывные случайные величины.

Все случайные величины подчиняются определенным закономерностям, называемым законами распределения. Законом распределения случайной величины называется соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.

Различают две формы закона: интегральную и дифференциальную. Интегральная форма – функция распределения вероятностей – функция, задающая для любого значения х вероятность того, что случайная величина Х будет меньше или равна х:

. (10)

По определению функция распределения равна вероятности, с которой случайная величина Х принимает значения, меньше или равные х (вероятности достижения х). Например, значение функции от 5 – это вероятность, с которой случайная величина Х достигнет значения, равного 5: .

Функция распределения вероятностей обладает следующими свойствами:

– она неотрицательная, т. е. ;

– значения функции распределения принадлежат отрезку [0,1];

– функция распределения неубывающая , т. е , если .

Если функция распределения непрерывной случайной переменной дифференцируема, то первая производная от нее называется плотностью распределения вероятностей случайной переменной Х:

. (11)

Плотность распределения обладает следующими свойствами:

;

.

Вид функции и плотности нормального распределения представлен на рис. 2.

Е сли усредненные величины, отсчитываются от начала координат, то моменты называются начальными, если от центра – центральными. Начальный и центральный моменты -го порядка для непрерывных случайных величин определяются по формулам

; (12)

. (13)

Для того чтобы охарактеризовать случайную величину, часто достаточно определить положение центра и меру разброса значений. Для нахождения этих параметров могут быть использованы некоторые усредненные числовые величины – начальные и центральные моменты.

Координата центра в зависимости от вида распределения (мера положения) может быть охарактеризована медианой, математическим ожиданием, модой или центром размаха.

Медиана (50% квантиль) является центром симметрии. Это точка на оси Х, слева и справа от которой вероятность появления различных значений одинакова и равна 0,5:

. (14)

Математическое ожидание – центр тяжести распределения, опрокидывающий момент в этой точке равен нулю. Математическое ожидание является первым начальным моментом случайной величины ( ):

, (15)

где интеграл берется по всему интервалу изменения Х.

Мода – это координата максимума распределения . Распределения с одним максимумом называются одномодальные, с двумя – двухмодальные.

Для ограниченных распределений например равномерного применяется оценка в виде центра размаха :

, (16)

где – первый и последний члены вариационного ряда соответствующего распределения.

Разные оценки центра имеют различную эффективность. Например, для островершинных распределений оценка координаты центра эффективнее медианой, чем математическим ожиданием. Для распределений, близких к нормальному, наиболее эффективной оценкой является математическое ожидание.

Характеристикой рассеивания значений служит дисперсия , которая является вторым центральным моментом ( ):

. (17)

Дисперсия случайной величины характеризует рассеяние отдельных ее значений относительно математического ожидания. Она имеет размерность квадрата случайной величины. Чаще для характеристики разброса значений пользуются положительным корнем квадратным из дисперсии – стандартным (средним квадратическим) отклонением (СКО), которое имеет размерность самой случайной величины.

Математическое ожидание и дисперсия являются наиболее часто применяемыми моментами, так как они определяют наиболее важные черты распределения – положение центра и степень разбросанности результатов.

Для характеристики некоторых распределений могут быть использованы и другие величины, например коэффициент асимметрии и эксцесс. Коэффициент асимметрии используется для характеристики асимметрии или скошенности распределения. Для его расчета используется третий центральный момент

. (18)

Четвертый центральный момент используется для расчета эксцесса и характеристики плосковершинности распределения.

Точечные оценки законов распределения. Функции распределения вероятностей описывают поведение непрерывных случайных величин, т. е. величин, возможные значения которых неотделимы друг от друга и непрерывно заполняют некоторый конечный или бесконечный интервал. Этот конечный или бесконечный интервал, т. е. множество всех рассматриваемых значений, называют генеральной совокупностью.

Генеральная совокупность как множество случайных величин описывается определенным законом и характеризуется своими параметрами (положением центра и рассеиванием), которые определяются по рассмотренным выше формулам. На практике используется ограниченное число измерений и задача состоит в том, чтобы оценить параметры генеральной совокупности (математическое ожидание, дисперсию или СКО) по конечному числу измерений, которые называют выборкой. Каждое единичное измерение, входящее в выборку и полученное при отдельном наблюдении, называется результатом наблюдения.

Операция определения на основе выборочных данных числовых значений параметров распределения, принятых в качестве статистической модели генеральной совокупности, из которой извлечена выборка, называется оцениванием.

Используемая выборка должна быть репрезентативной (представительной), т. е. должна достаточно хорошо представлять генеральную совокупность.

Оценкой является статистика, используемая для оценивания параметра генеральной совокупности. Оценка параметра называется точечной, если она выражается одним числом. В отличие от параметров генеральной совокупности (математического ожидания, дисперсии, СКО), их точечные оценки являются случайными величинами, значения которых будут зависеть от объема экспериментальных данных, а закон распределения – от законов распределения генеральной совокупности.

Точечные оценки должны быть состоятельными, несмещенными и эффективными. Состоятельность оценки состоит в том, что при увеличении числа измерений она должна приближаться к истинному значению. Несмещенной является оценка, математическое ожидание которой равно измеряемой величине. Эффективной является оценка, дисперсия которой меньше дисперсии любой другой оценки данного параметра.

Точечной оценкой математического ожидания результатов наблюдений является среднее арифметическое значение измеряемой величины. Среднее арифметическое является также оценкой истинного значения измеряемой величины после исключения систематической погрешности. Среднее арифметическое определяется как сумма всех значений, деленная на их число

, (19)

где – i-й результат наблюдения, – число результатов наблюдений.

При любом законе распределения среднее арифметическое является состоятельной и несмещенной оценкой, а также наиболее эффективной по критерию наименьших квадратов.

Точечная оценка дисперсии представляет собой сумму квадратов отклонений результатов наблюдений от их среднего арифметического , деленную на число наблюдений минус единица

. (20)

Она является также несмещенной и состоятельной.

Стандартное отклонение результатов наблюдений – положительный корень из дисперсии

. (21)

СКО среднего арифметического значения (результата измерений) в раз меньше СКО результата отдельного наблюдения

. (22)

Эта величина характеризует рассеяние среднего арифметического значения результатов наблюдений измеряемой величины относительно его истинного значения.

Для оценки рассеивания значений может быть использована такая характеристика, как размах. Размах (R) – разность между наибольшим и наименьшим наблюдаемыми значениями в ряду результатов наблюдений

. (23)

Чтобы разграничить параметры генеральной совокупности и их точечные оценки, они обозначаются различными символами. Параметры генеральной совокупности: математическое ожидание , или , дисперсия 2 и стандартное отклонение . Их выборочные оценки: среднее арифметическое , дисперсия результатов наблюдений и стандартное отклонение , размах .

В теории вероятностей и математической статистике используется множество разнообразных законов, с помощью которых описываются случайные величины. Встречающиеся в метрологии законы распределения также достаточно разнообразны: нормальный, равномерный, треугольный, трапецеидальный, экспоненциальный и др.

Нормальное распределение. Нормальное распределение случайной переменной (распределение Лапласа – Гаусса) – это наиболее важное распределение в метрологии. Его широкое применение объясняется тем, что многие случайные величины достаточно близко описываются этим законом. Особенность его в том, что он является предельным законом, к которому при определенных условиях приближаются другие законы. Нормальный закон проявляется в тех случаях, когда случайная переменная Х является результатом действия большого числа различных факторов. Каждый фактор в отдельности на величину Х воздействует незначительно, и нельзя указать, какой именно влияет в большей степени, чем остальные.

Нормальное распределение (распределение Лапласа – Гаусса) – распределение вероятностей непрерывной случайной величины Х такое, что плотность распределения вероятностей при   < х <   принимает действительное значение

ехр , (24)

где  – математическое ожидание;  – стандартное отклонение нормального распределения; – независимая переменная.

Величина  2 –дисперсия нормального распределения.

Функция распределения (интегральная функция) имеет вид

(25)

К ак видно из формул, нормальный закон распределения характеризуется двумя параметрами:  и . Математическое ожидание  характеризует положение центра распределения, а стандартное отклонение  является характеристикой рассеивания. Достаточно знать эти параметры, чтобы задать нормальное распределение.

В силу того, что нормальное распределение одномодально и симметрично, то медиана, мода и математическое ожидание совпадают: .

Плотность нормального распределения имеет две точки перегиба , а функция – одну точку перегиба (рис.3)

Нормальное распределение с произвольными параметрами  и  называется общим.

Линейное преобразование нормально распределенной случайной переменной Х, после которого получается случайная переменная Z с математическим ожиданием 0 и дисперсией 1, называется нормированием: .

Нормальное распределение с  = 0,  2 = 1 называется нормированным (стандартным) нормальным распределением. Вид функции и плотности нормированного нормального распределения представлен на рис. 3.5.

Стандартное нормальное распределение (стандартное распределение Лапласа – Гаусса, или нормированное нормальное распределение) – распределение вероятностей стандартизованной нормальной случайной величины Z, плотность распределения которой равна

ехр (26)

при   < z <  .

Значения функции Ф(z) определяется по формуле

(27)

Значения функции Ф(z) и плотности ф(z) нормированного нормального распределения рассчитаны и сведены в таблицы (табулированы). Часто таблицы составлены только для положительных значений z. Так как распределение симметрично относительно 0, то

Ф(–z) = 1–Ф(z). (28)

Нормирование позволяет все возможные варианты нормального распределения свести к одному случаю:  = 0,  2 = 1. С помощью таблиц можно определить не только значения функции и плотности нормированного нормального распределения для заданного z, но и значения функции общего нормального распределения по следующим формулам

; (29)

. (30)

Оценка результатов наблюдений, результата измерения и случайных погрешностей осуществляется, исходя из предположения о нормальном законе их распределения. Этот закон проявляется тогда, когда на результат измерений действует масса факторов, среди которых нельзя выделить доминирующий.

Исходя из нормального закона, результаты наблюдений физической величины описываются формулой (3.33).

Погрешность равна разности измеренного значения и истинного, оценкой которого является математическое ожидание . Если считать, что результаты измерений не содержат грубых и систематических погрешностей, то, перенеся начало координат в центр распределения и откладывая по оси абсцисс погрешность, получим формулы нормального распределения погрешностей

ехр , (31)

. (32)

Кривая плотности нормального распределения погрешностей (рис. 3.6) симметрична относительно оси ординат.

Это означает, что погрешности, одинаковые по величине, но противоположные по знаку, имеют одинаковую плотность распределения вероятностей, т. е. при большом числе наблюдений встречаются одинаково часто. Из характера кривой следует, что при нормальном законе распределения малые погрешности будут встречаться чаще, чем большие.

В метрологической практике часто необходимо определить вероятность того, что случайная величина (результаты наблюдений, погрешность) будет находиться в определенном интервале от х1 до х2. Вероятность нахождения случайной в интервал от х1 до х2 можно определить по формуле

(33).

Обычно и выбирают симметрично по обе стороны от максимума распределения, так что (рис. 5).

Так как , а математическое ожидание является оценкой истинного значения при исключении систематических погрешностей, то формула вероятности нахождения результата наблюдения в заданном интервале приобретает вид

(34)

где – аргумент (квантиль) функции нормированного нормального распределения, определенной на интервале от   до  : .

Поменяв местами и , получим вероятность того, что истинное значение будет находиться в определенном интервале

. (35)

Для погрешности вероятность нахождения в определенном интервале соответственно равна

. (36)

Это означает, что истинное значение измеряемой величины с вероятностью , называемой доверительной вероятностью (или уровнем доверия), находится между границами интервала . Интервал от до называется доверительным интервалом погрешности измерения, а половина интервала , называется доверительной границей случайного отклонения результатов наблюдения, соответствующей доверительной вероятности . Доверительный интервал является интервальной оценкой случайной погрешности и наряду с точечными оценками используется для ее характеристики.

Стандартное отклонение среднего арифметического в раз меньше стандартного отклонения результатов наблюдений, поэтому доверительный интервал, устанавливающий отклонения среднего арифметического от истинного значения, обозначаемый определяется формулой

. (37)

Он указывает, что с доверительной вероятностью равной истинное значение находится в интервале . Истинное значение может находиться и за пределами указанного интервала, и такая вероятность равная (рис.3.7), называется уровнем значимости.

Если таблицы нормированного нормального распределения составлены для положительных значений аргумента от 0 до , то в силу симметричности распределения относительно начала координат вероятность нахождения истинного значения и случайной погрешности в заданном интервале можно определить по следующим формулам:

; (38)

. (39)

где – квантиль функции нормированного нормального распределения, определенной на интервале от до :

. (40)

Можно найти вероятность того, что истинное значение окажется в интервале в пределах μ k.

При =1, 2, 3 эта вероятность равна

;

;

.

Последний результат означает, что с вероятностью, близкой к единице ( ), случайная величина, подчиняющаяся нормальному закону распределения, не выходит за границы интервала . Это утверждение носит название правило трех сигм.

Если какое-либо значение появляется за пределами трехсигмового участка, в котором находятся 99,73% всех возможных значений, а вероятность появления такого события очень мала (1:270), то следует считать, что рассматриваемое значение не принадлежит той генеральной совокупности, которой принадлежат все остальные результаты наблюдений.

Часто нужно решить обратную задачу, т. е определить доверительные границы, в пределах которых истинное значение находится с наперед заданной доверительной вероятностью . Для этого необходимо:

– задаться доверительной вероятностью , которую чаще всего выбирают из следующего ряда 0,9; 0,95 или 0,99. Для технических измерений обычно выбирают 0,95;

– вычислить значение функции нормированного нормального распределения. Из формул или находим или ;

– определить квантили или из таблиц нормированного нормального распределения, при которых функция примет значение или .

Например, необходимо определить доверительные границы истинного значения физической величины, распределенной по нормальному закону при доверительной вероятности Р = 0,95. Для их определения воспользуемся формулой нахождения истинного значения в доверительном интервале . Отсюда значение , т. е. . По таблицам значений функции нормированного нормального распределения находим значение аргумента , при котором функция примет значение равное : . Доверительные границы равны .

Распределение Стьюдента. Закон нормального распределения вероятностей справедлив только при сравнительно большом (более 20) числе наблюдений одной и той же физической величины. В этом случае можно считать, что оценка стандартного отклонения равна оцениваемому параметру, т. е. .

Если распределение результатов наблюдений нормально, но их дисперсия неизвестна, т. е. при малом числе наблюдений , расчет доверительных интервалов выполняют с использованием распределения Стьюдента , которое зависит от числа результатов наблюдений. Оно описывает плотность распределения отношения (дроби Стьюдента)

, (41)

где – истинное значение измеряемой величины. Величины , вычисляют на основании опытных данных, они представляют собой точечные оценки математического ожидания, СКО результатов наблюдений и СКО среднего арифметического.

Вероятность того, что дробь Стьюдента в результате выполненных наблюдений примет некоторое значение в интервале , равна

(42)

где k – число степеней свободы, равное .

Величины (называемые коэффициентами Стьюдента) рассчитаны для различных значений доверительной вероятности и различного числа измерений и сведены в таблицы (см. приложение). Следовательно, с помощью распределения Стьюдента можно найти вероятность того, что отклонение среднего арифметического от истинного значения измеряемой величины не превышает . Распределение Стьюдента используется при числе измерений , поскольку уже при оно переходит в нормальное.

Равномерное, треугольное и трапецеидальное распределения. Если случайная величина принимает значения лишь в пределах некоторого конечного интервала от до с постоянной плотностью вероятностей (рис. 6), то такое распределение называется равномерным и описывается соотношением

, при

, при и . (43)

Так как площадь, ограниченная кривой распределения равна единице, а , то

и

Математическое ожидание определяется формулой

. (44)

Дисперсия случайной величины Х, распределенной по равномерному закону равна:

,

откуда . (44)

Для треугольного и трапецеидального распределения (рис. 7) СКО определяются соответственно формулами

; (45)

. (46)