Постоянные погрешности сохраняют неизменным свой знак и величину в течение всего процесса измерения; поэтому математиче ская обработка результатов наблюдений не может привести к их обнаружению. Анализ таких погрешностей возможен только на основании некоторых априорных знаний об этих погрешностях, получаемых, например, при поверке средств измерений.
При переменной систематической погрешности последователь ность неисправленных отклонений результатов наблюдений обнару живает тенденцию к возрастанию или убыванию, что легко устанав ливается по графику зависимости погрешностей от номера изме рения.
В качестве наиболее общих приемов исключения систематических погрешностей, одинаково применимых как к постоянным, так и к пе ременным погрешностям, можно указать следующие.
1. Предварительное изучение погрешностей и введение соответ ствующих поправок. Сюда прежде всего относится поверка измери тельных приборов, калибровки шкал, наборов мер, магазинов и т. д., имеющая целью обеспечить правильность применяемой измеритель ной аппаратуры. Этим приемом определяются всякого рода поправоч ные формулы или кривые, например выражающие зависимость зна чений показаний измерительных приборов от температуры, давления, частоты и других факторов. Аналогично испытывается правильность метода химического анализа, применяя его к смесям чистых ве ществ, состав которых наперед установлен путем точного взве шивания.
2. Исключение самого источника погрешностей. Прежде всего этот прием предполагает тщательную установку или расположение измерительной аппаратуры и всех других приспособлений, служащих для производства измерений. Если, например, измерительный при бор требует установки по отвесу или уровню; то его и надо так уста новить; если термометр расположен так, что при отсчитывании тем пературы неизбежны погрешности параллакса, то его необходимо переставить в такое положение, чтобы при наблюдении параллакс отсутствовал. Если причиной погрешности является смещение нуле вой точки у измерительного прибора, то прежде чем им пользоваться необходимо установить указатель на нуль. В тех случаях, когда погрешности вносятся в измерения внешними условиями (темпера турой, движением воздуха, тряской и т. п.), измерения следует про изводить только при устойчивых условиях и прекращать их, если последние подвергаются резким изменениям.
Кроме этих общих приемов существуют специальные приемы для исключения определенного рода погрешностей.
Метод замещения. Этот прием заключается в том, что измеряемая величина (например, масса тела при взвешивании) заменяется в изме рительной установке равновеликой ей известной величиной (массой гири), причем при такой замене никаких изменений в состоянии и действии измерительной установки не происходит.
Компенсация погрешности |
по знаку. Этот прием заключается |
в постановке наблюдений так, |
чтобы погрешность вошла в резуль |
таты измерения один раз с одним знаком, другой раз — с обратным знаком. Например, применяемые в измерительных приборах микро метрические винты обладают мертвым ходом. В окулярном микро метре влияние мертвого хода выражается в том, что при вращении головки винта в каком-либо направлении перемещение связанных с винтом нитей начинается после того, как головка повернется на некоторый угол, вследствие чего отсчет угла поворота по нанесенной на головке шкале будет содержать систематическую погрешность. Для исключения этой погрешности наводка нитей на выбранную точку делается сначала при одном направлении вращения головки, а затем при обратном. Среднее значение двух отсчетов будет свободно от погрешности. Если значение измеряемой величины определяется разностью двух наблюдений, содержащих одну и ту же системати ческую погрешность, то эта погрешность исключается непосред ственно.
Метод противопоставления. Этот прием, сходный с предыдущим, состоит в постановке наблюдений таким образом, чтобы причина, вызывающая постоянную погрешность, оказывала бы противополож ное действие на результаты измерения. В тех случаях, когда система тическая погрешность имеет прогрессивный характер и изменяется по линейному закону, например пропорционально времени, действи тельным приемом ее исключения является метод симметричных на блюдений. В этом случае арифметическое среднее каждой пары зна чений прогрессивной погрешности, симметричных относительно некоторого момента времени, равны между собой. Поэтому если на блюдения можно расположить так, чтобы в результате сравнивались между собой арифметические средние симметрично расположенных наблюдений, то прогрессивная погрешность будет исключена. Во мно гих случаях это достигается повторением наблюдений в обратном порядке, заканчивая их той же операцией, которой они были начаты. В случае периодических погрешностей действенным приемом их исключения является метод наблюдений четное число раз через полупериоды [83].
Для выявления систематических погрешностей в отдельных случаях можно использовать уравнения сохранения, составленные для объекта исследования. К ним относится уравнение сохранения энергии (или первый закон термодинамики), уравнение сохранения массы, уравнение сохранения количества движения и т. д.
Фактически в распоряжении исследователя имеются самые раз личные уравнения баланса. При исследовании электрических це пей можно рассматривать сохранение заряда, потенциала или напря женности электромагнитного поля; в термодинамических системах — сохранение энтальпии, свободной энергии или энтропии, а в неко торых гидродинамических системах — баланс напора, давления или удельной энергии.
В заключение приведем пример использования рандомизирован ной процедуры для оценки систематической погрешности.
Пусть 0 = ф (t), где t — текущее время измерений. Если полагать t случайной ве личиной, что практически достигается назначением случайного порядка измерений,
то случайной будет и 0 как функция случайного аргумента. Если длительность
эксперимента равна Т, а распределение |
t — равновероятное, т. е. |
|
О, |
если |
/ ^ 0 ; |
(0 |
1 /Т, если |
0 < ^ < Г; |
|
1, |
если |
t ^ T , |
то математическое ожидание 0 может быть найдено из следующего выражения
с о Т
м [0] = J ф (0 f { t ) d t = ~ \ Ф( 0 dt.
При исключении систематических погрешностей тем или иным приемом в действительности не удается освободиться от них без всякого остатка. Эти остатки называются неисключенными остатками систематических погрешностей и рассматриваются как весьма малые систематические погрешности. Совершенно бесполезно'производить исключение систематических погрешностей далее некоторого предела равно как и вводить поправки на систематические погрешности, не превосходящие этого предела. Таким пределом может служить доля (например, 5%) квадратичного значения случайной погрешности.
4. Грубые ошибки и промахи
При измерениях встречаются случаи, когда один из результатов заметно отличается от всех остальных. Возникает вопрос — не яв ляется ли этот результат следствием случайного просчета, непра вильного чтения показаний измерительного прибора и т. п., и поэтому он должен быть исключен. В математической статистике такие измерения называют резко выделяющимися или анормальными, а в метрологии грубыми ошибками или промахами. Вопрос об исклю чении результата измерения особенно остро встает в тех случаях, когда число измерений невелико и вследствие этого резко возрастает значимость каждого результата.
Наиболее целесообразным способом выявления и устранения промахов является непосредственный анализ полученных резуль татов и тщательная проверка неизменности условий всех экспери ментов. Статистические методы выявления грубых ошибок и про махов следует применять лишь в сомнительных случаях, когда до полнительная информация о качестве измерений либо неполна, либо ненадежна.
Статистические методы выявления анормальных измерений по священы в основном оценке одной грубой ошибки, когда подозри тельным может оказаться минимальный или максимальный по ве личине результат наблюдений. Пусть х ъ — взаимно не зависимые случайные результаты измерения, подчиняющиеся нор мальному распределению с параметрами (mit а). Основная гипо теза # 0, подлежащая проверке, заключается в предположении, что каждая реализация xt принадлежит к одной и той же генеральной
совокупности с математическим ожиданием т, т. е. |
= m2 = |
26 Л . Л . Бошняк |
401 |
• • • — т. Если гипотеза Н 0 подтверждается, это значит, что ни одно из измерений нельзя считать анормаль ным. В противном случае минимальное (максимальное) измерение следует исклю чить.
Статистический критерий для проверки этой гипотезы обычно выбирают с учетом возможных альтернативных, т. е. взаимоисключающихся, гипотез. Обычно гипотезе Н 0 противопоставляются следую щие гипотезы: максимальное измерение анормальное, так как оно принадлежит к гене ральной совокупности, мате матическое ожидание которой
больше т. |
Эта |
гипотеза обо |
значается |
#+; |
минимальное |
измерение |
анормальное, так |
как оно принадлежит к гене ральной совокупности, мате матическое ожидание которой меньше т. Эта гипотеза обо значается # 7 ; максимальное либо минимальное измерение анормальное, так как одно из них принадлежит к гене ральной совокупности, мате матическое ожидание которой не равно т\ эта гипотеза обо значается Н х.
Если объем выборки п не очень велик, а отклонение от т значительно превышает а, то для проверки гипотезы #„ используются критерии, ста тистики которых представ ляют собой функции крайних значений вариационного ря да: минимального х г или мак симального хп. В табл. 34 приводятся статистики этих критерйев для каждой кон курирующей гипотезы в за висимости от того, известны
или неизвестны параметры т и сг. Здесь
|
|
х = ~ Е |
|
|
(= 1 |
— |
l |
(xt — т)2>если tn известно; |
n |
|
(s*)2 =
—— x)2, если m неизвестно.
Если вычисленная статистика критерия (£+, £_ или £) превышает или равна критическому значению этой же статистики, то гипотеза #„ должна быть отвергнута.
Процентные точки критического значения наибольшего норми рованного отклонения
|
|
|
|
|
|
|
£(х, s*) — шах |
Xi — X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
i |
|
s* |
|
|
|
|
|
|
|
|
|
табулированы |
[16]. |
Технику |
использования |
приведенных |
крите |
риев |
рассмотрим |
на |
следующем |
примере. |
|
|
|
|
|
|
|
П р и |
г р а д у и р о в а н и и |
м ессдозы |
бы ло |
п р о д е л а н о |
п я т ь |
и зм е р е н и й , |
р е зу л ь т а т ы |
к о то р ы х |
т ак о в ы : |
7 5 00, |
7 8 0 0 , 78 9 0 , |
7970 |
и |
8080 Н . |
|
И зв е с тн о , |
что |
д е й с тв и т е л ь н а я |
к о н т р о л ь н а я |
н а г р у з к а |
р а в н а 7900 |
Н , |
к в а д р а т и ч н о е о т к л о н ен и е |
м ессдозы |
н еи звестн о . |
С о м н и тел ьн ы м я в л я е т с я |
р е з у л ь т а т 7500 |
Н . |
С л ед о в ат ел ь н о , г и п о т езе |
Н д п р о т и в о п о |
с т а в л я е т с я ги п о т е за /7]“ , |
к о гд а |
т и зв е с тн о , а |
а |
н е и зв е ст н о , |
т . е. |
|
|
|
|
|
|
|
|
s* |
|
|
|
|
|
— 7900)2 = |
2 0 3 ,7 Я ; |
|
|
|
|
|
|
|
|
|
|
£ - |
(от, s*) |
|
17500 — 79001 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 0 3 ,7 |
|
~ |
, |
У |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
П о т а б л и ц а м [1 6 ] п р и Q = 5% н ах о д и м к р и т и ч е с к о е зн а ч е н и е р а вн ы м 2 ,0 5 . Э то |
о зн а ч а е т , |
что |
о т в е р га т ь |
ги п о т е зу |
Н 0 об |
о тсу тств и и |
п р о м а х а |
н ет |
о с н о в ан и й . |
В ы во д |
б у д ет |
и н ы м , |
е сл и |
д о п о л н и т е л ь н о |
и зв е с тн о , |
что |
сг = |
|
120 |
Н , |
т а к |
к а к |
в |
этом |
с л у ч а е |
|
|
|
|
|
|
|
(от, а) = |
7500 — 7900 | |
= 3 ,3 3 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
120 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Критерии, приведенные в табл. 34, составлены для нормального распределения. Другим типам распределения соответствуют свои критерии. Так, например, если х ъ . . ., хп — вариационный*ряд взаимно независимых случайных изменений, подчиняющихся экспо ненциальному распределению с параметром К = 1 1т, то для оценки
принадлежности хп к данной совокупности может быть использован критерий Р. Фишера
i=i
Проверка этой гипотезы состоит в вычислении критерия цп и сравнении его с критическим значением этой статистики
8а ( п ) = 1 —
где а — уровень значимости критерия. Если r\n ^>ga (п), то гипо тезу о принадлежности шах х( к данной совокупности наблюдений следует отвергнуть. Для распределений других типов подобные оценки либо не разработаны, либо таблицы соответствующих кри териев приводятся в малодоступных изданиях.
Если кривая плотности исследуемого распределения не суще ственно отличается от колоколообразной формы в первом приближе нии, допустимо пользоваться критериями для нормального распре деления. Если распределение исходной совокупности близко к экс поненциальному, оценка промаха при наблюдении максимального члена выборки может производиться по критерию цп. Если же эти рекомендации по тем или иным причинам не могут быть приняты, для получения точных результатов можно воспользоваться мате риалами, например, следующих работ: [136, 129, 46].
Г Л А В А XIII
ОЦЕНКА СЛУЧАЙНЫХ ПОГРЕШНОСТЕЙ ПРЯМЫХ ИЗМЕРЕНИЙ
1. Точечные оценки средней и рассеивания
При отсутствии систематических погрешностей результаты изме рений группируются около действительного значения измеряемой величины А. По мере неограниченного возрастания числа измере ний центр группирования приближается к А сколь угодно близко. Центром группирования случайной величины X является началь ный момент первого порядка, называемый математическим ожида нием т. Обычно действительная величина т неизвестна и в качестве ее оценки используется среднее арифметическое значение
X = ± £ x t, |
(XIII.1) |
п i=i |
|
где п — объем выборки; xt — одна из реализаций случайной вели чины X.
Если п велико, то суммирование всех значений х может оказаться весьма трудоемким. Для значительного сокращения вычислений наблюдения группируются по интервалам, и все значения в каждом интервале приравниваются среднему значению интервала. Такой прием хотя и дает лишь приближенный результат, но для практи ческих целей он, как правило, бывает удовлетворительным, если только групповые интервалы взяты не слишком большими. Причем методическая погрешность имеет тем меньшее значение, чем менее точно производится измерение каждого х£. При интервальном груп пировании X средняя арифметическая величина
(XIII.2)
Здесь г — число интервалов; пк — число х;, попавших в к-й интер
вал; хк — среднее значение к-го интервала. Величина х зависит от конкретной реализации (хх, . . ., хп) и, следовательно, является
случайной величиной. При использовании х вместо т случайную
переменную х называют точечной оценкой для т. Характеристикой рассеивания случайной величины X около ее
математического ожидания является центральный момент второго порядка, называемый дисперсией D [х] или а 2. Квадратный корень из дисперсии называется среднеквадратическим, квадратическим или квадратичным отклонением, которое выражается в тех же единицах, что и исходная случайная величина. Если тип распределения и его параметры неизвестны, то несмещенная оценка дисперсии, вычис ляемая по ряду наблюдений х ±, . . ., х„,
П
которая, как и х, является точечной. Вместо этого выражения не редко используется более удобная для вычисления форма
Необходимо иметь в виду, что последние две формулы могут при водить к заметным ошибкам округления.
Если первичные статистические данные сгруппированы по интер валам, то можно использовать тот же прием приближенного вы
числения, который применяется при расчетах средней величины х. Группируя статистические данные по интервалам надо помнить, что приравнивание всех значений X интервала его середине является приближением. Показано, что если распределение X непрерывно, a f (х) стремится к нулю в обоих направлениях, то в оценку диспер сии, полученную на основе сгруппированных данных, целесообразно
ввести поправку путем вычитания |
1 / 1 2 |
квадрата |
группового интер |
вала (поправку Шеппарда) [156]. |
Если |
интервал |
составляет h еди |
ниц, a sf есть оценка дисперсии, полученная непосредственно из сгруппированных данных, то скорректированная величина оценки дисперсии равна
Если общая численность наблюдений невелика, то поправка Шеп парда имеет второстепенное значение по сравнению со случайными колебаниями выборки.
До сих пор предполагалось, что результаты измерений равно точные, т. е. являются простой случайной выборкой из одной и той же генеральной совокупности. В то же время нередко измерения вы полняются в различных условиях или приборами, обладающими разной точностью. Если они независимы и свободны от системати ческих ошибок, то их математические ожидания равны, но диспер сии различны. Это обстоятельство и является характерной чертой неравноточных измерений. За оценку действительного значения измеряемой величины в этом случае принимают
П
х = Е §ix i-
1—1
«Веса» gi выбираются так, чтобы предпочтение было отдано ре зультатам, имеющим большую точность
|
|
i=i |
|
|
Дисперсия оценки х |
находится из выражения |
|
|
|
D[x] = 4 - 1— |
• |
(XIII.4) |
В частном случае при равенстве сгг = |
а |
|
|
|
D[x] = - |
|
|
2. |
Интервальные оценки средней и рассеивания |
|
Основная |
трудность |
при нахождении доверительных |
интерва |
лов состоит в том, что закон распределения оцениваемого параметра, зависящий от типа распределения случайной величины X, чаще всего во время проведения эксперимента бывает неизвестен. Если распре деление случайной величины X относится к нормальному типу, то для построения доверительных интервалов т и о используются/точ ные формулы, приведенные в табл. 35. Аргумент / 2, входящий в~выражения для та и т&, является табулированным значением аргу-
|
|
|
|
|
|
Т а б л и ц а 35 |
Формулы для оценки границ доверительных интервалов |
Приближенный метод. |
Точный метод. |
Тип распределения X неизвестен |
Распределение X нормального типа |
тн ^ |
UoS |
тн - х |
|
|
|
t 9S |
х -------- Ь - |
|
|
|
2 |
|
V п |
|
|
|
|
V П |
тв ^ |
х + — |
тв - х |
- |
+ |
, |
Us |
|
|
2 |
|
V п |
|
|
|
|
V п |
он я » ]/ s2 — u2]/ra2 (s2) |
Он — 2is |
ав ^ У |
s2 + и2 ]/о 2 (s2) |
Ов = |
|
Z2S |
mH— нижняя доверительная граница математического ожидания; |
шв — верхняя доверительная |
граница мат. ожидания; |
|
|
ан — нижняя доверительная |
граница квадратичного отклонения; |
0В— верхняя доверительная граница квадратичного отклонения.
мента распределения Стьюдента и находится по таблицам, например
[16], имеющим два входа: v = п — 1 и Q = 0,5 (1 — р 2) 100%.
Аргументы Zi и z 2, входящие в выражения для он и сгв, табули рованы для значений v = l-r-100. При v >>100 значения zx и г 2 вычисляются по формулам:
|
V x ( Q , v ) ; |
Z2 ~ V x ( l — Q ,v )’ |
|
где |
|
|
|
|
|
|
x(Q, |
n) = n + Y |
( l - 1| ) v |
r2^' + /-(Q, о); |
o = |
y = - . |
Функции1?' |
^ 1 -----Шо~) |
и r (Q. |
и) |
табулированы |
(см. |
[16]). Коэф |
фициент доверия р 2 связан с уровнем значимости а, являющимся одним из входов в таблицу, следующим соотношением: р 2 = 1 — 2 а. Если выборки не слишком малы, при любом типе распределения X можно использовать приближенный метод построения доверитель ного интервала, основанный на нормальной аппроксимации распре
деления величины х.
Границы доверительных интервалов тн и тв в этом случае опре деляются как симметричное отклонение величины u2s!V п около х.
Значение |
и 2 — это |
обратная |
нормированная |
функция |
Лапласа |
[и2 = Фо1(0,5ра)], |
которая табулирована. В |
некоторых |
таблицах |
в качестве |
входного |
аргумента |
используется не вероятность 0,5р2, |
а р = 0,5 {р2 + 1) |
[16]. Формулы для вычисления границ довери |
тельного интервала математического ожидания в этом случае при ведены в табл. 35. Эти же формулы можно использовать для опреде-
|
|
|
|
|
|
|
|
лени я односторонней |
нижней |
или верхней доверительной |
границы, |
если аргумент |
« 2 заменить |
аргументом и х = |
Фо1 {рх — 0,5). |
При |
использовании |
таблиц |
[16] |
входной аргумент |
Р = р ъ т. |
е. |
равен |
заданному коэффициенту |
доверия. |
|
|
|
Приближенные формулы для определения доверительных гра ниц для а также приведены в табл. 35. Входящая в эту формулу
величина а2 (s2) |
выражается следующим |
образом: |
|
|
|
|
П |
1 |
< 1 |
|
|
|
S { X i — х )4 |
1 со |
е |
СМ 4к1 1 |
м |
|
|
|
1 = 1 |
1 |
|
1 |
(XIII.5) |
О2(S2) |
|
п (п |
1 |
|
— I)3 |
|
Сравнение точных и приближенных формул для определения |
та |
и тв показывает, |
что они отличаются лишь множителем при s /|/ |
п, |
т. е. 12 и и 2. При одном и том же коэффициенте доверия р 2 и при ма лом п t 2 всегда больше чем и 2. Поэтому и доверительный интервал, построенный точным способом, оказывается не уже, а шире прибли женного интервала. Разница между t 2 и и 2 уменьшается по мере увеличения числа наблюдений и снижения коэффициента доверия. Приближенный метод дает надежные результаты уже при п 5> 30 и р2 = 0,90-г-0,95. В то же время применять его при п <С 10 вряд ли целесообразно. Заметим, что приближенные формулы для опреде ления ан и аБ дают надежные результаты лишь при п > 100. При менять их при я < 20 не рекомендуется [114, 139].
При определении доверительных интервалов выбор величины доверительной вероятности в значительной степени зависит от той цели, которая ставится. Желание лучше застраховаться от возмож ной ошибки приводит обычно к выбору весьма больших доверитель ных вероятностей (порядка 0,99 и более). Однако следует иметь в виду, что всякая перестраховка в статистических исследованиях имеет и свои отрицательные стороны, так как чем больше доверительная вероятность, тем шире границы для неизвестного параметра. Опыт показывает, что выбор доверительных вероятностей, равных 0,95 и
даже 0,90, вполне |
достаточен для практических целей. |
3. |
Оценки закона распределения |
Решение задачи исследования случайной величины не может считаться законченным без оценки закона или типа ее распределения. Знание типа распределения позволяет обоснованно пользоваться оценками и методами, разработанными для конкретных типов рас пределения, что приводит к более точным и достоверным выводам. Сведения о типе распределения несут большую информацию о фи зическом смысле рассматриваемого явления или процесса. В неко торых случаях только они могут стать достаточными для принятия практически важных решений.
Знание типа распределения случайных погрешностей позволяет понять характер спектра факторов, влияющих в процессе измерения на показание прибора. Так, распределение нормального типа сви-