Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
79
Добавлен:
11.05.2015
Размер:
1.83 Mб
Скачать

4. Исключение грубых ошибок наблюдений

Для исключения грубых ошибок наблюдений, искажающих статистические характеристики распределения, необходимо провести оценку резко выделяющихся членов выборки. Для этого используются различные методы. Конечно, прежде всего следует быть уверенным, что резко выделяющиеся члены выборки не являются результатом ошибки, нарушения условий эксперимента. Если такой уверенности нет, то грубые ошибки сразу следует исключить из дальнейшего анализа.

Разработанные методы для оценки резко выделяющихся членов выборки применимы, если известно распределение, которому подчиняются наблюдаемые случайные величины. Их применение при других распределениях может привести к серьезным ошибкам [3]. Это часто не указывается в литературе, где приводятся такие методы. Большинство методов разработано для случаев, когда исследуемые величины подчиняются нормальному распределению. Эти методы (часто они носят название критериев), как правило, требуют предварительного вычисления среднего значения и среднего квадратического отклонения исследуемой величины. Во всех методах рассчитываемая величина сравнивается с критическим значением этой величины, найденным из соответствующих таблиц при выбранном проценте риска. После чего принимается решение о том, является ли резко выделяющееся значение случайной величины грубой ошибкой и его следует отбросить или оно не подлежит исключению из выборки.

Рассмотрим методы (критерии), которые применяются при нормальном распределении исследуемой случайной величины. В литературе приводятся следующие методы (критерии): критерий, основанный на теореме Р.Фишера[4], критерий типа r [4], упрощенные критерии [4], метод Грэббса [5], метод Романовского [5], метод исключения при известной [6], оценка анормальности результатов измерений при известной генеральной дисперсии [3], метод исключения при неизвестной[6], оценка анормальности результатов измерений при неизвестной генеральной дисперсии [3]. Следует отметить, что в [5] и [6] не указано, что перечисленные методы применимы только при нормальном распределении.

Критерий, основанный на теореме Фишера [4], приведен в одной из работ В.Н.Романовского. В нем рассматривается неравенство

,

где n - число членов выборки;

- резко выделяющийся член выборки;

- среднее значение исследуемой величины, подсчитанное при исключенном резко выделяющемся члене выборки;

Если преобразовать неравенство к виду

то оно напоминает метод Романовского [5], при котором оценивается

где - среднее квадратическое отклонение, подсчитанное при исключенном резко выделяющемся члене выборки.

В рассмотренных двух методах не приходится пересчитывать среднее значение и среднее квадратическое отклонениеисследуемой случайной величины после исключения резко выделяющегося члена выборки. Но если его исключить не удается, то следует при дальнейшей обработке пересчитатьис учетом значения.

Во всех остальных методах (кроме упрощенных критериев) приходится после исключения грубой ошибки снова определять значения и.

Критерий типа r [4] определяет величину

,

где и.

Если преобразовать знаменатель этого критерия, то мы получим

,

где .

Полученное выражение совпадает с методом Грэббса [5]

.

В методе исключения грубой ошибки при известной  [6] определяется величина

,

а в методе оценки анормальности результатов измерений при известной генеральной дисперсии [3] определяется величина

.

В методе исключения грубых ошибок при неизвестной [6] определяется величина

,

то есть та же, что и в методе оценки анормальности результатов измерений при неизвестной генеральной дисперсии [3].

Таким образом, последний метод отличается от критерия типа r и метода Грэббса только способом определения среднего квадратического отклонения (несмещенная оценка).

Метод упрощенных критериев [4] предполагает определение отношения отклонения экстремального члена выборки к ее размаху. Определяются величины

и ,

поскольку экстремальные члены могут лежать слева и (или) справа от основной части выборки. Как указано выше, в этом методе не приходится определять и, что значительно уменьшает объем вычислительной работы.

Для случая оценки резко выделяющегося члена выборки при справедливости показательного распределения используется критерий Р. Фишера [4].

Таблицы для сравнения полученных критериев с их критическими значениями приведены в указанной в тексте литературе. А для метода Грэббса можно использовать [8].

Существует также критерий Ирвина [4,5], о котором не указывается, что он применим при определенном распределении. Метод или критерий Ирвина основан на оценке разности двух наибольших или наименьших членов выборки. Определяется величина , равная

или ,

в зависимости от того, с какой стороны выборки расположен резко выделяющийся член выборки. По приведенной таблице (или таблице [7]) в зависимости от объема выборки n при уровне значимости =0,95 находят критическое значение .

n

20

30

50

100

400

1000

0,95

1,3

1,2

1,1

1,0

0,9

0,8

Если оказывается, что рассчитанная ,то оцениваемый результат является случайным и не подлежит исключению из выборки. Если ,то следует исключить из выборки оцениваемое резко выделяющееся наименьшее или наибольшее значение случайной величины (или оба вместе), так как оно представляет собой грубую ошибку. После исключения ошибки необходимо снова вычислить значения и .

Соседние файлы в папке ТОПИН.Лекции, задания