Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методы и средства исследований.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
2.36 Mб
Скачать

4.3.3Отсев грубых погрешностей

Часто даже тщательно поставленные эксперименты могут давать неоднородные данные, поскольку в процессе эксперимента могут измениться условия проведения опытов. Если экспериментатор по каким-либо причинам не уловил этих изменений, наблюдения, соответствующие разным уровням факторов, будут принадлежать к разным генеральным совокупностям. Данные, соответствующие изменившимся условиям, называют грубыми погрешностями (ошибками) или резко выделяющимися (аномальными) значениями. Грубые погрешности появляются также при неправильной записи показаний приборов.

В литературе приводятся сведения о том, что экспериментальные данные могут содержать ~ 10% аномальных значений. Однако эти 10% могут дать сильное смещение при оценке параметров распределения, особенно для дисперсии, так как ошибки заметно отклоняются от основной группы значений, а на дисперсию особенно сильно влияют крайние члены вариационного ряда (вариационный ряд – результаты наблюдений, расположенные в возрастающей последовательности x1x2x3 ... ≤ xi …≤xn).

В случае отсева грубых погрешностей (ошибок) нулевая гипотеза формулируется следующим образом:

Н0 :"Среди результатов наблюдений (выборочных, опытных данных) нет резко выделяющихся (аномальных) значений ".

Альтернативной гипотезой может быть:

1) либо Н1(1): "Среди результатов наблюдений есть только одна грубая ошибка",

2) либо Н1(2): "Среди результатов наблюдений есть две или более грубых ошибки".

В литературе можно встретить большое количество различных критериев для отсева грубых погрешностей наблюдений. Обычно экспериментаторы имеют дело с выборками небольшого объема (т.е. когда генеральная дисперсия σx2 неизвестна и оценивается по опытным данным через выборочную дисперсию Sx2), причем именно в этом случае аномальные данные имеют большой вес. Наиболее распространенным и теоретически обоснованным в этом случае является критерий Н.В. Смирнова.

Если известно, что есть только одно аномальное значение (альтернативная гипотеза Н1(1) ), то оно будет крайним членом вариационного ряда. Поэтому проверять выборку на наличие одной грубой ошибки естественно при помощи статистики:

,

если сомнение вызывает первый член вариационного ряда, , или

если сомнителен максимальный член вариационного ряда .

При этом, среднее значение параметра вычисляется по формуле:

,

где - число наблюдений.

Среднеквадратическое отклонение вычисляется по формуле:

или

При выбранном уровне значимости α критическая область для критерия Н.В. Смирнова строится следующим образом:

u1 > uα,n или un > uα,n .

где uα,n – это табличные значения (Таблица 6).

В случае если выполняется последнее условие (статистика попадает в критическую область), то нулевая гипотеза отклоняется, т.е. выброс x1 или xn не случаен и не характерен для рассматриваемой совокупности данных, а определяется изменившимися условиями или грубыми ошибками при проведении опытов. В этом случае значение x1 или xn исключают из рассмотрения, а найденные ранее оценки подвергаются корректировке с учетом отброшенного результата.

Пример. Пирометром измеряется температура поверхности нагретого тела. Было проведено шесть измерений температуры T °С, и получены следующие значения: 925, 930, 950, 975, 990, 1080 (n = 6, причем, как видно, все значения приведены в возрастающей последовательности, т.е. в виде вариационного ряда T1=925 ≤ T2=930 ≤ T3 =950... ≤T6=1080). Можно ли значение T6=1080 считать грубой погрешностью, полученной, допустим, в результате неправильной регистрации показаний пирометра?

Таблица 6 - Критические значения критерия Н.В. Смирнова в зависимости от объема выборки n и уровня значимости α

n

a=0.10

a=0,05

a=0,01

3

1.15

1,15

1,15

4

1,42

1,46

1,49

5

1,60

1-67

1.75

6

1,73

1,82

1,94

7

1,83

1,94

2,10

8

1,91

2,03

2,22

9

1,98

2,11

2,32

10

2,03

2,18

2,41

11

2,09

2,23

2,48

12

2,13

2,29

2,55

13

2,17

2,33

2,61

14

2,21

2,37

2,66

15

2,25

2,41

2,70

16

2,28

2,44

2,75

17

2,31

2,48

2,78

18

2,34

2,50

2,82

19

2,36

2,53

2,85

20

2,38

2,53

2,88

21

2,41

2,58

2,91

22

2,43

2,60

2,94

23

2,45

2,62

2,96

24

2,47

2,64

2,99

25

2,49

2,66

3,01

Для ответа на поставленный в этом примере вопрос предварительно вычислим оценки параметров распределения исследуемой случайной величины T (предполагая, что она не противоречит нормальному закону распределения): выборочное среднее арифметическое и выборочное среднее квадратичное отклонение ST:

Теперь воспользуемся предложенным выше алгоритмом проверки стати­стических гипотез.

1. Формулируем нулевую гипотезу Н0: "Среди значений 925; 930: 950; 975; 990: 1080 нет грубых погрешностей".

2. Исходя из условий примера выбираем следующую альтернативную ги­потезу Н1(1): "Значение 1080 является (одной) грубой погрешностью".

3. Сформулированная нулевая гипотеза Н0 может быть проверена по критерию Н.В. Смирнова.

4. Значение статистики критерия Н.В. Смирнова равно:

5. Уровень значимости α примем равным 0,05.

6. По Таблица 6 при α = 0,05 и n = 6 находим u0,05;6 = 1,82, и строим критическую область ω: u6 > u0,05;6, т.е. u6 > 1,82.

7. Принимаем решение: поскольку значение статистики (1,83 > 1,82) попало в критическую область – нулевая гипотеза отвергается, и в качестве рабочей принимается альтернативная гипотеза, т.е. значение 1080 с вероятностью 0,95 (уровень значимости, не превышает 0,05) по критерию Н.В. Смирнова можно считать грубой погрешностью. Интересно отметить, что если бы на этапе 5 мы приняли α = 0,01, по таблицам критерия Н.В. Смирнова u0,01;6 = 1,94 и подсчитанное значение статистики при этом уровне значимости, то оно не попало бы в критическую область (1,83<1,94). Следовательно, при α = 0,01 мы не можем отвергнуть нулевую гипотезу, т.е. по критерию Н.В. Смирнова с вероятностью 0,99 (надежностью, достоверностью) мы не можем сказать, что значение 1080 является грубой погрешностью.