- •Статистические расчёты при планированиИ и обработкЕ результатов испытаний
- •А.Е.Коптелов, канд. Техн. Наук, главный специалист-метролог Института экологических проблем Севера УрО ран
- • Северный (Арктический)
- •Введение
- •Основные обозначения
- •Оценка результатов испытаний Лабораторная работа № 1 Точечные и интервальные оценки
- •Лабораторная работа № 2 Определение объёма испытаний
- •Лабораторная работа № 3 Проверка приемлемости результатов испытаний
- •Исключение грубых ошибок Лабораторная работа № 4 Критерий н.В. Смирнова
- •Лабораторная работа № 5 Критерий Диксона
- •Лабораторная работа № 6 Критерий Ирвина
- •Лабораторная работа № 7 Критерий Шовене
- •Лабораторная работа № 8 Критерий Романовского
- •Лабораторная работа № 10 Критерий омега-квадрат
- •Лабораторная работа № 11 Критерий Колмолгорова
- •Лабораторная работа № 12 Проверка гипотезы нормальности по совокупности выборок
- •Лабораторная работа № 13 Оценка вида распределения графическим способом
- •Лабораторная работа № 14 Оценка вида распределения по асимметрии и эксцессу
- •Испытания на надёжность Лабораторная работа № 15 Определение показателей безотказности по опытным данным
- •Лабораторная работа № 16 Распределение Вейбулла при расчёте показателей надёжности
- •Лабораторная работа № 17 Распределения Рэлея и экспоненциальное распределение при расчёте показателей надёжности
- •Лабораторная работа № 18 Планирование испытаний методом однократной выборки
- •Лабораторная работа № 19 Последовательный план испытаний
- •Список литературы
- •Оглавление
Исключение грубых ошибок Лабораторная работа № 4 Критерий н.В. Смирнова
Результаты испытаний выборки могут содержать одно или несколько значений, заметно отличающихся от остальных (выбросов). После анализа причин появления выбросов, если есть основания полагать, что они случайны, оценивают при помощи того или иного критерия, являются ли эти значения грубыми ошибками (промахами). Если такая оценка показывает, что это грубые ошибки, их исключают из результатов испытаний. Надо иметь в виду, что неправомерное отбрасывание выбросов может привести к неверным выводам. Несмотря на использование критериев, оценка выбросов довольно субъективна, поэтому целесообразно проводить такую оценку по нескольким критериям, и только после анализа причин выбросов.
Существует много различных критериев, каждый из которых применим в тех или иных случаях. Иногда полезно использовать оценку по нескольким критериям. Следует отметить, что в литературе иногда встречаются различные наименования для одних и тех же критериев и различные критерии с одними и теми же названиями. Кроме того, встречаются несколько различающиеся табличные значения одного и того же критерия.
Для нормально распределенной случайной величины часто используют критерий Н.В.Смирнова (на подобном алгоритме основан также критерий Граббса).
При известной генеральной дисперсии σ2 (например, когда генеральная дисперсия достаточно точно известна по текущим измерениям) используют статистику критерия t. Для этого строят вариационный ряд результатов испытаний (т.е. располагают их по возрастанию) и, если одно из крайних значений ряда сомнительно, вычисляют критерий для сомнительного значения хс по формуле
(4.1)
Расчётное значение сравнивают с табличным t, приведённым в табл. 4.1. При tрасч > tα результат xс считают грубой ошибкой и отбрасывают.
Пример 4.1. Проведены испытания выборки из партии бумаги на определение разрывной длины. При этом получены результаты, м: 3720, 3980, 3820, 3700, 3870, 3810, 3730, 3840, 3870, 3810. Генеральная дисперсия разрывной длины рассчитана ранее по результатам предыдущих испытаний, представленным в табл. 1.3. Оценить, при доверительной вероятности 0,9, имеется ли в полученных результатах грубая ошибка.
Возможный вариант выполнения примера 4.1 показан на рис.4.1.
Вводим в лист EXCEL результаты испытаний и доверительную вероятность, рассчитываем уровень значимости и объём испытаний (функция СЧЁТ). Затем копируем значение дисперсии, рассчитанное
Таблица 4.1.
n |
t |
||
=0.1 |
=0.05 |
=0.01 |
|
3 |
1,50 |
1.74 |
2,22 |
4 |
1.70 |
1,94 |
2.43 |
5 |
1,84 |
2,08 |
2,57 |
6 |
1,94 |
2,18 |
2,68 |
7 |
2,02 |
2,27 |
2,76 |
8 |
2,09 |
2,33 |
2,83 |
9 |
2,15 |
2,39 |
2,88 |
10 |
2,20 |
2,44 |
2,93 |
11 |
2,24 |
2,48 |
2,97 |
12 |
2,28 |
2,52 |
3,01 |
13 |
2,32 |
2,56 |
3,04 |
14 |
2,35 |
2,59 |
3,07 |
15 |
2,38 |
2,62 |
3,10 |
16 |
2,41 |
2,64 |
3,12 |
17 |
2,43 |
2,67 |
3,15 |
18 |
2,46 |
2,69 |
3,17 |
19 |
2,48 |
2,71 |
3,19 |
20 |
2,50 |
2,73 |
3,21 |
21 |
2,52 |
2,75 |
3,22 |
22 |
2,54 |
2,77 |
3,24 |
23 |
2,56 |
2,78 |
3,26 |
24 |
2,57 |
2,80 |
3,27 |
25 |
2,59 |
2,82 |
3,28 |
30 |
2,70 |
2,93 |
3,40 |
40 |
2,79 |
3,02 |
3,48 |
50 |
2,86 |
3,08 |
3,54 |
100 |
3,08 |
3,29 |
3,72 |
250 |
3,34 |
3,53 |
3,95 |
500 |
3,53 |
3,70 |
4,11 |
в задании 3
лабораторной работы 1. Для этого используем
команды Копировать
и Специальная
вставка.
В диалоговом окне последней команды
отмечаем указатель Значения,
чтобы копировалась не формула, по которой
рассчитывали дисперсию, а значение
дисперсии. Результаты располагаем в
вариационный ряд (по возрастанию),
например, кнопкой
на панели инструментов с указанием в
диалоговом окне Сортировать
в пределах указанного выделения.
В вариационном ряду выглядит сомнительно
последнее значение ряда 3980. Однако,
чтобы электронную таблицу можно было
использовать при вводе других данных,
проверим на выброс также и нижнее
значение ряда.
Рис.4.1. Вариант расчёта для примера 4.1.
Рассчитываем среднее значение ряда, при этом, чтобы таблица была пересчитываемой, в формулу СРЗНАЧ вводим диапазон примерно на 1000 значений. Далее находим tрасч для максимального и минимального значений вариационного ряда по формуле (4.1). При этом используем в расчётных формулах соответственно функции МАКС и МИН, чтобы электронная таблица была пересчитываемой. Пример формулы виден на рис. 4.1.
Для нахождения t вводим в электронную таблицу табличные значения t в пределах n от 3 до 25. Для более высоких значений n значения t можно c приемлемой точностью рассчитать по уравнениям, указанным в табл. 4.2.
Эти уравнения вводим в соответствующие ячейки таблицы значений критерия для строки >25, с указанием в них ссылки на значение n.
Таблица 4.2.
α |
t при n > 25 |
0,1 |
0,3053∙Ln(n) + 1,6513 |
0,05 |
0,2849∙Ln(n) + 1,9517 |
0,01 |
0,2648∙Ln(n) + 2,4839 |
Затем находим табличное значение t. Для этого удобно сначала найти номер строки и столбца таблицы критерия, на пересечении которых находится нужное значение.
Для нахождения номера столбца используем функцию ЕСЛИ. В её диалоговом окне вводим логическое условие α = 0,1 (разумеется, вместо символа α надо сделать ссылку на соответствующую ячейку), а в строке Значение_если_истина вводим соответствующий номер столбца, в данном случае 1. Затем устанавливаем курсор в конец формулы в строке формул, снова вводим функцию ЕСЛИ (нажав треугольник в правом верхнем углу окна программы и выбрав Другие функции…), вводим в строки диалогового окна α = 0,05 и соответствующий номер столбца. Таким же образом вводим α = 0,01 и соответствующий ему номер столбца.
Для нахождения номера строки также в формуле дважды используем функцию ЕСЛИ. Для первой функции ЕСЛИ используем логическое условие n <= 25 и ссылку на значение n. Для второй функции ЕСЛИ используем логическое условие n > 25 и значение 26, т.е. когда n > 25, значение t будет находиться в строке 26 таблицы критерия по одной из формул табл. 4.2. В конце формулы для нахождения строки указываем -2, поскольку первая строка таблицы критерия соответствует n = 3, т.е. номер строки на 2 меньше значения n. В конечном счёте получим формулу для номера строки =ЕСЛИ(E6<=25;E6)+ЕСЛИ(E6>25;26)-2. В этой формуле суммируются два значения, полученных по функциям ЕСЛИ, но по одной из функций заведомо будет получен ноль, т.к. в любом случае одно из логических условий будет неверно. Таким образом, получаем номер строки либо по первой, либо по второй функции ЕСЛИ.
По найденным номерам столбца и строки находим t с использованием функции ИНДЕКС. На первом шаге выбираем Массив;номер_строки;номер_столбца. На втором шаге в диалоговом окне функции ИНДЕКС в качестве массива указываем диапазон значений t, а также ссылки на строку и столбец.
Далее определяем, являются ли крайние значения вариационного ряда грубыми ошибками, используя функцию ЕСЛИ. Например, для максимального значения в диалоговое окно вводим логическое условие tрасч > tα, для истинности этого условия вводим строку «Гр. Ошибка», для ложности этого условия вводим строку «Не ошибка». Для ячеек, где выводятся эти сообщения, можно задать для наглядности цветной шрифт, например, красный.
В результате реализации электронной таблицы выводятся сообщения, являются ли крайние значения вариационного ряда грубыми ошибками. Однако при этом отбрасывать грубые ошибки следует по одной. Так, если максимальное значение ряда будет равно 5000 (попробуйте подставить это значение вместо 3980), оба крайних значения определятся как грубые ошибки. Но если по здравом рассуждении отбросить 5000 как грубую ошибку, то минимальное значение ряда 3700 уже не определяется как грубая ошибка.
При нормальном распределении исследуемого параметра и объёме испытаний не более 25 используют статистику критерия Н.В. Смирнова uα (если объём испытаний больше 25, выборочное СКО достаточно близко к генеральному, и можно использовать статистику t).
Строят вариационный ряд результатов испытаний, и, если одно из крайних значений ряда сомнительно, вычисляют критерий для сомнительного значения хс по формуле
Расчётное значение сравнивают с табличным u, приведённым в табл. 4.2.
Таблица 4.2.
n |
u |
||
=0.1 |
=0.05 |
=0.01 |
|
3 |
1,15 |
1,15 |
1,15 |
4 |
1,42 |
1,46 |
1,49 |
5 |
1,60 |
1,67 |
1,75 |
6 |
1,73 |
1,82 |
1,94 |
7 |
1,83 |
1,94 |
2,10 |
8 |
1,91 |
2,03 |
2,22 |
9 |
1,98 |
2,11 |
2,32 |
10 |
2,03 |
2,18 |
2,41 |
11 |
2,09 |
2,23 |
2,48 |
12 |
2,13 |
2,29 |
2,55 |
13 |
2,17 |
2,33 |
2,61 |
14 |
2,21 |
2,37 |
2,66 |
15 |
2,25 |
2,41 |
2,70 |
16 |
2,28 |
2,44 |
2,75 |
17 |
2,31 |
2,48 |
2,78 |
18 |
2,34 |
2,50 |
2,82 |
19 |
2,36 |
2,53 |
2,85 |
20 |
2,38 |
2,56 |
2,88 |
21 |
2,41 |
2,58 |
2,91 |
22 |
2,43 |
2,60 |
2,94 |
23 |
2,45 |
2,62 |
2,96 |
24 |
2,47 |
2,64 |
2,99 |
25 |
2,49 |
2,66 |
3,01 |
При uрасч > uα результат xс считают грубой ошибкой.
Пример 4.2. По результатам испытаний, приведённым в примере 4.1, оценить для различных доверительных вероятностей, имеется ли грубая ошибка, если генеральная дисперсия разрывной длины заранее неизвестна. Провести оценку также в случае, если последнее значение вариационного ряда будет не 3980, а 4010.
Для выполнения примера достаточно скопировать электронную таблицу, созданную в примере 4.1, ввести табличные значения критерия Смирнова u вместо табличных значений t, рассчитать выборочное СКО s вместо генерального σ, (подумайте, какой при этом задать диапазон) и изменить диапазон для расчёта хср (как изменить?). После этого можно провести оценку выбросов.
Задание.
1. Выполнить расчёты в соответствии с примером 4.1. Определить, содержат ли данные грубую ошибку при доверительных вероятностях 0,95 и 0,99.
2. Скопировать электронную таблицу примера 4.1 на другой лист и оценить, имеется ли грубая ошибка при доверительных вероятностях 0,9, 0,95 и 0,99 в ряду значений некоторого нормально распределённого параметра, полученного по результатам испытаний: 431 442 288 290 295 310 319 587 335 335 343 455 351 355 367 379 379 383 404 426 447 367 375 467 486 387 391 391 407 420. При этом генеральная дисперсия заранее неизвестна. Учитывая, что объём испытаний больше 25, модифицировать электронную таблицу так, чтобы генеральное среднеквадратическое отклонение определялось по данным испытаний, с учётом возможности пересчёта таблицы при вводе других исходных данных.
3. Выполнить расчёты в соответствии с примером 4.2.
