
- •1. Распределения, связанные с суммой случайных величин
- •1.1 Распределение Стьюдента
- •1.2 Распределение Фишера
- •2. Проверка гипотез
- •3. Отсев грубых измерений
- •3.1 Общие положения
- •3.2 Отсев грубых измерений по малым выборкам
- •3.3 Исключение грубых погрешностей
- •4. Свободные от распределения методы
- •4.1 Критерий об однородности двух выборок
- •4.2 Проверка гипотезы о некоррелированности
- •5. Регрессионный анализ
- •5.1 Модель регрессии
- •5.2 Анализ ошибок
- •5.3 Дисперсия оценок параметров регрессии
- •5.4 Коэффициент корреляции
- •5.5 Доверительный интервал
- •5.6 Проверка значимости коэффициента корреляции
- •5.7 Значимость коэффициента детерминации
- •5.8 Значимость оценок параметров регрессии
3. Отсев грубых измерений
3.1 Общие положения
Во время проведения эксперимента может создаться такая ситуация, что условия эксперимента резко изменились и измеренные значения не адекватны процессу, который изучается. В этом случае появляются грубые ошибки, от которых необходимо избавиться. Ниже рассматривается задача отсева грубых ошибок на основе проверки статистических гипотез.
Положим, производится
выборка
из генеральной совокупности, элементы
которой распределены по нормальному
закону с математическим ожиданием
и дисперсией
.
Среди этих выборочных
значений
,
могут быть такие, которые вызывают
подозрение. Причиной подозрений могут
быть изменение условий эксперимента
или ошибка экспериментатора, или другие
известные факторы, влияющие на значения
экспериментальных данных. В этом случае
нарушается однородность выборки и
полученные выборочные значения
исключаются экспериментатором из
массива данных. Однако возможна ситуация,
когда в массиве данных есть выборочные
значения, нарушающие однородность
выборки и причины нарушения неизвестны.
Чаще всего это наибольшее или наименьшее
значение выборок. Если бы не было никаких
возмущений во время эксперимента,
возможно, все
принадлежали бы одной и той же генеральной
совокупности. Но в результате случайных
явлений могут произойти грубые ошибки,
которые следует исключить из ряда
.
Отсев грубых ошибок производится по
результатам проверки гипотез относительно
измеряемого параметра.
Однородность выборки означает, что все имеют одно и то же математическое ожидание , т.е. с точки зрения экспериментатора, выборка - однородна. Альтернативной гипотезой будет утверждение, что в выборке присутствуют элементы с математическим ожиданием, не равным . Эти элементы могут дать наибольшее или наименьшее отклонение в выборке.
Отсев аномальных значений в выборке производится по разным критериям в зависимости от наличия дополнительной информации.
3.2 Отсев грубых измерений по малым выборкам
Рассмотрим случай, наиболее часто встречающийся на практике, когда неизвестно ни математическое ожидание , ни дисперсия измеряемой величины. Произведём оценку этих величин по выборке .
(3.1)
На основе выборки составляется статистика
(3.2)
где - одно из возможных значений в выборке .
Производится
проверка гипотезы
о том, что математическое ожидание
равно
.
Статистика
имеет
степеней свободы, т.к. в формуле (3.2)
используется две величины (
и
),
являющиеся функцией выборочных значений
.
Случайные величины
имеют плотность вероятности [4, стр. 26],
равную
,
,
(3.3)
и связаны со
случайными величинами
,
распределенными по закону Стьюдента с
степенями свободы
,
,
где
- функция
распределения Стьюдента с
степенями свободы.
В [4], [7] приведены
таблицы
- процентных точек распределения
Стьюдента,
Критическое
значение
при проверки гипотезы
:
определяется как
,
(3.4)
где
- критическое значение распределения
Стьюдента с
степенями свободы.
Пример 3.1. Положим,
произведена выборка объёмом
,
вычислены эмпирические
и
.
Одно из измерений вызывает сомнение и
требуется проверить гипотезу
об однородности выборки.
1. Вычисляется статистика по формуле (3.2).
2. По заданному
уровню значимости
0.05
определим критическое значение
,
используя плотность распределения
(3.3) статистики
.
Решением уравнения
будет
.
3. Вывод: если
,
гипотеза
об однородности выборки отвергается с
уровнем значимости
0.05.
Это же критическое
значение можно получить, используя
распределение Стьюдента. Действительно,
используя плотность распределения
Стьюдента
и решая уравнение
,
определим
,
равное
.
Пересчитаем полученное критическое
значение
в критическое значение
по формуле (3.4) и получим
.
В [4] представлена
таблица процентных точек
распределения Стьюдента для различных
и
,
рассчитанные по формуле
.
Для рассматриваемого примера имеем
.