
- •1. Распределения, связанные с суммой случайных величин
- •1.1 Распределение Стьюдента
- •1.2 Распределение Фишера
- •2. Проверка гипотез
- •3. Отсев грубых измерений
- •3.1 Общие положения
- •3.2 Отсев грубых измерений по малым выборкам
- •3.3 Исключение грубых погрешностей
- •4. Свободные от распределения методы
- •4.1 Критерий об однородности двух выборок
- •4.2 Проверка гипотезы о некоррелированности
- •5. Регрессионный анализ
- •5.1 Модель регрессии
- •5.2 Анализ ошибок
- •5.3 Дисперсия оценок параметров регрессии
- •5.4 Коэффициент корреляции
- •5.5 Доверительный интервал
- •5.6 Проверка значимости коэффициента корреляции
- •5.7 Значимость коэффициента детерминации
- •5.8 Значимость оценок параметров регрессии
4. Свободные от распределения методы
для непараметрических задач
Как известно, оценка параметров по методу максимума правдоподобия, проверка гипотез по критерию отношения правдоподобия и ряд других задач предполагает, что распределение выборочных значений априорно известно. Но на практике встречаются задачи, когда неизвестно распределение . Поэтому приходится решать эти задачи методами свободными от распределения вероятности выборочных значений .
Критерий проверки
непараметрических гипотез основан на
принципе равной вероятности всех
возможных выборок объема
,
количество которых равно
.
Выборки образованы перестановками
(инверсией) членов выборки
,
и для каждой перестановки вероятность
её реализации равна
.
Если верна проверяемая гипотеза
,
то ей соответствует некоторое множество
перестановок. При построении критерия
проверки гипотезы необходимо найти
критическое множество, определить
мощность критерия, значимость его и
состоятельность.
4.1 Критерий об однородности двух выборок
Рассмотрим следующую проблему. Производятся измерения одной и той же физической величины разными приборами, имеющими разные погрешности измерений. Необходимо проверить гипотезу о том, что эти измерения имеют одну и ту же функцию распределения . Применим критерий Вилкоксона для решения этой непараметрической задачи.
Положим, имеются
две последовательности измерений
(выборки)
и
,
выполненные разными приборами. Проверяется
гипотеза
о том, что
,
(4.1)
.
(4.2)
Гипотезе соответствует одно из соотношений
или
.
Соотношения (4.1) и (4.2) эквивалентны утверждению: проверяется гипотеза о том, что выборки и принадлежат одной и той же генеральной совокупности.
Вилкоксоном была
решена эта задача для
,
Манном и Уитни эта же задача была решена
для
,
[16]. Поэтому в литературе можно встретить
эту задачу под именем критерий Вилкоксона
[4] или критерий Манна-Уитни, [16].
Составим из величин
и
вариационный ряд, т.е. расположим их в
порядке возрастания их значений, положим
.
Полученный ряд в математической
статистике называется порядковой
статистикой. Например, получен следующий
ряд
x |
y |
x |
y |
x |
x |
y |
y |
x |
y |
|
y |
x |
x |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
N-2 |
N-1 |
N |
где
.
Представленная таблица является примером реализации одной из перестановок последовательностей и .
Нижний ряд чисел
указывает взаимное расположение
и
,
т.е. ранги величин
и
в вариационном ряде. В частности, для
приведенного примера ранги последовательности
имеют следующие значения
Пусть
- ранги, соответствующие последовательности
.
Статистика критерия Вилкоксона задается
формулой
(4.3)
Распределение
статистики
зависит от вида перестановки в [4, Таблица
6.8] приведены таблицы нижних критических
значений
статистики
,
соответствующие уровню значимости
для
.
Если объем выборки
или
больше 25, статистика
распределена асимптотически нормально
с математическим ожиданием и дисперсией
соответственно
,
.
(4.4)
Более точная формула распределения статистики имеет вид
,
(4.5)
где
,
.
Статистика
принимает только целочисленные значения.
Поэтому следует выбирать такое
целочисленное граничное значение
,
которое удовлетворяло бы системе
неравенств
,
.
(4.6)
При проверке
двусторонней гипотезы
необходимо найти нижнее критическое
значение
и верхнее критическое значение
.
Верхнее и нижнее критические значения
связаны между собой соотношением
.
(4.7)
Пример 4.1. Положим,
произведены две выборки
и
,
n
= m
= 10, значения которых приведены в таблице
4.1.
Таблица 4.1
-
x
y
ранг
В третьем столбце
указаны ранги элементов
по отношению к элементам выборки y.
Значение статистики
.
По таблицам [4,
Таблица 6.8, стр. 357] определим критическое
значение
для уровня значимости
=0,025:
=78.
Верхнее критическое значение определяется
по формуле (4.7) и равно
=210-78=132.
Вывод. Обе выборки
принадлежат одной и той же генеральной
совокупности, так как статистика
не принадлежит ни одной критической
области (0, 78), (132,
)
С целью определения
уровня значимости для критерия Вилкоксона
было проведено моделирование процедуры
проверки гипотезы
о том, что две выборки принадлежат одной
и той же генеральной совокупности. Число
серий экспериментов принято
.
В результате было принято правильных
решений 9538 раз, уровень значимости
составляет
=0.0462.
Программа - 2 моделирования процедуры
проверки гипотезы о принадлежности
двух выборок одной и той же генеральной
совокупности приведена в Приложении .