
- •«Непараметрические критерии однородности статистических данных»
- •Список обозначений
- •Введение
- •1. Непараметрические (свободные от распределения) критерии однородности статистических данных
- •1.1. Непараметрические критерии сдвига
- •1.1.1. Сравнение параметров сдвига двух совокупностей
- •1.1.1.1 Быстрый (грубый) критерий Кенуя
- •1.1.1.2. Быстрый (грубый) ранговый критерий
- •1.1.1.3. Критерий Манна-Уитни-Вилкоксона
- •1.1.1.4. Критерий Фишера-Йэйтса-Терри-Гёфдинга
- •1.1.1.5. Критерий Ван дер Вардена
- •1.1.1.6. Медианный критерий
- •1.1.2.2. Критерий Неменьи
- •1.1.2.3. Критерий Вилкоксона—Вилкокс
- •1.2 Непараметрические критерии масштаба
- •1.2.1 Сравнение параметров масштаба двух совокупностей
- •1.2.1.1. Критерий Ансари—Бредли
- •1.2.1.2. Критерий Муда
- •1.2.1.3. Критерий Сижела-Тьюки
- •1.2.1.4. Критерий Кейпена
- •1.2.1.5. Квартальный критерий
- •2. Реализация непараметрических критериев в статистическом пакете r
- •2.1. Реализация критерия Манна-Уитни-Вилкоксона
- •2.2. Реализация критерия Крускала-Уоллиса
- •2.3. Реализация критерия Ансари-Бредли
- •2.4. Реализация критерия Муда
- •3. Исследования
- •3.1. Исследование распределения статистик рассматриваемых гипотез при "малых" и "больших" выборках
- •3.2. Исследование распределения статистик по критериям согласия Колмогорова и Смирнова
- •3. 3. Исследование асимптотических свойств рассматриваемых критериев
- •3.4. Эмпирическая мощность критериев
- •3.5. Реальные данные
- •Заключение
2.2. Реализация критерия Крускала-Уоллиса
Этот
критерий определяет наличие сдвига в
параметрах положения нескольких
совокупностей, поэтому для его реализации
сформируем пять выборок по нормальному
закону распределения с параметрами
и
.
Объемы выборок равны 8, 10, 12, 14, 16
соответственно. Упорядочим по возрастанию
объединенную выборку. Воспользуемся
формулами (1.16) и (1.17) и найдем статистику
Крускала-Уоллиса H
для проверки гипотезы о наличии сдвига
в параметрах положения рассматриваемых
совокупностей.
Поскольку
совокупностей пять, используем
аппроксимацию Крускала-Уоллиса. Вычислим
статистику
,
воспользовавшись формулами (1.18), (1.19) и
(1.20). Гипотеза сдвига принимается, если
выполняется условие (1.21).
Более точная аппроксимация Имана-Давенпорта представлена в формулах (1.22) и (1.23). В соответствии с ней, гипотеза сдвига отклоняется с заданной достоверностью α, если выполняется условие (1.22). Статистика рассчитывается по формуле (1.23).
Используя данные выборки в критерии Крускала-Уоллиса получаем, что по аппроксимации Крускала-Уоллиса и по аппроксимации Имана-Давенпорта гипотеза сдвига отклоняется.
Когда
совпадают значения величин из разных
выборок и им присваиваются одинаковые
средние ранги, необходимо использовать
модифицированную статистику
,
которая вычисляется по формуле (1.24) с
использованием (1.25).
2.3. Реализация критерия Ансари-Бредли
Сформируем
две выборки по нормальному закону
распределения в статистическом пакете
R
с параметрами
и
.
Объемы выборок равны 8 и 10 соответственно.
Упорядочим по возрастанию объединенную
выборку. По формуле (1.26) посчитаем
статистику критерия Ансари-Бредли для
проверки гипотезы о наличии сдвига в
параметрах масштаба. По таблице
критических значений статистики
Ансари-Бредли находим
и
при заданных объемах выборок
и
уровне достоверности
.
При выполнении условия (1.27) гипотеза
равенства параметров масштаба принимается.
Используя полученные выборки, по критерию
Ансари-Бредли получаем, что гипотеза
равенства параметров масштаба принимается.
Увеличим
объем выборок
и
.
При
воспользуемся аппроксимацией и вычислим
значение статистики
,
используя формулы (1.28), (1.29) и (1.30). Если
условие (1.31) выполняется, то нулевая
гипотеза равенства параметров масштаба
в двух выборках принимается с заданной
достоверностью α. В этом случае, гипотеза
равенства параметров масштаба принимается.
2.4. Реализация критерия Муда
В
статистическом пакете R
сформируем две выборки по стандартному
нормальному закону распределения с
объемами выборок
и
.
Упорядочим по возрастанию объединенную
выборку. По формуле (1.32) вычислим
статистику критерия. Найдем по таблице
критических значений статистики Муда
при заданных объемах выборок
и уровне достоверности
и
Нулевая гипотеза равенства параметров
масштаба в выборках принимается, если
выполняется условие (1.33).
Увеличим объем выборок. При воспользуемся нормальной аппроксимацией, статистика которой вычисляется по формуле (1.34) с использованием формул (1.35) и (1.36). При выполнении условия (1.37), принимается нулевая гипотеза, которая утверждает, что параметры масштаба двух совокупностей равны.
Для
данных выборок по критерию Муда
принимается гипотеза