
- •«Непараметрические критерии однородности статистических данных»
- •Список обозначений
- •Введение
- •1. Непараметрические (свободные от распределения) критерии однородности статистических данных
- •1.1. Непараметрические критерии сдвига
- •1.1.1. Сравнение параметров сдвига двух совокупностей
- •1.1.1.1 Быстрый (грубый) критерий Кенуя
- •1.1.1.2. Быстрый (грубый) ранговый критерий
- •1.1.1.3. Критерий Манна-Уитни-Вилкоксона
- •1.1.1.4. Критерий Фишера-Йэйтса-Терри-Гёфдинга
- •1.1.1.5. Критерий Ван дер Вардена
- •1.1.1.6. Медианный критерий
- •1.1.2.2. Критерий Неменьи
- •1.1.2.3. Критерий Вилкоксона—Вилкокс
- •1.2 Непараметрические критерии масштаба
- •1.2.1 Сравнение параметров масштаба двух совокупностей
- •1.2.1.1. Критерий Ансари—Бредли
- •1.2.1.2. Критерий Муда
- •1.2.1.3. Критерий Сижела-Тьюки
- •1.2.1.4. Критерий Кейпена
- •1.2.1.5. Квартальный критерий
- •2. Реализация непараметрических критериев в статистическом пакете r
- •2.1. Реализация критерия Манна-Уитни-Вилкоксона
- •2.2. Реализация критерия Крускала-Уоллиса
- •2.3. Реализация критерия Ансари-Бредли
- •2.4. Реализация критерия Муда
- •3. Исследования
- •3.1. Исследование распределения статистик рассматриваемых гипотез при "малых" и "больших" выборках
- •3.2. Исследование распределения статистик по критериям согласия Колмогорова и Смирнова
- •3. 3. Исследование асимптотических свойств рассматриваемых критериев
- •3.4. Эмпирическая мощность критериев
- •3.5. Реальные данные
- •Заключение
3. 3. Исследование асимптотических свойств рассматриваемых критериев
Будем исследовать асимптотические свойства для статистики Вилкоксона критерия Манна-Уитни-Вилкоксона, которая, как отмечалось выше, имеет стандартное нормальное распределение при выполнении нулевой гипотезы.
Построим
доверительные границы для μ при объеме
моделируемой статистики
Допустимая
ошибка для математического ожидания
при известной дисперсии
определяется
по формуле [7]
,
где
– надежность.
Рисунок 3.7 – Доверительные границы для математического
ожидания статистики Вилкоксона критерия
Манна-Уитни –Вилкоксона
при объеме моделируемой статистики n (α=0,05)
Таким образом, с увеличением объема моделируемых статистик математическое ожидание стремится к теоретическому значению, которое при стандартном нормальном распределении равно нулю.
3.4. Эмпирическая мощность критериев
Рассмотрим критерий Крускала-Уоллиса. При использовании аппроксимации Крускала-Уоллиса получаем статистику F, которая при выполнении нулевой гипотезы имеет распределение Фишера с и степенями свободы ( и вычисляются по формуле (2.3)).
Мощность
критерия – вероятность принятия
альтернативной гипотезы при условии,
что она верна. Построим
график зависимости
от n,
где
– количество неправильно принимаемых
гипотез в m=70
испытаниях и фиксированных объемах
моделируемой статистики n.
Рисунок 3.8 – График зависимости эмпирической функции мощности
критерия
Крускала-Уоллиса от
объема моделируемой статистики
при
фиксированных
объемах моделируемых выборок, которые
имеют нормальное распределение с
параметрами
;
;
.
(α=0,05)
С увеличением объема моделируемой статистики вероятность ошибки стремится к нулю, а мощность возрастает и стремится к единице.
3.5. Реальные данные
1. Имеются две выборки случайных величин:
Необходимо проверить гипотезу сдвига критериями группы Манна-Уитни-Вилкоксона при доверительной вероятности α=0,95.
При реализации данного критерия c заданными выборками в статистическом пакете R получаем, что по статистике Манна-Уитни гипотеза сдвига отклоняется.
Ограничим исходную выборку восьмью значениями.
Применив критерий Манна-Уитни-Вилкоксона для полученной выборки получаем, что по статистике Манна-Уитни и по ранговой статистике Вилкоксона гипотеза сдвига отклоняется.
2. Перед началом игры двум группам детей дошкольного возраста показали два мультипликационных фильма. Одна группа (условие А) просмотрела фильм, содержание которого было с ярко выраженными агрессивными элементами; второй группе (условие В) был показан фильм без каких-либо агрессивных элементов. После просмотра фильмов каждый ребенок некоторое время играл отдельно от своих товарищей, причем опытные наблюдатели зарегистрировали количество поступков агрессивного характера, совершенных ребенком по отношению к его игрушкам в течение этого периода. Отметкой для каждого ребенка в данном случае является общее число совершенных им подобных поступков, которые, однако, различаются по характеру и по силе. Поэтому исследователи сочли более правильным рассматривать эти отметки только как относительную меру агрессивности (порядковая шкала). Полученные результаты были следующими [4]:
Условие А: 26,22,19,21,14,18,29,17,11,34;
Условие В: 16,10,8,13,19,11,7,13,9,21;
не
существует различия между медианами
для отметок об агрессивности детей
после просмотра мультипликационных
фильмов.
существует
различие между медианами для отметок
об агрессивности детей после просмотра
мультипликационных фильмов.
Проверить какая гипотеза выполняется с помощью критерия Манна-Уитни-Вилкоксона.
Воспользовавшись реализацией данного критерия в статистическом пакете R, получили следующие результаты: по статистике Манна-Уитни и по ранговой статистике Вилкоксона принимается гипотеза .
3. Чтобы установить, отличаются ли механизмы фатальной соевой астмы от механизмов обычной фатальной астмы, число CD3+ Т-клеток в подслизистой основе, показателе иммунной системы организма, сравнили с числом клеток в 7 случаях фатальной соевой астмы и в 10 случаях фатальной астмы. Из-за маленьких размеров выборки и явно скошенных (асимметричных) данных используем двухвыборочный критерий Манна-Уитни-Вилкоксона [5].
Соевая астма: 0,00; 0,00; 0,00; 1,36; 1,43; 4,01; 34,45.
Фатальная астма: 3,76; 4,32; 13,75; 37,50; 58,33; 73,63; 74,17; 99,99; 154,86; 1225,51.
Рассматриваются гипотезы:
распределения количества CD3+ Т-клеток в двух популяциях одинаковы.
распределения количества CD3+ Т-клеток в двух популяциях неодинаковы.
Используем критерий Манна-Уитни-Вилкоксона для данных выборок и получаем, что механизмы фатальной соевой астмы отличаются от механизмов обычной фатальной астмы (принимается гипотеза ).
4. В результате наблюдений получены пять выборок случайных величин (k = 5)
Необходимо проверить гипотезу об отсутствии сдвига между параметрами положения в выборках критерием Крускала-Уоллиса на уровне значимости α=0,05 [1].
Используя реализацию данного критерия в статистическом пакете R получаем следующий результат: по аппроксимации Крускала-Уоллиса и по аппроксимации Имана-Давенпорта гипотеза сдвига принимается.
5. Имеются две выборки случайных величин:
Проверить гипотезу равенства параметров масштаба в выборках критерием Ансари-Бредли при достоверности α=0,95 [1].
При проверке получаем, что гипотеза равенства параметров масштаба принимается.
6. Даны две выборки случайных величин:
Поверить гипотезу равенства параметров масштаба критерием Муда при достоверности α=0,95 [1].
Применив критерий Муда к данным выборкам, получаем, что гипотеза равенства параметров масштаба принимается.
7. 95 призванных на военную службу мужчин в возрасте 16-20 лет прошли осмотр зубов, когда зачислялись в Королевские вооруженные силы. Их зубы были осмотрены через год после лечения. У человека 28 зубов кроме зубов мудрости, и в этом исследовании каждый зуб имел 4 интересующие дантистов точки; каждый участник имел минимум 84 и максимум 112 измеряемых точек. Изучали влияние лечения на глубину десневого кармана (большая глубина кармана означает ухудшение состояния зуба). Данные показывают процент измеряемых сайтов, для которых была утрата прикрепления при каждой оценке в каждом из 14 этих участников. Утрата прикрепления — показатель заболевания десен, которое может быть более запущенным, чем определяется по глубине десневого кармана. Использовали критерий знаковых рангов Вилкоксона, чтобы исследовать, влияло ли лечение на утрату прикрепления.
Рассматриваются следующие гипотезы:
медиана разностей (до и после лечения) в процентах сайтов с потерей прикрепления равна нулю в популяции участников.
медиана разностей (до и после лечения) в процентах сайтов с потерей прикрепления не равна нулю в популяции участников [5].
До лечения (%): 65,5; 75,0; 87,2; 97,1; 100,0; 92,6; 82,3; 90,0; 93,0; 100,0; 91,7; 97,7; 79,0; 95,4;
После лечения (%): 100,0; 10,0; 100,0; 97,1; 99,1; 100,0; 91,6; 94,6; 95,5; 97,3; 92,3; 98,0; 100,0; 99,0.
По ранговой статистике Вилкоксона принимаем гипотезу .
8. При измерении частоты пульса через 2 минуты окончания физической нагрузки у 10 спортсменов (выборка ) и у 10 лиц, не занимающихся спортом (выборка ), получены следующие данные (ударов в 1 минуту) [6]:
Проверить гипотезу сдвига критериями группы Манна-Уитни-Вилкоксона при доверительной вероятности α=0,95.
Получаем результаты: по статистике Манна-Уитни гипотеза сдвига отклоняется; по ранговой статистике Вилкоксона гипотеза сдвига принимается.
9. Имеется экспериментальная группа, состоящая из 25 человек (N = 25), и контрольная группа, состоящая из 30 человек (M = 30), и измерение заключается в определении числа хондроцитов в 1 мкм ткани регенерата на седьмые сутки после травмы. В дальнейшем число хондроцитов будет обозначено как степень регенерации суставного хряща (СРСХ). Экспериментальным воздействием в рассматриваемом примере выступала стимуляция заживления (регенерации), в то время как в контрольной группе имела место естественная регенерация.
Результаты измерений СРСХ в контрольной и экспериментальной группах до и после эксперимента:
Контрольная группа до начала эксперимента: 15,13,11,18,10,8,20,7,8,12,15,16,13,14,14,19,7,8,11,12,15,16,13,5,11,19,18,9,6,15.
Экспериментальная группа до начала эксперимента:
12,11,15,17,18,6,8,10,16,12,15,14,19,13,19,12,11,16,12,8,13,7,15,8,9.
Контрольная группа после окончания эксперимента:
16,12,14,17,11,9,15,8,6,13,17,19,15,11,9,19,8,6,9,12,11,17,10,8,8,20,19,6,14,10.
Экспериментальная группа после окончания эксперимента:
15,18,12,20,16,11,13,7,14,17,19,16,12,15,19,18,14,13,18,13,13,15,18,9,14.
C помощью критерия Манна-Уитни-Вилкоксона проверить гипотезу о равенстве сравниваемых выборок [10].
Для этого сравним сначала оценки СРСХ в контрольной и экспериментальной группе до начала эксперимента. Гипотеза о том, что сравниваемые выборки совпадают, принимается на уровне значимости 0,05. Теперь сравним оценки СРСХ в контрольной и экспериментальной группе после окончания эксперимента. Достоверность различий сравниваемых выборок составляет 95%.
Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной групп совпадают, а конечные (после окончания эксперимента) – различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментального воздействия.