Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
5_Проверка статистических гипотез.doc
Скачиваний:
1053
Добавлен:
01.02.2015
Размер:
1.08 Mб
Скачать

5.4 Непараметрические методы проверки однородности выборок

Критерии сравнения, которые могут быть применены как количественным, так и к порядковым совокупностям, называются непараметрическими. Использование этих критериев не нуждается в каких-либо предположениях о характере распределения переменных. Так как их применение не требует оценки параметров распределений, то критерии называют непараметрическими (термин ввел Вольфовиц в 1942 г.), или - свободными от параметров, или свободно распределенными

Непараметрические критерии обладают рядом преимуществ:

  • они не требуют предварительных предположений относительно вида исходного распределения;

  • для их вычисления не требуется большого объема данных;

  • они являются более робастными (применимыми в широком диапазоне условий), чем их параметрические аналоги.

Недостатки непараметрических критериев:

  • низкая статистическая мощность (менее чувствительные);

  • меньшая гибкость;

  • большая вероятность совершить ошибку II рода - отклонить нулевую гипотезу, когда она верна.

5.5 Сравнение двух независимых выборок

5.5.1 Сравнение двух независимых выборок Критерий Манна–Уитни

Наиболее часто для сравнения двух независимых выборок используется U-критерий Манна–Уитни –– статистический критерий, используемый для оценки различий между двумя независимымивыборкамипо уровню какого-либо признака, измеренного количественно.

В отличие от t-критерия Стьюдента U-критерий не требует проверки на нормальность распределения, с его помощью можно сравнивать маленькие выборки объёмом от 3-х наблюдений, т.е. тест позволяет выявлять различия в значении параметра между малыми выборками.

Данный метод выявления различий между выборками был предложен в 1945 годуФрэнком Уилкоксоном(F. Wilcoxon). В1947 годуон был существенно переработан и расширен Х. Б. Манном (H. B. Mann) и Д. Р. Уитни (D. R. Whitney), по именам которых сегодня обычно и называется.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны. Иногда эти различия называют различиями в расположении двух выборок.

Для корректной работы теста требуется выполнение следующих условий:

  • распределения X и Y непрерывны (или являются дискретными распределениями, хорошо аппроксимирующими непрерывное распределение);

  • распределения X и Y имеют одинаковую форму, единственным возможным отличием является их расположение (т.е. медиана);

  • выборки независимы;

  • тест нельзя применять к номинальным переменным;

  • в каждой выборке должно быть не менее 3 наблюдений: n1,n2 ≥ З; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5;

  • в выборочных данных не должно быть совпадающих значений (все числа — разные) или таких совпадений должно быть достаточно мало.

Первым рядом (выборкой, группой) выбирается тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже.

Гипотезы U - критерия Манна-Уитни:

H0: Уровень признака в группе 2 не ниже уровня признака в группе 1.

H1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Для применения U-критерия Манна — Уитни нужно произвести следующие операции:

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: , где— количество единиц в первой выборке, а— количество единиц во второй выборке.

  2. Если имеются одинаковые значения, им присваивается средний ранг.

  3. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно — на долю элементов второй выборки.

  4. Определить большую из двух ранговых сумм (), соответствующую выборке сединиц.

  5. Определить значение U-критерия Манна — Уитни по формуле:

  1. По таблице для избранного уровня статистической значимостиопределить критическое значение критерия для данныхи. Если полученное значение U меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (отвергается нулевая гипотеза). Если же полученное значение U больше табличного, тонулевая гипотезане отвергается. Достоверность различий тем выше, чем меньше значение U.

Пример проверки гипотезы при помощи U-критерия Манна-Уитни

Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Для расчета U-критерия расположим значения сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до . Первая строка представляет собой значения первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:

6

7

7

8

8

9

9

9

10

11

8

9

9

11

11

12

12

12

13

13

1

2,5

2,5

5

5

5

9

9

9

9

9

12

14

14

14

17

17

17

19,5

19,5

Если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно (в нашем случае 20). Это правило используют для проверки правильности ранжирования. Отдельно для каждой выборки рассчитываем суммы рангов их рангови. В нашем случае:

Для проверки правильности вычислений можно воспользоваться правилом:

В рассматриваемом случае .

Статистика

Для проверки одностороннего критерия определим критическое значение для и уровня значимости 5%, которое равно (таблица критических значений критерия приведены в приложении 2). Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий подтверждается с помощью данного непараметрического теста.