Непараметрическое сравнение двух выборок: критерий Манна-Уитни Уилкоксона
Непараметрические критерии предназначены для обнаружения различий в законах распределения двух генеральных совокупностей. Критерии, которые чувствительны к различиям генеральных срекдних, называют критериями сдвига. Критерии, которые чувствительны к различиям генеральных дисперсий, называют критериями масштаба. Критерий Манна-Уитни относится к критериям сдвига и используется для обнаружения различий в средних значениях двух генеральных совокупности, выборки из которых представлены в ранговой шкале. При работе с ранжированными выборками значение имеет не величина признака, а лишь порядковое место, который она занимает среди других величин.
Для преобразования выборки в ранговую форму ее значения распологаются в порядке возрастания, а затем нумеруются целыми числами, начиная с единицы (1, 2, 3...) Эти номера являются предварительными рангами. Если в выборке есть повторяющиеся элементы, то их предварительные ранги усредняют. Таким образом, формируют окончательные ранги, которые называют просто рангами (слово „окончательный“ опускают). После завершения ранжирования равные величины получают одинаковые ранги.
Рассмотрим порядок и правила ранжирования на следующем примере. В первой строке таблицы представлена упорядоченная по возрастанию выборка с повторяющимися значениями. В строке 2 указаны предварительные ранги. В строке 3 ранги одинаковых величин, заменены на среднеарифметические значения. Например, элементы 4 и 4, из первой строки, получили предварительные ранги 2 и 3, которые затем заменены среднеарифметическим значением 2,5.
3 |
4 |
4 |
5 |
5 |
5 |
6 |
6 |
6 |
6 |
6 |
6 |
6 |
7 |
7 |
7 |
7 |
8 |
8 |
9 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
1 |
2,5 |
2,5 |
5 |
5 |
5 |
10 |
10 |
10 |
10 |
10 |
10 |
10 |
15,5 |
15,5 |
15,5 |
15,5 |
18,5 |
18,5 |
20 |
Ранговая шкала широко используется в математической статистике для обработки выборок из генеральных совокупностей с неизвестным законом распределения.
Постановка задачи
Независимые выборки {Х1} и {X2} извлечены из генеральных совокупностей с неизвестными законами распределения. Объемы выборок n1 и n2, соответственно. Требуется проверить, различаются ли эти генеральные совокупности между собой?
Проверяемые гипотезы:
Н0 – выборки принадлежат к одной генеральной совокупности (генеральные средние – одинаковы).
Н1 – выборки принадлежат к различным генеральным совокупностям (генеральные средние – различны).
Для проверки таких гипотез применяется Т–критерий Манна-Уитни-Уилкоксона.
Применение Т-критерия
Сначала из двух выборок составляется объединенная выборка {X}, элементы которой ранжируются. Затем находится сумма рангов, соответствующих элементам первой выборки. Эта сумма и является критерием для проверки гипотез.
Т = Сумма рангов первой выборки
Для независимых выборок, объемы которых больше 20, сумма величина Т подчиняется нормальному распределению, математическое ожидание и СКО которого равны:
.
Поэтому границы критической области находятся по таблицам нормального распределения.
= 0.05 (P = 0.95) М/ = 0,7 |
|||||
выборки |
B1 |
B2 |
|
B1 |
B2 |
М |
6 |
6,7 |
|
6 |
6,7 |
|
1 |
1 |
|
1 |
1 |
n |
10 |
10 |
|
20 |
20 |
|
5,756 |
6,081 |
|
5,756 |
6,081 |
|
4,726 |
6,883 |
|
4,726 |
6,883 |
|
7,994 |
5,199 |
|
7,994 |
5,199 |
|
5,675 |
4,424 |
|
5,675 |
4,424 |
|
6,977 |
6,548 |
|
6,977 |
6,548 |
|
6,998 |
5,979 |
|
6,998 |
5,979 |
|
4,756 |
6,716 |
|
4,756 |
6,716 |
|
6,180 |
6,740 |
|
6,180 |
6,740 |
|
6,174 |
5,526 |
|
6,174 |
5,526 |
|
5,652 |
6,984 |
|
5,652 |
6,984 |
|
|
|
|
5,264 |
5,506 |
|
|
|
|
6,092 |
6,674 |
|
|
|
|
5,778 |
7,336 |
Средние |
6,089 |
6,108 |
|
5,648 |
6,189 |
|
|
|
|
5,795 |
8,168 |
границы |
Тлев |
Тправ |
|
4,823 |
7,547 |
79 |
131 |
|
4,890 |
6,120 |
|
Т |
105 |
|
4,469 |
5,060 |
|
Принята |
Но |
|
7,264 |
5,521 |
|
|
|
|
|
5,810 |
6,109 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Средние |
5,836 |
6,265 |
|
|
|
|
|
|
|
|
|
границы |
Тлев |
Тправ |
|
|
|
338 |
482 |
|
|
|
|
Т |
357 |
|
|
|
|
Принята |
Но |
|
= 0.05 (P = 0.95) М/ = 0,7 |
|||||
выборки |
B1 |
B2 |
|
B1 |
B2 |
М |
6 |
6,7 |
|
6 |
6,7 |
|
1 |
1 |
|
1 |
1 |
n |
25 |
25 |
|
30 |
30 |
|
|
|
|
|
|
|
5,756 |
6,081 |
|
5,756 |
6,081 |
|
4,726 |
6,883 |
|
4,726 |
6,883 |
|
7,994 |
5,199 |
|
7,994 |
5,199 |
|
5,675 |
4,424 |
|
5,675 |
4,424 |
|
6,977 |
6,548 |
|
6,977 |
6,548 |
|
6,998 |
5,979 |
|
6,998 |
5,979 |
|
4,756 |
6,716 |
|
4,756 |
6,716 |
|
6,180 |
6,740 |
|
6,180 |
6,740 |
|
6,174 |
5,526 |
|
6,174 |
5,526 |
|
5,652 |
6,984 |
|
5,652 |
6,984 |
|
5,264 |
5,506 |
|
5,264 |
5,506 |
|
6,092 |
6,674 |
|
6,092 |
6,674 |
|
5,778 |
7,336 |
|
5,778 |
7,336 |
|
5,648 |
6,189 |
|
5,648 |
6,189 |
|
5,795 |
8,168 |
|
5,795 |
8,168 |
|
4,823 |
7,547 |
|
4,823 |
7,547 |
|
4,890 |
6,120 |
|
4,890 |
6,120 |
|
4,469 |
5,060 |
|
4,469 |
5,060 |
|
7,264 |
5,521 |
|
7,264 |
5,521 |
|
5,810 |
6,109 |
|
5,810 |
6,109 |
|
6,158 |
7,297 |
|
6,158 |
7,297 |
|
4,327 |
5,283 |
|
4,327 |
5,283 |
|
5,183 |
5,035 |
|
5,183 |
5,035 |
|
5,914 |
5,829 |
|
5,914 |
5,829 |
|
5,319 |
7,137 |
|
5,319 |
7,137 |
|
|
|
|
5,764 |
7,569 |
|
|
|
|
5,669 |
6,152 |
|
|
|
|
6,811 |
7,563 |
Средние |
5,745 |
6,236 |
|
5,160 |
7,780 |
|
|
|
|
6,334 |
8,086 |
границы |
Тлев |
Тправ |
|
|
|
536 |
739 |
|
|
|
|
Т |
541 |
|
|
|
|
Принята |
Но |
Средние |
5,779 |
6,435 |
|
|
|
|
|
|
|
|
|
|
границы |
Тлев |
Тправ |
|
|
|
782 |
1048 |
|
|
|
|
Т |
744 |
|
|
|
|
Принята |
Н1 |
|
