
- •Глава 3. Непараметрические статистические критерии
- •3.1. Критерий Розенбаума
- •3.2. Критерий Манна-Уитни
- •3.3. Критерий Крускала-Уолиса.
- •3.4. Критерий тенденций Джонкира
- •3.5. Критерий Макнамары
- •3.6. Критерий знаков
- •3.7. Критерий Вилкоксона
- •3.8. Критерий Фридмана
- •3.9. Критерий тенденций Пейджа
- •3.10. Критерий Пирсона
- •3.11. Критерий Колмогорова-Смирнова
- •3.12. Критерий Фишера
3.3. Критерий Крускала-Уолиса.
Критерий
Крускала-Уолиса
предназначен для оценки различий
одновременно между несколькими (более
двух) выборками по
уровню
какого-либо приз
нака.
Критерий Крускала-Уолиса включает следующие этапы: |
|||
1 |
Определить признак, участвующий в сопоставлении (значения признака должны быть представлены не ниже порядковой шкалы). |
||
2 |
Произвести выборку более двух групп респондентов, учитывая, что при сопоставлении 3-х выборок допускается: |
||
а |
чтобы в одной из них было три респондента, а в двух других – два (установить различия в данном случаем можно лишь на низшем уровне значимости при p≤ 0,05); |
||
б |
чтобы в каждой выборке было не менее трех респондентов, или в одной из них было четыре респондента, а в двух других – два (установить различия в данном случаем можно на более высоком уровне значимости при p≤ 0,01). |
||
3 |
Диапазоны разброса значений признака в данных выборках не должны совпадать между собой. |
||
4 |
Упорядочить значения признака отдельно в каждой выборке по степени возрастания (или убывания). |
||
5 |
Упорядочить значения признака всех выборок вместе по степени возрастания (или убывания). |
||
6 |
Проранжировать значения признака в объединенной выборке (общее количество рангов будет равняться количеству испытуемых в объединенной выборке). |
||
7 |
Разбить объединенную выборку на первоначальные выборки. |
||
8 |
Подсчитать сумму рангов отдельно по каждой выборке: |
||
а |
если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками; |
||
б |
если в одной из выборок будут преобладать низкие значения рангов, в другой – средние, а в третьей – высокие, то критерий H – Крускала-Уолиса позволит установить эти различия. |
||
9 |
Сформулировать гипотезы: |
||
Н0 |
Между выборками 1, 2, 3 и т.д. существуют лишь случайные различия по уровню исследуемого признака. |
||
Н1 |
Между выборками 1, 2, 3 и т.д. существуют неслучайные различия по уровню исследуемого признака. |
||
10 |
Проверить, совпадает ли общая сумма рангов с расчетной. |
||
11 |
Вычислить значение
Hэмп
по формуле:
где N – общее количество испытуемых в объединенной выборке; ni – количество испытуемых в i-той группе; Ti – суммы рангов по каждой группе. |
||
12 |
Определить критические значения Н1кр и Н2кр, которые отвечают уровням значимости в 5% и 1%: |
||
а |
если рассматриваются три группы (n1, n2, n3 ≤ 5), то находят критические значения и соответствующий им уровень значимости по таблице № 3 приложения; |
||
б |
если рассматривается более трех групп или n1, n2, n3 > 5, то находят критические значения χ2 по таблице № 4 приложения. Количество степеней свободы при этом определяется по формуле: df=c-1 (c – количество сопоставляемых выборок). |
||
13 |
Расположить эмпирическое значение критерия Нэмп и критические значения Н1кр и Н2кр на оси значимости. |
||
14 |
Если Нэмп находится в зоне незначимости, то принимается гипотеза Н0 об отсутствии различий. Если Нэмп находится в зоне значимости, то гипотеза об отсутствии различий Н0 отклоняется и принимается гипотеза Н1 о наличии различий. Если Нэмп находится в зоне неопределенности, то существует вероятность принятия ложного решения |
Пример. Была проведена выборка студентов из первого, второго и третьего курсов в количестве шести, восьми и семи человек соответственно для определения у них интегральной самооценки личности. Количественные результаты исследования представлены в таблице.
Студенты 1 курса |
Студенты 2 курса |
Студенты 3 курса |
|||
№ респондента
|
показатель интегральной самооценки личности |
№ респондента
|
показатель интегральной самооценки личности |
№ респондента
|
показатель интегральной самооценки личности |
1 |
61 |
1 |
43 |
1 |
44 |
2 |
46 |
2 |
49 |
2 |
51 |
3 |
55 |
3 |
46 |
3 |
28 |
4 |
47 |
4 |
31 |
4 |
43 |
5 |
36 |
5 |
42 |
5 |
38 |
6 |
26 |
6 |
59 |
6 |
35 |
|
|
7 |
37 |
7 |
47 |
|
|
8 |
41 |
|
|
Можно ли утверждать, что одна из групп превосходит другую по уровню интегральной самооценки личности?
Сформулируем гипотезы:
Н0: Между студентами 1, 2 и 3 курсов существуют лишь случайные различия по уровню интегральной самооценки личности.
Н1: Между студентами 1, 2 и 3 курсов существуют неслучайные различия по уровню интегральной самооценки личности.
Упорядочим значения в выборках.
Студенты 1 курса |
Студенты 2 курса |
Студенты 3 курса |
||||||
№
|
показатель интегральной самооценки личности |
ранг |
№
|
показатель интегральной самооценки личности |
ранг |
№
|
показатель интегральной самооценки личности |
ранг |
6 |
26 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
3 |
28 |
2 |
|
|
|
4 |
31 |
3 |
|
|
|
|
|
|
|
|
|
6 |
35 |
4 |
5 |
36 |
5 |
|
|
|
|
|
|
|
|
|
7 |
37 |
6 |
|
|
|
|
|
|
|
|
|
5 |
38 |
7 |
|
|
|
8 |
41 |
8 |
|
|
|
|
|
|
5 |
42 |
9 |
|
|
|
|
|
|
|
|
|
4 |
43 |
10,5 |
|
|
|
1 |
43 |
10,5 |
|
|
|
|
|
|
|
|
|
1 |
44 |
12 |
|
|
|
3 |
46 |
13,5 |
|
|
|
2 |
46 |
13,5 |
|
|
|
|
|
|
4 |
47 |
15,5 |
|
|
|
|
|
|
|
|
|
|
|
|
7 |
47 |
15,5 |
|
|
|
2 |
49 |
17 |
|
|
|
|
|
|
|
|
|
2 |
51 |
18 |
3 |
55 |
19 |
|
|
|
|
|
|
|
|
|
6 |
59 |
20 |
|
|
|
1 |
61 |
21 |
|
|
|
|
|
|
∑ |
271 |
75 |
|
348 |
87 |
|
286 |
69 |
.
Общая сумма рангов: 75+87+69=231 совпадает с
расчетной
.
Определим эмпирическое значение Н:
.
Так как количество респондентов в группах больше 5, необходимо сопоставлять полученное эмпирическое значение Н с критическими значениями χ2.
Найдем количество степеней свободы df для с = 3: df = с – 1 = 3 – 1 = 2.
Определим критические значения по таблице № 4 приложения для df = 2:
зона
неопределенности
зона
незначимости
зона
значимости
0,05
0,01
χ21кр=5,991
χ22кр=9,210
Нэм=0,6
Нэмп находиться в зоне неопределенности, есть вероятность принятия ложного решения (необходимо увеличить выборку или воспользоваться другим критерием).