
- •Глава 5. Непараметрические тесты. Команда Nonparametric tests.
- •5.1. Одновыборочные тесты
- •5.1.1. Тест Хи-квадрат
- •5.1.2. Тест, основанный на биномиальном распределении
- •5.1.3. Тест Колмогорова-Смирнова
- •5.2. Тесты сравнения нескольких выборок
- •5.2.1. Двухвыборочный тест Колмогорова-Смирнова
- •Var lab w4 "отношение к передаче островов".
- •Val lab 1 "Отдать" 2 "нет".
- •5.2.2. Тест медиан
- •5.3. Тесты для ранговых переменных
- •5.3.1. Двухвыборочный тест Манна-Уитни (Mann-Witney)-
- •5.3.2. Одномерный дисперсионный анализ Краскэла-Уоллиса (Kruskal-Wallis)
- •5.4. Тесты для связанных выборок (related samples)
- •5.4.1. Двухвыборочный критерий знаков (Sign)
- •5.4.2. Двухвыборочный знаково-ранговый критерий Вилкоксона (Wilcoxon)
- •5.4.3. Критерий Фридмана (Friedman)
- •Глава 5. Непараметрические тесты. Команда Nonparametric tests. 69
5.3.2. Одномерный дисперсионный анализ Краскэла-Уоллиса (Kruskal-Wallis)
В основе сравнения средних рангов заданного числа групп лежит одномерный дисперсионный анализ, в котором вместо значений переменных используются ранги объектов исследуемой переменной.
NPAR TESTS K-W = V14 BY V4(1,3).
В условиях гипотезы равенства распределений в группах нормированный межгрупповой разброс имеет распределение, близкое к распределению хи-квадрат. В выдаче распечатывается значимость этой статистики.
Следующий пример показывает различие доходов жителей населенных пунктов разного типа.
npar test k-w=v9 by tp(1,4).
Таблица 5.12. Тест Краскэла Уоллиса. Средние ранги.
|
TP тип поселен |
N |
Mean Rank |
V14 Ср.мес. душевой доход в семье |
1.00 растущие |
174 |
382 |
|
2.00 стабильные |
230 |
365.2 |
|
3.00 крупные |
201 |
304.6 |
|
4.00 гигант |
68 |
222.2 |
|
Total |
673 |
|
Таблица 5.13. Тест Краскэла-Уоллиса. Значимость критерия.
|
V14 Ср.мес. душевой доход в семье |
Chi-Square |
43.702 |
Df |
3 |
Asymp. Sig. |
0 |
Тест показывает (Sig=0), что точка зрения респондента на иностранную помощь существенно связана типом населенного пункта, в котором он проживает (таблицы 5.12-13).
5.4. Тесты для связанных выборок (related samples)
Напомним, что связанными выборками называются совокупности повторных измерений на одних и тех же объектах. Например, доходы семьи в различных волнах панельного обследования RLMS; психологические характеристики мужа и жены и т.п.
5.4.1. Двухвыборочный критерий знаков (Sign)
Для исследования связи пары измерений Х и Y рассматриваются знаки разностей di=Yi-Xi. В случае независимости измерений и отсутствии повторов значений di (связей) число знаков "+" (положительных di) должно подчиняться биномиальному распределению с параметром p=0.5. Именно эта гипотеза и проверяется с помощью статистики критерия - стандартизованной частоты положительных разностей.
В качестве примера по данным RLMS проверим, какой характер имели изменения веса (кг) мужчин старше 30 лет в 1994-95 гг.
COMPUTE filter_$=(a_age < 30 & ah5_1 = 1).
FILTER BY filter_$.
NPAR TEST / SIGN= am1 WITH bm1 (PAIRED).
Таблица 5.14. Тест знаков для парных наблюдений. Частоты
Frequencies |
|
|
|
|
N |
BM1 вес в 1995г. - AM1 вес в 1994г. |
Negative Differences |
877 |
|
Positive Differences |
722 |
|
Ties |
350 |
|
Total |
1949 |
Судя по таблице 5.14, мужчины чаще худели, чем толстели, причем этот факт подтверждается отрицательным значением статистики критерия, наблюдаемая значимость которой равна 0.000118 (таблица 5.15.).
Таблица 5.15. Тест знаков для парных наблюдений. Значимость критерия.
Test Statistics |
|
|
BM1 вес в 1995г. - AM1 вес в 1994г. |
Z |
-3.8512 |
Asymp. Sig. (2-tailed) |
0.000118 |
5.4.2. Двухвыборочный знаково-ранговый критерий Вилкоксона (Wilcoxon)
Ранжируются абсолютные величины разностей di=Yi-Xi. Затем рассматривается сумма рангов положительных и сумма рангов отрицательных разностей. Если связь между X и Y отсутствует и распределение одинаково, то эти две суммы должны быть примерно равны. Статистика критерия - стандартизованная разность этих сумм.
По сути, это проверка, не произошло ли между измерениями событие, существенно изменившее иерархию объектов?
Обратимся к предыдущему примеру, но проверим, будет ли преобладать отрицательный ранг изменения веса мужчин старше 30 лет?
NPAR TEST /WILCOXON=am1 WITH bm1 (PAIRED).
Таблица 5.16 показывает, что преобладает уменьшение веса, что подтверждается наблюдаемой значимостью статистики критерия, равной 0.00053 (таблица 5.17).
Таблица 5.16. Знаково-ранговый тест Вилкоксона. Средние ранги.
BM1 вес в 1995г. - AM1 вес в 1994г. |
|
N |
Mean Rank |
Sum of Ranks |
|
Negative Ranks |
877 |
802.2 |
703500 |
|
Positive Ranks |
722 |
797.4 |
575700 |
|
Ties |
350 |
|
|
|
Total |
1949 |
|
|
Таблица 5.17. Знаково-ранговый тест Вилкоксона. Средние ранги.
|
BM1 вес в 1995г. - AM1 вес в 1994г. |
Z |
-3.46504 |
Asymp. Sig. (2-tailed) |
0.00053 |