Скачиваний:
90
Добавлен:
21.01.2014
Размер:
100.35 Кб
Скачать

5.2. Тесты сравнения нескольких выборок

Эти тесты предназначены для проверки гипотезы совпадения распределений в выборках. В отличие от t-теста и известных методов дисперсионного анализа, здесь не предполагается нормальность теоретического распределения.

Многие тесты основаны на поиске определенного типа противоречия с гипотезой совпадения распределений и не может обнаружить всех отличий. Например, тест медиан проверяет совпадение только медиан. Поэтому иногда полезно воспользоваться несколькими тестами.

5.2.1. Двухвыборочный тест Колмогорова-Смирнова

Двухвыборочный тест Колмогорова-Смирнова предназначен для проверки гипотезы о совпадении распределений в паре выборок:

NPAR TESTS K-S=V14 BY V4(1,3).

В команде за ключевым словом K-S следует тестируемая переменная (в нашем примере - V14), за ней после слова BY указываются сравниваемые группы - переменная, определяющая эти группы, и соответствующие этим группам значения: V4(1,3).

Статистика критерия - абсолютная величина разности эмпирических функций распределения в указанных выборках:

, где N1 и N2 - объемы выборок.

В листинге выдается статистика критерия Z=ks двусторонняя значимость - вероятность случайно в условиях гипотезы превзойти выборочное значение статистики.

Пример: сравнение распределений доходов групп готовых отдать острова или их часть и придерживающихся твердой позиции:

recode v4(1,2=1)(3=2) into W4.

Var lab w4 "отношение к передаче островов".

Val lab 1 "Отдать" 2 "нет".

npar test k-s=v14 by w4(1,2).

Таблица 5.7. Cравнение распределения доходов в двух группах на основе критерия Колмогорова-Смирнова,.

V14 Душевой доход в семье

Most Extreme Differences

Absolute

0.05

Positive

0.05

Negative

-0.028

Kolmogorov-Smirnov Z

0.455

Asymp. Sig. (2-tailed)

0.986

В приведенном примере (таблица 5.7) наблюдаемый уровень значимости велик (0.986). Поэтому, приходим к заключению, что на нашей учебной выборке критерием Колмогорова-Смирнова не удалось обнаружить различие распределений по душевому доходу в группах считающих, что нужно отдать острова или их часть, и противников такого решения. Это не означает достоверно, что распределения совпадают, возможны тонкие различия распределений, которые критерий не улавливает из-за малого объема данных.

5.2.2. Тест медиан

Этот тест позволяет сравнивать распределения исследуемой переменной сразу в нескольких группах. Тест весьма груб, но прост.

NPAR TESTS MEDIAN = V14 BY V1(1,3).

Внешне задание теста похоже на задания критерия Колмогорова-Смирнова.

Задание сравниваемых групп. После слова BY за именем переменной в скобках указывается интервал значений. В приведенном примере сравниваются распределения в трех группах. Тестом можно сравнить также и пару групп, если в скобках вначале указать большее значение, затем меньшее (при задании V4(3,1) сравниваются только 1-я и 3-я группы).

Суть проверки гипотезы состоит в следующем. Значения исследуемой переменной (в нашем примере - V14) делятся на две группы: больше медианы и меньше или равно медиане. Такое разделение можно считать заданием новой, дихотомической переменной. Вычисляется таблица сопряженности полученной дихотомической переменной и переменной, задающей группы. Далее применяется известный критерий Хи-квадрат. Если величина наблюдаемой значимости критерия мала, естественно предположить, что распределение исследуемой переменной в группах различается существенно.

Замечание. Для получения дихотомии можно, также, навязать точку "разрыва" переменной, не совпадающую с медианой, указав в скобках за словом MEDIAN соответствующее значение.

Пример. Курильское обследование проходило в 21 городе Западной Сибири. Экспертным путем все города разделены на 4 типа: 1 растущие, 2 стабильные, 3 крупные, 4 гиганты. Типу города в наших данных соответствует переменная TP.

Исследуется связь доходов и типа населенного пункта.:

npar test med=v14 by TP(1,4).

Таблица 5.8. Метод медиан. Разделение на две подвыборки.

TP тип поселения

Растущие

Стабильные

крупные

гигант

V14 Ср.мес. душевой доход в семье

> Median

84

104

62

12

<= Median

90

126

139

56

Таблица 5.9. Метод медиан. Значимость критерия.

V14 Ср.мес. душевой доход в семье

N

673

Median

200

Chi-Square

28.698

Df

3

Asymp. Sig.

0

Анализируя величину наблюдаемой значимости, видим, что между точкой зрения на иностранную помощь и возрастом имеется существенная связь, т.е. обнаружено значимое различие распределения доходов в группах.

Соседние файлы в папке Учебник по SPSS, учебное пособие