
- •Глава 4. Сравнение средних, корреляции
- •4.3. Compare Means - простые параметрические методы сравнения средних.
- •Одновыборочный тест (One sample t-test).
- •Variable labels lnv14m "логарифм промедианного дохода".
- •Двухвыборочный t-тест (independent sample t-test)
- •Двухвыборочный t-тест для связанных выборок (Paired sample t-test)
- •Команда means - сравнение характеристик числовой переменной по группам.
- •Одномерный дисперсионный анализ (oneway)
- •Множественные сравнения
- •Var lab w10 "образование".
- •Value lab w10 1 "Высшее" 2 "н/высш" 3 "ср. Спец" 4 "среднее" 5 "ниже среднего".
- •4.4. Корреляции (correlations)
- •Парные корреляции
- •Частные корреляции.
Двухвыборочный t-тест (independent sample t-test)
Вариант команды для выполнения процедуры T-TEST для сравнения средних в двух выборках имеет следующий вид:
T-TEST/GROUPS V4(1,3)/VARIABLES = V9 lnV14m.
Подкоманда GROUPS указывает переменную группирования; в скобках задаются два значения этой переменной, определяющие группы. Например, приведенная команда будет выполняться только для групп объектов, у которых V4 принимает указанные значения 1 и 3. VARIABLES задает сравниваемые (зависимые) переменные для выделенных групп объектов. Объекты можно также разбить на две группы, указав в параметре GROUPS одно значение:
T-TEST /GRO v9(30)/VAR V9 lnV14m.
В этом случае вся совокупность будет разделена на те объекты, на которых указанная переменная не больше заданного значения (v930), и те, у которых она больше (v9>30).
Процедурой T-TEST проверяется гипотеза равенства средних, при этом предполагается нормальность распределения генеральной совокупности. Процедура подсчитывает средние для пары групп, стандартные ошибки, статистики и их значимость. При сравнении двух выборок нас интересует, насколько случайный характер носит различие средних - отличаются ли они значимо?
В зависимости от предположения о равенстве дисперсий испльзуются разные варианты t-статистик.
Если не предполагается
равенство дисперсий в группах, то для
сравнения средних принято использовать
статистику
,
которая в условиях гипотезы равенства
матожиданий и нормальностиX
имеет распределение Стьюдента, число
степеней которого оценивается на основе
оценок дисперсий.
Если заранее известно о
равенстве дисперсий в группах, то
предпочтительнее статистика
.
При определении ее величины предварительно вычисляется объединенная дисперсия
.
Из теории известно, что при условии равенства дисперсий вычисляемая величина Sp есть несмещенная оценка дисперсии, и статистика t также имеет распределение Стьюдента.
Для проверки равенства дисперсий используется статистики Ливиня, имеющая распределение Фишера.
Двусторонней наблюдаемой значимостью, вычисляемой процедурой T-TEST, является вероятность случайно получить различия средних, такие, что │t-теоретическое│>│t-выборочного│. Если значимость близка к 0, делаем вывод о неслучайном характере различий.
Результат выдается в двух таблицах. В первой размещены средние и характеристики разброса в группах, во второй - результаты их сравнения.
Таблица 4.3. T-тест, описательные статистики по группам
|
V9 Возраст |
N |
Mean |
Std. Deviation |
Std. Error Mean |
LNV14M |
>= 30 |
521 |
0.019 |
0.517 |
0.023 |
|
< 30 |
133 |
-0.177 |
0.593 |
0.051 |
Таблица 4.4. T-тест, сравнение средних и дисперсий в группах
|
Levene's Test for Equality of Variances |
T |
Df |
Sig. (2-tailed) |
Mean Difference |
Std. Error Difference |
95% Confidence Interval of the Difference | ||
F |
Sig. | ||||||||
Lower |
Upper | ||||||||
Equal variances assumed |
2.47 |
0.1162 |
3.78 |
652 |
0.000 |
0.196 |
0.052 |
0.094 |
0.298 |
Equal variances not assumed |
|
|
3.48 |
186.42 |
0.001 |
0.196 |
0.056 |
0.085 |
0.307 |
В таблицах 4.3 и 4.4 приведен пример сравнения средних логарифмов душевых доходов в группах населения до 30 лет и старше 30. Статистика Ливиня в этом случае свидетельствует, что гипотеза равенства дисперсий не отвергается (sig=0.1162). Поэтому, для сравнения средних можно воспользоваться строкой" Equal variances assumed" - "Предполагаются равные дисперсии". Соответствующая статистика показывает, что средние различиются существенно (sig=0.000). Впрочем, даже если мы не удовлетворены статистикой Ливиня, в данном случае и без предположения равенства дисперсий мы можем утверждать то же самое (sig=0.001). Кроме того, это подтверждает и доверительный интервал, не включающий нуля.