- •12 Лекция 9-10. Spss
- •Визуализация различий средних значений.
- •Результаты выполнения команды means, приведенной на рисунке 3.2
- •Столбиковая диаграмма значений средней заработной платы в населенных пунктах различного типа
- •.2.1. Команда t-Test для сравнения двух независимых выборок.
- •Результаты выполнения команды сравнения средних возрастов респондентов, проживающих в столицах и в больших городах
- •3.2.2. Команда t-Test для одной выборки.
- •3.2.3. Команда t-Test для парных данных.
- •3 Однофакторный дисперсионный анализ.
3.2.3. Команда t-Test для парных данных.
Еще одна исследовательская задача, которая достаточно часто возникает при анализе социологических данных это ситуация сравнения средних значений двух отдельных переменных на предмет выяснения вопроса о том, средние значение какой из них больше, а какой – меньше. К примеру, в ходе известного панельного социологического исследований «Российский мониторинг экономики и здоровья» (RLMS) одним из направлений изучения является анализ экономических источников жизни россиян. В рамках этого направления в ходе опроса у респондентов спрашивали о том, какое количество овощей, выращенных на собственных приусадебных или дачных участках они потребили в течении последнего года, а какую часть из этих овощей продали. В этой связи весьма важно выяснить то, есть ли разница между размерами доходов семей от продажи различных овощей.
Очевидно, что в данном случае мы снова имеем дело с задачей проверки различия средних значений, но уже в отношении двух отдельных переменных, измеренных в рамках одной выборки. Эту ситуацию иногда называют сравнением парных данных. С точки зрения математической статистики в данном случае проверяется статистическая гипотеза H0: μ1 = μ2, где μ1 и μ2 средние значения переменных x1 и x2, против альтернативы H1: μ1 ≠ μ2 .
Решение данной задачи в рамках пакета SPSS осуществляется с помощью команды Paired Samples T Test (Т-тест для парных выборок). Меню данной команды представлено на рисунке 3.11.
В меню рисунка 3.11 показано, что требуется сравнение средних значений переменных ed8.4b и ed8.5d – переменных, фиксирующих количество свеклы и моркови, которые собрали семьи на своих приусадебных участках3. Результаты работы команды, показанной на рисунке 3.11, приведены в таблице 3.5.
Таблица 3.5
Результаты выполнения команды сравнения
средних значений двух переменных
Paired Samples Statistics
|
|
Mean |
N |
Std. Deviation |
Std. Error Mean |
Pair 1 |
Сколько всего килограмм собрали? Свеклы |
96,5359 |
1841 |
2335,66058 |
54,43558 |
Сколько всего килограмм собрали? Моркови |
73,1684 |
1841 |
1166,70392 |
27,19154 |
Paired Samples Correlations
|
|
N |
Correlation |
Sig. |
Pair 1 |
Сколько всего килограмм собрали? Свеклы & Сколько всего килограмм собрали? Моркови |
1841 |
,996 |
,000 |
Paired Samples Test
|
|
Paired Differences |
t |
df |
Sig. (2-tailed) |
||
|
|
Mean |
Std. Deviation |
Std. Error Mean |
|||
Pair 1 |
Сколько всего килограмм собрали? Свеклы - Сколько всего килограмм собрали? Моркови |
23,3675 |
1178,5864 |
27,46847 |
,851 |
1840 |
,395 |
Таблица 3.5 демонстрирует, что результаты работы команды Т-тест на парных данных представляются в виде 3-х таблиц. Первая из них содержит показатели описательной статистики для пары анализируемых переменных, вторая – коэффициент корреляции Пирсона между этими переменными с оценкой уровня значимости этого коэффициента. Третья таблица (Paired Samples Test) собственно и посвящена представлению результатов проверки статистической гипотезы H0. Для проверки этой гипотезы, как и в предыдущих командах Т-тест, используется t-статистика. В таблице содержатся значения этой статистики, которая имеет распределение Стьюдента (см. Приложение), число степеней свободы (df) и оценка значимости полученного значения t-статистики (Sig. 2-tailed).
С точки зрения статистики таблица 3.5 показывает, что вероятность справедливости гипотезы H0: μ1 = μ2 составляет P=0,395. С социологической точки зрения проведенный анализ показывает, что не смотря на весьма существенную разницу между средним количеством собираемых свеклы и моркови, мы не имеем статистических оснований утверждать наличие различий в объемах выращивания россиянами этих овощей.
Почему в данном случае довольно большие различия в объемах выращивания рассматриваемых овощей (96,5 кг и 73,2 кг) тем не менее, не дают статистических оснований для констатации статистической разницы? Ответ довольно прост: обе эти переменные имеют очень высокие значения показателей вариации – стандартного отклонения.