Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
61
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

4.1.3. Двухвыборочныйt-тестдля связанных выборок (Paired sample t-test)

Если на одних и тех же объектах дважды измеряется некоторое свойство, то проверка значимости различия средних по измеренным переменным осуществляется этим тестом. Пример задания команды:

T-TEST PAIRS = x WITH y (PAIRED) /CRITERIA = CIN(.95).

Переменные xиyмогут быть характеристиками мужа и жены при исследовании семей; по данным RLMS – измерениями, связанными с потреблением напитков в 1996 и 1998 г., и т. п. Поэтому данная процедура полезна для анализа панельных данных.

Почему же здесь нельзя воспользоваться таким же анализом, как и для двух несвязанных выборок, считая, что имеются две выборки одинакового объема?

Проверка значимости различия матожиданий xиyэквивалентна проверке гипотезы о равенстве нулю математического ожидания разности y. Дисперсия разности yравна( y) =(x) +D(y) 2 cov (X,Y). Отсюда точность оценки матожиданий yсвязана с ковариациейxиy.

Поэтому наряду с соответствующей статистикой в выдачу по этому тесту входит и коэффициент корреляции этих переменных и наблюдаемая значимость.

Для примера взгляните на выдачу, в которой сравниваются вес 1995 и 1996 г. женщин от 30 до 40 лет (в 1995 г.), табл. 4.5 – 7, данные RLMS.

Таблица 4.5

T-тест на связанных выборках, описательные статистики

Mean

N

Std. Deviation

Std. Error Mean

AM1 Вес 1995

67,59

793

13,72

0,49

BM1 Вес 1996

68,12

793

14,22

0,50

Таблица 4.6

T-тест на связанных выборках, корреляции

N

Correlation

Sig.

AM1  Вес 1995 & BM1  Вес 1996

793

0,914

0,0000

Таблица 4.7

T-тест на связанных выборках, сравнение средних

Paired Differences Mean

Std. Deviation

Std. Error Mean

95 % Con­fi­dence Interval of the Difference

t

df

Sig. (2-tailed)

Lower

Upper

AM1 Вес 1995 & BM1 Вес 1996

–0,53

5,81

0,21

–0,93

–0,12

–2,547

792

0,011

Женщины в среднем набрали по полкилограмма веса, и этот прирост статистически значим. Значим и коэффициент корреляции – вес в целом имеет свойство сохраняться.

4.1.4. КомандаMeans– сравнение характеристик числовой переменной по группам

Процедура вычисляет одномерные статистики в группах – все описательные статистики, которые вычислялись командами DESCRIPTIVESиFREQUENCIES, а также гармоническое среднее, среднее геометрическое, проценты сумм значений переменных в группах и др. – всего 20 харак­те­ристик. Поэтому имя командыMEANS(cредние) сохранилось лишь «исторически», оно пришло из ранних версий SPSS, где ее назначением, действительно, было сравнение средних. В диалоговом окне для назначения статистик используется кнопкаOptions. Проводится также одномерный дисперсионный анализ.

MEANS TABLES = v14 BY v11 BY v8 /CELLS MEAN STDDEV MEDIAN COUNT /STATISTICS ANOVA.

В команде указывается список зависимых переменных, BYи список переменных, определяющих группы. Каждое дополнительное словоBYпорождает следующий нижний уровень группирования, в диалоговом режиме словуBYсоответствует кнопкаNext.

Анализ результатов (табл. 4.8) позволяет сделать следующие выводы. Самый высокий среднемесячный доход (332 р.) имеют разведенные мужчины, при этом он значительно превосходит среднемесячный доход, полученный всеми разведенными (249 р.) и всеми мужчинами (238 р.). На втором месте по доходам находятся вдовцы (276 р.), но их всего 5 человек, поэтому цифра ненадежна. Среди женщин наиболее высокие среднемесячные доходы (226 р.) у состоящих в браке, что почти равно доходам женатых мужчин. Это естественно – ведь это же душевой доход в семье.

Мы можем сколько угодно описывать эту таблицу, но описание не будет доказательством какой-либо истины, пока оно не подтверждено статистическим выводом. Такая таблица может быть только источником гипотез о взаимосвязи, которые в дальнейшем следует проверить.

Одномерный дисперсионный анализ здесь проводится только по переменным первого уровня задания групп.

Напомним, что суть этого анализа состоит в вычислениии межгруппового квадратичныого разброса зависимой переменной SSв(Between groups) и внутригруппового разброса, обозначаетсяSSw(Within groups). ВеличинаSSвхарактеризует, насколько сильно отклонились от общего среднего средние между группами, аSSw– отклонения от центров групп. Статистикав условиях гипотезы равенства средних и дисперсий распределения при нормальном распределенииXв группах имеет распределение Фишера.Fпредставляет собой в определенном смысле расстояние наблюдаемой таблицы от таблицы, в которой нет никаких зависимостей, т. е. средние в группах совпадают. Чем большеF, тем существеннее зависимость, однако сама по себе величинаFни о чем не говорит. Ответ на вопрос дает, как обычно, величина наблюдаемой значимостиF-критерия:Significance– вероятность случайно получить значениеF, большее выборочного Sig = P{F >Fвыб.}.

Таблица 4.8