Скачиваний:
93
Добавлен:
21.01.2014
Размер:
168.96 Кб
Скачать

Команда split file

Нередко возникает необходимость получить однотипные таблицы для различных групп наблюдений, а, возможно и сравнить их. С этой целью предусмотрена команда SPLIT FILE. Ее удобно запускать из меню редактора данных. Команда SPLIT FILE требует предварительной сортировки данных по переменным разбиения. В ней указываются переменные разбиения выборки, а также цель расщепления - получение независимых выдач для различных групп объектов (ключевое слово SEPARATE), или сравнение данных по группам (LAYERED). В последнем случае для большинства статистических программ выдачи по группам объединяются в единую таблицу.

Например, расщепление наших учебных данных выборки по полу с целью сравнения групп можно сделать программой.

SORT CASES BY v8 .

SPLIT FILE LAYERED BY v8 .

Descriptives Variables= v9 v14.

Команда Descriptives получает описательные статистики переменных. В таблице 2.2 благодаря команде SPLIT результаты работы команды Descriptives на разных группах по полу объединены в одну таблицу.

Таблица 2.2. Описательные статистики, полученные при расщеплении данных для сравнения групп

V8 Пол

N

Minimum

Maximum

Mean

Std. Deviation

1 муж.

V9 Возраст

354

16.0

76.0

39.6

13.0

V14 Ср.мес. душевой доход

341

21.0

1254.0

237.9

168.2

Valid N (listwise)

335

2 жен.

V9 Возраст

344

16.0

74.0

39.5

12.2

V14 Ср.мес. душевой доход

324

50.0

1500.0

219.8

132.8

Valid N (listwise)

317

При получении результатов для отдельных групп программой

SORT CASES BY v8 .

SPLIT FILE SEPARATE BY v8 .

Descriptives Variables= v9 v14.

будут получены две отдельные таблицы.

Взвешивание выборки weight

Социологи достаточно часто некорректно работают со статистическими данными. К примеру, перед ними стоит задача изучить социальные факторы людей, занятых в правовых органах. Известно, что в органах юстиции занято 2% трудоспособного населения. При определении объектов исследования на практике возникают трудности с репрезентативностью выборки. Например, если будет отобрано 500 человек, то из них может оказаться только 10 занятых в органах юстиции. Их обследование будет недостаточно для формирования выводов.

Поэтому социологи осознанно выбирают большее число занятых в этих органах, например 50 из 500. Иногда они рассчитывают целую половозрастную, отраслевую и т.д. таблицу, по которой решают, сколько человек в каждой социальной группе опросить. Это, как правило, деформирует выборку, от которой требуется репрезентация населения, например, всего города. Чтобы уменьшить влияние деформированности выборки на результаты статистического анализа, применяют взвешивание объектов: группы, которые были искусственно уменьшены, выбираются с весовым коэффициентом, превышающим единицу. Обычно суммарный вес объектов равен числу объектов в рассматриваемом файле.

Пусть, например, опрошено 300 человек, из них 100 мужчин, 200 женщин (бухгалтеров застать на рабочем месте было проще всего). Предполагается, что в генеральной совокупности 50% мужчин, 50% женщин. Целесообразно учитывать мужчину с весом 1.5, а женщину - с весом 0.75, тогда с учетом весов выборка будет выровнена.

Пусть переменная SEX содержит сведения о поле респондентов (1 - мужской, 2 - женский). Соответствующие веса будут назначены соответствующими командами

Recode SEX (1=1.5)(2=0.75) into wsex.

WEIGHT by wsex

Execute.

Вообще, если известно распределение объектов k групп в генеральной совокупности p1,…,pk; получено частотное распределение n1,…,nk, то i-й группе должен быть приписан вес wi=pi/ni*n, где n=.

Назначение веса можно сделать также через меню редактора данных (DATA->WEIGHT CASES).

Замечания: взвешивание - это не физическое повторение наблюдения. Если значение веса отрицательное или неопределенное (предварительно определенное как SYSMIS), то оно обрабатывается статистическими процедурами как вес, равный нулю.

Соседние файлы в папке Учебник по SPSS, учебное пособие