Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Архив WinRAR / Rost SPSS.doc
Скачиваний:
51
Добавлен:
15.05.2015
Размер:
8.1 Mб
Скачать

2.6. Операции с файлами

2.6.1. Агрегирование данных (командаAggregate)

Нередко на основе собранных данных необходимо получить статистичес­кие сведения об укрупненных объектах. Для этого на базе исходной ма­трицы создается и обрабатывается новая матрица агрегированных данных.

Пример. На рис. 2.2 приведены анкетные данные обследования рабочих нескольких заводов. Объекты – информация о рабочих. В данных в виде переменных содержатся номер завода и номер цеха, в котором трудится респондент. На основе собранной информации вычисляется новый массив данных, в которых объектами являются цеха, признаками – статистические сведения по цехам, например, доля мужчин в цехе (в %), средний возраст и т. д. Соотношение двух массивов информации приведено на рис. 2.2.

Новую матрицу агрегированных данных, организованную по тому же принципу «объект – признак», что и исходная матрица, можно получить с помощью команды AGGREGATE.

AGGREGATE /OUTFILE = 'ZECH.SPS'/BREAK ZAVOD ZECH

/PERCM = PLT(POL,2) /SRWOZR = MEAN(WOZR).

Исходные данные Агрегированные данные

Завод

Цех

№ ан­кеты

Пол

Возраст

Завод

Цех

Доля

мужч.

Средний

возраст

┌────┬────┬──────┬───┬─────┬─── ┌────┬───┬─────┬──────┬──

│ 1 │ 1 │ 1 │ 1 │ 35 │..──┬─── │ 1 │ 1 │ 50.0│ 30.0 │..

┌────┬────┬──────┬───┬─────┬─── │ ┌────┬───┬─────┬──────┬──

│ 1 │ 1 │ 2 │ 2 │ 25 │..──┘┌── │ 1 │ 2 │ 66.6│ 28.3 │..

┌────┬────┬──────┬───┬─────┬─── │ ┌────┬───┬─────┬──────┬──

│ 1 │ 2 │ 3 │ 1 │ 40 │..───┤┌─ │ 2 │ 1 │ 45.2│ 42.2 │..

┌────┬────┬──────┬───┬─────┬─── ││ ........ ─────┬──────┬──

│ 1 │ 2 │ 4 │ 2 │ 18 │..───┤│

┌────┬────┬──────┬───┬─────┬─── ││

│ 1 │ 2 │ 5 │ 1 │ 27 │..───┘│

┌────┬────┬──────┬───┬─────┬─── │

│ 2 │ 1 │ 6 │ 2 │ 35 │..────┤

┌────┬────┬──────┬───┬─────┬─── │

│ 2 │ 1 │ 7 │ 1 │ 44 │..────┤

............................. │

Рис. 2.2. Агрегирование данных

В подкоманде /OUTFILEуказывается имя выходного файла; в подкоманде/BREAKназначаются переменные «разрыва» файла данных, которые определяют агрегируемые группы объектов. Далее задаются разделенные слэшами «/» имена новых переменных и функций (статистики), с использованием которых агрегируются исходные переменные, например:

Z9 "средний возраст" = MEAN(V9)/PM = PLT(V8,2).

Перед именем функции агрегирования знак равенства «=» обязателен. В списке допускается указание нескольких переменных для одной функции, в списках переменных можно использовать ключевое словоTO (Z9 Z14 = MEAN(V9 V14)/d1 to d6 = pgt(d1 to d6,0)). Число переменных в аргументе функции должно совпадать с числом новых переменных.

2.6.1.1. Функции агрегирования

В приведенном ниже списке функций идентификатор VARSозначает список переменных или переменную.

N(VARS)– число объектов, для которыхVARSопределены;

N– без указания переменных – число объектов в агрегируемой группе;

MIN(VARS)– минимум;

MAX(VARS)– максимум;

SD(VARS)– стандартное отклонение;

PGT(VARS, значение)– процент объектов, у которых переменная имеет значение большее, чем указанное в команде;

PLT(VARS, значение) – процент объектов, у которых переменная имеет значение меньшее, чем указанное в команде;

PIN(VARS, значение1, значение2) – процент объектов, которые находятся в интервале [значение1, значение2];

POUT(VARS, значение1, значение2) – процент объектов, которые находятся вне интервала [значение1, значение2];

FGT(VARS, значение)– доля объектов, у которых переменная имеет значение большее, чем указанное в команде;

FLT(VARS, значение) – доля объектов, у которых переменная имеет значение меньшее, чем указанное в команде;

FIN(VARS, значение1, значение2) – доля объектов, которые находятся в интервале [значение1, значение2];

FOUT(VARS, значение1, значение2) – доля объектов, которые находятся вне интервала [значение1, значение2];

FIRST(VARS)– первое значение переменной;

LAST(VARS)– последнее значение переменной.