Скачиваний:
93
Добавлен:
21.01.2014
Размер:
168.96 Кб
Скачать

Пример 2.1

Приемы использования команд описания и преобразования данных рассмотрены нами на примере анкеты "Курильские острова".

Задача. На основании ответов на вопросы анкеты получить переменную, отражающую степень противостояния СССР и Японии.

Решением этой задачи может быть переменная, в зависимости от ответов респондентов имеющая значения:

1. Япония противостоит Союзу и Союз - Японии, т.е. противостояние взаимно.

2. Одна из сторон (Япония или Союз) против контактов.

3. Стороны не противостоят по отношению друг к другу.

Основой для конструирования такой переменной используем ответы на вопрос анкеты "III. Как Вы считаете, что мешает подписать мирный договор между СССР и Японией?" с подсказками:

1. Нет настоятельной необходимости, отношения и без того нормальные.

2. Традиционное недоверие друг к другу в результате войн в прошлом.

3. Слабая экономическая заинтересованность Японии.

4. Разные политические симпатии СССР и Японии.

5. Нежелание Японии признать послевоенные границы с СССР.

6. Нежелание СССР рассматривать вопрос о спорных островах.

7. Другое (что именно).

8. Не знаю, затрудняюсь сказать.

Под ответы на вопрос III в матрице данных отведено восемь столбцов, поименованных V3S1 - V3S8; для заполнения ответов по этому вопросу используется кодирование в виде списка. Анализируя ответы, строим переменную ТР, соответствующую этим трем типам. Для этого построим вспомогательные переменные Т1 и Т2, являющиеся индикаторами того, что Япония противостоит СССР и СССР противостоит Японии, соответственно.

Построить такие переменные можно воспользовавшись командами

COUNT T1 = V3S1 to V3S7 (2,5) /

T2 = V3S1 to V3S7 (2,6).

В результате выполнения команды переменной T1присваивается либо 1 (когда в анкете была обведена одна из двух подсказок: 2 или 5); либо 2 ( когда обведены обе подсказки) и 0, если респондент не обвел ни подсказку 2, ни подсказку 5. По аналогии заполнены значениями - количествами обведенных соответствующих подсказок - переменныеBиТ2.

COMPUTE OPPOS=3.

IF ( T1 > 0 | T2>0) OPPOS = 2.

IF (T1 > 0 & T2>0) OPPOS = 1.

Execute.

Variable labels oppos 'Степень противостояния ссср и Японии'

T1 'Противостояние Японии' T2. 'Противостояние СССР'.

Value labels oppos 1 'Взаимное' 2 'Одна из сторон' 3 'Нет противостояния'.

Здесь первая команда IF затирает значение 3 кодом 2, а вторая команда IF "затирает" код 2 кодом 3.

Есть и другой путь решения этой задачи:

COUNT T1 = V3S1 to V3S7 (2,5) /

T2 = V3S1 to V3S7 (2,6).

Recode T1 T2(2=1).

COMPUTE OPPOS=3-(T1+T2).

А можно и так

COUNT T1 = V3S1 to V3S7 (2,5) /

T2 = V3S1 to V3S7 (2,6).

COMPUTE OPPOS=3-((T1>0)+(T2>0)).

Таким образом, OPPOS=1 для первого типа респондентов, OPPOS=2 для второго, OPPOS =3 для третьего. Построенная переменная позволяет проводить в дальнейшем многосторонний анализ выделенных типов населения: возрастной структуры, социального положения, образования и т.д.

2.5. Операции с файлами Агрегирование данных (команда aggregate)

Нередко на основе собранных данных необходимо получить статистические сведения об укрупненных объектах. Для этого на базе исходной матрицы создается и обрабатывается статистическим пакетом новая матрица данных.

Пример. На рис.2.3 приведены данные анкетного обследовании рабочих нескольких заводов. Объекты - информация о рабочих. В данных содержится в виде переменной номер завода и номер цеха, в котором трудится респондент. На основе собранных данных вычисляется новый массив информации, в котором объектами являются цеха, признаками - статистические сведения по цехам, например, доля мужчин в цехе (в %), средний возраст и т.д. Соотношение двух массивов информации приведено на рис.2.3.

Исходные данные Агрегированные данные

Завод Цех Номер Пол Возраст .. Завод Цех Доля Средний

анкеты мужч возраст

┌─────┬────┬──────┬───┬─────┬─── ┌────┬───┬─────┬──────┬──

│ 1 │ 1 │ 1 │ 1 │ 35 │..──┬─── │ 1 │ 1 │ 50.0│ 30.0 │..

┌─────┬────┬──────┬───┬─────┬─── │ ┌────┬───┬─────┬──────┬──

│ 1 │ 1 │ 2 │ 2 │ 25 │..──┘┌── │ 1 │ 2 │ 66.6│ 28.3 │..

┌─────┬────┬──────┬───┬─────┬─── │ ┌────┬───┬─────┬──────┬──

│ 1 │ 2 │ 3 │ 1 │ 40 │..───┤┌─ │ 2 │ 1 │ 45.2│ 42.2 │..

┌─────┬────┬──────┬───┬─────┬─── ││ ........ ─────┬──────┬──

│ 1 │ 2 │ 4 │ 2 │ 18 │..───┤│

┌─────┬────┬──────┬───┬─────┬─── ││

│ 1 │ 2 │ 5 │ 1 │ 27 │..───┘│

┌─────┬────┬──────┬───┬─────┬─── │

│ 2 │ 1 │ 6 │ 2 │ 35 │..────┤

┌─────┬────┬──────┬───┬─────┬─── │

│ 2 │ 1 │ 7 │ 1 │ 44 │..────┤

.............................. │

Рис.2.3. Агрегирование данных

Новую матрицу агрегированных данных, организованную по тому же принципу "объект-признак", что и исходная матрица, можно получить с помощью команды AGGREGATE.

AGGREGATE /OUTFILE = 'ZECH.SPS'/BREAK ZAVOD ZECH

/PERCM = PLT(POL,2) /SRWOZR=MEAN(WOZR).

Основной способ употребления команды: подкомандой /OUTFILE указывается имя выходного файла; подкомандой /BREAK назначаются переменные "разрыва" файла данных, которыми определяются агрегируемые группы объектов. Далее записываются разделенные слэша ми "/" имена новых переменных и функции (статистики) которыми агрегируются исходные переменные, например:

Z9 "средний возраст"= MEAN(V9)/PM=PLT(V8,2).

Перед именем функции агрегирования знак равенства "=" ОБЯЗАТЕЛЕН. В списке допускается указание нескольких переменных для одной функции, в списках переменных можно использовать ключевое слово TO ( Z9 Z14= MEAN(V9 V14)/d1 to d6 = pgt(d1 to d6,0)). Число переменных в аргументе функции должно совпадать с числом новых переменных.

Соседние файлы в папке Учебник по SPSS, учебное пособие