1. Имя переменной.
Имя должно начинаться с буквы и не должно заканчиваться точкой. В имени не должны использоваться пробелы и специальные символы (!, ?, * и др.), а также следует избегать в конце имени знака нижнего подчеркивания _. Длина имени не должны превышать 64 символа.
2. Тип переменной.
Указывается, о какой переменной идет речь: числовой, текстовой, формата даты или другие варианты.
3. Число цифр или символов в переменной. Задается максимальное число символов в значении переменной.
4. Число десятичных знаков. Задается число выводимых десятичных знаков.
5. И 6. Описательные метки переменных и значений.
Метки переменных поясняют содержательную часть переменной (по сути содержание самого вопроса или показателя), могут быть до 256 символов и содержать пробелы и символы, использование которых не допускается в именах переменных.
Метки значений поясняют содержательную часть каждого значения отдельной переменной (например, поясняют, что 1 означает мужской пол, 2 – женский пол) могут быть длиной до 60 символов и не применяются к длинным текстовым переменным.
7. Пропущенные значения.
Определенные значения переменной задаются как пользовательские пропущенные. Например, Вы хотите подводить итоги обследования по данному вопросу без учета тех анкет, а которых нет ответа на этот вопрос. Значения, помеченные как пользовательские пропущенные, помечаются для специальной обработки и исключаются из большинства вычислений.
Одновременно можно задать до трех отдельных пользовательских пропущенных значений для каждой переменной, диапазоны пропущенных значений могут быть заданы только для числовых переменных.
8. Ширина столбца.
9. Выравнивание значений в столбце. Возможно выравнивание по левому краю, правому краю, по центру.
10. Шкала измерений (имеет значение при построении таблиц).
Вы можете выбрать одну из трех шкал измерения:
Количественная. Значения данных представляют собой числовые значения (например, возраст, доход).
Порядковая. Значения данных представляют собой категории (градации) с некоторым естественным упорядочением (например: низкий, средний, высокий или: полностью не удовлетворен, скорее не удовлетворен, скорее удовлетворен, полностью удовлетворен). Порядковые переменные могут быть текстовыми или числовыми значениями, представляющими различные категории (например: 1-низкий, 2-средний, 3-высокий).
Номинальная. Значения данных представляют собой категории (градации) для которых не задано естественное упорядочение (примерами могут служить отделы компании, субъекты РФ).
Все свойства переменных могут быть изменены путем изменения значений в ячейках в закладке «переменные». Щелчок по конкретной ячейке вызывает окно, в котором можно изменить свойства переменной. Кроме того, значения ячеек могут быть скопированы и вставлены в другие ячейки. Это особенно полезно при задании меток значений и пропущенных значений для нескольких однотипных переменных.
ВВОД ДАННЫХ
Вводить данные можно прямо в Редактор данных в закладке Данные в любую ячейку. Для пременных всех типов, кроме простых числовых, прежде чем вводить данные, необходимо сначала задать тип переменной.
Если вводить значение в пустой столбец, Редактор данных автоматически создаст новую переменную и присвоит ей имя (VAR00001) и формат по умолчанию (числовой).
Кроме того, данные могут быть подготовлены заранее другими программными средствами. SPSS позволяет открывать и работать с файлами данных любых форматов. Например, для открытия файла в формате *.xls, необходимо нажать Файл…Открыть…Данные…

Если данных хранятся в базе данных, то для того, чтобы их открыть, нужно использовать Конструктор баз данных (Файл…Открыть базу данных…Новый запрос…).

ПРЕОБРАЗОВАНИЕ ДАННЫХ
Вычисление переменных.
Выберите в меню:
Преобразовать
Вычислить переменную…

Введите имя вычисляемой переменной. Ей может быть существующая или новая переменная. Если Вы выбрали уже существующую, то следует иметь ввиду, что вычисленные новые значения заменят существующие значения и возврата к старым значениям не будет. Введем, например, имя «godrab», что будет означать «Количество лет работы на данном месте». Эту метку введем, щелкнув мышкой по «Тип и метка».

После нажатия клавиши «продолжить», можно закладывать формулу расчета. При этом можно воспользоваться более 70 встроенных функций, включая арифметические, статистические, текстовые и функции рапсределения. У нас в примере есть переменная «jobtime» – время работы с момента поступления (месяцы). Для того, чтобы месяцы перевести в годы, нам достаточно разделить эту переменную на 12. Эту формулу и закладываем в расчет:

После нажатия клавиши «ОК», в редакторе данных появляется дополнительный столбик с переменной «godrab», где стоит количество лет, отработанных на данном месте работы, а на вкладке переменные добавилась новая переменная.

Следует иметь ввиду, что в функциях и арифметических выражениях пропущенные значения обрабатываются по-разному. В выражении:
(var1 + var2 + var3) / 3
результатом будет пропущенное значение в случае, если значение хотя бы одной из трех переменных является пропущенным значением.
В выражении:
MEAN (var1, var2, var3)
результатом будет пропущенное значение только в том случае, если все три переменные являются пропущенными значениями.
Можно задать минимальное число значений, которые не должны иметь пропущенных значений, например, средняя величина из трех переменных может быть вычислена, если значения имеют минимум две из них:
MEAN.2 (var1, var2, var3)
Пользуясь кнопкой «Если» можно сделать вычисления не для всех значений исходной переменной, а только по тем, для которых выполняется то или иное условие.
Перекодировка переменных.
Первоначально собранные данные можно перекодировать с помощью средств SPSS. Это бывает необходимо, когда первоначальное разнообразие исходных данных не нужно для последующего анализа. Перекодирование в таком случае означает уменьшение объема обрабатываемой информации.
Выберите в меню:
Преобразовать
Перекодировать
В другие переменные…

Лучше всего выбирать перекодировку в другие переменные, нежели перекодировку в те же переменные. Представьте, что Вы делаете перекодировку возраста в числовых значениях в интервальные значения. Если же выбран режим перекодировки в те же переменные, то исходные данные возраста будут затерты интервалами и восстановить их уже не получится.
Далее выберите переменные для перекодировки (можно несколько, но они должны быть одного типа (числовые или текстовые).
Введите имя для каждой выходной (новой) переменной и щелкните Изменить.

Щелкните по кнопке Старые и новые значения и задайте перекодировку значений.
Старое значение – перекодируемое(ые) значение(я). Значение. Отдельное старое значение, которое нужно перекодировать в новое. Системное пропущенное (или пользовательское тоже). Такие значения (не заполненные числовые поля, неответы респондентов) иногда необходимо выделять в отдельную группу. Диапазон. Доступен только для числовых переменных и позволяет объединять в одно новое значение несколько старых в выбранном диапазоне (интервальная группировка).
Новое значение – значение, в которое будут перекодированы одно или несколько старых значений. Можно выбрать Скопировать старое значение для тех, где перекодировка не нужна. Также старые значения числовой переменной можно перекодировать в новые текстовые, выбрав Новые переменные – текстовые.

РАБОТА С ФАЙЛАМИ.
Сортировка наблюдений.
Выберите в меню:
Данные
Сортировать наблюдения…
Можно выбрать одну или несколько переменных. Если, например, выбраны пол и национальность, то сначала наблюдения сортируются по полу, а затем внутри каждой полученной категории сортируются по значениям переменной национальность.
Транспонировать.
Выберите в меню:
Данные
Транспонировать…
В результате транспонирования создается новый файл, в котором строки и столбцы меняются местами.
Объединение файлов данных.
Файлы можно объединить двумя различными способами:
– Слить файлы, содержащие одни и те же переменные, но различные наблюдения
– Слить файлы, содержащие одни и те же наблюдения, но различный состав переменных.
В первом случае выберите в меню:
Данные
Слить файлы
Добавить наблюдения…
После этого выберите файл данных, который нужно добавить к открытому файлу данных. Удалите из списка Переменные в новом рабочем файле данных все переменные, которых не должно быть в объединенном файле. Из списка Непарные переменные добавьте любые пары переменных, представляющие одну и ту же переменную, но записанную под различными именами в двух файлах.
Во втором случае выберите в меню:
Данные
Слить файлы
Добавить переменные…
Перед слиянием необходимо убедиться, что наблюдения в обоих файлах отсортированы в одинаковом порядке, особенно если используется слияние по ключу. Имена переменных во втором файле данных, совпадающие с именами переменных в рабочем файле данных по умолчанию исключаются, поскольку предполагается, что они содержат одну и ту же информацию.
Если в одном из файлов отсутствуют некоторые отдельные наблюдения, то для корректного слияния можно использовать переменные – ключи.
Преобразования временных рядов.
Преобразования временных рядов предполагают такую структуру файла данных, в которой каждая строка (наблюдение) представляет набор характеристик в определенный момент времени, а интервалы времени между наблюдениями равны.
Процедура Задать даты генерирует переменные, которые могут быть использованы для выделения периодических компонент временного ряда.
Наблюдения – это. Здесь задаются единицы времени, которые будут использоваться для создания дат.
Первое наблюдение. Здесь задается значение начальной даты, которое будет присвоено первому наблюдению. Последующим наблюдениям будут присвоены последовательные значения, основанные на заданном интервале времени.
Выберите в меню:
Данные
Задать даты…
Выберите временной интервал из списка Наблюдения – это.
Введите значения даты в поля Первое наблюдение.
Переменные, созданные процедурой Задать даты отличаются от переменных, имеющих формат типа Данные, который определяется при задании свойств переменных. Значения переменных, созданных процедурой Задать даты, - это целые положительные числа, каждое из которых представляет количество дней, недель, часов или других единиц времени, прошедших с заданного Вами начального момента времени.
Выберите в меню:
Преобразовать
Создать временной ряд…
Процедура создать временной ряд используется для создания новых переменных, которые являются функциями существующих переменных, образующих временной ряд.
Функции, предназначенные для создания временных рядов, включают разности, скользящие средние, скользящие медианы, функции задержки (лаги) и опережения.
Некоторые процедуры анализа временных рядов не работают при наличии пропущенных значений. В окне Заменить пропущенные значения задаются параметры новых переменных, содержащих временные ряды, в которых пропущенные значения заменены оценками, которые могут быть вычислены одним из нескольких способов.
Выберите в меню:
Преобразовать
Заменить пропущенные значения…
Выберите метод, который Вы хотите использовать для замены пропущенных значений.
ЧАСТОТЫ
Процедура Частоты дает возможность вычислять статистики и строить диаграммы, полезные для описания многих типов переменных.
Выберите в меню:
Анализ
Описательные статистики
Частоты…

Выберите одну или несколько категориальных или количественных переменных.
Дополнительно Вы можете:
-
Щелкнуть мышью по кнопке Статистики, чтобы задать вычисление описательных статистик для количественных переменных (среднее, мода, медиана и др.).
-
Щелкнуть мышью по кнопке Диаграммы, чтобы задать вывод столбиковых диаграмм, круговых диаграмм и гистограмм.
-
Щелкнуть мышью по кнопке Формат, чтобы задать порядок, в котором будут выводиться результаты.
Пример вывода:
Статистики
Количество лет, потраченных на образование
|
N |
Валидные |
474 |
|
Пропущенные |
0 |
|
|
Среднее |
13.49 |
|
|
Медиана |
12.00 |
|
|
Стд.отклонение |
2.885 |
|
Количество лет, потраченных на образование
|
|
Частота |
Процент |
Валидный процент |
Кумулятивный процент |
|
|
Валидные |
8 |
53 |
11.2 |
11.2 |
11.2 |
|
12 |
190 |
40.1 |
40.1 |
51.3 |
|
|
14 |
6 |
1.3 |
1.3 |
52.5 |
|
|
15 |
116 |
24.5 |
24.5 |
77.0 |
|
|
16 |
59 |
12.4 |
12.4 |
89.5 |
|
|
17 |
11 |
2.3 |
2.3 |
91.8 |
|
|
18 |
9 |
1.9 |
1.9 |
93.7 |
|
|
19 |
27 |
5.7 |
5.7 |
99.4 |
|
|
20 |
2 |
.4 |
.4 |
99.8 |
|
|
21 |
1 |
.2 |
.2 |
100.0 |
|
|
Итого |
474 |
100.0 |
100.0 |
|
|

ОПИСАТЕЛЬНЫЕ СТАТИСТИКИ
Процедура Описательные статистики осуществляет вывод одномерных итожащих статистик для нескольких переменных в одной таблице.
Выберите в меню:
Анализ
Описательные статистики
Описательные…

Пример вывода:
Описательные статистики
|
|
N |
Минимум |
Максимум |
Среднее |
Стд. отклонение |
|
Количество лет, потраченных на образование |
474 |
8 |
21 |
13.49 |
2.885 |
|
Начальная зарплата |
474 |
$9,000 |
$79,980 |
$17,016.09 |
$7,870.638 |
|
Зарплата в настоящее время |
474 |
$15,750 |
$135,000 |
$34,419.57 |
$17,075.661 |
|
Время работы с момента поступления (месяцы) |
474 |
63 |
98 |
81.11 |
10.061 |
|
N валидных (целиком) |
474 |
|
|
|
|
ТАБЛИЦЫ СОПРЯЖЕННОСТИ
Процедура Таблицы сопряженности формирует двумерные и многомерные таблицы, а также вычисляет целый ряд критериев и мер силы связи для двумерных таблиц. Таким образом, таблицы сопряжённости применяются, когда нас интересует двумерный анализ, а также когда необходимо выяснить, существует ли взаимосвязь между двумя переменными.
Выберите в меню:
Анализ
Описательные статистики
Таблицы сопряженности…

Выберите одну или несколько переменных для строк и одну или несколько переменных для столбцов.
Дополнительно Вы можете:
- выбрать одну или несколько переменных для слоев;
- щелкнуть мышью по кнопке Статистики и выбрать нужные критерии и меры силы связи для двумерных таблиц и подтаблиц;
- щелкнуть мышью по кнопке Ячейки, чтобы задать вывод наблюденных и ожидаемых значений, процентов, а также остатков;
- щелкнуть мышью по кнопке Формат для задания порядка, в котором следует располагать категории.
Пример вывода:
Таблица сопряженности Категория занятости * Принадлежность к национальному меньшинству
Частота
|
|
Принадлежность к национальному меньшинству |
Итого |
||
|
|
Нет |
Да |
|
|
|
Категория занятости |
Сотрудник секретариата |
276 |
87 |
363 |
|
|
Сотрудник среднего звена |
14 |
13 |
27 |
|
|
Менеджер |
80 |
4 |
84 |
|
Итого |
370 |
104 |
474 |
|
Таблица сопряженности Пол сотрудника * Категория занятости
Частота
|
|
Категория занятости |
Итого |
|||
|
|
Сотрудник секретариата |
Сотрудник среднего звена |
Менеджер |
|
|
|
Пол сотрудника |
Женский |
206 |
0 |
10 |
216 |
|
|
Мужской |
157 |
27 |
74 |
258 |
|
Итого |
363 |
27 |
84 |
474 |
|
