Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
158
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

219

Работа с файлами

Как идентифицируются группы наблюдений в рабочем файле данных?Группа наблюдений представляет собой группу строк, связанных между собой, поскольку они относятся к одной единице наблюдения, например, человеку или организации. Конструктору необходима информация о том, какие переменные рабочего файла идентифицируют группы наблюдений, для того, чтобы объединить эти наблюдения в одну строку в новом файле данных. Переместите переменные, которые идентифицируют группы наблюдений в рабочем файле данных, в список Переменные для идентификации. Переменные, использованные для расщепления в рабочем файле данных, автоматически используются для идентификации групп наблюдений. Всякий раз, когда встречается новая комбинация идентификационных значений, конструктор создает новую строку, поэтому наблюдения в рабочем файле данных должны быть отсортированы по значениям идентификационных переменных в таком же порядке, в каком порядке переменные

перечислены в списке Переменные для идентификации. Если рабочий файл данных еще не отсортирован, Вы можете выполнить сортировку на следующем шаге.

Каким образом должны быть созданы группы переменных в новом файле данных? В

исходном файле переменная занимает один столбец. В новом файле данных эта переменная будет занимать несколько столбцов. Индексные переменные - это переменные рабочего файла данных, которые конструктор использует для создания новых столбцов данных. Реструктурированные данные будут содержать по одной новой переменной на каждое уникальное значение в этих столбцах. Переместите переменные, которые должны использоваться для образования групп переменных, в список Индексные переменные. Когда конструктор предоставляет такую возможность, Вы можете выбрать упорядочение новых столбцов по индексу.

Что происходит с остальными столбцами? Конструктор автоматически решает, что делать с переменными, которые остались в списке Переменные текущего файла. Он проверяет каждую переменную на предмет изменения значений внутри группы наблюдений. Если они изменяются, конструктор реструктурирует значения в группу переменных в новом файле данных. Если нет, то конструктор копирует значения в новый файл данных. В процессе выяснения того, изменяются ли значения переменной внутри группы, пользовательские пропущенные значения рассматриваются как допустимые значения, а системные пропущенные - как недопустимые. Если в группе содержится одно допустимое или пользовательское пропущенное значение, а также системное пропущенное значение, эта группа рассматривается как переменная, значения которой не изменяются внутри группы, и конструктор копирует значения в новый файл.

Конструктор реструктуризации данных (наблюдения в переменные): Сортировка данных

Примечание: Этот шаг предлагается в конструкторе, если Вы выбрали реструктуризацию групп наблюдений в переменные.

На этом шаге необходимо решить, нужно ли сортировать рабочий файл данных перед реструктуризацией. Всякий раз, когда конструктор обнаруживает новую комбинацию идентификационных значений, он создает новую строку, поэтому важно, чтобы данные были отсортированы по переменным, которые идентифицируют группы наблюдений.

220

Глава 9

Рисунок 9-33

Конструктор реструктуризации данных: Сортировка данных,шаг 3

Как упорядочены строки в рабочем файле? Подумайте, как отсортированы данные в рабочем файле и какие переменные Вы используете для идентификации групп наблюдений (заданные на предыдущем шаге).

Да. Конструктор автоматически отсортирует данные текущего файла по идентификационным переменным в таком же порядке, в каком эти переменные перечислены в списке Переменные для идентификации на предыдущем шаге. Выберите этот вариант, если данные не отсортированы по идентификационным переменным, или если Вы не уверены в этом. Этот вариант потребует дополнительного прохода по данным, ногарантирует при этом, что строки будут в правильном порядке, необходимом для реструктуризации.

Нет. Конструктор не будет выполнять сортировку данных. Выберите этот вариант, если Вы уверены, что данные отсортированы по переменным, идентифицирующим группы наблюдений.

Конструктор реструктуризации данных (наблюдения в переменные): Параметры

Примечание: Этот шаг предлагается в конструкторе, если Вы выбрали реструктуризацию групп наблюдений в переменные.

На данном шаге задайте параметры нового реструктурированного файла.

221

Работа с файлами

Рисунок 9-34

Конструктор реструктуризации данных: Параметры, шаг 4

Каким образом должны быть упорядочены новые группы переменных в новом файле данных?

По исходным переменным. Конструктор группирует вместе новые переменные, образованные из одной исходной переменной.

По индексу. Конструктор группирует переменные в соответствии со значениями индексных переменных.

Пример. Реструктурируемые переменные w и h, а индексная переменная - месяц. w h месяц

Результат группирования по исходным переменным:

w.jan

w.feb

h.jan

Результат группирования по индексу:

w.jan

h.jan

w.feb

Создавать ли переменную подсчета количества наблюдений? Конструктор может создать в новом файле переменную подсчета количества наблюдений. Переменная содержит значения, равные числу строк рабочего файла данных, использованных для создания строки в новом файле данных.

222

Глава 9

Создавать индикаторные переменные? Конструктор может использовать индексные переменные для создания индикаторных переменных в новом файле данных. Создается одна новая переменная для каждого уникального значения индексной переменной. Индикаторные переменные указывают на присутствие или отсутствие значения в наблюдении. Индикаторная переменная принимает значение 1, если в наблюдении имеется значение, и 0 - в противном случае.

Пример. Индексная переменная - product (товар). В ней регистрируются товары, которые приобрел потребитель. Исходные данные имеют вид:

customer

товар

1

chick

1

eggs

2

eggs

3

chick

Создание индикаторной переменной приводит к созданию одной новой переменной для каждого уникального значения переменной product. Результат реструктуризации:

customer

indchick

indeggs

1

1

1

2

0

1

3

1

0

В данном примере реструктурированные данные можно использовать для получения информации о количестве товаров, приобретенных потребителем.

Конструктор реструктуризации данных: Завершение работы

Это заключительный шаг Конструктора. Нужно решить, что делать с параметрами реструктуризации, которые Вы задали.

223

Работа с файлами

Рисунок 9-35

Конструктор реструктуризации данных: Завершение работы

Реструктурировать данные сейчас. Конструктор создаст новый, реструктурированный файл. Используйте, если хотите заменить текущий файл немедленно.

Примечание: Если исходные данные были взвешены, данные в новом файле также будут взвешены, если только переменная весов не реструктурирована или удалена из нового файла.

Вставить синтаксис. Конструктор вставит сгенерированный синтаксис в окно Редактора синтаксиса. Выберите этот вариант, если Вы не готовы заменить рабочий файл данных, если Вы хотите внести изменения в синтаксис, или если Вы хотите сохранить синтаксис для использования его в дальнейшем.