Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
158
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

205

Работа с файлами

После того, как Вы взвесили файл по взвешивающей переменной, файл будет взвешен по указанной переменной во всех вычислениях до тех пор, пока не будет выбрана другая взвешивающая переменная или взвешивание будет отключено. Если вы сохраняете взвешенный файл данных, информация о взвешивании также сохраняется. Вы можете отключить взвешивание в любой момент — даже после того как файл был сохранен с включенным взвешиванием.

Веса в таблицах сопряженности. В процедуре Таблицы сопряженности имеется несколько вариантов обработки весов наблюдений.

Веса в диаграммах рассеяния и гистограммах. При построении диаграмм рассеяния и гистограмм можно включить или выключить взвешивание в самой процедуре. Этот параметр, однако, не влияет на наблюдения, в которых взвешивающая переменная имеет отрицательные, нулевые или пропущенные значения. Такие наблюдения останутся исключенными, даже если взвешивание будет отключено в процедуре построения диаграммы.

Как взвесить наблюдения

E Выберите в меню:

Данные > Взвесить наблюдения...

E Выберите Взвесить наблюдения по.

EУкажите взвешивающую переменную.

Значения взвешивающей переменной используются в качестве весов наблюдений. Например, наблюдение со значением 3 в переменной весов представляет три наблюдения во взвешенном файле данных.

Реструктуризация данных

Чтобы реструктурировать данные для их последующего использования в анализе, воспользуйтесь Конструктором реструктуризации данных. Конструктор заменяет текущий файл данных новым, реструктурированным файлом данных. С помощью конструктора можно:

Реструктурировать выбранные переменные в наблюдения

Реструктурировать выбранные наблюдения в переменные

Транспонировать все данные

Как реструктурировать данные

E Выберите в меню:

Данные > Реструктурировать...

E Выберите вид реструктуризации.

E Выберите данные для реструктуризации.

206

Глава 9

Дополнительно Вы можете:

Создать идентификационные переменные, которые позволят Вам связать значения в новом файле данных с этими же значениями в исходном файле данных.

Отсортировать данные перед реструктуризацией

Задать параметры нового файла

Вставить команду синтаксиса в окно Редактора синтаксиса

Конструктор реструктуризации данных: Выберите тип

Для реструктуризации данных используйте Конструктор реструктуризации данных. В первом диалоговом окне выберите тип реструктуризации.

Рисунок 9-17

Конструктор реструктуризации данных

Реструктурировать выбранные переменные в наблюдения. Выберите этот вариант,

если у Вас есть группы связанных столбцов данных, и Вы хотите преобразовать их в группы строк в новом файле данных. Если Вы выбираете этот вариант, конструктор будет отображать шаги для варианта Реструктурировать выбранные переменные в наблюдения.

207

Работа с файлами

Реструктурировать выбранные наблюдения в переменные. Выберите этот вариант,

если в данных имеются группы связанных строк, и Вы хотите преобразовать их в группы столбцов в новом файле данных. Если Вы выбираете этот вариант, конструктор будет отображать шаги для варианта Реструктурировать выбранные наблюдения в переменные.

Транспонировать все данные. Выберитеэтотвариант, еслиВыхотитетранспонировать данные. Все строки станут столбцами, а все столбцы - строками в новом файле данных. В этом случае диалоговое окно Конструктора реструктуризации данных закрывается, а открывается диалоговое окно Транспонировать данные.

Выбор варианта реструктуризации данных

Переменная содержитинформацию, которуюВыхотите анализировать, например, какой-то показатель. Наблюдение представляет объект наблюдения, например, человека. В случае простой структуры данных каждая переменная является столбцом, а каждое наблюдение - строкой в файле данных. Таким образом, например, если бы Вы анализировали баллы, полученные студентами группы, то значения баллов содержались бы в одном столбце, а каждая строка соответствовала бы одному студенту.

При анализе данных нас часто интересует, как изменяются значения переменной в зависимости от некоторых условий. Условие может представлять собой вид лечения, демографические характеристики, точку на временной шкале или что-то еще. В анализе данных такие условия часто называют факторами. Если в анализе участвуют факторы, это приводит к сложной структуре данных. Информация о переменной может содержаться более чем в одном столбце данных (например, по одному столбцу для каждого уровня фактора), или информация о наблюдении может содержаться более чем в одной строке (например, по одной строке для каждого уровня фактора). Конструктор реструктуризации данных помогает реструктурировать файлы со сложной структурой.

Структура текущего файла данных и структура файла данных, который Вы хотите получить в результате, определяют выбор параметров реструктуризации, которые нужно задать в конструкторе.

Как устроены данные в Вашем рабочем файле? Данные могут быть устроены так, что для записи значений фактора используется либо одна переменная (уровни фактора задаются группами наблюдений), либо несколько переменных (уровни фактора задаются группой переменных).

Группы наблюдений. Записаны ли переменные и условия в отдельных столбцах в рабочем файле данных? Например:

var factor

81

91

3

2

1

2

208

Глава 9

В этом примере первые две строки являются группой наблюдений, поскольку они связаны между собой. Они содержат данные для одного и того же уровня фактора. Если данные устроены таким образом, при проведении анализа в IBM® SPSS® Statistics фактор часто называют группирующей переменной.

Группы столбцов. Находятся ли переменные и условия в одном и том же столбце в этом файле? Например:

var_1 var_2

83

91

Вэтом примере два столбца являются группой переменных, поскольку они связаны между собой. В столбцах записаны значения одной переменной - в var_1 записаны ее значения для уровня фактора 1, а в var_2 записаны ее значения для уровня фактора 2. Когда данные устроены таким образом, при проведении анализа в SPSS Statistics факторы часто называется повторными измерениями.

Как должны быть устроены данные в новом файле? Как правило, это зависит от процедуры, которую Вы хотите использовать для анализа данных.

Процедуры, которые требуют групп наблюдений. Данные должны быть структурированы в группы наблюдений, если анализ требует наличия группирующей переменной. Примерами таких процедур являются ОЛМ-одномерная,

ОЛМ-многомерная и Компоненты дисперсии в Общих линейных моделях, Смешанные модели, OLAP-кубы, а также T-критерий и Непараметрические критерии для независимых выборок. Если рабочий файл данных устроен так, что в нем есть группы

переменных, а Вы хотите выполнить один из перечисленных выше видов анализа, то следует выбрать вариант Реструктурировать выбранные переменные в наблюдения.

Процедуры, которые требуют групп переменных. Данные должны быть структурированы в группы переменных для анализа повторных измерений. Примерами такого анализа являются ОЛМ-повторные измерения в Общей линейной модели,

анализ с зависящими от времени ковариатами в регрессии Кокса, парные выборки

в Т-критерии и связанные наблюдения в Непараметрических критериях. Если рабочий файл данных устроен так, что в нем есть группы наблюдений, а Вы хотите выполнить одни из перечисленных выше видов анализа, следует выбрать вариант

Реструктурировать выбранные наблюдения в переменные.

Пример преобразования переменных в наблюдения

В этом примере результаты тестов записаны в отдельных столбцах для каждого фактора,

А и B.

Рисунок 9-18

Текущая структура данных для преобразования переменных в наблюдения

209

Работа с файлами

Вы собираетесь воспользоваться Т-критерием для независимых выборок. Имеется группа столбцов баллы_a и баллы_b, но нет группирующей переменной, которая необходима для использования в процедуре анализе. Выберите в Конструкторе реструктуризации данных вариант Реструктурировать выбранные переменные в наблюдения, реструктурируйте одну группу переменных в новую переменную с именем балл и создайте индексную переменную группа. Новый файл данных показан на следующем рисунке.

Рисунок 9-19

Новый,реструктурированный файл данных (переменные в наблюдения)

При выполнении анализа с помощью Т-критерия для независимых выборок можно использовать переменную группа в качестве группирующей переменной.

Пример преобразования наблюдений в переменные

В данном примере результаты тестов записаны дважды по каждому субъекту — до и после лечения.

Рисунок 9-20

Текущая структура данных для преобразования наблюдений в переменные

Вы собираетесь воспользоваться Т-критерием для парных выборок. Данные структурированы в группы наблюдений, а Вам нужно структурировать данные в повторные измерения, которые требуются для выполнения процедуры. Выберите в Конструкторе реструктуризации данных вариант Реструктурировать выбранные наблюдения в переменные,

используйте id для идентификации групп строк в рабочем файле данных и time для создания группы переменных в новом файле.

Рисунок 9-21

Новый,реструктурированный файл данных (наблюдения в переменные)

Теперь при выполнении анализа с помощью Т-критерия для парных выборок можно использовать переменные bef и aft в качестве пары переменных.