Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
MC-91(Зуйкова) / IBM_SPSS_Statistics_Core_System_Users_Guide.pdf
Скачиваний:
158
Добавлен:
08.02.2015
Размер:
6.76 Mб
Скачать

159

Преобразование данных

Шаблоны не содержат никакой информации о пользовательских пропущенных значениях. Пользовательские пропущенные значения для новых переменных создаются на основе пользовательских пропущенных значений первой переменной из списка. Все другие значения исходных переменных, за исключением системных пропущенных, обрабатываются как валидные.

В первую очередь применяются перекодировки, описанные в шаблоне. Все остальные значения перекодируются в значения, превышающие последнее значение в шаблоне, а пользовательские пропущенные значения (на основе первой переменной в

списке переменных с заданными пользовательскими пропущенными значениями) перекодируются в значения, превышающие последнее валидное значение.

Если Вы выбрали несколько переменных для автоматической перекодировки, в первую очередь применяется шаблон, после чего применяется общая комбинированная схема автоматической перекодировки для всех дополнительных значений, обнаруженных в выбранных переменных, в результате чего образуется единая схем перекодировки для всех выбранных переменных.

Как перекодировать текстовые и числовые значения в последовательные целые

E Выберите в меню:

Преобразовать > Автоматическая перекодировка...

E Выберите одну или более переменных для перекодировки.

E Для каждой выбранной переменной введите имя новой переменной и нажмите на кнопку

Новое имя.

Ранжировать наблюдения

Процедура Ранжировать наблюдения создает новые переменные, значениями которых являются значения рангов, нормальные значения, баллы Сэвиджа, а также значения процентилей для числовых переменных.

Имена и метки новых переменных создаются автоматически на основе исходных имен переменных и выбранных типов рангов. В сводных таблицах, вывод которых можно задать, перечислены исходные переменные, новые переменные и метки переменных. (Замечание: Автоматически создаваемые имена имена новых переменных ограничены по длине 8 байтами.)

Дополнительно Вы можете:

Ранжировать наблюдения в возрастающем и в убывающем порядке.

Организовать ранжирование в подгруппах, выбрав одну или несколько группирующих переменных для списка Группирующие переменные. При этом ранги будут вычисляться внутри каждой группы. Группы задаются комбинациями значений группирующих переменных. Например, если Вы выбираете в качестве группирующих переменных пол и национальность, то ранги будут рассчитываться для каждой комбинации значений этих переменных.

160

Глава 8

Рисунок 8-13

Диалоговое окно Ранжировать наблюдения

Как ранжировать наблюдения

E Выберите в меню:

Преобразовать > Ранжировать наблюдения...

EВыберите одну или несколько переменных для ранжирования. Ранжировать можно только числовые переменные.

Дополнительно Вы можете ранжировать наблюдения в возрастающем и в убывающем порядке, а также организовать ранжирование в подгруппах.

Ранжирование наблюдений: Типы

Можно выбрать один из нескольких методов ранжирования. Для каждого метода создается отдельная ранговая переменная. Методы ранжирования включают простые ранги, значения Сэвиджа, дробные ранги и процентили (N разбиений). Также ранжирование может быть выполнено на основе оценок долей и нормальных значений.

Ранг. Простой ранг. Значение новой переменной равно ее рангу.

Баллы Сэвиджа. Новая переменная содержит баллы Севиджа, основанные на экспоненциальном распределении.

Дробный ранг. Значение новой переменной равно рангу, деленному на сумму весов непропущенных наблюдений.

Дробный ранг в %. Каждый ранг делится на число наблюдений с непропущенными значениями и умножается на 100.

Cумма весов наблюдений. Значение новой переменной равно сумме весов наблюдений. Новая переменная постоянна для всех наблюдений одной группы.

161

Преобразование данных

N разбиение:. Ранги, приписываемые наблюдениям, основываются на процентилях групп, где каждая группа содержит приблизительно одно и то же число наблюдений. Например, при четырех рангах процентилей, ранг 1 будет назначен наблюдениям, лежащим ниже 25-го процентиля, ранг 2 - наблюдениям между 25-м и 50-м процентилями, ранг 3 - наблюдениям между 50-м и 75-м процентилями, и ранг 4 - наблюдениям выше 75-го.

Оценки долей. Оценки кумулятивной доли распределения, соответствующей некоторому конкретному рангу.

Нормальные значения. Z-значения, соответствующие оцененной кумулятивной (накопленной) доле.

Формула для оценки долей. Для вычисления оценок долей и нормальных значений можно выбрать формулу оценивания: Блома, Тьюки, Ранкит или Ван дер Вардена.

Блома. Создает новую ранговую переменную, основанную на оценках пропорций, которые используют формулу (r-3/8) / (w+1/4), где w - сумма весов наблюдений, а r - ранг.

Тьюки. Использует формулу (r-1/3) / (w+1/3), где r — ранг, а w — сумма весов наблюдений.

Ранкит. Использует формулу (r-1/2)/w, где w - число наблюдений, а r - ранг наблюдения, меняющийся от 1 до w.

Ван дер Вардена. Преобразование Ван-дер-Вардена, задаваемое формулой r/(w+1), где w — сумма весов наблюдений, а r — ранг, меняющийся от 1 до w.

Рисунок 8-14

Диалоговое окно Ранжировать наблюдения: Типы рангов

Ранжирование наблюдений: Совпадающие наблюдения

Диалоговое окно Ранжировать наблюдения: Совпадающие наблюдения позволяет задавать методы присвоения рангов наблюдениям с одинаковыми значениями исходной переменной.