2.5.5. КомандаRank

Анализируя доходы населения, мы можем работать непосредственно с доходами, вычисляя средние, корреляции и др. Можем изучать иерархию семей или индивидуумов по этой переменной. Для этого нужно перейти к порядковым номерам объектов, упорядоченным по доходам. Такие порядковые номера называются рангами. Например, иерархию семей можно изучать, определив для каждой семьи долю (процент) семей, которые беднее ее. Наконец, можно разбить семьи по уровню доходов на равные 5 частей (квинтили) или на 10 частей (децили). Ранги, процентили, n-тили суть преобразованные в соответствии с ранжированием объектов переменные.

Команда RANKвесьма полезна, когда нужно перейти от исходных значений любых количественных переменных к их рангам, процентилям, децилям и квинтилям и др., а можно перекодировать переменную в соответствии с нормальным распределением.

Пусть нам необходимо получить переменные «ранг по доходам», «процентили по доходам» и «квинтильные группы по доходам». («Курильские» данные).КомандаRANKсоздаст нам нужные переменные:

RANK VARIABLES = v14 (A) /RANK into rangv14/NTILES (5)into v14_5 /PERCENT percv14/PRINT = YES /TIES = MEAN.

VARIABLE LABELS rangv14 "ранг по доходам"/

v14_5 "квинтильные группы по доходам"/

percv14 "процентили по доходам".

Подробнее о команде RANKсм. в [1. С. 115].

2.5.6. Отбор подмножеств наблюдений

Для выбора в матрице данных в диалоговом режиме подмножества наблюдений необходимо использовать в главном меню Data окноSelect Cases.

После выполнения этих команд появляется окно диалога, в котором пользователь задает условия отбора данных. Невыбранные объекты будут исключены из сеанса работы или временно отфильтрованы. Имеется возможность организовать случайную выборку данных заданного объема, например, выбрать 10 % случайных объектов из множества данных. Вся работа пакета будет осуществляться для отобранных объектов, пока действие Select Cases не буде аннулировано.

Если необходимость во временной выборке отпала, нужно снова обратиться к этому же пункту меню и указать, что необходимы все объекты (All Cases).

Если мы хотим, чтобы пакет сохранил наши действия в диалоговом режиме в виде соответствующих команд в файле синтаксиса, необходимо запустить их на выполнение с использованием диалогового окна Paste. Это приведет к появлению в конце текста файла синтаксиса целой серии следующих команд:

USE ALL.

COMPUTE filter_$ = (v8 = 1).

VARIABLE LABEL filter_$ 'v8 = 1 (FILTER)'.

VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'.

FORMAT filter_$ (f1.0).

FILTER BY filter_$.

EXECUTE .

Как видно из сгенерированного SPSS текста, в случае использования условия для временной подвыборки объектов программа выборки создает переменную фильтра (filter_$) и использует командуFILTER BY filter_$.

Таким образом, можно для временной выборки объектов самим написать программу, создающую переменную фильтра, и выполнить. Например, для выбора мужчин в нашем учебном массиве можно воспользоваться командой

FILTER BY V8.

Это возможно, так как для мужчин в переменной V8 указан код 1. А если хотим выбрать женщин таким же способом, то нужно заменить кодировку для женщин на 1, а для мужчин на любое другое число.

Для отмены фильтра необходимо запустить команду FILTER OFF.

Следует внимательно следить в процессе работы за состоянием ваших фильтров и вовремя отменять фильтрацию. В статусной строке, если включен фильтр, горит сообщение Filter on.

Если необходимо отдельно сохранить данные только для отобранных объектов, нужно в командеSAVEиспользовать подкоманду/UNSELECTED DELETE:

SAVE FILE = 'D:\mydir\city' /KEEP = x1 to x10, x15

/UNSELECTED DELETE/COMPRESSED.

В подкоманде КЕЕРуказываются сохраняемые переменные (столбцы), а подкомандаUNSELECTED DELETEпозволяет сохранять только отфильтрованные объекты (строки матрицы).

Если необходимо исключить некоторые объекты из матрицы данных на все время данного сеанса работы с пакетом, диалог позволяет выполнить последовательность команд такого типа:

USE ALL.

SELECT IF(v8 = 1).

EXECUTE .

Можно обойтись и одной командой SELECT IF (v8 = 1). Строки, в которых переменнаяV8 = 0, становятся недоступными.

Обратим еще раз внимание на то, что в результате применения команды SELECT IFневыбранные объекты для данного сеанса работы теряются полностью. Если потеря данных имела смысл только для этого сеанса, то либо не следует сохранять исходную информацию после окончания исследований, либо сохранить ее под другим именем.

<<< < Предыдущая 2 3 4 5 6 7 8 9 10 11 12 1314 / 6914 15 16 17 18 19 20 21 22 23 24 25 26 > Следующая >>>