
3.7.2 Перешкалирование (приведение к другой шкале)
При перешкалировании по определенному правилу на основании имеющейся переменной создается новая переменная.
К перешкалированию можно отнести ранжирование (в статистических системах). Ранжирование - создание новой переменной, значения которой определяются как ранговые места значений наблюдений по заданной переменной. Эта процедура применяется, когда необходимо перейти от исходных значений переменной к рангам.
Перешкалирование может осуществляться исходя из определенного условия например, переменную «возраст», измеренную на основании метрической шкалы, преобразуем в переменную «возрастная категория», являющуюся порядковой. Преоразование проводится на основании принятых условий, например, до 30 лет – «молодой возраст», 30-60 лет – «зрелый возраст», больше 60 лет – «преклонный возраст».
3.7.3 Вычисление новых переменных
Исходные переменные могут быть использованы для вычисления расчетных переменных. На основании имеющихся данных можно вычислить новые переменные: среднедушевой доход в семье, рождаемость, ВВП на душу населения и тд.
3.7.4 Использование фиктивных переменных
К важнейшим процедурам переопределения переменной относится также использование фиктивных переменных для переопределения категорий. Фиктивные переменные (dummy variables) часто также называют двоичными, дихотомическими, инструментальными или качественными. Это переменные, которые могут принимать только два значения, например, 0 или 1.
Фиктивные переменные позволяют учесть влияние качественных признаков принимающих несколько возможных значения. Кроме того, фиктивная переменная может быть также индикатором принадлежности наблюдения к некоторой подвыборке.
Пусть имеется признак, который принимает несколько возможных значений. Общее правило введения фиктивных переменных следующее: общее количество фиктивных переменных должно быть на единицу меньше количества возможных значений качественного признака, если в модели имеется константа. Например, уровень образования: нет образования, среднее образование, высшее образование, ученая степень и т. д. В этом случае каждому уровню образования, кроме уровня «нет образования» можно поставить в соответствие некоторую бинарную фиктивную переменную.
В некоторых случаях целесообразным является использование фиктивных переменных взаимодействия.
Пусть в модели (например, средней заработной платы) участвуют две фиктивные переменные, отвечающие, например, за пол и наличие высшего образования. При обычном включении этих переменных в модель каждая из них дает определенный вклад в изменение коэффициентов модели. Однако, сумма эффектов пола и образования может быть не равна суммарному эффекту этих двух факторов, действующих одновременно. То есть наличие высшего образования у мужчин и у женщин может по-разному отражаться на доходе. Поэтому наряду с фиктивными переменными пола и образования можно использовать фиктивную переменную взаимодействия: например, данная переменная равна 1 для мужчин с высшим образованием и равна нулю для всех остальных случаев (мужчин без высшего образования и женщин независимо от уровня образования).