- •Регрессионные модели с переменной структурой (фиктивные переменные) Понятие о фиктивных переменных
- •Фиктивные переменные при анализе пространственных данных
- •Ancova-модель при наличии у фиктивной переменной двух альтернатив
- •Модели ancova при наличии у качественных переменных более двух альтернатив
- •Регрессия с одной количественной и двумя качественными переменными
- •Сравнение двух регрессий (тест г.Чоу)
- •Фиктивные переменные во временных рядах
- •Единственный временной тренд
- •Два временных тренда
- •Сезонные фиктивные переменные
Регрессионные модели с переменной структурой (фиктивные переменные) Понятие о фиктивных переменных
В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные.
Например:
1. Исследуется зависимость между продолжительностью полученного образования и доходом, и в выборке представлены лица как мужского, так и женского пола. Нужно выяснить, обусловливает ли пол различие в результатах.
2. Исследуется зависимость между доходом и потреблением и выборка включает как мусульманские и христианские семьи, нужно выяснить, имеет ли существенное влияние на предпочтение конфессиональное различие.
3. Исследуются факторы, определяющие инфляцию, и в некоторые годы периода наблюдений правительство проводило политику регулирования доходов. Нужно проверить, оказало ли это какое-либо влияние на исследуемую зависимость.
В каждом из этих примеров одним из возможных решений было бы оценивание отдельных регрессий для двух указанных категорий с последующим выяснением, различаются ли полученные коэффициенты. Другой возможный подход к решению состоит в оценивании единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фактора посредством введения, так называемой фиктивной переменной (искусственной).
Второй подход обладает двумя важными преимуществами:
во-первых, имеется простой способ проверки, является ли воздействие качественного фактора значимым;
во-вторых, при условии выполнения определенных предположений регрессионные оценки оказываются более эффективными.
Обычно фиктивная переменная отражает два противоположных состояния качественного фактора и может выражаться в двоичной форме:
Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).
Следует отметить не совсем удачный перевод на русский язык термина dummy variables как «фиктивные» переменные.
Во-первых, в модели регрессионного анализа уже имеет фиктивная переменная x0 при 0, всегда равная единицы.
Во-вторых, все процедуры регрессионного анализа проводятся при включении фиктивных переменных так, же как и обычных количественных переменных.
«Фиктивность» же переменных Di состоит только в том, что они количественным образом описывают качественный признак.
Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые Xj), в эконометрике рассматривают содержащие лишь качественные переменные (обозначаемые Di), либо те и другие одновременно.
В связи с тем, что фиктивные переменные в регрессионных моделях могут располагаться как в левой, так и в правой части (быть зависимой переменой и не зависимой), а также входить как отдельно, так и совместно с объясняющими переменными, рассмотрим классификацию подобных моделей:
Также необходимо рассмотреть некоторую особенность включения в уравнение регрессии фиктивных переменных.
Вводя в уравнение регрессии фиктивную переменную и найдя параметры уравнения следующим шагом мы проверим нулевую гипотезу о равенстве коэффициента при Di нулю, этим мы можем установить существенность влияния фактора отражаемого фиктивной переменной на Y.
Если рассматриваемый качественный признак имеет несколько (k) уровней (градаций), то в принципе можно ввести в регрессионное уравнение дискретную переменную, принимающую такое же количественное значение. Однако так не поступают из-за трудности содержательной интерпретации соответственных коэффициентов регрессии, а вводят (k-1) бинарных переменных.
Вводить бинарную переменную Dk нельзя, так как при этом для любой i-го наблюдения D1+D2+…+Dk=1, т.е. при суммировании элементов столбцов общей матрицы, соответствующих фиктивных переменных D1, D2,…,Dk получим столбец, состоящий из одних единиц. А так как в матрице такой столбец из единиц уже есть, то это означает линейную зависимость значений (столбцов) общей матрицы X, т.е. нарушилось бы шестая предпосылка МНК. Таким образом, мы оказались бы в условиях мультиколлинеарности и как следствие – невозможности получения оценок МНК. Такая ситуация, когда сумма значений несколько переменных, включенных в регрессию, равна постоянному числу (единице) получила название «dummy trap» или «ловушка». Чтобы избежать указанной проблемы, число вводимых переменных должно быть на единицу меньше числа уровней (градации) качественного признака.