Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
фиктивные переменные1.docx
Скачиваний:
7
Добавлен:
15.08.2019
Размер:
502.1 Кб
Скачать

Регрессионные модели с переменной структурой (фиктивные переменные) Понятие о фиктивных переменных

В регрессионных моделях в качестве объясняющих пере­менных часто приходится использовать не только количествен­ные (определяемые численно), но и качественные переменные.

Например:

1. Исследуется зависимость между продолжительностью полученно­го образования и доходом, и в выборке представлены лица как мужс­кого, так и женского пола. Нужно выяснить, обусловливает ли пол раз­личие в результатах.

2. Исследуется зависимость между доходом и потреблением и выборка включает как мусульманские и христианские семьи, нужно выяснить, имеет ли существенное влияние на предпочтение конфессиональное различие.

3. Исследуются факторы, определяющие инфляцию, и в некоторые годы периода наблюдений правительство проводило политику регули­рования доходов. Нужно проверить, оказало ли это какое-либо влия­ние на исследуемую зависимость.

В каждом из этих примеров одним из возможных решений было бы оценива­ние отдельных регрессий для двух указанных категорий с последующим выяс­нением, различаются ли полученные коэффициенты. Другой возможный под­ход к решению состоит в оценивании единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фак­тора посредством введения, так называемой фиктивной переменной (искусственной).

Второй под­ход обладает двумя важными преимуществами:

во-первых, имеется простой спо­соб проверки, является ли воздействие качественного фактора значимым;

во-вто­рых, при условии выполнения определенных предположений регрессионные оценки оказываются более эффективными.

Обычно фиктивная переменная отражает два противоположных состояния качественного фак­тора и может выражаться в двоичной форме:

Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).

Следует отметить не совсем удачный перевод на русский язык термина dummy variables как «фиктивные» переменные.

Во-первых, в модели регрессионного анализа уже имеет фиктивная переменная x0 при 0, всегда равная единицы.

Во-вторых, все процедуры регрессионного анализа проводятся при включении фиктивных переменных так, же как и обычных количественных переменных.

«Фиктивность» же переменных Di состоит только в том, что они количественным образом описывают качественный признак.

Таким образом, кроме моделей, содержащих только коли­чественные объясняющие переменные (обозначаемые Xj), в эконометрике рассматривают содержащие лишь качественные переменные (обозначаемые Di), либо те и другие одновременно.

В связи с тем, что фиктивные переменные в регрессионных моделях могут располагаться как в левой, так и в правой части (быть зависимой переменой и не зависимой), а также входить как отдельно, так и совместно с объясняющими переменными, рассмотрим классификацию подобных моделей:

Также необходимо рассмотреть некоторую особенность включения в уравнение регрессии фиктивных переменных.

Вводя в уравнение регрессии фиктивную переменную и найдя параметры уравнения следующим шагом мы проверим нулевую гипотезу о равенстве коэффициента при Di нулю, этим мы можем установить существенность влияния фактора отражаемого фиктивной переменной на Y.

Если рассматриваемый качественный признак имеет несколько (k) уровней (градаций), то в принципе можно ввести в регрессионное уравнение дискретную переменную, принимающую такое же количественное значение. Однако так не поступают из-за трудности содержательной интерпретации соответственных коэффициентов регрессии, а вводят (k-1) бинарных переменных.

Вводить бинарную переменную Dk нельзя, так как при этом для любой i-го наблюдения D1+D2+…+Dk=1, т.е. при суммировании элементов столбцов общей матрицы, соответствующих фиктивных переменных D1, D2,…,Dk получим столбец, состоящий из одних единиц. А так как в матрице такой столбец из единиц уже есть, то это означает линейную зависимость значений (столбцов) общей матрицы X, т.е. нарушилось бы шестая предпосылка МНК. Таким образом, мы оказались бы в условиях мультиколлинеарности и как следствие – невозможности получения оценок МНК. Такая ситуация, когда сумма значений несколько переменных, включенных в регрессию, равна постоянному числу (единице) получила название «dummy trap» или «ловушка». Чтобы избежать указанной проблемы, число вводимых переменных должно быть на единицу меньше числа уровней (градации) качественного признака.