Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
книжка----11.06-2.doc
Скачиваний:
0
Добавлен:
01.04.2025
Размер:
5.5 Mб
Скачать

7. Фиктивные переменные. Применение фиктивных переменных для исследования устойчивости коэффициентов регрессии. Тест чоу Фиктивные переменные (качественные переменные)

До сих пор мы рассматривали регрессионную модель, в которой в качестве объясняющих переменных (регрессоров) выступали количественные переменные. Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней (градаций). К числу таких признаков можно отнести: пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т.п.

Качественные признаки могут существенно влиять на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или построении регрессионных моделей по неоднородным данным.

Существует подход, позволяющий оценивать влияние значений количественных переменных и уровней качественных признаков с помощью одного уравнения регрессии. Этот подход связан с введением так называемых фиктивных переменных.

Фиктивная переменная – это переменная, принимающая конечное число возможных значений (учитывающих принадлежность к одному из выделенных классов).

В качестве фиктивных переменных обычно используются дихотомические (бинарные, булевы) переменные, которые принимают всего два значение: «0» или «1».

Следует отметить, что в принципе качественное различие можно формализовать с помощью любой переменной, принимающей два разных значения, не обязательно «0» или «1». Однако в эконометрической практике почти всегда используются фиктивные переменные типа «0-1», так как при этом интерпретация полученных результатов выглядит наиболее просто.

Пусть требуется учесть принадлежность объекта к одному из двух непересекающихся классов А и B. Тогда фиктивная переменная типа «0-1» вводится следующим образом

(7.1)

В общем случае, когда качественный признак имеет более двух значений, вводится несколько бинарных переменных. При использовании нескольких бинарных переменных необходимо исключить линейную зависимость между переменными, так как в противном случае при оценке параметров это приведет к совершенной мультиколлинеарности. Поэтому применяется следующее правило: если качественная переменная имеет альтернативных значений, то при моделировании используется только фиктивная переменная (в противном случае для каждой строки наблюдений сумма всех значений всех фиктивных переменных будет равна 1, а столбец, состоящий из единиц, всегда есть в матрице (4.8)).

В регрессионных моделях применяются фиктивные переменные двух типов: переменные сдвига и переменные наклона.

1) Фиктивная переменная сдвига

Спецификация парной регрессионной модели с фиктивной переменной сдвига имеет вид

, (7.2)

где – параметры модели; – значение регрессора в наблюдении с номером i; – фиктивная переменная;

– параметр при фиктивной переменной.

Параметр при фиктивной переменной отражает среднее изменение изучаемого признака при переходе из одной категории в другую при неизменных значениях остальных параметров. Как видно из спецификации (7.2), изменение признака в модели с фиктивной переменной сдвига влияет только на изменение свободного члена в уравнении регрессии.

Геометрическая интерпретация параметра представлена на рис. 7.1.

Рис. 7.1

Проверка статистической значимости параметра (проводимая при помощи t-статистики) показывает, влияет ли данный качественный признак на зависимую переменную или нет.

2) Фиктивная переменная наклона

Фиктивная переменная наклона изменяет наклон линии регрессии. При помощи фиктивных переменных наклона можно построить кусочно-линейные модели, которые позволяют учесть структурные изменения в экономических процессах (например, введение новых правовых или налоговых ограничений, изменение политической ситуации и т. д.).

Спецификация такой регрессионной модели в случае парной регрессии имеет вид

, (7.3)

где – бинарная переменная:

Фиктивная переменная наклона входит в уравнение в мультипликативной форме.

Влияние фиктивной переменной наклона отражено на рис. 7.2.

Рис. 7.2

Проверку наличия (или отсутствия) в выборочных данных структурных изменений можно выполнить и при помощи теста Чоу (см. параграф 7.2).

3) Объясняемая переменная является фиктивной переменной

Модели, в которых объясняемая переменная является качественной (дискретной), возникают в задачах классификации объектов. Если объясняемая переменная может принимать всего два значения, говорят о моделях бинарного выбора. В этих случаях используются регрессионные модели специального вида. Самые известные из них логит- пробит-модели.

Фиктивные переменные используются, например, для учета фактора сезонности. Пусть имеются данные с ярко выраженной сезонностью в зависимости от времени года (рис. 7.3).

Рис. 7.3

Очевидно, что классическое уравнение регрессии недостаточно хорошо описывает данную зависимость. Поэтому, для того чтобы данная закономерность по-прежнему описывалась одним уравнением, целесообразно ввести следующие фиктивные переменные:

(7.4)

(7.5)

(7.6)

Четвертая бинарная переменная не вводится из-за проблемы мультиколлинеарности, поскольку тогда для каждого месяца выполнялось бы тождество

, (7.9)

что означает линейную зависимость столбцов матрицы (4.8) (мультиколлинеарность) и, как следствие, – невозможность получить МНК-оценки параметров модели.

Модель линейной регрессии с фиктивными переменными имеет вид

(7.10)

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]