Регрессионные модели с переменной структурой (фиктивные переменные) Понятие о фиктивных переменных

В регрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные.

Например:

1. Исследуется зависимость между продолжительностью полученного образования и доходом, и в выборке представлены лица как мужского, так и женского пола. Нужно выяснить, обусловливает ли пол различие в результатах.

2. Исследуется зависимость между доходом и потреблением и выборка включает как мусульманские и христианские семьи, нужно выяснить, имеет ли существенное влияние на предпочтение конфессиональное различие.

3. Исследуются факторы, определяющие инфляцию, и в некоторые годы периода наблюдений правительство проводило политику регулирования доходов. Нужно проверить, оказало ли это какое-либо влияние на исследуемую зависимость.

В каждом из этих примеров одним из возможных решений было бы оценивание отдельных регрессий для двух указанных категорий с последующим выяснением, различаются ли полученные коэффициенты. Другой возможный подход к решению состоит в оценивании единой регрессии с использованием всей совокупности наблюдений и измерением степени влияния качественного фактора посредством введения, так называемой фиктивной переменной (искусственной).

Второй подход обладает двумя важными преимуществами:

во-первых, имеется простой способ проверки, является ли воздействие качественного фактора значимым;

во-вторых, при условии выполнения определенных предположений регрессионные оценки оказываются более эффективными.

Обычно фиктивная переменная отражает два противоположных состояния качественного фактора и может выражаться в двоичной форме:

Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).

Следует отметить не совсем удачный перевод на русский язык термина dummy variables как «фиктивные» переменные.

Во-первых, в модели регрессионного анализа уже имеет фиктивная переменная x₀ при ₀, всегда равная единицы.

Во-вторых, все процедуры регрессионного анализа проводятся при включении фиктивных переменных так, же как и обычных количественных переменных.

«Фиктивность» же переменных D_i состоит только в том, что они количественным образом описывают качественный признак.

Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые X_j), в эконометрике рассматривают содержащие лишь качественные переменные (обозначаемые D_i), либо те и другие одновременно.

В связи с тем, что фиктивные переменные в регрессионных моделях могут располагаться как в левой, так и в правой части (быть зависимой переменой и не зависимой), а также входить как отдельно, так и совместно с объясняющими переменными, рассмотрим классификацию подобных моделей:

Также необходимо рассмотреть некоторую особенность включения в уравнение регрессии фиктивных переменных.

Вводя в уравнение регрессии фиктивную переменную и найдя параметры уравнения следующим шагом мы проверим нулевую гипотезу о равенстве коэффициента при D_i нулю, этим мы можем установить существенность влияния фактора отражаемого фиктивной переменной на Y.

Если рассматриваемый качественный признак имеет несколько (k) уровней (градаций), то в принципе можно ввести в регрессионное уравнение дискретную переменную, принимающую такое же количественное значение. Однако так не поступают из-за трудности содержательной интерпретации соответственных коэффициентов регрессии, а вводят (k-1) бинарных переменных.

Вводить бинарную переменную D_kнельзя, так как при этом для любой i-го наблюдения D₁+D₂+…+D_k=1, т.е. при суммировании элементов столбцов общей матрицы, соответствующих фиктивных переменных D₁, D₂,…,D_k получим столбец, состоящий из одних единиц. А так как в матрице такой столбец из единиц уже есть, то это означает линейную зависимость значений (столбцов) общей матрицы X, т.е. нарушилось бы шестая предпосылка МНК. Таким образом, мы оказались бы в условиях мультиколлинеарности и как следствие – невозможности получения оценок МНК. Такая ситуация, когда сумма значений несколько переменных, включенных в регрессию, равна постоянному числу (единице) получила название «dummy trap» или «ловушка». Чтобы избежать указанной проблемы, число вводимых переменных должно быть на единицу меньше числа уровней (градации) качественного признака.

1 / 61 2 3 4 5 6 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
01.07.20253 Мб12Физические основы квантовой электроники..doc
#
22.11.2019862 Кб103Физические основы Механики, Мол. физ. и термоди...doc
#
01.03.2025675 Кб8Физическое загрязнение.doc
#
01.05.202577 Кб1Физкультура 1.docx
#
20.09.2019609 Кб210физра.doc
#
15.08.2019502 Кб19фиктивные переменные1.docx
#
22.08.201994 Кб18филиппов курсач.docx
#
18.07.2019354 Кб54Философ и поэт Ломоносов.doc
#
01.04.2025110 Кб7Философия (Практич. зан.).docx
#
04.05.2019133 Кб16ФИЛОСОФИЯ - метод.указание для выполнения конт...doc
#
01.03.20251 Мб0философия джордано бруно.пантеизм.rtf