Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ек-ка заочн 2012.docx
Скачиваний:
8
Добавлен:
23.11.2019
Размер:
549.33 Кб
Скачать

Тема: Фіктивні змінні в регресійних моделях

1. Необхідність використання фіктивних змінних

У регресійних моделях у якості пояснюючих змінних часто доводиться використовувати не тільки кількісні (обумовлені чисельно), але і якісні змінні. Наприклад, попит на деяке благо може визначатися ціною даного блага, ціною на замінники даного блага, доходом споживачів тощо (ці показники визначаються кількісно). Але попит може також залежати від смаків споживачів, їхніх вподобань, національних і релігійних особливостей . А ці показники представити в чисельному виді не можна. Виникає проблема відображення в моделі впливу таких змінних на досліджувану величину. Це досить складне завдання.

Зазвичай в моделях вплив якісного фактору виражається у вигляді фіктивної (штучної) змінної, котра відображає два протилежних стани якісного фактору. Наприклад, «фактор діє» - «фактор не діє», «курс валюти фіксований» - «курс валюти плаваючий», «сезон літній» - «сезон зимовий» тощо. У цьому випадку фіктивна змінна D може виражатися у двійковій формі:

0, фактор не діє,

D = 1, фактор діє.

Наприклад, D = 0, якщо споживач не має вищої освіти, D = 1, якщо споживач має вищу освіту;

D = 0, якщо в суспільстві є інфляційні очікування, D = 1, якщо інфляційних очікувань немає.

Таким чином, крім моделей, що містять тільки кількісні пояснюючі змінні (позначені Xj), у регресійному аналізі розглядаються також моделі, що містять лише якісні змінні (позначені Dj) або ті й інші одночасно.

Регресійні моделі, що містять лише якісні пояснюючі змінні, називаються ANOVA - моделями (моделями дисперсійного аналізу). Наприклад, нехай Y - початкова заробітна плата.

0, претендент не має вищої освіти,

D = 1, претендент має вищу світу.

Тоді залежність між заробітною платою і наявністю вищої освіти можна виразити моделлю парної регресії Y = βо + γ D + и. (1)

При цьому M(Y | D = 0) = βо + γ · 0 = βо,

M(Y | D = 1) = βо + γ ·1 = βо + γ.

При цьому коефіцієнт βо визначає середню початкову заробітну плату за відсутності вищої освіти. Коефіцієнт γ вказує, на яку величину відрізняються середні початкові заробітні плати за наявності та відсутності вищої освіти у претендента. Перевіряючи статистичну значущість коефіцієнта γ за допомогою t-статистики або значущість коефіцієнта детермінації R2 за допомогою F-статистики, можна визначити, впливає чи ні наявність вищого утворення на початкову заробітну плату.

Однак такі моделі в економіці є вкрай рідкими. Набагато частіше зустрічаються моделі, що містять як якісні, так і кількісні змінні.

2. Моделі ancova

Моделі, у яких пояснюючі змінні носять як кількісний, так і якісний характер, називаються ANCOVA - моделями (моделями коваріаційного аналізу).

2.1. Ancova - Модель при наявності у фіктивної змінної двох альтернатив

Спочатку розглянемо найпростішу ANCOVA-модель із однією кількісною й однією якісною змінною, що має два альтернативні стани: Y = βо + γ D + β1X + и . (2)

Нехай, наприклад, Y - заробітна плата співробітника фірми, X -стаж співробітника, D - стать співробітника, тобто

0, якщо співробітник - жінка,

D = 1, якщо співробітник - чоловік.

Тоді очікуване значення заробітної плати співробітників для х років виробничого стажу буде:

M(Y | х, D = 0) = βо + β1 х для жінки, (3)

M(Y | х, D = 1) = βо + β1 х + γ = (βо + γ) + β1 х для чоловіка. (4)

Заробітна плата в цьому випадку є лінійною функцією від стажу роботи

Причому, як для чоловіків, так і для жінок заробітна плата змінюється з тим самим коефіцієнтом пропорційності β1. А от вільні члени в моделях (3), (4) відрізняються на величину γ.

Перевіривши за допомогою t-статистики статистичні значимості коефіцієнтів βо й о + γ), можна визначити, чи має місце у фірмі дискримінація за гендерною ознакою. Якщо ці коефіцієнти виявляться статистично значущими, то, можливо, дискримінація існує. Більше того, при γ > 0 вона буде на користь чоловіків, при γ < 0 - на користь жінок.

Значення якісної змінної, для якої приймається D = 0, називається базовим або порівняльним. Вибір базового значення звичайно диктується цілями дослідження, але може бути й довільним.

Коефіцієнт γ у моделі (2) іноді називається диференціальним коефіцієнтом вільного члена, бо він показує, на яку величину відрізняється вільний член моделі при значенні фіктивної змінної, яке = 1 , від вільного члена моделі при базовому значенні фіктивної змінної.

Існує загальне правило: якщо якісна змінна має k альтернативних значень, то при моделюванні використовуються тільки (k - 1) фіктивні змінні. Якщо не дотримуватися даного правила, то при моделюванні можна потрапити до ситуації мультиколінеарності або так звану пастку фіктивної змінної.