
- •8. Фіктивні змінні в регресійних моделях
- •8.1. Необхідність використання фіктивних змінних
- •8.2. Моделі anсova
- •8.2.1. Anсova-модель при наявності у фіктивної змінної двох альтернатив
- •8.2.2. Моделі ancova при наявності в якісних змінних більш двох альтернатив
- •8.2.3. Регресія з однієї кількісної і двома якісними змінними
- •8.3. Порівняння двох регресій
- •8.4. Використання фіктивних змінних у сезонному аналізі
8. Фіктивні змінні в регресійних моделях
8.1. Необхідність використання фіктивних змінних
У регресійних моделях у якості пояснюючих змінних часто приходиться використовувати не тільки кількісні (обумовлені чисельно), але і якісні змінні. Наприклад, попит на деяке благо може визначатися ціною даного блага, ціною на замінники даного блага, ціною благ, що доповнюють, доходом споживачів і т.д. (ці показники визначаються кількісно). Але попит може також залежати від смаків споживачів, їх національних і релігійних особливостей і т.д. Представити ці показники в чисельному вигляді не можна. Виникає досить складна задача відображення в моделі впливу таких змінних на досліджувану величину.
Звичайно в моделях вплив якісного фактора виражається у вигляді фіктивної (штучної) змінної, котра відбиває два протилежних стани якісного фактора. Наприклад, “фактор діє” --“фактор не діє”. У цьому випадку фіктивна змінна може виражатися в формі:
Наприклад,
,
якщо
споживач
не
має
вищої
освіти,
,
якщо
споживач
має
вищу
освіту;
Змінна
називається фіктивною
змінною
(індикатором).
Таким чином, крім
моделей, що містять тільки кількісні
пояснюючі змінні (
),
у регресійному аналізі розглядаються
також моделі, що містять лише якісні
змінні (
),
або ті й інші одночасно.
Регресійні моделі, що містять лише якісні пояснюючі змінні, називаються ANOVA-моделями (моделями дисперсійного аналізу).
Наприклад, нехай
–
початкова заробітна плата.
.
Тоді залежність можна виразити моделлю парної регресії:
(8.1)
При цьому коефіцієнт
визначає середню початкову заробітну
плату при відсутності вищої освіти.
Коефіцієнт
вказує, на яку величину відрізняються
середні початкові заробітні плати при
наявності і при відсутності вищої освіти
у претендента. Перевіряючи статистичну
значущість коефіцієнта
за допомогою
-статистики
або значущість коефіцієнта детермінації
за допомогою
-статистики,
можна визначити, чи впливає немає
наявність вищої
освіти на
початкову заробітну плату.
Неважко помітити, що ANOVA-моделі являють собою кусочно-постійні функції. Однак такі моделі в економіці вкрай рідкі. Набагато частіше зустрічаються моделі, що містять як якісні, так і кількісні змінні.
8.2. Моделі anсova
Моделі, у яких пояснюючі змінні носять як кількісний, так і якісний характер, називаються ANСOVA-моделями.
8.2.1. Anсova-модель при наявності у фіктивної змінної двох альтернатив
Спочатку розглянемо найпростішу ANСOVA-модель з однією кількісною й однією якісною змінною, що має два альтернативних стани:
(8.2)
Нехай, наприклад,
–
заробітна плата співробітника фірми,
–
стаж співробітника,
–
стать
співробітника, тобто
Тоді очікуване
значення заробітної плати співробітників
при
роках виробничого стажу буде:
– для жінки,
(8.3)
-для чоловіка.
(8.4)
Заробітна плата
в даному випадку є лінійною функцією
від стажу роботи (рис. 8.1). Причому і для
чоловіків, і для жінок заробітна плата
міняється з тим самим коефіцієнтом
пропорційності
,
а вільні члени в моделях (8.3), (8.4)
відрізняються на величину
.
Перевіривши за допомогою
-статистики
статистичну
значущістьі
коефіцієнтів
і
,
можна визначити, чи має місце у фірмі
дискримінація по половій ознаці. Якщо
ці коефіцієнти виявляться статистично
значущими,
то, мабуть, дискримінація є. Більш того,
при
вона буде
на користь чоловіків, при
–
на користь жінок.
У даному випадку піл співробітників має два альтернативних значення, і в моделі це відбивається однієї фіктивної змінної. Виникає питання, не можна чи за допомогою більшого числа фіктивних змінних моделювати більш складні комбінації? Наприклад, нехай
(8.5)
Рис. 8.1
У цій ситуації між змінними існує строга лінійна залежність, тобто має місце досконала мультиколінеарність, при якій коефіцієнти рівняння регресії однозначно визначені бути не можуть. Найпростішим способом подолання даної проблеми є відкидання однієї з фіктивних змінних і використання для розглянутої задачі моделі (8.2). Застосовуючи аналогічні викладення, можна одержати наступне загальне правило:
Якщо
якісна змінна має
альтернативних значень, то при моделюванні
використовуються тільки
фіктивних змінних.
Якщо не застосовувати це правило, то при моделюванні дослідник попадає в ситуацію досконалої мультиколінеарності.
Значення фіктивної змінної можна змінювати на протилежні. Суть моделі від цього не зміниться. Наприклад, у моделі (8.2) можна покласти, що:
Однак при цьому знак коефіцієнта зміниться на протилежний.
Значення якісної змінної, для якого приймається , називається базовим. Вибір базового значення звичайно диктується цілями дослідження, але може бути і довільним.
Коефіцієнт у моделі (8.2) іноді називається диференціальним коефіцієнтом вільного члена, тому що він показує, на яку величину відрізняється вільний член моделі при значенні фіктивній змінної рівної одиниці, від вільного члена моделі при базовому значенні фіктивної змінної.