Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
F_ktivn_zm_nn.doc
Скачиваний:
0
Добавлен:
01.05.2025
Размер:
276.48 Кб
Скачать

8.2.2. Моделі ancova при наявності в якісних змінних більш двох альтернатив

Нехай розглядається модель із двома пояснюючими змінними, одна з яких кількісна, а інша – якісна. Причому якісна змінна має три альтернативи. Наприклад, витрати на утримання дитини можуть бути зв'язані з доходами сімей і віком дитини: дошкільний, молодший шкільний і старший шкільний. Якісна змінна зв'язана з трьома альтернативами, тому за загальним правилом моделювання необхідно використовувати дві фіктивні змінні. Таким чином, модель може бути представлена у вигляді:

(8.6)

де – витрати, – доходи сімей.

Утворяться наступні залежності. Середня витрата на дошкільника:

(8.7)

Середня витрата на молодшого школяра:

(8.8)

Середня витрата на старшого школяра:

(8.9)

Тут , – диференціальні вільні члени. Базовим значенням якісної змінної є значення “дошкільник”. Таким чином, виходять три регресійні прямі (8.7), (8.8), (8.9), рівнобіжні одна однієї (рис. 8.2).

Рис. 8.2

Після обчислення коефіцієнтів рівнянь регресії (8.7) – (8.9) визначається статистична значущість коефіцієнтів і на основі звичайної -статистики.

Якщо коефіцієнти і виявляються статистично незначущими, то можна зробити висновок, що вік дитини не впливає на витрати по його утриманню.

8.2.3. Регресія з однієї кількісної і двома якісними змінними

Техніка фіктивних змінних може бути поширена на довільне число якісних факторів. Розглянемо ситуацію з двома якісними змінними.

Нехай – заробітна плата співробітників фірми, – стаж роботи, – стать співробітника, – наявність вищої освіти:

Таким чином, одержимо наступну модель:

(8.10)

З цієї моделі виводяться наступні регресійні залежності.

Середня заробітна плата жінки без вищої освіти:

(8.11)

Середня заробітна плата жінки з вищою освітою:

(8.12)

Середня заробітна плата чоловіка без вищої освіти:

(8.13)

Середня заробітна плата чоловіка з вищою освітою:

(8.14)

Очевидно, що усі регресії відрізняються лише вільними членами. Подальше визначення статистичної значущості коефіцієнтів і дозволяє переконатися, чи впливають освіта і стать співробітника на його заробітну плату.

Запропоновані вище схеми можуть бути поширені на ситуації з довільним числом кількісних і якісних факторів.

8.3. Порівняння двох регресій

У прикладах, розглянутих раніше, передбачалося, що зміна значення якісного фактора впливає лише на зміну вільного члена. Але це, безумовно, не завжди так. Зокрема, у прикладі з розділу 8.2.1 передбачалося, що заробітна плата співробітника збільшується пропорційно стажу з тим самим коефіцієнтом пропорційності поза залежністю від стажа співробітника, хоча найчастіше коефіцієнт для співробітників чоловічої статі більш аналогічного коефіцієнта для жінок. Отже, необхідно представити, що зміна якісного фактора може привести до зміни як вільного члена рівняння, так і нахилу прямої регресії.

Звичайно це характерно для тимчасових рядів економічних даних при зміні інституціональних умов, уведенні нових правових чи податкових обмежень. Наприклад, можна припустити, що до деякого року в країні обмінний курс валют був фіксованим, а потім плаває. Або податок на ввезені автомобілі був одним, а потім він істотно змінився. У цьому випадку залежність може бути виражена таким чином:

(8.15)

де

У цій ситуації очікуване значення залежної змінної визначається таким чином:

(8.16)

(8.17)

Коефіцієнти й у рівнянні (8.15) називаються диференціальним вільним членом і диференціальним кутовим коефіцієнтом відповідно. Фіктивна змінна в рівнянні (8.15) використовується як в аддитивном виді ( ), так і в мультиплікативному ( ), що дозволяє фактично розбивати розглянуту залежність на дві частини, зв'язані з періодами зміни деякого розглянутого в моделі якісного фактора. Рівняння регресії (8.15) досить добре моделює ситуацію, зображену на рис. 8.3.

а) б)

Рис. 8.3

На рис. 8.3, а) залежність моделюється звичайною лінійною регресією. На рис. 8.3, б) у моделі враховуються зміни, що відбулися з деякого моменту в характері розташування точок спостережень. На даному прикладі добре видно, яким чином можна проаналізувати, чи слід розбивати вибірку на частині і будувати для кожної із них рівняння регресії (тобто фактично будувати складну регресію з фіктивними змінними) (рис. 8.3, б) або можна обмежитися загальною “звичайною” регресією для всіх точок спостережень (рис. 8.3, а). Для цього можна використовувати тест Чоу.

Суть тесту Чоу полягає в наступному. Нехай вибірка має обсяг . Через позначимо суму квадратів відхилень значень від загального рівняння регресії (рис. 8.3, а).

Нехай є підстава припускати, що доцільно загальну вибірку розбити на дві підвибірки обсягами і . відповідно і побудувати для кожної із підвибірки рівняння регресії (рис. 8.3, б). Через і позначимо суми квадратів відхилень значень , кожної із підвибірки від відповідних рівнянь регресії. Очевидно, рівність можлива лише, якщо коефіцієнти регресії всіх трьох рівнянь зівпадають. Чим сильніше розходження в поводженні для двох підвиборок, тим більше значення буде перевищувати . Тоді різниця може бути інтерпретована як поліпшення якості моделі при розбивці інтервалу спостережень на два подінтервала. Отже, визначає оцінку зменшення дисперсії регресії за рахунок побудови двох рівнянь замість одного. При цьому число ступенів вільності скоротиться на , тому що замість параметра об'єднаного рівняння тепер необхідно оцінювати параметра двох регресій. Дріб (81 + – непояснена дисперсія залежної змінної при використанні двох регресій. Таким чином, загальну вибірку доцільно розбити на два подінтервала тільки у випадку, якщо зменшення дисперсії буде значимо більш залишилася непоясненої дисперсії. Даний аналіз здійснюється по стандартній процедурі порівняння дисперсій на основі -статистики. У цьому випадку -статистика має вигляд:

(8.18)

Якщо зменшення дисперсії статистично не відрізняється від непоясненої дисперсії, то -статистика має розподіл Фішеру з числом ступені вільності і . Тут – число кількісних пояснюючих змінних у рівняннях регресії ( -однаково для всіх трьох рівнянь регресії).

Тоді, якщо , розраховане за формулою (8.18), виявиться при обраному рівні значущості  менше відповідної критичної точки розподілу Фішеру , то вважається, що розходження між і і статистично незначиме і нема рації розбивати рівняння регресії на частині. У противному випадку розбивка на подінтервали доцільно з погляду поліпшення якості моделі. Це фактично означає необхідність введення в рівняння регресії відповідної фіктивної змінної.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]