Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ІАД / Лекція8.doc
Скачиваний:
19
Добавлен:
05.02.2016
Размер:
221.7 Кб
Скачать

Множинна регресія

Парна регресія може дати прийнятний результат при моделюванні, якщо вплив інших факторів, які діють на об’єкт можна було б проігнорувати. Якщо цього зробити не можна, необхідно спробувати виявити вплив інших факторів, тобто побудувати рівняння множинної регресії. , де - залежна змінна (результативна ознака), - незалежні або пояснюючі змінні (ознаки фактори).

Множинна регресія широко використовується у вирішенні проблем попиту, прибутковості акцій, при вивченні функції витрат виробництва, в макроекономічних розрахунках. В даний час множинна регресія - один з найбільш поширених методів в економетриці.

Специфікація моделі. Відбір факторів при побудові рівняння множинної регресії

Метою множинної регресії є:

Побудувати модель з великим числом факторів, визначивши вплив кожного з них окремо, а також сукупну їх дію на фактор, який ми моделюємо.

Специфіка моделі включає в себе 2 типи питань:

  1. Відбір факторів

  2. Вибір виду рівняння регресії

Вимоги до включаємих факторів:

  1. Кількісно вимірні

2. Не повинні бути в точному функціональному зв’язку або бути сильно корельовані. Якщо між факторами існує висока кореляція, то не можна визначити їх ізольований вплив на результативний показник і параметри рівняння регресії виявляються неінтерпритовані.

Форми рівняння регресії

Лінійна

Степенна

Експоненційна

Гіперболічна

Найчастіше використовуються лінійні і степенна функції.

В лінійній множинній регресії коефіцієнти при характеризують середню зміну результату зі зміною відповідного фактора на 1 при незмінних значеннях інших факторів, закріплених на середньому рівні.

Приклад: Нехай залежність витрат на продукти харчування по сукупності сімей характеризуються наступним рівняння: , де витрати сім’ї за місяць на продукти харчування, місячний дохід на одного члена сім’ї, - розмір сім’ї (чол.).

Аналіз даного рівняння дозволяє зробити висновок:

1. З ростом доходу на одного члена сім’ї на 1000 грн. при тому ж розмірі сім’ї витрати на продукти харчування виростуть на 270 грн

2. Збільшення розміру сім’ї на 1 людину при тих же доходах, визначає додатковий ріст втрат на харчування на 720 грн.

Параметр а=0.6 не має економічної інтерпритації.

В степенній функції коефіцієнти називаються коефіцієнтами еластичності. Вони показують на скільки процентів змінюється в середньому результат зі зміною відповідного фактора на один процент при незмінній дії інших факторів. Розглядаючи степенну функцію ми перетворюємо її в лінійний вид:

, де змінні виражені в логарифмах.

Приклад: При дослідженні попиту на деякий продукт отримано наступне рівняння:

, де - кількість продуктів на душу населення (кг), - ціна (грн.), - дохід на душу населення (тис. грн.). З цього рівняння видно, що з ростом ціни на один процент при тому ж доході, попит знижається в середньому на 0.888%, а збільшення доходу на один процент при незмінній ціні викликає збільшення попиту на 1.126%.

Відбір факторів

Відбір факторів звичайно здійснюється в дві стадії:

1. підбираються фактори виходячи з сутності проблеми;

2. аналізується кореляційна матриція

Визначення:

1. Інтеркорреляція - це кореляції між пояснюючими змінними, що дозволяє виключати з моделі дублюючі фактори.

2. Колінеарність: вважається, що дві змінні явно колінеарні, тобто знаходяться між собою в лінійній залежності, якщо .

Якщо фактори явно колінеарні, то вони дублюють один одного і один з них рекомендується виключити з регресії. Перевага при цьому віддається фактору, який при досить тісному зв'язку з результатом має найменшу тісноту зв'язку з іншими факторами. Нехай, наприклад, при вивченні залежності матриця парних коефіцієнтів кореляції виявилася такою:

Приклад 1. Проведіть аналіз доцільності включення факторів в рівняння множинної лінейної регресії.

Таблиця

1

0,8

0,7

0,6

1

0,8

0,5

1

0,2

1

Аналіз:

1. Перевіряємо кореляцію з У факторів х1, х2, х3.

Очевидно, що фактори і дублюють один одного (колінеарні). Який фактор включити в аналіз? Для цього перевіряємо міжфакторну кореляцію . В аналіз доцільно включити фактор , а не , хоча кореляція з результатом слабша, ніж кореляція фактора з , але зате значно слабкіша міжфакторна кореляція . Тому в даному випадку в рівняння множинної регресії включаються фактори , . Фактор виключаємо.

Приклад2. Проведіть аналіз доцільності включення факторів в рівняння множинної лінейної регресії.

y

X1

X2

X3

X4

y

1

0.71

0.58

0.08

0.62

X1

1

0.53

0.2

0.81

X2

1

0.13

0.3

X3

1

0.25

X4

1

Аналіз:

Перевіряємо кореляцію з У факторів х1, х2, х3.

У – х3 =0.8 включати недоцільно (зв’язок практично відсутній), отже зразу виключаємо х3.

Між факторами x1 і х4 існує сильний прямий зв’язок (коэффіцієнт парної кореляції > 0,8). Для того, щоб уникнути явища мультиколінеарності, один з цих факторів треба виключити з аналізу.

Аналізуємо міжфакторну кореляцію:х1 – х2 (0.53) та х2 – х4 (0.3) : 0.3<0.53

Висновок: виключається фактор х1, помірно корелюючий з х2 (коефіцієнт їх парної кореляції = 0,53). Фактори, які включені в модель множинної регресії: х2, х4.

За величиною парних коефіцієнтів кореляції виявляється лише явна коллінеарність факторів.

Найбільші труднощі у використанні апарату множинної регресії виникають при наявності мультиколінеарності.

Визначення: мультиколінеарність факторів явище коли більш ніж два фактори пов'язані між собою лінійною залежністю, тобто має місце сукупний вплив факторів один на одного. Наявність мультиколінеарності факторів може означати, що деякі фактори будуть завжди діяти в унісон. В результаті варіація у вихідних даних перестає бути повністю незалежною і не можна оцінити вплив кожного фактора окремо.

Включення в модель мультиколінеарних факторів небажано в силу наступних наслідків:

1. Утруднюється інтерпретація параметрів множинної регресії як характеристик дії факторів у «чистому» вигляді (якщо фактори корельовані, параметри лінійної регресії втрачають економічний сенс).

2. Оцінки параметрів ненадійні, виявляють великі стандартні помилки і змінюються зі зміною обсягу спостережень (не тільки по величині, але і по знаку), що робить модель непридатною для аналізу і прогнозування.

Соседние файлы в папке ІАД