
14 Лекція № 14,15
Тема: |
Особливі випадки в регресійному аналізі |
||
ПЛАН 14 ЛЕКЦІЯ № 14,15 14.2 Гетерокседастичность 14.3 Автокореляція
|
|||
Час: |
4 год. |
||
Література: |
[1] с. 263-282 |
При побудові регресійних моделей по МНК необхідно дотримуватися певних умов:
1)
Математичне очікування випадкової
величини
дорівнює нулю
.
Тобто, вплив випадкових факторів
(віднесених до випадкової величини
)
не впливають систематично на середнє
значення показника
.
2)
Відсутність автокореляції між випадковими
величинами
,
.
Тобто, випадкові величини незалежні
між собою й значення однієї випадкової
величини не впливає на іншу.
3)
Гомоскедастичність. Дисперсія випадкової
величини
постійна й дорівнює
,
тобто
4)
Незалежність випадкової величини
й змінної
,
.
Якщо хоча б одне з умов не дотримується, то будувати регресійну модель по МНК не ефективно. У цьому випадку необхідно попередня обробка даних і побудову моделі по спеціальних методиках.
14.1 Мультиколінеарність
Термін «мультиколінеарність» означає, що в багатофакторній моделі два або більше незалежних змінних (фактори) зв'язані між собою залежністю або, інакше кажучи, мають високий ступінь кореляції.
У математичному аспекті мультиколінеарність приводить до слабкої обумовленості матриці системи нормальних рівнянь, тобто близькості її визначника до нуля, а в змістовному аспекті - до перекручування змісту коефіцієнтів регресії й утрудненню виявлення найбільше що істотно впливають факторів.
У цей час існує ряд методів, що дозволяють оцінити наявність мультиколінеарністі в сукупності незалежних змінних, виміряти її ступінь, виявити взаємно корельовані змінні й усунути або послабити її негативний вплив на регресійну модель..
Причини виникнення мультиколінеарності.
Основні причини, що викликають мультиколінеарність, - незалежні змінні, або ті, що характеризують ті самі властивості досліджуваного явища, або якщо вони є складовими частинами тієї самої ознаки а саме:
Глобальна тенденція одночасної зміни економічних показників. На багато макроекономічних показників впливають однакові фактори. Це приводить до того, що вони відображають широкий спектр моделей. Наприклад, у період швидкого економічного росту, базові економічні показники також ростуть (дохід, споживання, ціни, інвестиції й т.д.), точніше в них є загальна тенденція росту. Сама наявність загальної тенденції росту (або спаду) уже є причиною мультиколінеарністі в динамічних рядах.
Широке використання в економічних моделях значень фактору минулого рівня (лагових значень).
Приклад.
Модель залежності (функції) споживання
в якості одного з факторів розглядають
витрати на споживання в попередній
період
.
У такий спосіб зрозуміло, що в економіці дуже часто зіштовхуються із проблемою мультиколінеарністі.
Визначення мультиколінеарності.
Тест
1. Велике значення
коефіцієнта множинної детермінації
й одночасно незначимість великої
кількості параметрів моделі. Так, якщо
для моделі
коефіцієнт множинної детермінації
близький до одиниці (
), а гіпотезу про незначимості параметрів
моделі
приймаємо.
Тест
2. Близьке
до одиниці значення парних коефіцієнтів
кореляції
.
Однак навіть при малих
між
і
може існувати криволінійна кореляційна
залежність.
Тест 3. Побудова допоміжних регресій.
Необхідно побудувати для кожного фактору регресійну модель залежності від інших факторів, потім розрахувати значення відповідних коефіцієнтів множинної кореляції й перевірити їхня значимість. Якщо хоча б один з побудованих коефіцієнтів кореляції значимо, значить є присутнім мультиколінеарність.
Тест
4. Побудувати
для кожного фактору регресійну модель
залежності від інших факторів і
розрахувати значення відповідних
коефіцієнтів множинної детермінації
.
Розрахувати величину
.
Якщо
,
то є присутнім мультиколінеарність.
Тест
5
(за критерієм Пірсона (
- критерій)). Знаходимо
- статистику
,
де
- визначник кореляційної матриці
;
- число спостережень;
- число факторів
Якщо
,
то існує мультиколінеарність,
де
знаходять по таблиці критичних крапок
при рівні значимості
й
.
Тест
6
(за критерієм Фішера (
-критерій)).
-статистики
для кожної пари факторів
має
вигляд
,
де
- парні коефіцієнти кореляції.
Табличне
значення
знаходимо по таблиці критичних крапок
Фішера-Снедекора при
й ступенях волі
й
.
Якщо
,
то змінна
корелює іншими, тобто є присутнім
мультиколлинеарность.
Тїсть
7 (за
критерієм Стьюдента).
Для кожної пари факторів знаходимо
-статистики
,
де
- приватні коефіцієнти кореляції.
По
таблиці критичних точок
Стьюдента при рівні значимості
й ступеня волі
знаходимо
.
Якщо
,
то між змінними
і
є присутнім мультиколінеарність.
Побудова регресійної моделі в умовах мультиколінеарності
Cпособ 1. Виключення одного з факторів, що корелюють
Нехай
фактори
й
корелюють. Знаходимо парні коефіцієнти
кореляції
і
.
Якщо
,
то виключаємо з розгляду фактор
.
Після чого параметри моделі визначаємо
по методу найменших квадратів.
Спосіб 2. Побудова фіктивного фактору.
Нехай
фактори
й
корелюють. Водимо фіктивний фактор
і будуємо регресійну модель у вигляді
Параметри моделі визначаємо по методу найменших квадратів.
Шляхом найпростіших перетворень переходимо до моделі, що містить вихідний фактор
де
,
.