
- •1. Основні теоретичні положення регресійного аналізу
- •1.1. Кореляційна залежність
- •1.2. Основні математичні поняття,
- •1.3. Передумови використання
- •2. Парний регресійний аналіз
- •2.1. Лінійна парна регресія
- •2.2. Властивості оцінок
- •2.3. Лінійний коефіцієнт кореляції
- •2.4. Коефіцієнт детермінації
- •2.5. Оцінка значущості рівняння регресії
- •2.6. Прогноз залежної змінної.
- •2.7. Приклад 1.
- •2.8. Нелінійна парна регресія
- •2.9. Дослідження нелінійних рівнянь
- •2.10. Приклад 2.
- •2.11. Побудова функції парної регресії
- •2.12. Побудова графіку функції
- •2.13. Питання для самоперевірки
- •3. Багатофакторний регресійний аналіз
- •3.1. Класична нормальна лінійна модель
- •3.2. Коефіцієнти детермінації і кореляції.
- •3.3. Перевірка значущості параметрів
- •3.4. Прогноз залежної змінної
- •3.5. Приклад 3. Знаходження двофакторної моделі
- •3.6. Використання пакету анализ данных
- •3.7. Використання Excel для розрахунку
- •Введення і підготовка даних
- •4. Мультиколінеарність
- •4.1. Поняття і наслідки мультиколінеарності
- •4.2. Алгоритм Фаррара – Глобера
- •4.3. Приклад 4.
- •4.5. Питання для самоперевірки
- •5. Гетероскедастичність
- •5.1. Поняття гетероскедастичності
- •5.2. Виявлення гетероскедастичності.
- •5.3. Приклад 5. Дослідження даних
- •5.4. Виявлення гетероскедастичності.
- •5.5. Приклад 6. Дослідження даних
- •5.6. Непараметричний тест Гольдфельда-Квандта
- •5.7. Питання для самоперевірки
- •6. Автокореляція
- •6.1. Поняття автокореляції.
- •6.2. Критерій Дарбіна-Уотсона
- •6.3. Приклад 7. Дослідження моделі на наявність
- •6.4. Питання для самоперевірки
- •7. Індивідуальні комплексні завдання
- •Завдання 2
- •Завдання 3
- •Завдання 4
- •Завдання 5
- •Предметний покажчик
- •Література
- •Коефіцієнтів автокореляції залишків
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Значення критерія Пірсона
- •Квантилі розподілу Стьюдента
- •83050, М. Донецьк, вул. Щорса, 31.
- •83023, М. Донецьк, вул. Харитонова, 10
3. Багатофакторний регресійний аналіз
3.1. Класична нормальна лінійна модель
багатофакторної регресії
Багатофакторний регресійний аналіз є узагальненням парного регресійного аналізу на випадок, коли залежна змінна зв’язана більш ніж з однією пояснювальною змінною.
В багатофакторному регресійному аналізі в порівнянні з парним регресійним аналізом виникають, принаймні, дві нові проблеми. По-перше, необхідно вирішити проблему специфікації, так як залежна змінна залежить від багатьох змінних і необхідно вирішити, які з них є домінуючими і які необхідно включати в модель, а які ні.
По-друге, при аналізі впливу
конкретної пояснювальної змінної
на
необхідно відокремити вплив на
змінної
від впливу інших пояснювальних змінних.
Будемо вважати, що проблема специфікації вирішена і багатофакторна лінійна регресійна модель в загальному вигляді буде
.
Позначимо
-е
спостереження залежної змінної
,
а відповідні значення залежних змінних
.
Тоді лінійна модель матиме вигляд
,
(3.1.1)
Модель (3.1.1), в якій залежна
змінна
,
пояснюючі змінні
,…,
а також залишки
задовольняють умовам Гаусса-Маркова і
крім того, пояснювальні змінні
,…,
є незалежними, називається класичною
нормальною лінійною моделлю багатофакторної
регресії (Classic Normal Linear Multiple Regression Model).
В випадку багатофакторної регресії модель (3.1.1) зручно всі викладки проводити в матричному вигляді. Для цього введемо позначення
(3.1.2)
– матриця значень пояснюючої
змінної розміру
,
де
– кількість спостережень, а
– кількість параметрів моделі.
В матриці введено додатковий стовпчик із одиниць, чим враховується наявність в моделі вільного члена .
(3.1.3)
– матриця-стовпчик пояснювальної
змінної. Позначення
– означає транспонування.
(3.1.4)
– матриця-стовпчик параметрів моделі.
Тоді рівняння (3.1.1) запишеться так
.
(2.1.5)
Використовуючи ІМНК можна показати, що параметри моделі знаходяться з матричного рівняння (за допомогою оператора оцінювання)
,
(3.1.6)
де
транспонована матриця
,
– матриця обернена до
.
Останнє рівняння (оператор оцінювання) представляє собою матричну форму запису розв’язку системи нормальних рівнянь для знаходження параметрів моделі.
3.2. Коефіцієнти детермінації і кореляції.
Оцінка значущості багатофакторної регресії
Як і у випадку парної регресійної моделі, в моделі багатофакторної регресії загальна варіація (сума квадратів відхилень залежної змінної від середнього значення) може бути розкладена на дві складові
, (3.2.1)
де і – відповідно сума квадратів відхилень зумовлена регресією і залишкова сума квадратів, яка характеризує вплив на пояснювальну змінну всіх неврахованих чинників.
Значення варіацій
можуть бути обчислені за формулами
,
(3.2.2)
,
(3.2.3)
3.2.4)
Коефіцієнт детермінації дає одну з найбільш ефективних оцінок адекватності регресійної моделі. Він є мірою якості моделі і її прогностичної сили. Даний коефіцієнт показує, яка частина дисперсії пояснювальної змінної пояснюється регресією. Коефіцієнт детермінації знаходиться за формулою
,
(3.2.5)
або за формулою
,
(3.2.6)
або
.
(3.2.7)
Коефіцієнт детермінації
змінюється в межах
.
Чим ближче
до одиниці, тим краще регресія описує
залежність між пояснювальними і залежною
змінною.
Іноді обчислюють скоректований
(адаптований, нормований, виправлений)
коефіцієнт детермінації
,
який враховує число ступенів свободи
і обчислюється за формулою
.
(3.2.8)
Справді, так як для коефіцієнт детермінації знаходиться за формулою
,
тоді
,
або
,
звідки і отримується формула (3.2.8).
Коефіцієнт детермінації
,
обчислений без врахування числа ступенів
свободи буде збільшуватися при введені
в модель нових пояснювальних змінних,
хоча це і не завжди буде означати
покращення моделі. Скоректований
коефіцієнт детермінації
не має такого недоліку. Він може навіть
зменшуватися при введені в модель нових
пояснювальних змінних, якщо вони не
дають суттєвого покращення якості
моделі.
Зауважимо, що збільшення коефіцієнта детермінації не завжди означає покращення якості моделі. Велике значення коефіцієнта детермінації може бути наслідком того, що досліджувані показники мають часовий тренд.
Коефіцієнт багатофакторної
кореляції (або теоретичне
кореляційне співвідношення, індекс
кореляції
по
)
дорівнює квадратному кореню із коефіцієнту
детермінації, тобто
.
Для оцінки тісноти зв’язку між показниками, що входять до моделі розраховуються коефіцієнти парної кореляції. Розрахунок коефіцієнтів парної кореляції може бути проведено за формулами
;
.
Для характеристики зв’язку між ознаками розраховують також коефіцієнти еластичності. Для лінійної багатофакторної моделі вони розраховуються за формулою аналогічною як для парної лінійної регресії
.
Коефіцієнти еластичності в
даному випадку мають такий самий зміст,
як і для парної лінійної регресії:
показує, на скільки відсотків в середньому
зміниться залежна змінна при зміні
незалежної змінної
в середньому на один відсоток при інших
незмінних умовах.
Перевірка значущості моделі здійснюється за допомогою -критерію Фішера. Якщо коефіцієнт детермінації відомий, то - критерій Фішера розраховується за формулою
.
(3.2.9)
Отримане значення -критерію порівнюється з табличним для рівня значимості і числа ступенів свободи чисельника і - числа ступенів свободи знаменника. Якщо
,
то рівняння вважається статистично значущим.
Нагадаємо, що
– число спостережень,
– число пояснювальних змінних ,
– число параметрів моделі.