- •1. Основні теоретичні положення регресійного аналізу
- •1.1. Кореляційна залежність
- •1.2. Основні математичні поняття,
- •1.3. Передумови використання
- •2. Парний регресійний аналіз
- •2.1. Лінійна парна регресія
- •2.2. Властивості оцінок
- •2.3. Лінійний коефіцієнт кореляції
- •2.4. Коефіцієнт детермінації
- •2.5. Оцінка значущості рівняння регресії
- •2.6. Прогноз залежної змінної.
- •2.7. Приклад 1.
- •2.8. Нелінійна парна регресія
- •2.9. Дослідження нелінійних рівнянь
- •2.10. Приклад 2.
- •2.11. Побудова функції парної регресії
- •2.12. Побудова графіку функції
- •2.13. Питання для самоперевірки
- •3. Багатофакторний регресійний аналіз
- •3.1. Класична нормальна лінійна модель
- •3.2. Коефіцієнти детермінації і кореляції.
- •3.3. Перевірка значущості параметрів
- •3.4. Прогноз залежної змінної
- •3.5. Приклад 3. Знаходження двофакторної моделі
- •3.6. Використання пакету анализ данных
- •3.7. Використання Excel для розрахунку
- •Введення і підготовка даних
- •4. Мультиколінеарність
- •4.1. Поняття і наслідки мультиколінеарності
- •4.2. Алгоритм Фаррара – Глобера
- •4.3. Приклад 4.
- •4.5. Питання для самоперевірки
- •5. Гетероскедастичність
- •5.1. Поняття гетероскедастичності
- •5.2. Виявлення гетероскедастичності.
- •5.3. Приклад 5. Дослідження даних
- •5.4. Виявлення гетероскедастичності.
- •5.5. Приклад 6. Дослідження даних
- •5.6. Непараметричний тест Гольдфельда-Квандта
- •5.7. Питання для самоперевірки
- •6. Автокореляція
- •6.1. Поняття автокореляції.
- •6.2. Критерій Дарбіна-Уотсона
- •6.3. Приклад 7. Дослідження моделі на наявність
- •6.4. Питання для самоперевірки
- •7. Індивідуальні комплексні завдання
- •Завдання 2
- •Завдання 3
- •Завдання 4
- •Завдання 5
- •Предметний покажчик
- •Література
- •Коефіцієнтів автокореляції залишків
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Значення критерія Пірсона
- •Квантилі розподілу Стьюдента
- •83050, М. Донецьк, вул. Щорса, 31.
- •83023, М. Донецьк, вул. Харитонова, 10
5.4. Виявлення гетероскедастичності.
Тест рангової кореляції Спірмена
Ідея цього методу полягає в наступному: так як абсолютні величини залишків можуть бути оцінками залишкової дисперсії , тому у випадку гетероскедастичності ( ) залишки корелюють із значеннями регресорів. Встановити наявність такої кореляції можна с допомогою тесту (коефіцієнту) рангової кореляції Спірмена. Для застосування даного тесту об’єкти аналізу спочатку впорядковують (ранжують) відповідно до величини чи степені вираженості однієї із ознак, які вивчаються. При цьому кожному об’єкту присвоюється свій порядковий номер. Рангом називається порядковий номер, який присвоюється об’єкту. Отже ранг, характеризує величину чи вираженість ознаки.
Даний тест може бути застосований до вибірок довільного розміру. На закон розподілу залишків не накладаються ніякі обмеження.
Алгоритм розрахунку складається із таких кроків.
Крок 1-й. За допомогою 1МНК будується рівняння регресії .
Крок 2-й. На основі побудованої моделі розраховуються величини залишків , .
Крок 3-й. Ранжуються абсолютні величини залишків в порядку зростання або в порядку спадання. Кожному значенню присвоюється свій ранг . Наприклад, найбільшому (найменшому) значенню присвоюємо ранг 1, наступному меншому (більшому) ранг 2 і т.д. Кількість рангів буде дорівнювати обсягу вибірки.
Аналогічно операція виконується для всіх пояснюючих змінних , . Тобто проводиться ранжування значень , ,…, . Відповідні ранги факторних ознак позначимо .
Крок 4-й. Для кожної змінної обчислюється різниця рангів і визначається коефіцієнт рангової кореляції Спірмена за формулою
, (5.4.1)
де – обсяг вибірки.
Коефіцієнт може приймати значення . Якщо ранги завжди співпадають , то . В цьому випадку між залишками і величиною значень ознаки є повний прямий зв’язок, тобто найбільшому значенню залишку відповідає найбільше значення ознаки . Якщо , то ранги ознаки і ранги залишків розміщені в протилежному напрямку. В цьому випадку зв’язок повний, обернений.
Крок 5-й. Перевіряється значущість коефіцієнта рангової кореляції за критерієм Стьюдента. Для цього розрахуємо - критерій Стьюдента за формулою
. (5.4.2)
Обчислене значення - критерію порівнюється з табличним для числа ступенів свободи і рівня значущості . Якщо , то гіпотеза про наявність гетероскедастичності приймається і вона викликана саме ознакою . Якщо , то вважається, що в моделі має місце гомоскедастичність.
Зауваження. |
Тест рангової кореляції Спірмена застосовують також для виявлення залежності між двома якісними ознаками, наприклад, між умовами ведення бізнесу і надійністю ділового партнерства, між якістю житлових умов і якістю продуктів харчування і т. ін. В цьому випадку об’єкти аналізу спочатку ранжуються в залежності від степені вираженості ознак і далі застосовують наведений алгоритм, починаючи з третього кроку. |
При ранжуванні об’єктів за якісними ознаками можуть бути випадки, коли деякі об’єкти за ознаками не відрізняються один від одного. Такі об’єкти називають зв’язаними. Зв’язаним об’єктам присвоюється однаковий середній ранг. Наприклад, якщо не можна відрізнити 5, 6 і 7 об’єкти, то їм необхідно присвоїти однаковий ранг, що дорівнює 6=(5+6+7)/3. Об’єкти 5, 6, 7 будуть зв’язаними.
Найбільший можливий ранг зажди дорівнює числу спостережень.
Розглянемо застосування тесту рангової кореляції Спірмена на прикладі тих самих даних, що досліджувалися за допомогою тесту Гольдфельда-Квандта