- •1. Основні теоретичні положення регресійного аналізу
- •1.1. Кореляційна залежність
- •1.2. Основні математичні поняття,
- •1.3. Передумови використання
- •2. Парний регресійний аналіз
- •2.1. Лінійна парна регресія
- •2.2. Властивості оцінок
- •2.3. Лінійний коефіцієнт кореляції
- •2.4. Коефіцієнт детермінації
- •2.5. Оцінка значущості рівняння регресії
- •2.6. Прогноз залежної змінної.
- •2.7. Приклад 1.
- •2.8. Нелінійна парна регресія
- •2.9. Дослідження нелінійних рівнянь
- •2.10. Приклад 2.
- •2.11. Побудова функції парної регресії
- •2.12. Побудова графіку функції
- •2.13. Питання для самоперевірки
- •3. Багатофакторний регресійний аналіз
- •3.1. Класична нормальна лінійна модель
- •3.2. Коефіцієнти детермінації і кореляції.
- •3.3. Перевірка значущості параметрів
- •3.4. Прогноз залежної змінної
- •3.5. Приклад 3. Знаходження двофакторної моделі
- •3.6. Використання пакету анализ данных
- •3.7. Використання Excel для розрахунку
- •Введення і підготовка даних
- •4. Мультиколінеарність
- •4.1. Поняття і наслідки мультиколінеарності
- •4.2. Алгоритм Фаррара – Глобера
- •4.3. Приклад 4.
- •4.5. Питання для самоперевірки
- •5. Гетероскедастичність
- •5.1. Поняття гетероскедастичності
- •5.2. Виявлення гетероскедастичності.
- •5.3. Приклад 5. Дослідження даних
- •5.4. Виявлення гетероскедастичності.
- •5.5. Приклад 6. Дослідження даних
- •5.6. Непараметричний тест Гольдфельда-Квандта
- •5.7. Питання для самоперевірки
- •6. Автокореляція
- •6.1. Поняття автокореляції.
- •6.2. Критерій Дарбіна-Уотсона
- •6.3. Приклад 7. Дослідження моделі на наявність
- •6.4. Питання для самоперевірки
- •7. Індивідуальні комплексні завдання
- •Завдання 2
- •Завдання 3
- •Завдання 4
- •Завдання 5
- •Предметний покажчик
- •Література
- •Коефіцієнтів автокореляції залишків
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Критичні значення і для коефіцієнта автокореляції залишків критерія Дарбіна-Уотсона для
- •Значення критерія Пірсона
- •Квантилі розподілу Стьюдента
- •83050, М. Донецьк, вул. Щорса, 31.
- •83023, М. Донецьк, вул. Харитонова, 10
2.10. Приклад 2.
Знаходження нелінійного рівняння парної регресії
Приклад 2. За даними таблиці 2.5 ( – середні річні витрати студента на розваги; – доходи студента, після сплати за навчання й гуртожиток) необхідно: а) розрахувати параметри рівнянь регресій, заданих у вигляді функцій: а) рівносторонньої гіперболи; б) степеневої; в) показникової; б) розрахувати індекси кореляції і оцінити якість рівнянь регресій, заданих у вигляді функцій: а) гіперболічної; б) степеневої; в) показникової.
Таблиця 2.5
Номер підприємства |
|
|
Номер підприємства |
|
|
1 |
1 |
8 |
5 |
7 |
9 |
2 |
4 |
9 |
6 |
10 |
7 |
3 |
5 |
8 |
7 |
12 |
3 |
4 |
7 |
8 |
8 |
24 |
3 |
Розв’язання.
Для розрахунку параметрів гіперболічної функції за формулами (2.8.13) будуємо допоміжну розрахункову таблицю 2.6.
За формулами (2.8.13) знайдемо параметри рівняння регресії:
;
.
Побудуємо рівняння регресії: .
Таблиця 2.6
Номер підприємства |
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
1 |
1 |
8 |
1 |
8 |
1 |
2 |
4 |
9 |
0,25 |
2,25 |
0,063 |
3 |
5 |
8 |
0,2 |
1,6 |
0,04 |
4 |
7 |
8 |
0,143 |
1,143 |
0,020 |
5 |
7 |
9 |
0,143 |
1,286 |
0,020 |
6 |
10 |
7 |
0,1 |
0,7 |
0,01 |
7 |
12 |
3 |
0,083 |
0,25 |
0,007 |
8 |
24 |
3 |
0,042 |
0,125 |
0,002 |
|
70 |
55 |
1,961 |
15,354 |
1,162 |
Середні значення |
8,75 |
6,875 |
0,245 |
1,919 |
0,145 |
Для розрахунку параметрів степеневої регресії за формулами (2.8.18) – (2.8.19) будуємо допоміжну розрахункову таблицю 2.7.
Таблиця 2.7
Номер підприємства |
|
|
|
|
|
|
1 |
2 |
3 |
4 |
|
5 |
6 |
1 |
1 |
8 |
0 |
2,079 |
0 |
0 |
2 |
4 |
9 |
1,386 |
2,197 |
3,046 |
1,922 |
3 |
5 |
8 |
1,609 |
2,079 |
3,347 |
2,590 |
4 |
7 |
8 |
1,946 |
2,079 |
4,046 |
3,787 |
5 |
7 |
9 |
1,946 |
2,197 |
4,276 |
3,787 |
6 |
10 |
7 |
2,303 |
1,946 |
4,481 |
5,302 |
7 |
12 |
3 |
2,485 |
1,099 |
2,73 |
6,1751 |
8 |
24 |
3 |
3,178 |
1,099 |
3,491 |
10,100 |
|
70 |
55 |
14,853 |
14,776 |
25,417 |
33,662 |
Середні значення |
8,75 |
6,875 |
1,857 |
1,847 |
3,177 |
4,208 |
За формулами (2.8.18) – (2.8.18) знайдемо параметри рівняння регресії:
;
.
Звідки
.
Побудуємо рівняння регресії:
.
Для розрахунку параметрів показникової функції за формулами (2.8.20) – (2.8.21) будуємо допоміжну розрахункову таблицю 2.8.
Таблиця 2.8
Номер підприємства |
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
1 |
1 |
8 |
2,079 |
2,079 |
1 |
2 |
4 |
9 |
2,197 |
8,789 |
16 |
3 |
5 |
8 |
2,079 |
10,397 |
25 |
4 |
7 |
8 |
2,079 |
14,556 |
49 |
5 |
7 |
9 |
2,197 |
15,381 |
49 |
6 |
10 |
7 |
1,946 |
19,459 |
100 |
7 |
12 |
3 |
1,097 |
13,183 |
144 |
8 |
24 |
3 |
1,097 |
26,367 |
576 |
|
70 |
55 |
14,776 |
110,211 |
960 |
Середні значення |
8,75 |
6,875 |
1,847 |
13,776 |
120 |
За формулами (2.8.20) – (2.8.21) знайдемо параметри рівняння регресії:
;
.
Звідки
й
Побудуємо рівняння регресії:
.
Тісноту зв'язку ознак і для різних рівнянь регресій оцінимо через індекси кореляції, які розрахуємо за формулою (2.9.1):
для рівносторонньої гіперболи (використаємо дані таблиці 2.9)
;
для степеневої функції (використаємо дані таблиці 2.8)
:
для показникової функції (використаємо дані таблиці 2.8)
,
де .
Таким чином, ознаки й зв'язані слабко, якщо для їхнього зв'язку використати рівносторонню гіперболу або степеневу функцію. Для показникової функції цей зв'язок сильний, тому що . Це означає, що 64% варіації пояснюється варіацією фактору .
Таблиця 2.9
Номер підприємства |
|
|
|
|
|
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
1 |
1 |
8 |
8,951 |
0,904 |
11,732 |
13,928 |
2 |
4 |
9 |
6,889 |
4,458 |
7,41 |
2,527 |
3 |
5 |
8 |
6,7519 |
1,560 |
6,882 |
1,25 |
4 |
7 |
8 |
6,594 |
1,977 |
6,156 |
3,401 |
5 |
7 |
9 |
6,594 |
5,789 |
6,156 |
8,089 |
6 |
10 |
7 |
6,476 |
0,275 |
5,47 |
2,342 |
7 |
12 |
3 |
6,43 |
11,767 |
5,149 |
4,617 |
8 |
24 |
3 |
6,316 |
10,994 |
4,092 |
1,193 |
|
70 |
55 |
55 |
37,723 |
53,046 |
37,347 |
Середні значення |
8,75 |
6,875 |
6,875 |
4,7154 |
6,631 |
4,668 |
Таблиця 2.10
Номер підприємства |
|
|
|
|
1 |
2 |
3 |
4 |
5 |
1 |
1 |
8 |
9,703 |
2,9019 |
2 |
4 |
9 |
8,230 |
0,593 |
3 |
5 |
8 |
7,790 |
0,044 |
4 |
7 |
8 |
6,98 |
1,040 |
5 |
7 |
9 |
6,98 |
4,080 |
6 |
10 |
7 |
5,92 |
1,166 |
7 |
12 |
3 |
5,305 |
5,311 |
8 |
24 |
3 |
2,745 |
0,065 |
|
70 |
55 |
53,653 |
15,201 |
Середні значення |
8,75 |
6,875 |
6,707 |
1,9002 |
Оцінимо моделі через – критерії. Для цього розрахуємо – критерії за формулою (2.9.2), де , і перевіримо нульову гіпотезу : про випадкову природу залежності ознак по тому або іншому рівнянню регресії й статистичної незначущості його й показника тісноти зв'язку:
;
;
.
З таблиці Додатка 4 знайдемо .
Так як для рівносторонньої гіперболи й для степеневої функції , то нульова гіпотеза для них не відхиляється. Рівняння регресії у вигляді гіперболічної і степеневої функції не можна використати як модель залежності від .
Так як для показникової функції , то нульова гіпотеза про статистичну незначущість і ненадійность обраного рівняння регресії відхиляється з ймовірністю . Це означає, що факторна дисперсія істотно більше залишкової, а значить рівняння регресії у вигляді показникової функції якісно описує зміну результативної ознаки при зміні факторної ознаки .