- •7 Регресійний аналіз
- •7.1 Попередній аналіз даних
- •7.2 Припущення, які використовує регресійний аналіз
- •7.3 Вибір вигляду функції для монотонних процесів
- •7.4 Метод найменших квадратів для оцінки параметрів функції регресії
- •Властивості регресії
- •7.5 Оцінка якості моделі
- •7.6 Критерій Фішера для оцінки адекватності моделі
- •7.7 Перевірка значущості коефіцієнтів регресії
- •7.8 Функції Excel для побудови регресійних залежностей
- •Розв’язання
- •7.9 Парна регресія в матричній формі
- •7.10 Метод найменших квадратів при оцінюванні параметрів поліномів
- •Розв’язання
- •7.11 Множинний регресійний аналіз
- •7.11.1 Матричний спосіб оцінки параметрів множинної регресії
- •7.11.2 Перевірка значущості коефіцієнтів регресії
- •7.11.3 Перевірка якості моделі. Скоригований коефіцієнт детермінації
- •7.11.4 Парна й часткова кореляції
- •Розв’язання.
- •7.12 Методи побудови багатофакторної регресійної моделі
- •7.12.1 Вибір "найкращого" рівняння регресії
- •7.12.2 Метод усіх можливих регресій
- •7.12.3 Метод виключень
- •7.12.4 Кроковий регресійний метод
- •Питання і завдання до розділу 7
- •Лабораторна робота Тема. Парний регресійний аналіз
- •Лабораторна робота Тема. Множинний регресійний аналіз
- •8 Дисперсійний аналіз
- •8.1 Однофакторний дисперсійний аналіз
- •Розв’язання.
- •Питання і завдання до розділу 8
- •Лабораторна робота Тема. Однофакторний дисперсійний аналіз
- •9 Ранговий аналіз
- •9.1 Коефіцієнт рангової кореляції Кенделла (Кендалла)
- •9.2 Коефіцієнт рангової кореляції Спірмена
- •Розв’язок.
- •9.3 Коефіцієнт конкордації
- •Питання і завдання до розділу 9
Розв’язання.
1 Обчислимо парні коефіцієнти кореляції.
Використовуємо Сервис – Анализ данных – Корреляция.
Одержимо кореляційну матрицю
|
|
|
X1 |
X2 |
Y |
|
|
|
Строка 1 |
Строка 2 |
Строка 3 |
|
X1 |
Строка 1 |
1 |
|
|
|
X2 |
Строка 2 |
0,508 |
1 |
|
|
Y |
Строка 3 |
0,901 |
0,7619 |
1 |
Отже відповідні коефіцієнти парної кореляції такі:
rY1=0,901; rY2= 0,7619; r12=0,508.
Обчислимо коефіцієнти часткової кореляції за формулами
,
,

Отримаємо такі данні:
-
ry1,2
=
0,921637
ry2,1
=
0,814348
r12,y
=
-0,63603
Проведемо аналіз отриманих коефіцієнтів парної та часткової кореляції.
Додатне значення ry1 свідчить про прямий зв'язок між Y та X1, ry1=0,901, отже вплив потужності шару X1 на видобуток вугілля сильний. Усунення X2 збільшує кореляційний зв'язок (ry1,2 = 0,921637).
Додатне значення ry2 свідчить про прямий зв'язок між Y та X2, оскільки ry2=0,7619 – зв'язок обсягу видобутку вугілля й рівня механізації робіт X2 суттєвий. Усунення Х1 цей зв'язок підсилює (ry2,1 = 0,814348).
r12=0,508 свідчить про те, що X1 і X2 практично не корелюють. Це важливо в регресійних моделях. Однак усунення Y не послабляє кореляцію (r12,y = -0,63603).
2 Оцінимо невідомі параметри множинної лінійної регресії.
Рівняння
регресії має вигляд
![]()
=a0+a1x1+a2x2.
Для визначення невідомих параметрів
регресії (а0,
а1
, а2)
необхідно записати систему рівнянь у
матричній формі.
.
Запишемо матриці X та Y .
|
X |
|
|
Y |
|
1 |
8 |
5 |
5 |
|
1 |
11 |
8 |
11 |
|
1 |
12 |
8 |
10 |
|
1 |
9 |
5 |
6 |
|
1 |
8 |
7 |
6 |
|
1 |
8 |
8 |
7 |
|
1 |
9 |
6 |
6 |
|
1 |
9 |
4 |
5 |
|
1 |
8 |
5 |
5 |
|
1 |
12 |
7 |
11 |
Обчислимо XТ за допомогою функції Excel ТРАНСП( <масив>).
|
XТ |
|||||||||
|
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
8 |
11 |
12 |
9 |
8 |
8 |
9 |
9 |
8 |
12 |
|
5 |
8 |
8 |
5 |
7 |
8 |
6 |
4 |
4 |
7 |
Обчислимо добутки матриць XТХ та XТY (функція Excel МУМНОЖ(<матриця 1>;< матриця 2>).
|
XТ |
|
XТY |
||
|
10 |
94 |
62 |
|
72 |
|
94 |
908 |
595 |
|
710 |
|
62 |
595 |
408 |
|
474 |
Знайдемо обернену матрицю (XТХ)-1 (функція Excel МОБР(<діапазон>)). А потім обчислимо добуток матриць (XТХ)-1(XТY).
|
(XТ)-1 |
(XТХ)-1(XТY) |
|||
|
3,849883 |
-0,34239 |
-0,08571 |
а0 = |
-6,53302 |
|
-0,34239 |
0,055269 |
-0,02857 |
а1 = |
1,04637 |
|
-0,08571 |
-0,02857 |
0,057143 |
а2 = |
0,628571 |
За значеннями обчислених параметрів записуємо рівняння регресії y= -6,533+ 1,046x1+ 0,6286x2.
3 Використовуючи функцію ЛИНЕЙН, перевіряємо обчислення. Отримуємо такі дані:
|
0,6286 |
1,046 |
-6,533 |
|
0,1693 |
0,166 |
1,3897 |
|
0,9368 |
0,708 |
|
|
51,910 |
7 |
|
|
52,088 |
3,5119 |
|
Як бачимо з таблиці a0 = -6,533, a1 = 1,046, a2 = 0,6286, R2= 0,9368, Fp= 51,910.
Одержуємо рівняння регресії y= -6,533+ 1,046x1+ 0,6286x2.
Воно показує, що при збільшенні тільки потужності шару x1 (при незмінному x2) на 1 м видобуток вугілля на одного робітника y збільшиться в середньому на 1,046 т, а при збільшенні тільки рівня механізації робіт x2 (при незмінному x1) на 1% – у середньому на 0,6286 т.
-
Установимо значущість коефіцієнтів лінійної регресії. Обчислимо критеріальні значення tai = ai /σai.
![]()
Задамо
рівень значущості
та обчислимо критичне значення
,
де k –
кількість параметрів регресії; n
– кількість вимірювань.
tkp=СТЬЮДРАСПОБР(0,05;7)=2,365
Якщо |tai | < tkr – коефіцієнти статистично не значущі, у випадку |tai |> tkr – коефіцієнти статистично значущі.
Висновок: коефіцієнти регресії а0 , а1, а2 статистично значущі.
5
Перевіримо якість моделі. Коефіцієнт
детермінації R2=0,936,
скоригований коефіцієнт детермінації
–
=0,9188,
що свідчить про прийнятну якість моделі.
6 Перевіримо адекватність моделі за критерієм Фішера.
Fp=51,91, Fkp=FРАСПОБР(0,05; 2; 7)=19,35.
Як бачимо Fp > Fkp, отже модель адекватна.
Висновок: модель Y= -6,533+ 1,046x1+ 0,6286x2 +U якісна і адекватна.
