- •7 Регресійний аналіз
- •7.1 Попередній аналіз даних
- •7.2 Припущення, які використовує регресійний аналіз
- •7.3 Вибір вигляду функції для монотонних процесів
- •7.4 Метод найменших квадратів для оцінки параметрів функції регресії
- •Властивості регресії
- •7.5 Оцінка якості моделі
- •7.6 Критерій Фішера для оцінки адекватності моделі
- •7.7 Перевірка значущості коефіцієнтів регресії
- •7.8 Функції Excel для побудови регресійних залежностей
- •Розв’язання
- •7.9 Парна регресія в матричній формі
- •7.10 Метод найменших квадратів при оцінюванні параметрів поліномів
- •Розв’язання
- •7.11 Множинний регресійний аналіз
- •7.11.1 Матричний спосіб оцінки параметрів множинної регресії
- •7.11.2 Перевірка значущості коефіцієнтів регресії
- •7.11.3 Перевірка якості моделі. Скоригований коефіцієнт детермінації
- •7.11.4 Парна й часткова кореляції
- •Розв’язання.
- •7.12 Методи побудови багатофакторної регресійної моделі
- •7.12.1 Вибір "найкращого" рівняння регресії
- •7.12.2 Метод усіх можливих регресій
- •7.12.3 Метод виключень
- •7.12.4 Кроковий регресійний метод
- •Питання і завдання до розділу 7
- •Лабораторна робота Тема. Парний регресійний аналіз
- •Лабораторна робота Тема. Множинний регресійний аналіз
- •8 Дисперсійний аналіз
- •8.1 Однофакторний дисперсійний аналіз
- •Розв’язання.
- •Питання і завдання до розділу 8
- •Лабораторна робота Тема. Однофакторний дисперсійний аналіз
- •9 Ранговий аналіз
- •9.1 Коефіцієнт рангової кореляції Кенделла (Кендалла)
- •9.2 Коефіцієнт рангової кореляції Спірмена
- •Розв’язок.
- •9.3 Коефіцієнт конкордації
- •Питання і завдання до розділу 9
9.2 Коефіцієнт рангової кореляції Спірмена
Коефіцієнт рангової кореляції Спірмена обчислюється за формулою
, (9.3)
де di 2= (xi–yi)2 – квадрати різниць рангів;
n – кількість спостережень.
Коефіцієнт Спірмена приймає значення з інтервалу [-1;1].
Для нашого прикладу
-
X
1
2
3
4
5
Y
4
1
2
5
3
di
-3
1
1
-1
2
di 2
9
1
1
1
4
=16
=0,2.
Зв'язок між ознаками вважається статистично значущим, якщо значення коефіцієнтів рангової кореляції Спірмена і Кенделла більше 0,5.
Для
нашого прикладу коефіцієнт Кенделла
τ
=0,2, коефіцієнт
рангової кореляції Спірмена
,
що
свідчить про практичну відсутність
зв'язку між розглянутими ознаками X
та Y.
Як правило, коефіцієнт Кенделла менший коефіцієнта Спірмена. При досить великому обсязі сукупності значення даних коефіцієнтів мають таку залежність:
=2/3 ρ
Коефіцієнт Спірмена (ρ) – легше розраховувати, але з теоретичної точки зору коефіцієнт Кенделла (τ) становить більший інтерес.
Якщо не можна встановити рангове розходження між декількома об'єктами, їх називають зв'язаними. В цьому випадку об’єктам приписують середній ранг. Наприклад, якщо об'єкти 4,5,6 – мають однакові значення, то їх середній ранг дорівнює (4+5+6)/3=5. Сума рангів зв’язаних об’єктів повинна дорівнювати сумі рангів при ранжуванні без урахування зв’язків.
Якщо t послідовних членів Х зв'язані, то всі оцінки, що відносяться до будь-якої пари, що вибрані з них, дорівнюють нулю. Число таких пар t(t – 1). Тоді
.
Відповідно для другої послідовності Y
,
де t та u – кількість зв’язаних пар у послідовностях. Позначимо
.
Отримаємо вираз для розрахунку коефіцієнта Кенделла при наявності зв’язаних об’єктів
. (9.4)
Аналогічно знаходимо вираз для обчислення коефіцієнта Спірмена. Тільки в цьому випадку
,
.
Отримаємо вираз для розрахунку коефіцієнта Спірмена при наявності зв’язаних об’єктів
. (9.5)
Приклад. На змаганнях з фігурного катання судді таким чином розташували учасників змагань:
|
|
учасники |
|||||||||
|
А |
Б |
В |
Г |
Д |
Є |
Ж |
З |
І |
К |
|
|
1 суддя |
1,5 |
1,5 |
3 |
4 |
6 |
6 |
6 |
8 |
9,5 |
9,5 |
|
2 суддя |
1 |
2 |
4 |
4 |
4 |
6 |
7 |
8 |
9 |
10 |
Встановити, наскільки об’єктивні оцінки суддів, тобто на скільки тісний зв'язок між їхнім оцінками. Обчислити коефіцієнти рангової кореляції Спірмена та Кенделла.
