- •Основні положення регресійного аналізу. Парна регресійна модель. Множинний регресійний аналіз
- •Інтервальна оцінка функції регресії
- •Преревірка значущості рівняння регресії. Інтервальна оцінка параметрів парної моделі
- •Нелінійна регресія
- •Множинний регресійний аналіз
- •Контрольні питання
- •Введення в аналіз часових рядів Загальні відомості про часові ряди і завдання їх аналізу
- •Стаціонарні часові ряди та їх характеристики. Автокореляційна функція
- •Аналітичне вирівнювання (згладжування) часового ряду (виділення невипадкової компоненти)
- •Часові ряди і прогнозування. Автокореляція збурень
- •Авторегресійна модель
- •Перевірка гіпотез про рівність часток ознаки в двох і більше сукупностях
- •Порівняння часток ознаки в кількох сукупностях
- •Порівняння дисперсій декількох сукупностей
- •Перевірка гіпотез про закон розподілу. Критерій Колмогорова
- •Поняття про багатовимірний кореляційний аналіз. Множинний та частинний коефіцієнти кореляції. Рангова кореляція
- •Множинний коефіцієнт кореляції
- •Частинний коефіцієнт кореляції
- •Рангова кореляція
- •Коефіцієнт рангової кореляції Кендалла
- •Матриця коваріації і її вибіркова оцінка
- •Мультиколінеарність
- •Поняття про інші методи багатовимірного статистичного аналізу
- •Метод головних компонент (компонентний аналіз)
- •Лінійні регресійні моделі фінансового ринку
- •Регресійні моделі
- •Ринкова модель
- •Моделі залежності від дотичного портфеля
- •Неврівноважені і врівноважені моделі
- •Модель оцінки фінансових активів (сарм)
- •Зв'язок між очікуваною прибутковістю і ризиком оптимального портфеля
- •Багатофакторні моделі
- •Список використаної та рекомендованої літератури
Коефіцієнт рангової кореляції Кендалла
Знаходиться
за формулою:
,
де К
– статистика
Кендалла
(при відсутності зв’язаних рангів). Для
визначення К
потрібно ранжувати об’єкти по одній
змінній в порядку зростання рангів (1,
2,…,n)
і визначити відповідні їм ранги (
)
по іншій змінній. Статистика К
дорівнює
загальному числу інверсій
( порушень порядку, коли більше число
стоїть зліва від меншого) в ранговій
послідовності (ранжуванні)
.
При повному співпадінні ранжувань маємо
К=0
і
;
при повній протилежності, можна показати,
що К=n(n-1)/2
і
.
В усіх інших випадках |τ|<1.
При
перевірці значущості τ виходять з того,
що у випадку справедливості нульової
гіпотези про відсутність кореляційного
зв’язку між змінними (при n>10)
τ
має наближено нормальний закон розподілу
з математичним сподіванням, рівним
нулю, і середнім квадратичним відхиленням
.
Тому τ значущий на рівні α, якщо значення
статистики
більше критичного
,
де
.
◄ Приклад 3 В результаті анкетного опитування для 10 найважливіших видів обладнання, що використовуються судноводіями під час
вахти, отримані наступні ранги по важливості обладнання Х і по частоті його використання Y ( див. табл. 2). Обчислити ранговий коефіцієнт Кендалла і оцінити його значущість на рівні α=0,05.
Таблиця 2
Ранг |
Тип обладнання |
Всього |
|||||||||
А |
Б |
В |
Г |
Д |
Е |
Є |
Ж |
З |
І |
||
Важливість обладнання, Х |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
- |
Частота використання,Y |
1 |
4 |
2 |
6 |
3 |
9 |
10 |
8 |
7 |
5 |
- |
Кількість інверсій |
0 |
2 |
0 |
2 |
0 |
3 |
3 |
2 |
1 |
0 |
К=13 |
Розв’язання.
Знайдемо, наприклад, кількість інверсій
при рангу n=6
по змінній Х
(результати обчислень розташуємо в
останньому рядку таблиці 2). Тоді
відповідний ранг по змінній Y
і, враховуючи подальші ранги, маємо
ранжування по Y
(9,10,8,7,5). З пар чисел (перестановок) (9,10),
(9,8), (9,7), (9,5) присутні інверсії (порушення
порядку, коли більше число стоїть зліва
від меншого) у трьох останніх парах,
тобто число інверсій рівне 3. Аналогічно
визначаємо й інші значення кількості
інверсій і знаходимо їх суму K=13.
Тепер за формулою рангової кореляції
Кендалла:
. Оцінимо значущість τ. Статистика
,
табличне критичне значення
.
Оскільки
,
то ранговий коефіцієнт кореляції
Кендалла значущий на 5%-ому рівні. Зв'язок
між даними змінними помірний. ►
Порівнюючи
коефіцієнти рангової кореляції ρ
(Спірмена) і τ (Кендалла), можна відмітити,
що
має деякі переваги перед ρ при дослідженні
його статистичних властивостей
(наприклад, можливістю приблизної
побудови довірчого інтервала для τ) і
великою зручністю його перерахунку при
додаванні до n
статистично досліджених об’єктів
нових.
Значення
коефіцієнтів ρ і τ тісно пов’язані між
собою. При помірно великих значеннях n
(n>10)
і при умові, що абсолютні величини
значень цих коефіцієнтів не надто
близькі до одиниці, їх зв’язує просте
приблизне співвідношення
.
Рангові коефіцієнти кореляції ρ і τ
можуть бути використані також для оцінки
тісноти зв’язку між простими кількісними
змінними, які виміряні в інтервальних
шкалах. Знаходження цих коефіцієнтів
не вимагає нормального розподілу
змінних, лінійного зв’язку між ними
(хоча і припускає монотонність функції
регресії, яка відображає цей зв’язок).
Але необхідно враховувати, що при
переході від початкових значень змінних
до їх рангів відбувається значена втрата
інформації. Чим тісніший зв'язок, чим
менше кореляційна залежність між
змінними відрізняється від лінійної,
тим ближче коефіцієнт Спірмена ρ до
коефіцієнта парної кореляції r.
Додаток 3
