- •Основні положення регресійного аналізу. Парна регресійна модель. Множинний регресійний аналіз
- •Інтервальна оцінка функції регресії
- •Преревірка значущості рівняння регресії. Інтервальна оцінка параметрів парної моделі
- •Нелінійна регресія
- •Множинний регресійний аналіз
- •Контрольні питання
- •Введення в аналіз часових рядів Загальні відомості про часові ряди і завдання їх аналізу
- •Стаціонарні часові ряди та їх характеристики. Автокореляційна функція
- •Аналітичне вирівнювання (згладжування) часового ряду (виділення невипадкової компоненти)
- •Часові ряди і прогнозування. Автокореляція збурень
- •Авторегресійна модель
- •Перевірка гіпотез про рівність часток ознаки в двох і більше сукупностях
- •Порівняння часток ознаки в кількох сукупностях
- •Порівняння дисперсій декількох сукупностей
- •Перевірка гіпотез про закон розподілу. Критерій Колмогорова
- •Поняття про багатовимірний кореляційний аналіз. Множинний та частинний коефіцієнти кореляції. Рангова кореляція
- •Множинний коефіцієнт кореляції
- •Частинний коефіцієнт кореляції
- •Рангова кореляція
- •Коефіцієнт рангової кореляції Кендалла
- •Матриця коваріації і її вибіркова оцінка
- •Мультиколінеарність
- •Поняття про інші методи багатовимірного статистичного аналізу
- •Метод головних компонент (компонентний аналіз)
- •Лінійні регресійні моделі фінансового ринку
- •Регресійні моделі
- •Ринкова модель
- •Моделі залежності від дотичного портфеля
- •Неврівноважені і врівноважені моделі
- •Модель оцінки фінансових активів (сарм)
- •Зв'язок між очікуваною прибутковістю і ризиком оптимального портфеля
- •Багатофакторні моделі
- •Список використаної та рекомендованої літератури
Поняття про багатовимірний кореляційний аналіз. Множинний та частинний коефіцієнти кореляції. Рангова кореляція
Економічні явища найчастіше адекватно описується багатофакторни-ми моделями. Тому виникає необхідність узагальнити розглянуту в
розділі 6 двовимірну кореляційну модель на випадок декількох змінних.
Нехай
маємо сукупність випадкових змінних
які мають спільний нормальний розподіл.
У цьому випадку матрицю
(1)
складену
з парних коефіцієнтів кореляції
(i,
j
=1,2, …,p),
будемо називати кореляційною. Основна
задача багатовимірного кореляційного
аналізу є в оцінці кореляційної матриці
за вибіркою. Ця задача розв’язується
визначенням матриці вибіркових
коефіцієнтів кореляції :
(2)
де
(i,
j
=1,2, …,p),
визначається за формулою
або її модифікаціями. В багатовимірному
кореляційному аналізі розглядають дві
ти-
пові задачі:
а) визначення тісноти зв’язку однієї зі змінних із сукупністю інших (р-1 ) змінних, що розглядаються;
б)
визначення тісноти зв’язку між змінними
при фіксуванні або виключенні впливу
інших q
змінних, де q
.
Ці задачі розв’язуються за допомогою множинних та частинних коефіцієнтів кореляції.
Множинний коефіцієнт кореляції
Тіснота
лінійного взаємозв’язку однієї змінної
з
сукупністю інших (р-1)
змінних
,
що розглядається в цілому, вимірюється
за допомогою множинного коефіцієнта
кореляції
,
який є узагальненням парного коефіцієнта
кореляції
.
Вибірковий множинний чи сукупний,
коефіцієнт кореляції
який є оцінкою
може бути обчислений за формулою:
=
,
де
-
визначник матриці
;
-
алгебраїчне доповнення елемента
тієї ж матриці (рівного 1). У випадку
трьох змінних (р=3)
маємо
. Множинний коефіцієнт кореляції
знаходиться в межах від 0 до 1. Він не
менше ніж абсолютна величина будь-якого
парного або частинного коефіцієнта
кореляції з таким самим початковим
індексом. За допомогою множинного
коефіцієнта кореляції (по мірі прямування
R
до 1) робимо висновок про тісноту
взаємозв’язку, проте не про її напрям.
Величина
називається вибірковим
множинним коефіцієнтом детермінації
і показує яку частину варіації
досліджуваної змінної пояснює варіація
інших змінних. Можна показати, що
множинний коефіцієнт кореляції
відрізняється від 0, якщо значення
статистики
, де
-
табличне значення F-критерія
на рівні значущості
при числі степенів вільності
та
=n-p.
Частинний коефіцієнт кореляції
Якщо
змінні корелюють одна з одною, то на
значення парного коефіцієнта кореляції
частково впливають інші змінні. Вибірковим
частинним коефіцієнтом кореляції між
змінними
та
при фіксованих значеннях інших (р-2)
змінних називається вираз
,
де
-алгебраїчні
доповнення елементів
матриці
.
У випадку трьох змінних (р=3)
маємо, що
. Частинний коефіцієнт кореляції
,
як і парний коефіцієнт кореляції r,
може приймати значення від -1 до 1. Крім
цього
,
обчислений на основі вибірки об’єму
n,
має такий самий розподіл, що і r,
знайдений за (n-p+2)
cпостереженнями.
Тому важливість частинного коефіцієнта
кореляції
,
оцінюють так само як і коефіцієнт
кореляції r,
проте при цьому вважають n′=n-p+2.
◄ Приклад
1
Для знаходження залежності між
продуктивністю роботи Х1,
віком Х2
і виробничим стажем Х3
була зроблена вибірка з 100 робітників
однієї і тієї ж спеціальності. Знайдені
парні коефіцієнті кореляції виявилися
=0.20
=0.41
=0.82.
Знайти
множинний коефіцієнт кореляції
,
частинні коефіцієнти кореляції і оцінити
їх значення.
Розв’язання. Знайдемо множинний коефіцієнт кореляції
.
Тобто, між продуктивністю праці, з
одного боку , і віком та виробничим
стажем працівників з іншого існує
помітний зв'язок. Множинний коефіцієнт
детермінації
=0,255
показує, що варіація продуктивності
роботи працівників на 22,5% пояснюється
варіацією їх віку та стажу.
Для
оцінки
знайдемо
.
По таблицях
F-
розподілу знайдемо
.
Оскільки F
>
, то
значно
відрізняється від 0.
Знаходимо частинні коефіцієнти кореляції:
.
Аналогічно
0.44;
0.83.
Оцінимо значення
.
Вважаємо умовно n′=n-p+2=
=100-3+2=99.
Статистика критерію
.
За
таблицею t-
розподілу Стьюдента знаходимо
.
Оскільки
, то частинний коефіцієнт кореляції
значущий. Отже, будуть значущі і більші
коефіцієнти
та
.
Порівнюючи частинні коефіцієнти
кореляції
з
відповідними парними коефіцієнтами
бачимо, що завдяки очищенню зв’язку
найбільшій зміні піддався коефіцієнт
кореляції між продуктивністю праці Х1
та віком Х2
робітників
(змінилась не лише його величина, а й
знак, причому обидва коефіцієнти
значущі). Отже між продуктивністю праці
Х1
та віком Х2
робітників
існує прямий кореляційний зв'язок (
.
Якщо
зменшити (виключити) вплив змінної Х3,
то продуктивність праці Х1
знаходиться в оберненому (і досить
слабкому по тісноті) зв’язку з віком
працівників Х2.
Це досить легко пояснити, якщо розглядати
вік як показник продуктивності
(працездатності) організму на певному
відрізку його життєдіяльності. Таким
самим способом можуть бути інтерпретовані
й інші частинні коефіцієнти кореляції.►
Задачею
наукового дослідження
є в відшукування причинних залежностей.
Тільки знання справжніх причин дозволяє
правильно зрозуміти і викласти
закономірності, що спостерігаються.
Але кореляція, як формальне статистичне
поняття, сама по собі не показує причинного
характеру зв’язку. За допомогою
кореляційного аналізу не можна вказати,
яку змінну приймати як причину, а яку –
як наслідок.
Не
існує загальновживаного критерію
перевірки вимоги кореляційного аналізу
- нормальності багатовимірного розподілу
змінних. Враховуючи властивості
теоретичної моделі, зазвичай вважають,
що відношення до спільного нормального
закону можливе, якщо окремі одномірні
розподіли змінних не суперечать
нормальним розподілам. Для перевірки
лінійності зв’язку пари ознак можна
використовувати розходження між
квадратами емпіричного кореляційного
відношення
та коефіцієнта кореляції
,
враховуючи, що статистика
(n
-
кількість спостережень, m
-
кількість групових інтервалів) має
F-розподіл
з
i
степенями вільності.
