2.1.1 Вибіркову коваріацію
Для цього застосувати формулу (1), функцію КОВАР(), формулу (2) та пакет аналізу (коваріація). Порівняти та пояснити 4 отримані результати.
Варіанти завдань (Додаток B).
2.1.2 Коефіцієнт кореляції
Для цього застосувати формулу (3), функцію КОРЕЛ(), пакет аналізу (кореляція). Порівняти та проаналізувати отримані результати. Визначити достовірність отриманого коефіцієнта кореляції.
Варіанти завдань (Додаток B).
Частина 3. Множинна кореляція
При великій кількості спостережень, коли коефіцієнти кореляції необхідно послідовно обчислювати для декількох вибірок, для зручності одержувані коефіцієнти зводять у таблиці, які називаються кореляційними матрицями.
У MS Excel для обчислення кореляційних матриць використовується процедура Кореляція з пакету Аналіз даних . Процедура дозволяє отримати кореляційну матрицю, що містить коефіцієнти кореляції між різними параметрами.
Для реалізації процедури необхідно:
1. виконати команду Сервіс - Аналіз даних;
2. в списку, що з'явився Інструменти аналізу вибрати рядок Кореляція і натиснути кнопку ОК;
3. в діалоговому вікні вказати Вхідний інтервал, тобто ввести посилання на комірки, що містять дані, які аналізуються. Вхідний інтервал повинен містити не менше двох стовпців.
4. в розділі Угрупування перемикач встановити у відповідності з введеними даними (по стовпцях або по рядках);
5. вказати вихідний інтервал, тобто ввести посилання на клітинку, з якої будуть показані результати аналізу. Розмір вихідного діапазону буде визначений автоматично, і на екран буде виведено повідомлення в разі можливого накладення вихідного діапазону на вихідні дані. Натиснути кнопку ОК.
У вихідний діапазон буде виведена кореляційна матриця, в якій на перетині кожних рядка і стовпця знаходиться коефіцієнт кореляції між відповідними параметрами. Комірки вихідного діапазону, що мають співпадаючі координати рядків і стовпців, містять значення 1, так як кожен стовпець у вхідному діапазоні повністю корелює сам із собою.
Розглядається окремо кожен коефіцієнт кореляції між відповідними параметрами. Відзначимо, що хоча в результаті буде отримана трикутна матриця, кореляційна матриця симетрична. Мається на увазі, що в порожніх клітинах в правій верхній половині таблиці знаходяться ті ж коефіцієнти кореляції, що і в нижній лівій (симетрично розташовані відносно діагоналі).
Приклад: Є щомісячні дані спостережень за станом погоди і відвідуваністю музеїв і парків Необхідно визначити, чи існує взаємозв'язок між станом погоди і відвідуваністю музеїв і парків.
Число ясних днів Кількість відвідувачів музею Кількість відвідувачів парку
Кількість ясних днів |
Кількість відвідувачів музею |
Кількість відвідувачів парку |
8 |
495 |
132 |
14 |
503 |
348 |
20 |
380 |
643 |
25 |
305 |
865 |
20 |
348 |
743 |
15 |
465 |
541 |
Розв’язок. Для виконання кореляційного аналізу введіть в діапазон A1: С3 вхідні дані (рис. 3). Потім в меню Сервіс виберіть пункт Аналіз даних і далі вкажіть рядок Кореляція. У діалоговому вікні вкажіть Вхідний інтервал (А2: С7). Вкажіть, що дані розглядаються по стовпцях. Вкажіть вихідний діапазон (Е1) і натисніть кнопку ОК.
Результати обчислення кореляційної матриці
Висновок: кореляція між станом погоди і відвідуваністю музею дорівнює -0,92, а між станом погоди і відвідуваністю парку 0,97, між відвідуваністю парку і музею - 0,91.
Таким чином, в результаті аналізу виявлені залежності: сильна ступінь зворотної лінійної взаємозв'язку між відвідуваністю музею та кількістю сонячних днів і практично лінійна (дуже сильна пряма) зв'язок між відвідуваністю парку і станом погоди. Між відвідуваністю музею та парку є сильний зворотний взаємозв'язок.
Завдання 3: Побудувати та проанаізувати кореляційну матрицю
Варіанти завдань (додаток C).
