
- •Лабораторна робота № 2 Тема: Кореляційно-регресійний аналіз
- •Частина 1. Кореляційний аналіз. Множинна кореляція
- •Завдання 1
- •1.1. Отримати та проаналізувати описову статистику заданих наборів даних. Оцінити середнє значення по у.
- •1.2.Встановити ступінь лінійного зв’язку між вибірками, застосовуючи:
- •Множинна кореляція
- •Частина 2. Регресійний аналіз
- •Порядок виконання роботи
- •Список питань до лабораторної роботи 2
- •Додатки
- •Стандартні коефіциєнти кореляції, які вважаються достовірными (по л.С. Каміиському)
Лабораторна робота № 2 Тема: Кореляційно-регресійний аналіз
Мета. Навчитись визначати міру зв’язку між двома вибірками (коефіцієнт кореляціїї) та декількома вибірками (кореляційна матриця), а також розв’язувати задачі парної та множинної регресії за допомогою Excel.
Частина 1. Кореляційний аналіз. Множинна кореляція
Одна з найбільш поширених завдань статистичного дослідження полягає у вивченні зв'язку між вибірками. Зазвичай зв'язок між вибірками носить не функціональний, а імовірнісний (або стохастичний) характер. У цьому випадку немає суворої, однозначної залежності між величинами. При вивченні стохастичних залежностей розрізняють кореляцію і регресію.
Для оцінки ступеня взаємозв'язку величин X і Y, виміряних в кількісних шкалах, використовується коефіцієнт лінійної кореляції (коефіцієнт Пірсона), що припускає, що вибірки X і Y розподілені по нормальному закону.
Коефіцієнт кореляції -
параметр, який характеризує ступінь
лінійного взаємозв'язку між двома
вибірками, розраховується за формулою:
(1)
У MS Excel для обчислення парних коефіцієнтів лінійної кореляції використовується спеціальна функція КОРЕЛЛ (масив1; масив2), де масив1 - посилання на діапазон комірок першої вибірки (X); масив2 - посилання на діапазон комірок другої вибірки (Y).
Приклад 10 школярам були задані тести на наглядно-образне і вербальне мислення. Вимірявся середній час розв’язку завдань теста в секундах. Дослідника цікавить питання: чи існує взаємозв’язок між часом розв’язку цих задач? Змінна X — означає середній час розв’язку наглядно-образних, а змінна Y— середній час розв’язку вербальних завдань тестів.
Т
аблицая1
№ п/п |
x |
Y |
1 |
19 |
17 |
2 |
32 |
7 |
3 |
33 |
17 |
4 |
44 |
28 |
5 |
28 |
27 |
6 |
35 |
31 |
7 |
39 |
20 |
8 |
39 |
17 |
9 |
44 |
35 |
10 |
44 |
43 |
Рис. 1. Результати обчислення коефіцієнта кореляції
Завдання 1
1.1. Отримати та проаналізувати описову статистику заданих наборів даних. Оцінити середнє значення по у.
1.2.Встановити ступінь лінійного зв’язку між вибірками, застосовуючи:
коефіцієнт кореляції (формула1)
функцію КОРРЕЛ()
Порівняти отримані результати.
Варіанти завдань (Додаток B).
Множинна кореляція
При великій кількості спостережень, коли коефіцієнти кореляції необхідно послідовно обчислювати для декількох вибірок, для зручності одержувані коефіцієнти зводять у таблиці, які називаються кореляційними матрицями.
У MS Excel для обчислення кореляційних матриць використовується процедура Кореляція з пакету Аналіз даних . Процедура дозволяє отримати кореляційну матрицю, що містить коефіцієнти кореляції між різними параметрами.
Для реалізації процедури необхідно:
1. виконати команду Сервіс - Аналіз даних;
2. в списку, що з'явився Інструменти аналізу вибрати рядок Кореляція і натиснути кнопку ОК;
3. в діалоговому вікні вказати Вхідний інтервал, тобто ввести посилання на комірки, що містять дані, які аналізуються. Вхідний інтервал повинен містити не менше двох стовпців.
4. в розділі Угрупування перемикач встановити у відповідності з введеними даними (по стовпцях або по рядках);
5. вказати вихідний інтервал, тобто ввести посилання на клітинку, з якої будуть показані результати аналізу. Розмір вихідного діапазону буде визначений автоматично, і на екран буде виведено повідомлення в разі можливого накладення вихідного діапазону на вихідні дані. Натиснути кнопку ОК.
У вихідний діапазон буде виведена кореляційна матриця, в якій на перетині кожних рядка і стовпця знаходиться коефіцієнт кореляції між відповідними параметрами. Комірки вихідного діапазону, що мають співпадаючі координати рядків і стовпців, містять значення 1, так як кожен стовпець у вхідному діапазоні повністю корелює сам із собою.
Розглядається окремо кожен коефіцієнт кореляції між відповідними параметрами. Відзначимо, що хоча в результаті буде отримана трикутна матриця, кореляційна матриця симетрична. Мається на увазі, що в порожніх клітинах в правій верхній половині таблиці знаходяться ті ж коефіцієнти кореляції, що і в нижній лівій (симетрично розташовані відносно діагоналі).
Приклад: Є щомісячні дані спостережень за станом погоди і відвідуваністю музеїв і парків (див. табл. 3). Необхідно визначити, чи існує взаємозв'язок між станом погоди і відвідуваністю музеїв і парків.
Таблиця 3.
Число ясних днів Кількість відвідувачів музею Кількість відвідувачів парку
Таблица 3.
Кількість ясних днів |
Кількість відвідувачів музею |
Кількість відвідувачів парку |
8 |
495 |
132 |
14 |
503 |
348 |
20 |
380 |
643 |
25 |
305 |
865 |
20 |
348 |
743 |
15 |
465 |
541 |
Розв’язок. Для виконання кореляційного аналізу введіть в діапазон A1: С3 вхідні дані (рис. 3). Потім в меню Сервіс виберіть пункт Аналіз даних і далі вкажіть рядок Кореляція. У діалоговому вікні вкажіть Вхідний інтервал (А2: С7). Вкажіть, що дані розглядаються по стовпцях. Вкажіть вихідний діапазон (Е1) і натисніть кнопку ОК.
Рис. 3. Результати обчислення кореляційної матриці з прикладу 3
На рис. 3 видно, що кореляція між станом погоди і відвідуваністю музею дорівнює -0,92, а між станом погоди і відвідуваністю парку 0,97, між відвідуваністю парку і музею - 0,91.
Таким чином, в результаті аналізу виявлені залежності: сильна ступінь зворотної лінійної взаємозв'язку між відвідуваністю музею та кількістю сонячних днів і практично лінійна (дуже сильна пряма) зв'язок між відвідуваністю парку і станом погоди. Між відвідуваністю музею та парку є сильний зворотний взаємозв'язок.
Завдання для самостійної роботи
Приклад . 10 менеджерів оцінювалися за методикою експертних оцінок психологічних характеристик особистості керівника (див. Психологічні тести. Т.2. Під ред. А.А. Кареліна. - М., ВЛАДОС, 1999, стор 99). 15 експертів визначали оцінку кожної психологічної характеристики за п'ятибальною системою (див. табл. 4). Психолога цікавить питання, у якому взаємозв'язку знаходяться ці характеристики керівника між собою.
Таблица 4.
-
N п/п
тактичність
вимогливість
критичність
1
70
18
36
2
60
17
29
3
70
22
40
4
46
10
12
5
58
16
31
6
69
18
32
7
32
9
13
8
62
18
35
9
46
15
30
10
62
22
36
Перевірте відповідь: всі три оцінювані якості справляють істотний вплив один на одного, іншими словами, такі якості особистості менеджера, як критичність, тактовність і вимогливість, виступають єдиним комплексом і в дуже великій мірі необхідні для успішності його професійної роботи (див. рис. 4).
Рис. 4. Результати обчислення кореляційної матриці з завдання 4
Завдання 2: Побудувати та проаналізувати кореляційну матрицю.
Варіанти завдань (додаток C).