- •План заняття
- •Методичні рекомендації
- •Етапи аналізу
- •Побудова довірчого інтервалу коефіцієнта регресії.
- •Задача 1
- •Задача 2
- •Задача 3
- •Задача 4
- •Задача 5
- •Задача 6
- •Задача 7
- •Приклади розв’язання типових задач
- •Залежність між факторною (х) та результативною (у) ознаками
- •Допоміжна таблиця для розрахунку параметрів лінійної моделі
- •Допоміжна таблиця для обчислення коефіцієнта кореляції Пірсона
- •Бібліографічний список до практичного заняття: [5 - 11, 15 - 20]
Задача 7
За даними обстеження витрати часу жінок на домашню роботу такі:
Тип помешкання |
Чисельність жінок, тис. чол. |
Середні витрати часу на домашню роботу, год. |
Групова дисперсія витрат часу |
Індивідуальна квартира |
50 |
6,2 |
0,01 |
Приватний будинок |
40 |
7,0 |
0,04 |
Щоб проаналізувати, чи існує взаємозв’язок між типом помешкання та витратами часу на домашню роботу, визначте міжгрупову, середню з групових дисперсії витрат часу жінок на домашню роботу. Поясніть зміст кожної дисперсії та зробіть загальний висновок про щільність зв’язку між типом помешкання та витратами часу на домашню роботу.
Приклади розв’язання типових задач
Приклад 1
На основі даних, наведених у табл. встановити наявність кореляційного зв’язку, визначити лінію регресії за лінійною моделлю. Оцінити істотність і щільність зв’язку.
Залежність між факторною (х) та результативною (у) ознаками
х |
2 |
3,5 |
4, |
5,2 |
6,3 |
7,1 |
8,4 |
9,5 |
у |
26,4 |
26,9 |
27,3 |
27,7 |
28,1 |
28,4 |
29,1 |
29,4 |
Розв’язання:
Математично лінійний зв’язок у загальному вигляді записується рівнянням:
Y = a + bx,
де Y – результативна ознака,
а – параметр рівняння, який характеризує початковий рівень;
b – параметр рівняння, який характеризує середній абсолютний приріст;
х – факторна ознака.
Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого – мінімізація суми квадратів відхилень емпіричних значень (y) від теоретичних Y:
де у – емпіричні значення результативної ознаки;
Y – теоретичні значення результативної ознаки.
Математично доведено, що значення параметрів a та b, при яких мінімізується сума квадратів відхилень, визначаються із системи нормальних рівнянь:
.
Розв’язавши цю систему, знаходимо такі значення параметрів:
; .
Для визначення параметрів лінійного рівняння складемо допоміжну таблицю.
Допоміжна таблиця для розрахунку параметрів лінійної моделі
і |
х |
у |
ху |
х2 |
1 |
2 |
26,4 |
52,8 |
4 |
2 |
3,5 |
26,9 |
94,15 |
12,25 |
3 |
4 |
27,3 |
109,2 |
16 |
4 |
5,2 |
27,7 |
144,04 |
27,04 |
5 |
6,3 |
28,1 |
177,03 |
39,69 |
6 |
7,1 |
28,4 |
201,64 |
50,41 |
7 |
8,4 |
29,1 |
244,44 |
70,56 |
8 |
9,5 |
29,4 |
279,3 |
90,25 |
Разом |
46 |
223,3 |
1302,6 |
310,2 |
Використовуючи дані наведеної таблиці, знаходимо параметри лінійного рівняння:
= 0,408
= 223,3 / 8 – 0,408 × 46 / 8 = 25,57.
Таким чином, лінія регресії має вигляд: у = 25,57 + 0,408 х.
Тобто, при зміні факторної ознаки х на одиницю результативна ознака у зросте на 0,408.
Для оцінки істотності та щільності лінійного зв’язку використовується лінійний коефіцієнт кореляції (Пірсона) r:
,
де – факторна дисперсія;
–загальна дисперсія.
–середнє значення факторної ознаки;
–середнє значення результативної ознаки;
n – кількість пар ознак.
Для обчислення коефіцієнта кореляції Пірсона складемо допоміжну таблицю.