
- •Державний вищий навчальний заклад
- •1. Інформаційна база економетричних моделей
- •1.1. Динамічні ряди та їхні характеристики
- •2. Варіаційні ряди та їхні характеристики
- •2. Проста вибіркова лінійна регресія
- •2.1. Оцінка параметрів лінійної регресії за допомогою методу найменших квадратів
- •2.2. Коефіцієнти кореляції та детермінації
- •Поняття про ступені вільності. Аналіз дисперсій
- •Anova-таблиця
- •2.4. Перевірка простої регресійної моделі на адекватність. Поняття f-критерію Фішера
- •2.5. Інші критерії якості лінійної регресії
- •2.6. Математичне сподівання та дисперсія розподілу параметрів b0 та b1 . Оцінка дисперсії випадкової величини .
- •2. Дисперсія параметра b0:
- •4. Дисперсія параметра b1:
- •5. Оцінка дисперсії випадкової величини :
- •Перевірка значимості параметрів b0 та b1 вибіркової лінійної регресійної моделі за допомогою t-теста Стьюдента
- •Коефіцієнта кореляції
- •2.9. Побудова інтервалів довіри для параметрів та
- •2.10. Прогнозування за моделями простої лінійної регресії
2.2. Коефіцієнти кореляції та детермінації
Найпростішим критерієм, який дає кількісну оцінку зв’язку між двома показниками, є коефіцієнт кореляції:
r
(2.2.1)
Значення
коефіцієнта завжди розташовані між –1
та +1
Якщо rух = 0, зв’язок між ознаками відсутній;
|r
yx|—
щільність зв’язку низька;
0,3
<|r
yx|
— щільність зв’язку середня;
0,75 <|r yx|<1 — щільність зв’язку висока;
r
yx=1
— зв’язок
переходить у функціональний;
r yx<0 — зв’язок зворотний;
r yx>0 — зв’язок прямий.
Поряд з коефіцієнтом кореляції використовується ще один критерій, за допомогою якого також вимірюється щільність зв’язку між двома або більше показниками та перевіряється адекватність (відповідність) побудованої регресійної моделі реальній дійсності. Таким критерієм є коефіцієнт детермінації (R2):
. (2.2.2)
Частина дисперсії, котра пояснює регресію, називається коефіцієнтом детермінації.
Цей коефіцієнт показує, яка частина загальної варіації залежної (результативної) ознаки (у) обумовлена варіацією незалежної (факторної) ознаки (х), що включена в регресійну модель.
Коефіцієнт
детермінації R2
завжди додатний і знаходиться в межах
від 0 до 1
.
[5]
Приклад 2. За даними прикладу 1 оцінити щільність зв’язку між обсягом продажу цукерок фірмою “Світоч” та витратами на рекламу.
Рішення: Розрахунки представимо в таблиці:
№п/п |
Хі — витрати на рекламу, млн.грн. |
Уі — обсяг продажу, млн. коробок |
|
|
|
|
|
1 2 3 4 5 |
5 6 9 12 18 |
25 30 35 45 65 |
-5 -1 -1 2 8 |
-15 -10 -5 5 25 |
75 40 5 10 200 |
25 16 1 4 64 |
225 100 25 25 625 |
|
50
10 |
200
40 |
0
0 |
0
0 |
330
66 |
110
22 |
1000
200 |
Визначимо коефіцієнт кореляції:
r
.
Визначимо коефіцієнт детермінації:
R2 = (r yx)2 = (0,995)2 = 0,990 або R2 = 99%.
Висновок: Коефіцієнт кореляції ryx=0,995 свідчить про високу щільність зв’язку між обсягом продажу цукерок та витратами на рекламу фірмою “Світоч”, оскільки 0,75<0,995<1. Коефіцієнт детермінації R2=99% показує, що 99% варіації (коливань) результативної ознаки — обсягу продажу цукерок на 99% обумовлено варіацією незалежної (факторної) ознаки — витратами на рекламу і лише 1% варіації обсягу продажу залежить від варіації факторів, що не включені в регресійну модель.
Завдання 5. За даними завдання 2 розрахувати коефіцієнт кореляції між обсягом продажу продукції та сумою, що використана на наукові дослідження в фірмі “Україна”. Визначити коефіцієнт детермінації для регресії. Дати економічну інтерпретацію одержаних результатів.
Завдання 6. За даними завдання 3 оцінити щільність зв’язку між залежною змінною (у) та незалежною змінною (х), розрахувавши коефіцієнти кореляції та детермінації. Зробити висновки.
Завдання 7. За даними завдання 4 дати кількісну оцінку зв’язку між урожайністю зернових та кількістю внесених мінеральних добрив під зернові в ПОК “Зоря” Білозерського району Херсонської області. Зробити висновки.
Завдання 8. Маємо статистику витрат родини залежно від кількості її членів:
Кількість членів родини, осіб, хі |
Витрати на відпустку, грош.одиниць, уі |
1 2 2 4 6 |
17 11 23 19 30 |
Побудувати лінійну регресію і розрахувати параметри.
Розрахувати коефіцієнт кореляції та детермінації. Які висновки можна зробити щодо якості регресійної моделі?
Завдання 9. Є 4 динамічні ряди. Якщо ці дані апроксимувати простою лінійною регресією, то вони дадуть однакові результати. Побудувати графіки і проаналізувати їх зображення. Побудувати лінійну модель, оцінивши параметри за методом найменших квадратів. Оцінити щільність зв’язку між залежною (у) та незалежною (х) змінними. Пояснити отримані результати.
Х1 |
У1 |
Х2 |
У2 |
Х3 |
У3 |
Х4 |
У4 |
10 |
8,04 |
10 |
9,14 |
10 |
7,46 |
8 |
6,58 |
14 |
9,96 |
14 |
8,1 |
14 |
8,86 |
8 |
5,76 |
5 |
5,68 |
5 |
4,74 |
5 |
5,73 |
8 |
7,71 |
8 |
6,95 |
8 |
8,14 |
8 |
6,77 |
8 |
8,84 |
9 |
8,81 |
9 |
8,77 |
9 |
7,11 |
8 |
8,47 |
12 |
10,84 |
12 |
9,13 |
12 |
8,15 |
8 |
7,04 |
4 |
4,26 |
4 |
3,1 |
4 |
5,39 |
8 |
5,25 |
7 |
4,82 |
7 |
4,26 |
7 |
6,42 |
19 |
12,5 |
11 |
8,33 |
11 |
9,26 |
11 |
7,81 |
8 |
5,56 |
13 |
7,58 |
13 |
8,74 |
13 |
12,74 |
8 |
7,91 |
6 |
7,24 |
6 |
6,13 |
6 |
6,08 |
8 |
6,89 |
Завдання 10. Маємо дані про рівень звільнень на 100 робітників та рівень безробіття у виробничій сфері східного регіону України (дані умовні) протягом 1997-2009 рр.
Примітка: Дані про звільнення стосуються людей, що покинули роботу за власним бажанням.
Рік |
Рівень звільнень на 100 робітників, у |
Рівень безробіття (%), х |
1997 |
1,3 |
6,2 |
1998 |
1,2 |
7,8 |
1999 |
1,4 |
5,8 |
2000 |
1,4 |
5,7 |
2001 |
1,5 |
5,0 |
2002 |
1,9 |
4,0 |
2003 |
2,6 |
3,2 |
2004 |
2,3 |
3,6 |
2005 |
2,5 |
3,3 |
2006 |
2,7 |
3,3 |
2007 |
2,1 |
5,6 |
2008 |
1,8 |
6,8 |
2009 |
2,2 |
5,6 |
Нанесіть дані на координатну площину.
Припустимо, що рівень звільнень (у) лінійно пов’язаний з рівнем безробіття (х) і цей зв’язок виражається моделлю
. Обчисліть параметри
.
Обчисліть коефіцієнт кореляції та детермінації.
Поясніть отримані результати.
Завдання 11. У таблиці подано дані про кількість телефонів на 1000 осіб (у) та валовий внутрішній продукт (ВВП) на душу населення (х) у західному районі України (дані умовні) за 1989-2009 рр. Чи є зв’язок між цими двома змінними? Довести, побудувавши лінійну регресійну модель та обчисливши коефіцієнти кореляції та детермінації. Зробити висновки.
Рік |
у |
х |
Рік |
у |
х |
1989 |
36 |
1299 |
2001 |
102 |
3033 |
1990 |
37 |
1365 |
2002 |
114 |
3317 |
1991 |
38 |
1409 |
2003 |
126 |
3487 |
1992 |
41 |
1549 |
2004 |
141 |
3575 |
1993 |
42 |
1416 |
2005 |
163 |
3784 |
1994 |
45 |
1473 |
2006 |
196 |
4025 |
1995 |
48 |
1589 |
2007 |
223 |
4286 |
1996 |
54 |
1757 |
2008 |
269 |
4628 |
1997 |
59 |
1974 |
2009 |
291 |
5038 |
1998 |
67 |
2204 |
|
|
|
1999 |
78 |
2462 |
|
|
|
2000 |
90 |
2723 |
|
|
|