- •Тема 8. Статистичні методи вимірювання взаємозв”язків.
- •8. 1. Види взаємозв язків між явищами.
- •8.2. Метод аналітичного групування.
- •Залежність продуктивності праці від урожайності
- •Найчастіше в статистистико-економічних дослідженнях
- •8.3. Основи кореляційно- регресійного аналізу.
- •Степенева функція приводиться до лінійного вигляду логарифмуванням. .
- •Індекс кореляції – це корінь квадратний із коєфіцієнта детермінації.
- •8.4. Множинна регресія.
Степенева функція приводиться до лінійного вигляду логарифмуванням. .
Гіпербола
приводиться до лінійного вигляду заміною
х
новою зміною (її зворотнім значенням
Z=
).
.
Парабола другого
порядку
приводиться до лінійного вигляду заміною
квадрату значень факторної ознаки (
),
в результаті чого дістанемо лінійну
функцію від двох змінних
.
Подальші розрахунки аналогічні лінійній моделі.
ІІІ етап визначення тісноти зв’язку.
Цей етап грунтується, як і в методі аналітичного групування, на привилі складання дисперсій. На відміну від методу аналітичного групування, де оцінками лінії регресії є групові середні результативної ознаки, в кореляційно-регресійному аналізі оцінками є теоритичні значення результативної ознаки.
Дисперсію теоретичних значень називають факторною (вона ж у методі аналітичного групування називається міжгруповою) і обчислюють
Як і в методі аналітичного групування, вона характеризує варіацію результативної ознаки у, пов’язану з варіацією факторної ознаки х.
Замість середньої із групових дисперсій обчислюють залишкову дисперсію
.
Вона характеризує варіацію результативної ознаки у, не пов’язану з факторною ознакою х.
Наведені
формули
теоретичної
та залишкової дисперсій потребують
попереднього обчислення теоретичних
значень
для всіх елементів сукупності. Наприклад,
для першого господарства
=154,840+1,733*50,3=242,01ц/особу
Аналогічно - для другого – двадцятого господарств.
Щоб зменшити осяг обчислень, на практиці використовують іншу розрахункову формулу дисперсії теоретичних значень (факторної дисперсії) без теоретичних значень
У нашому прикладі
Загальну
дисперсію ознаки у
визначено раніше
,
а залишкову визначають за правилом
складання дисперсій.
.
Мірою тісноти зв’язку в кореляційно-регресійному аналізі є коефіцієнт детермінації , аналогічний кореляційному відношенню.
.
Цей коефіцієнт характеризує ту частину варіації результативної ознаки у, яка відповідає лінійному рівнянню регресії.
Отже, в обстеженій сукупності господарств 91,02% варіації продуктивності праці пояснюється різними рівнями урожайності.
Коефіцієнт
детермінації
,
як і коререляційне відношення
,
приймає значення 0≤
≤1.
При
=
0 дисперсія теоретичних значень
=
0, всі теоретичні значення
збігаються
з середнім значенням
.
Лінійний кореляційний зв’язок між х
і у
відсутній.
При =1 дисперсія теоретичних значень дорівнює загальній, залишкова дисперсія дорівнює нулю; емпіричні значення у і теоретичні збігаються, зв’язок між ознаками х і у лінійно-функціональний.
Індекс кореляції – це корінь квадратний із коєфіцієнта детермінації.
Як і , індекс кореляції змінюється в межах від 0 до1, характеризує тісноту зв’язку, але економічної інтерпритації не має.
Для вимірювання тісноти зв’язку при лінійній залежності використовують лінійний коефіцієнт кореляції
.
Межі
зміни -1<
<+1. Він характеризує не тільки тісноту,
а й напрям зв язку. Якщо r
> 0, то це означає прямий зв”язок між
ознаками, а якщо r
< 0 – зворотній.
На практиці частіше використовують таку формулу для визначення :
Абсолютна величина збігається з індексом кореляції R.
У
прикладі :
=
101,2;
=
330,22 ;
;
Отже
r
=
.
ІУ етап. Перевірка істотності зв язку.
У
кореляційно-регресійному аналізі
перевірку істотності зв”язку здійснюють
за допомогою тих самих критеріїв і за
тими ж процедурами, що і в методі
аналітичного групування. Ступені
вільності залежать від числа параметрів
рівняння регресії
.
Для лінійної моделі
Істотність зв”язку можна перевірити
за допомогою таблиць критичних значень
R².
Так для рівня істотності
=
0,05 критичне значення
Фактичне
значення R2
=0,910 значно
перевищує критичне, що свідчить про
істотність лінійного кореляційного
зв’язку між продуктивністю праці і
урожайністю.
У випадку, коли використовується F – критерій, фактичне значення визначають як
.
Критичне значення F 0,95 (1,18) = 4,41 значно менше за фактичне, що підтверджує істотність кореляційного зв”язку між ознаками, які вивчають.
У невеликих за обсягом сукупностях коефіціент регресії схильний до випадкових коливань. Тому слід визначати відповідні межи цих коливань, тобто довірчий інтервал коефіцієнта регресії.
Середня помилка для визначається за формулою
.
Величина граничної помилки залежить від імовірності Р.
,
де t- коефіціент довіри.
Для
Р = 0,954 (t
=2 ) гранична помилка у два рази більша
від середньої і становить
.
Довірні межі коефіціента регресії :
1,733-0,256≤ ≤1,733=0,256
1,477≤ ≤1,989.
Отже, якщо урожайність збільшується на 1 ц/га, рівень продуктивності праці підвищується не менше, ніж на 1,477 і не більше,ніж на 1,989 ц/особу.
Як правило, кореляційно-регресійний аналіз проводиться за незгрупованими даними, але вихідна інформація може бути подана у вигляді аналітичного групування чи комбінаційного розподілу.
