- •Передмова
- •Змістовний модуль 1 предмет і методологія статистики, система показників
- •Тема 1. Методологічні основи статистики
- •Тема 2. Статистичне спостереження
- •Тема 3. Зведення і групування статистичних даних
- •Групування підприємств торгівлі за розміром товарообігу
- •Дані про робітників підприємства
- •Групування робітників за стажем роботи
- •Робоча таблиця “ Розподіл робітників за стажем роботи ”
- •Групування робітників за стажем роботи
- •Групування робітників за стажем роботи і продуктивністю праці
- •Чисельність робітників, осіб, за варіантами
- •Тема 4. Узагальнюючі статистичні показники
- •Абсолютні величини
- •Індивідуальні
- •Сумарні
- •Тема 5. Аналіз рядів розподілу.
- •Формули для обчислення дисперсій
- •Тема 6. Статистичні методи вимірювання взаємозв'язків
- •Розрахункова таблиця для визначення непараметричних показників щільності зв'язку
- •Допоміжні розрахунки характеристик для парного кореляційно-регресійного аналізу
- •Тема 7. Вибірковий метод
- •Умовні позначення і формули розрахунку узагальнюючих характеристик генеральної і вибіркової сукупностей
- •Формули середніх помилок вибірки для середньої і частки
- •Формули граничних помилок вибірки для середньої і частки
- •Формули визначення чисельності вибірки для середньої і частки
- •Змістовний модуль 3 статистичні методи вивчення динаміки і тенденцій розвитку
- •Тема 8. Аналіз інтенсивності динаміки
- •Тема 9. Аналіз тенденцій розвитку
- •Рівняння, що використовуються при аналітичному вирівнюванні динамічних рядів
- •Виробництво продукції на підприємствах за 2003-2009 рр., тис. Грн. (дані умовні)
- •Тема 10. Індексний метод
- •Основні формули загальних індексів у формі середньої і методи їх одержання
- •Тема 11. Подання статистичних даних: таблиці, графіки, карти
- •Основні поняття та терміни статистики
- •Учені-статистики
- •Програмні питання до модуля "статистика" для підготовки до іспиту чи заліку
- •Література
- •Грецький алфавіт
Тема 6. Статистичні методи вимірювання взаємозв'язків
Усі явища у суспільному житті існують не ізольовано, а у нерозривному зв'язку, тобто залежать одне від одного. При цьому виділяються факторні (х) і результативні (у) ознаки.
Для кількісних ознак залежності між окремими явищами можуть бути:
функціональними, коли певному значенню однієї змінної, чиннику (х), відповідає певне значення результативної ознаки (у);
кореляційними (статистичними), коли із зміною факторної ознаки (х) змінюються групові середні результативної ознаки (у).
Основним моментом у вивченні зв'язків між явищами є встановлення їх суті на основі пізнання якісних характеристик явищ, їх зв'язків.
Наявність або відсутність зв'язків можна виявити, використовуючи:
метод аналітичних групувань;
графічний метод;
побудову та аналіз кореляційних таблиць;
кореляційний аналіз.
У кореляційно-регресійному аналізі лінії регресії відображають не окремими точками, як в аналітичних групуваннях, а в кожній точці інтервалу зміни факторного значення (х). Лінія регресії зображується у вигляді певної функції: у = f(x), яка називається рівнянням регресії, де у – теоретичне значення результативної ознаки.
Серед безлічі функцій найбільш поширеною у статистичному аналізі є лінійна , що пояснюється її простотою і змістовністю.
Для визначення за даними парної кореляції параметрів лінійної регресії треба розв’язати систему нормальних рівнянь для знаходження параметрів а і b:
.
Інколи для знаходження параметрів а і b використовують спосіб визначників:
;
або ; .
Після знаходження параметрів (а і b), це вже рівняння не регресії, а кореляційне, яке можна використовувати в прогнозуванні результативної ознаки (у) при певному значенні чинника (х): . Методику розрахунків викладено в таблиці.
№ п/п |
Товарооборот, тис. грн. х |
Витрати обігу тис. грн. у |
х2 |
ху |
у2 |
Вирівняне (теоретично) значення витрат обігу, тис. грн.
|
1 2 3 ... 10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Виміряти щільність зв'язку між корелюючими величинами (х и у) можна за допомогою кореляційного відношення (η) і коефіцієнта кореляції (r).
1. Кореляційне відношення застосовне до всіх випадків кореляційної залежності, незалежно від форми цього зв'язку. Загальний вигляд формули кореляційного відношення:
,
де η - кореляційне відношення;
η2 - коефіцієнт детермінації.
В основі числення цих показників лежить правило додавання дисперсій, згідно з яким загальна дисперсія (σ2) дорівнює сумі міжгрупової ( ) і середньої з групових дисперсій ( ):
σ2= + ,
де - загальна дисперсія, що характеризує вплив усіх чинників на результативну ознаку (у);
- міжгрупова дисперсія, що характеризує вплив чинника (х), який вивчається, на результативну ознаку (у);
- середня з групових дисперсій, яка характеризує вплив інших чинників на результативну ознаку (у);
- загальна середня;
- групові середні;
n - число даних, які обстежують в цілому;
fi - число обстежених одиниць у кожній групі;
.
Кореляційне відношення може бути обчислене як:
емпіричне, на основі фактичних даних:
теоретичне, що обчислюється після знаходження параметрів (а і b), тобто після розв’язання функцій і знаходження теоретичних (вирівняних) значень результативної ознаки ( ):
,
де - дисперсія теоретичних значень результативної ознаки, що характеризує міру впливу факторної ознаки (х) на результативну ( ); - теоретичне значення результативної ознаки, вирівняне.
Оскільки:
,
де – залишкова дисперсія, то ηТ може бути обчислено за формулою
і носитиме назву в цьому випадку індексу кореляції.
Чим ближче значення η до 1, тим вища, щільніша залежність між у та х. Чим ближче η до 0, тим залежність менша.
При:
η < 0,3 говорять про слабку залежність між корельованими величинами;
0,3 < η <0,6 говорять про середню щільність зв'язку між х і у;
η > 0,6 говорять про високу (істотну) залежність.
2. Лінійний коефіцієнт кореляції (r), який використовується як показник тісноти зв'язку лише при лінійному зв'язку між х і у.
Його можна обчислити за формулами:
,
де r - коефіцієнт кореляції, значення якого коливається від -1 до +1 і характеризує не лише тісноту зв'язку, але і його напрям (“-” - обернена залежність, “+” - пряма залежність між х і у );
; ; ;
; ;
;
n - кількість ознак.
Для якісної оцінки щільності зв'язку використовують таблицю Чеддока.
Значення коефіцієнта кореляції |
0,1 – 0,3 |
0,3 – 0,5 |
0,5 – 0,7 |
0,7 – 0,9 |
0,9 – 0,99 |
Характеристика тісноти зв'язки |
слабка |
помірна |
помітна |
висока |
дуже висока |
З суті щільності зв'язку випливає, що чисельне значення може знаходитися лише в межах ±1. Близькість до 1 коефіцієнта кореляції говорить про близькість до функціональної залежності, а близькість до 0 - про слабку залежність.
Приклад 1
З 12 підприємств отримано дані про річну продуктивність праці робітника (тис. грн.) і озброєність праці основним капіталом (тис. грн. /особу.).
На підставі приведених даних: 1) оцінити щільність зв'язку між показниками за допомогою коефіцієнта Фехнера і коефіцієнта рангової кореляції Спірмена; 2) виявити залежність і тісноту зв'язку між показниками за допомогою парного кореляційно-регресійного аналізу. Зробити висновки.
Вихідні дані та необхідні для розв’язання прикладу розрахунки викласти в табл. 1 та табл. 2.
1. Для визначення коефіцієнта Фехнера розраховуються середні значення ознак:
тис. грн/ос., тис. грн.
Визначають знаки відхилень від середньої, тобто знаки та , і заносять в таблицю (гр. 3 та 4), а потім підраховують число співпадань і не співпадань знаків відхилень (гр. 5). Тоді: . Коефіцієнт, який дорівнює 0,5, свідчить про наявність прямої і помірної залежності між продуктивністю та капіталоозброєністю праці.
Для визначення коефіцієнта рангової кореляції Спірмена ( ) проранжовують в порядку зростання факторну і результативну ознаки, тобто визначають Rх и Rу і заносять їх у гр. 6 и 7 таблиці 1. Потім розраховують і заносять у гр. 8 таблиці. Коефіцієнт рангової кореляції Спірмена буде дорівнювати:
.
Щільність зв'язку між аналізованими показниками пряма і досить тісна.