Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
СТАТ 1 Ряди розподілу.doc
Скачиваний:
3
Добавлен:
29.04.2019
Размер:
670.72 Кб
Скачать

5. Визначення ступеню зв`язку між ознаками

Варіація ознаки обумовлена різними факторами, деякі з цих факторів можна виділити, якщо статистичну сукупність розбити на групи по будь-якій ознаці. Тоді поряд з вивченням варіації ознаки і всієї сукупності в цілому стає можливим вивчити варіацію для кожної зі складових її групи, а також між цими групами.

У найпростішому випадку, коли сукупність розчленована на групи по одному фактору, вивчення варіації досягається за допомогою обчислення й аналізу трьох видів дисперсії: загальної, міжгрупової, внутрішньогрупової.

Загальна дисперсія вимірює варіацію ознаки по всій сукупності під впливом усіх факторів, що обумовлюють цю варіацію. Вона дорівнює середньому квадрату відхилень окремого значення ознаки від загальної середньої і може бути обчислена як проста і зважена дисперсія.

Проста загальна дисперсія:

Зважена загальна дисперсія:

Міжгрупова дисперсія ( 2 ) характеризує систематичну варіацію результативної ознаки, обумовлену впливом ознаки фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень групових середніх від загальної середньої.

Внутрішньогрупова дисперсія відбиває випадкову варіацію, обумовлену впливом неврахованих факторів і незалежну від ознаки фактора, покладеного в основу угруповання. Вона дорівнює середньому квадрату відхилень окремих значень ознаки всередині групи від середньої арифметичної цієї групи і може бути обчислена як проста, чи як зважена дисперсія.

Проста внутрішньогрупова дисперсія:

де j – кількість значень у групі.

Загальна середня з внутрішньогрупових дисперсій:

Відповідно до правила додавання дисперсій, загальна дисперсія дорівнює сумі середньої з внутрішньогрупових та міжгрупової дисперсії.

Загальна дисперсія:

У статистичному аналізі широко використовується емпіричний коефіцієнт детермінації 2 - показник, що представляє собою частку міжгрупової дисперсії в загальній дисперсії результативної ознаки, та характеризуючий силу впливу групувальної ознаки на варіацію ознаки.

Коефіцієнт детермінації:

Емпіричне кореляційне відношення - відображає тісноту зв'язку між групувальною та результативною ознакою. Приймає значення від 0 до 1 і дорівнює кореню квадратному з емпіричного коефіцієнту детермінації.

Якщо зв'язок є відсутнім, то кореляційне відношення дорівнює 0, а якщо зв'язок функціональний - 1.

Чим значення кореляційного відношення ближче до 1, тим тісніше та ближче до функціональної залежності зв'язок між ознаками.

Для якісної оцінки зв'язку на основі показника емпіричного кореляційного відношення можна скористатися кореляційними відносинами Чеддока:

0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99

сила слабкий помірний помітний тісний дуже

зв'язку зв'язок зв'язок зв'язок зв'язок тісний

зв'язок

5. Приклад

1. Перетворимо наступні первинні дані грошового місячного доходу 25 домогосподарств (гр.од.) у ряд розподілу:

Xi - 375;446;472;517;390;464;526;485;457;496;485;483; 412; 449;512;467;526;538;403;437; 504; 488; 454; 489; 472.

Першим кроком у побудові ряду розподілу є його ранжування, тобто розташування значень ознаки у зростаючому порядку:

375; 390; 403; 412; 437; 446; 449; 454; 457; 464; 467; 472; 472; 483; 485; 485; 488; 489; 496; 504; 512; 517; 526; 526; 538.

2. Ряд розподілу, побудований за кількісною ознакою, називається варіаційним. Побудуємо ряд розподілу, виражений у вигляді інтервалів. Такий ряд характеризує склад (структуру) досліджуваного явища, а також дозволяє судити про однорідність сукупності, закономірності розподілу і межах варіювання одиниць сукупності.

Визначимо кількість груп, величину інтервалу, показники структури, кумулятивну чисельність, середину інтервалу.

Кількість груп визначаємо по формулі Стерджесса:

n = 1 + 3,322 lg N

де N – число одиниць сукупності (=25).

n = 1 + 3,322 lg25 = 5,34 5,64 або 5 (округлення відбувається до найближчого цілого).

Тоді розмір інтервалу можна визначити за формулою:

=(538-375)/5 = 32,6

де n - кількість інтервалів;

Х - значення варіюючої ознаки.

Приймаємо розмір інтервалу 33.

В результаті одержимо наступний інтервальний ряд розподілу грошового місячного доходу домогосподарств:

xi

375 – 408

408-441

441-474

474-507

507-540

fi

3

2

8

7

5

Як видно з даного ряду розподілу, рентабелность активів банків в основному поміщена в межах 15,0 – 19,0 %

Результати побудови ряду розподілу оформляються у вигляді таблиці.

Таблиця 1.1.