- •Структура навчальної дисципліни «Статистика»
- •Тема 1. Методологічні засади статистики
- •Термінологічний словник
- •Завдання для самоконтролю
- •Тема 2. Статистичне спостереження
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 3. Зведення і групування статистичних даних
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 4. Подання статистичних даних: таблиці, графіки, карти
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 5. Узагальнюючі статистичні показники
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 6. Аналіз рядів розподілу
- •Термінологічний словник.
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 7. Аналіз концентрації, диференціації та подібності розподілів
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 8. Статистичні методи аналізу зв’язків
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 9. Аналіз інтенсивності динаміки
- •Термінологічний словник
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 10. Аналіз тенденцій розвитку та коливань
- •Завдання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема11. Індекси
- •Термінологічний словник
- •Запитання для самоконтролю
- •Практичні завдання для самоконтролю
- •Тема 12. Вибірковий метод
- •Термінологічний словник
- •Запитання для самоконтролю
- •Практичні завдання для самоконтролю
- •Список рекомендованої літератури
- •Ресурси
Тема 6. Аналіз рядів розподілу
Основні поняття та категорії:
варіація;
дисперсія;
розмах варіації;
середнє квадратичне відхилення;
середнє лінійне відхилення;
кореляційне відношення;
метод моментів;
момент першого порядку;
момент другого порядку.
Методичні вказівки:
Термін "варіація" походить від латинського variato— зміна, коливання, відмінність.
Варіацією в статистиці називають кількісні зміни величини досліджуваної ознаки в межах однорідної сукупності, які зумовлені впливом дії різних факторів.
Для характеристики коливання певної ознаки в даній сукупності (варіації) обчислюються спеціальні показники:
розмах варіації: R = Xmax – Xmin – різниця між максимальним і мінімальним значенням ознаки;
середнє лінійне відхилення ( ) – обчислюється з модулів відхилень кожної варіанти від середньої величини:
= |
- (просте, коли дані не згруповані); |
або |
|
= |
- (зважене, для варіаційного ряду, коли частоти нерівні) |
середній квадрат відхилення або дисперсія ( ) – (сігма) являє собою середню арифметичну квадратів відхилень варіант від їх середньої арифметичної величини:
= |
- (проста) |
= |
- (зважена) |
середнє квадратичне відхилення – являє собою квадратний корінь з середнього квадрату відхилення (дисперсії)
= |
- (просте) |
= |
- (зважене) |
Коефіцієнт варіації (V) являє собою процентне відношення середнього квадратичного відхилення до середньої величини даної ознаки:
Коефіцієнти варіації розраховують за формулами
лінійний ;
квадратичний ;
осциляції .
Приклад.
На основі даних про розподіл 60 робітників за тарифним розрядом розрахуємо основні показники варіації. Розрахунок оформимо в таблиці:
Тарифний розряд, хі |
Число робітників, fі |
|
|
|
2 |
8 |
1,9 |
15,2 |
28,88 |
3 |
16 |
0,9 |
14,4 |
12,96 |
4 |
17 |
0,1 |
1,7 |
0,17 |
5 |
12 |
1,1 |
13,2 |
14,52 |
6 |
7 |
2,1 |
14,7 |
30,87 |
∑ |
60 |
- |
59,2 |
87,40 |
Середнє лінійне відхилення:
= = = 0,987
Дисперсія:
= = = 1,46
Середнє квадратичне відхилення:
= = = 1,21
Коефіцієнт варіації:
= 100% = 31,0%
Виходячи з математичних властивостей дисперсії, можна обчислити її способом моментів:
= і2 (m2 – m12), = і ;
де: m1 = - момент першого порядку;
m2 = - момент другого порядку,
і – розмір інтервалу в інтервальному варіаційному ряді;
а – середнє значення інтервального ряду.
Алгоритм обчислення середнього квадратичного відхилення спрощеним способом – способом моментів.
Якщо ряд інтервальний, то його перетворюють у дискретний.
Від кожної варіанти віднімається число а.
Спрощені варіанти діляться на число і.
Спрощені варіанти множаться на відповідні частоти
( )f і обчислюється сума .
Можна обчислити момент першого порядку
m1 =
Зменшені варіанти підносяться до квадрату
( )2
Обчислюється добуток квадратів зменшених варіантів на частоти і знаходимо суму добутків
Обчислюється момент другого порядку
m2 =
Підставивши значення m1 і m2 у формулу, можна визначити дисперсію і середнє квадратичне відхилення
= і2 (m2 – m12) = і
Денна виручка продавця, грн. |
Кількість продавців |
Розрахункові дані |
||||
х - а а = 280 |
і = 10 |
fі |
( )2
|
( )fі |
||
х |
f |
|||||
250 |
5 |
-30 |
-3 |
-15 |
9 |
45 |
260 |
12 |
-20 |
-2 |
-24 |
4 |
48 |
280 |
20 |
0 |
0 |
0 |
0 |
0 |
300 |
10 |
20 |
2 |
20 |
4 |
40 |
310 |
3 |
30 |
3 |
9 |
9 |
27 |
Всього |
50 |
х |
х |
-10 |
х |
160 |
m1 = = -0,2;
m2 = = 3,2
= і = 10 = 10 = 10(±1,78) = ±17,8грн.
= і2 (m2 – m12) = 102(3,2 – (-0,2)2) = 100 (3,2 – 0,04) = 316грн.
або = = = 17,8грн.
Якщо якась сукупність одиниць поділена на групи, то можна обчислити загальну дисперсію, а також дисперсії для кожної групи окремо і середню із групових.
В курсі математичної статистики доведено закон складання дисперсій:
= ,
де = - |
середня із групових дисперсій (m – число виділених груп, nі – число одиниць в кожній групі). |
= - |
міжгрупова дисперсія ( – групові середні, – загальна середня). |
Розглянемо конкретний приклад.
Відомі наступні умовні дані по трьом групам робітників з різним стажем роботи:
Стаж роботи (роки) |
Число робочих ni |
Середньотижнева зарплата, грн.
|
Середнє квадратичне відхилення зарплати, грн. σі |
до 3 |
10 |
500 |
12 |
3-10 |
15 |
600 |
10 |
більше 10 |
25 |
700 |
20 |
Розрахувати:
а) середньотижневу зарплату для всієї сукупності робітників;
б) загальну дисперсію і середнє квадратичне відхилення зарплати.
Рішення:
Загальна середня:
= |
∑ уini |
= |
500×10 + 600×15 + 700×25 |
= |
31500 |
= |
630 (грн.) |
∑ ni |
10 + 15 +25 |
50 |
Загальну дисперсію знаходимо за правилом складання дисперсій:
=
Знаходимо середню із групових дисперсій:
= = грн.
Міжгрупова дисперсія:
= = грн.
Загальна дисперсія середньотижневої зарплати:
= = 258,8 + 6100 = 6358,8
Звідси середнє квадратичне відхилення середньотижневої зарплати у всій сукупності робітників
Відношення міжгрупової дисперсії до загальної характеризує частку варіації результативної ознаки, яка пов’язана з варіацією групувальної ознаки.
Це відношення називають кореляційним і позначають символом :
Отже, 95,9% варіації зарплати пов’язані зі стажем роботи.