
- •В ступ
- •Тема 1. Методологічні засади статистики
- •Тема 2. Статистичне спостереження
- •Тема 3. Подання статистичних даних:
- •Тема 4. Зведення і групування статистичних даних
- •Тема 5. Узагальнюючі статистичні показники
- •Тема 6. Аналіз рядів розподілу
- •Тема 7. Аналіз концентрації, диференціації та подібності розподілів
- •Тема 8. Статистичні методи вимірювання взаємозв’язків
- •Тема 9. Аналіз інтенсивності динаміки
- •Тема 10. Аналіз тенденцій розвитку та коливань
- •Тема 11. Індексний метод
- •Тема 12. Вибірковий метод
- •Список рекомендованої літератури
- •Додатки Додаток а
- •Додаток б
- •Додаток в
Тема 6. Аналіз рядів розподілу
Маючи в розпорядженні дані статистичного спостереження, що характеризують те чи інше явище, насамперед необхідно їх упорядкувати.
Статистичний ряд розподілу – це впорядковані статистичні сукупності.
Найпростішим видом статистичного ряду розподілу є ранжируваний ряд, тобто ряд чисел, що знаходиться в порядку зростання чи спадання варіюючої ознаки. За таким рядом не можна судити, біля якої величини групується більшість показників; які є відхилення від цієї величини; яка загальна картина. З цією метою групують дані, показуючи, як часто зустрічаються окремі спостереження в загальному їх числі.
Розрізняють дискретний варіаційний ряд – це таблиця, що складається з двох рядків чи графів: конкретних значень варіюючої ознаки xi та числа одиниць сукупності з даним значенням ознаки (табл. 6.1).
Таблиця 6.1 – Дискретний ряд розподілу
Варіанта |
Кількість одиниць сукупності, що мають значення ознаки xi |
…
|
…
|
|
|
Варіанта – це окреме значення групувальної ознаки, .
Інтервальний варіаційний ряд – це ряд розподілу, в якому значення ознаки подано у вигляді інтервалів (табл. 6.2).
Кожен ряд має низку статистичних характеристик, серед яких основні:
частотні характеристики;
характеристики центра розподілу;
характеристики варіації;
показники аналізу форми розподілу.
Таблиця 6.2 – Інтервальний ряд розподілу
Варіанта |
Кількість одиниць сукупності, що мають значення ознаки в межах від xi до xi+1 |
-
-
…
-
|
…
|
|
|
Частотними характеристиками ряду є:
частота – число, яке показує, скільки разів зустрічається кожна варіанта,
;
частість – відношення частоти випадків даного інтервалу до загальної суми частот, р:
;
нагромаджені частоти:
.
Наприклад,
;
і т.д.
Варіаційні ряди графічно можуть бути зображені у вигляді полігону, гістограми, кумуляти чи огіви .
Полігон – графічне зображення статистичних даних, при якому на осі абсцис відкладається варіанта, а на осі ординат – частота або частість (рис. 6.1).
Рисунок 6.1 – Полігон
Для графічного зображення інтервального ряду використовують гістограму (рис.6.2).
Рисунок 6.2 – Гістограма
Кумулята
–
крива, яка зображує варіаційний ряд з
нагромадженими частотами, кожна крапка
якої (
)
показує, скільки варіантів (
)
з усієї сукупності має значення ознаки
менше, ніж
(рис.
6.3).
Огіва
– крива,
кожна крапка на якій (
)
показує, скільки варіантів (
)
з усієї сукупності має значення ознаки
більше, ніж
(рис.
6.3).
Наприклад, відомий розподіл комерційних банків за обсягом капіталу (табл. 6.3).
Таблиця 6.3 – Розподіл банків за обсягом капіталу
Обсяг капіталу, млн грн |
Кількість банків |
Накопичена частота (кількість банків, що мають об’єм капіталу менше хі), |
Кількість банків, що мають обєм капіталу більше хі, |
3 |
|
0 |
20 |
3-6 |
3 |
3 |
17 |
6-9 |
12 |
15 |
5 |
9-12 |
5 |
20 |
0 |
Разом |
20 |
|
|
Так,
немає таких банків, що мають обсяг
капіталу менше 3 млн грн (
),
рівно 3 банки мають обсяг капіталу менше
6 млн грн (
),
а 15 банків мають обсяг капіталу менше
9 млн грн та всі 20 банків мають капітал
менше 12 млн грн.
У
свою чергу, всі 20 банків мають обсяг
капіталу більше 3 млн грн (
),
17 банків функціонують при капіталі
більше, ніж 6 млн грн, а 5 банків мають
капітал більше 9 млн грн та немає таких
банків, що мають капітал більше 12 млн
грн.
Рисунок 6.3 – Кумулята і огіва
Показники центру розподілу
Для характеристики середнього значення ознаки розподілу використовуються середня арифметична, мода та медіана.
Середня арифметична:
для
дискретного ряду:
,
де – варіанти значень ознаки;
– частота повторень даної варіанти.
для
інтервального ряду:
,
де – середина відповідного інтервалу.
Медіана – це значення варіаційної ознаки, яка приходиться на середину варіаційного ряду.
У випадку варіаційного ранжованого ряду:
для ряду, що має парну кількість варіант: .
для
ряду, що має непарну кількість варіант:
.
У випадку інтервального варіаційного ряду:
,
(6.1)
де – початок медіанного інтервалу (інтервалу, якому відповідає половина накопичених частот);
ширина інтервалу;
об’єм
вибірки;
частота медіанного інтервалу;
накопичена частота, яка відповідає інтервалу, що передує медіанному.
В аналізі закономірностей розподілу використовується також дециль.
Дециль – значення варіант, які ділять упорядкований ряд на десять рівних частин (рис. 6.4).
Перший
дециль показує,
що
10 % одиниць сукупності має
значення
ознаки менше
,
а інші 90 % - більше
(рис.
6.4).
,
(6.2)
Рисунок 6.4 – Розподіл сукупності на десять частин
де
початок інтервалу, де знаходиться перший
дециль. Інтервал, де знаходиться перший
дециль, - це інтервал, якому відповідає
десята частина накопичених частот.
частота
інтервалу, де знаходиться перший дециль.
частота і-го інтервалу;
кумулятивна
частота інтервалів, що знаходяться
перед інтервалом першого дециля.
Дев’ятий
дециль показує, що 90 % одиниць сукупності
має значення ознаки менше
,
а інші 10 % – більше
.
,
(6.3)
де
початок інтервалу, де знаходиться
дев’ятий дециль. Інтервал, де знаходиться
дев’ятий дециль, – це інтервал, якому
відповідає 0,9 частин накопичених частот.
частота
інтервалу, де знаходиться дев’ятий
дециль;
кумулятивна
частота інтервалів, що знаходяться
перед інтервалом дев’ятого дециля.
Мода – це варіанта, яка найчастіше трапляється в даному варіаційному ряді. Для дискретного ряду розподілу мода визначається за частотами варіант і відповідає варіанті з найбільшою частотою.
У випадку інтервального ряду:
, (6.4)
де початок модального інтервалу (інтервалу з найбільшою частотою);
частота модального інтервалу, інтервалу, який передує йому та інтервалу, наступного за модальним.
Для
симетричних рядів
.
Середня величина дає узагальнену характеристику всієї сукупності явища, що вивчається. Однак два ряди розподілу, які мають однакову середню арифметичну величину, можуть значно відрізнятися між собою за рівнем коливань (варіації) величини ознаки, що вивчається.
Показники варіації (коливань) ознаки
Для виміру варіації ознаки застосовуються абсолютні та відносні показники.
Абсолютні показники варіації.
Розмах
варіації –
різниця між максимальним та мінімальним
значеннями ознаку сукупності, що
вивчається:
.
Середнє лінійне відхилення:
Для
незгрупованого ряду:
.
Для
згрупованого ряду:
.
Дисперсія – середня із квадратів відхилень варіантів ознаки від їх середньої величини:
Для
незгрупованого ряду:
.
Для
згрупованого ряду:
.
Середнє
квадратичне відхилення:
.
Відносні показники варіації
Коефіцієнт
осциляції:
.
Відносне
лінійне відхилення:
.
Коефіцієнт
варіації:
.
Сукупність вважається однорідною, якщо коефіцієнт варіації не перевищує 33 %.
Показники аналізу форми розподілу
Для порівняльного аналізу ступеня асиметрії декількох розподілів розраховують відносний показник – коефіцієнт асиметрії (As).
.
(6.5)
Якщо
розподіл симетричний; якщо
розподіл
має правосторонню асиметрію; якщо
лівосторонню асиметрію (рис.6.5).
Рисунок
6.5 – Форми розподілу при різних значеннях
коефіцієнту асиметрії.
Оцінку ступеню значимості коефіцієнта асиметрії отримують із співвідношення:
,
при
,
(6.6)
де n – обсяг сукупності.
Якщо
,
то асиметрія суттєва, тобто поширюється
і на генеральну сукупність.
Якщо , то асиметрію, що має місце у межах вибірки, можна вважати несуттєвою, що не поширюється на генеральну сукупність.
Для
встановлення міри відхилення від
нормального розподілу вираховують
показник ексцесу
(
).
Він характеризує відхилення від
нормального розподілу варіант із
виступанням або падінням вершини кривої
розподілу (рис. 6.6):
.
(6.7)
Рисунок 6.6 – Форми розподілу при різних значеннях ексцесу.
Приклад. Є наступні дані про заробітну платню персоналу організації (табл. 6.4):
Таблиця 6.4 – Статистичні дані про заробітну платню персоналу організації
Розмір заробітної платні, грн |
До 150 |
150-200 |
200-250 |
250-300 |
Більше 300 |
Чисельність персоналу, люд. |
8 |
12 |
24 |
36 |
20 |
Визначити:
1) середній розмір заробітної платні персоналу організації:
2) модальний та медіанний розмірі заробітної платні;
3) абсолютні та відносні показники варіації;
4) показники аналізу форми розподілу.
1. Середній розмір заробітної платні персоналу організації визначаємо за формулою середньої арифметичної зваженої:
2. Для визначення моди спочатку визначаємо модальний інтервал – тобто інтервал, який має максимальну частоту. Це інтервал 250-300 грн, ( у нього максимальна частота – 36 людей.). Моду визначаємо за формулою:
Таким
чином, частіше за все рівень заробітної
плати складає 271, 43 грн.
Для визначення медіани складемо таблицю, в якій розрахуємо накопичені частоти (табл. 6.5):
Таблиця 6.5 – Розрахунок накопичувальної частоти
Розмір заробітної платні, грн |
Чисельність персоналу, люд. |
Накопичена частота, |
До 150 |
8 |
8 |
150-200 |
12 |
20 |
200-250 |
24 |
44 |
250-300 |
36 |
80 |
Більше 300 |
20 |
100 |
Разом |
100 |
|
Медіанним є інтервал 250-300 грн., тому що на цей інтервал припадає перша накопичена частота, яка перевищує половину об’єму сукупності (80 перевищує 50).
Медіану визначаємо за формулою:
Таким чином, половина робітників отримує зарплатню більше 253,41 грн., а половина менше.
3.Для розрахунку показників варіації складемо таблицю (табл. 6.6).
Таблиця 6.6 – Розрахункові дані
Розмір заробітної платні, грн |
Чисельність персоналу, люд., n |
Центр интервалу, (х') |
х'n |
х'- |
(х'- )n |
(х'- )2n |
До 150 |
8 |
125 |
1000 |
-124 |
992 |
123008 |
150-200 |
12 |
175 |
2100 |
-74 |
888 |
65712 |
200-250 |
24 |
225 |
5400 |
-24 |
576 |
13824 |
250-300 |
36 |
275 |
9900 |
26 |
936 |
24336 |
Більше 300 |
20 |
325 |
6500 |
76 |
1520 |
115520 |
Разом |
100 |
|
24900 |
|
4912 |
342400 |
Розмах варіації:
.
Середнє лінійне відхилення:
Дисперсія:
Середнєквадратичне відхилення:
Коефіцієнт осциляції:
.
Відносне лінійне відхилення:
.
Коефіцієнт варіації:
.
4. Показники аналізу форми розподілу.
Коефіцієнт асиметрії (As):
Розподіл
має незначну лівосторонню асиметрію
(рис. 6.7).
Перевіримо, чи поширюється вона й на генеральну сукупність.
.
Оскільки
,
то асиметрію можна вважати несуттєвою.
Показник ексцес:
Розподіл
має не в значній мірі плоску вершину.
Рисунок 6.7 – Полігон частот