- •Тема 4. Статистичні показники.
- •Тема 5. Середні величини
- •Тема 5.1. Продовження про середні величини
- •Тема 6. Ряди розподілу. Аналіз варіацій та форми розподілу. Основні поняття та категорії
- •Асиметрія і ексцес як характеристики форми ряду розподілу Асиметрія як характеристика кривої розподілу.
- •Ексцес як характеристика кривої розподілу.
Тема 6. Ряди розподілу. Аналіз варіацій та форми розподілу. Основні поняття та категорії
Ряд розподілу характеризує склад, структуру сукупності за певною ознакою. Елементами ряду розподілу є варіанти — значення ознаки хj та частоти fj. Залежно від статистичної природи варіантів ряди поділяються на атрибутивні та варіаційні. У співвідношенні варіантів та частот проявляється закономірність розподілу. Вона описується низкою статистичних характеристик, зокрема:
а) частотні характеристики;
б) характеристики центру розподілу;
в) характеристики варіації;
г) характеристики нерівномірності розподілу, асиметрії, ексцесу.
Частотними характеристиками будь-якого ряду є абсолютна чисельність j-ї групи — частота fj та відносна частота— частка dj.
Очевидно,
що
,
a
або
100%.
Додатковою характеристикою варіаційних рядів є кумулятивна частота Sfj (частка Sdj), яка характеризує обсяг сукупності із значеннями варіант, які не перевищують хj. Кумулятивні частотні характеристики утворюються послідовним підсумовуванням абсолютних чи відносних частот. Так, S1 = f1 ; S2 = f 1 + f 2 ; S3= f1 +f2 + f3 і т.д. Якщо інтервали варіаційного ряду нерівні, то використовують щільність частоти (частки) на одиницю інтервалу g j = f j / h j aбо g j = d j / h j., де h j — ширина j-го інтервалу.
До характеристик центру розподілу відносять середню, моду та медіану. Середня величина характеризує типовий рівень ознаки в сукупності. За даними ряду розподілу середня розраховується як арифметична зважена:
на основі частот |
на основі часток |
де т — число груп;
В інтервальних рядах, припускаючи рівномірний розподіл у межах j-го інтервалу, як варіант х j використовують середину інтервалу. При цьому ширину відкритого інтервалу умовно вважають такою ж, як і сусіднього закритого інтервалу. Так, у ряду розподілу, який характеризує попит на держоблігації на вторинному ринку (табл. 4.1), середній термін обертання облігацій становить
= 560 / 100=5,6 міс.
Таблиця 4.1
Термін обертання, міс. X |
Кількість проданих держоблігацій, тис.од f |
Кумулятивна частота, тис.од. Sf |
Xj |
Xj * f |
До 2 |
15 |
15 |
1 |
15 |
2-4 |
13 |
28 |
3 |
39 |
4—6 |
29 |
57 |
5 |
145 |
6—8 |
22 |
79 |
7 |
154 |
8—10 |
12 |
91 |
9 |
108 |
10 і більше |
9 |
100 |
11 |
99 |
Разом |
100 |
X |
X |
560 |
Мода М0 — це найпоширеніше значення ознаки, тобто варіанта, яка в ряду розподілу має найбільшу частоту (частку).
У дискретному ряду Мo визначається візуально за максимальною частотою, або часткою. Наприклад, в результаті опитування населення щодо самовизначення матеріального стану за чотирма градаціями (добрий, задовільний, незадовільний, нестерпний) більшість респондентів визначили свій стан як незадовільний. Або у розподілі сучасних сімей за кількістю дітей найпоширенішими є малодітні сім'ї, що мають 1 дитину. Зустрічаються ряди, що мають дві моди (бімодальний ряд) або декілька (полімодальний). Наприклад, на фондовому ринку однаково високим попитом користуються як найдешевші акції, так і дорогі. В інтервальному ряду за найбільшою частотою визначається модальний інтервал. Конкретне значення моди в інтервалі обчислюється за формулою
Мo
=
Х0
+
h
,
де
х0
та
h
—
відповідно
нижня межа та ширина модального інтервалу;
fmo
,
fmo-1,
fmo+1
—
частоти
(частки) модального, передмодального
та післямодальнего
інтервалу.
За даними таблиці 4.1 найбільшим попитом користуються акції з терміном обертання в інтервалі 4—6 місяців. Це модальний інтервал, ширина якого h=2, а нижня межа х0 — 4, частота fm = 29, передмодальна частота fmo-1 =13, а післямодальна fmo+1 = 22. Модальний термін обертання облігацій становить
Мo
=
4+ 2
*
= 5,4 міс.
Медіана
Мe
—
це
варіанта, яка припадає на середину
упорядкованого ряду розподілу і ділить
його на дві рівні за обсягом частини.
Медіана, як і мода, не залежить від
крайніх значень варіант, тому
застосовується для характеристики
центру в ряду розподілу з невизначеними
межами. Для визначення Мe
у
ряду використовують кумулятивні частоти
Sf
або
частки Sd
.
у
дискретному
ряду медіаною
буде значення ознаки, для якої кумулятивна
частота Sf
дорівнює
або перевищує половину обсягу сукупності
,
або кумулятивна частка Sdj
> 0,5.
В інтервальному
ряду у
такий спосіб визначається медіанний
інтервал. Конкретне значення медіани
в інтервалі обчислюється за формулою
Мe
=x0
+ h
,
де
х0
та h
—
відповідно
нижня межа та ширина медіанного інтервалу;
fme
—
частота
медіанного інтервалу; Sfme-1
—
кумулятивна
частота передмедіанного інтервалу. За
даними табл. 4.1 половина обсягу cукупності
проданих облігацій 0,5
=
50.
Отже, кумулятивна частота Sme3 = 57 визначає, що п'ятидесята з початку ряду облігація знаходитиметься в інтервалі 4—6 з частотою f me = 29. Медіанний термін обертання проданих облігацій становить
Мe
=4
+ 2 *
=
5,5 міс.
Тож половина облігацій продавалися з терміном обертання менше, ніж півроку — 5,5 міс, а половина — більше 5,5 міс.
У
симетричних рядах розподілу значення
моди та медіани збігаються з середньою
величиною (
=
Ме
=
М0,
а
в помірно асиметричних вони співвідносяться
таким чином: 3*
(
-
Ме)
-Мo
.
У наведеному прикладі з табл. 4.1 співвідношення характеристик центру розподілу облігацій за терміном обертання свідчить про помірну асиметрію: 3*(5,6 - 5,5) 5,6 - 5,4.
Для вимірювання та оцінки варіації використовують абсолютні та відносні характеристики. До абсолютних відносяться: варіаційний розмах, середнє лінійне та середнє квадратичне відхилення, дисперсії; відносні характеристики представлені низкою коефіцієнтів варіації, нерівномірності, локалізації, концентрації.
Варіаційний розмах характеризує діапазон варіації, це різниця між максимальним і мінімальним значеннями ознаки: R = х max - x min. Якщо крайні значення ознаки не типові для сукупності, то використовують квартильні або децильні розмахи. Квартальний розмах RQ = Q3 — Q1 охоплює 50% обсягу сукупності, децильний RD2 = D8 - D2 — 60%, децильний RD1 = D9 – D 1 — 80%.
Узагальнюючою
мірою варіації є середнє відхилення
індивідуальних значень ознаки від
центру розподілу. Оскільки алгебраїчна
сума відхилень
,
то
в розрахунках використовують
або
модулі
,
або
квадрати (xj
-
)2
відхилень.
Середній з модулів відхилень називають
середнім
лінійним
відхиленням ;
середній квадрат відхилень — дисперсією
,
корінь
квадратний з дисперсії —
середнім
квадратичним відхиленням
:
;
За первинними незгрупованими даними наведені характеристики варіації розраховуються за принципом незваженої середньої, тобто:
;
Середнє лінійне та середнє квадратичне відхилення
— іменовані числа (в одиницях вимірювання ознаки)
— за
змістом ідентичні, проте через математичні
властивості
.
У
симетричному, близькому до нормального,
розподілі
,
R
=
6
.
Дисперсію використовують не лише для оцінки варіації, а й при вимірюванні взаємозв'язків, для перевірки статистичних гіпотез тощо. Для ознак метричної шкали розрахунок дисперсії ведеться за формулами
.
Як і будь-яка середня, дисперсія має певні математичні властивості:
а) якщо всі значення ознаки х. зменшити (збільшити) на певну величину, дисперсія не зміниться;
б) якщо всі значення ознаки змінити в К разів, то дисперсія зміниться в K2 разів;
в) у разі заміни частот частками дисперсія не зміниться.
Для альтернативної ознаки, варіація якої має два взаємовиключні значення — "1" та "0", а розподіл характеризується відповідно двома частками — d2 та d0, дисперсія розраховується як добуток часток
У табл. 4.2 наведено розрахунок абсолютних характеристик варіації на прикладі терміну обертання облігацій.
Таблиця 4.2
Термін обертання облігацій, міс. |
f |
х j |
х j – |
/х j – / f |
(х j – ) 2 f |
До 2 |
15 |
1 |
-4,6 |
69,0 |
317,40 |
2-4 |
13 |
3 |
-2,6 |
33,8 |
87,88 |
4—6. |
29 |
5 |
-0,6 |
17,4 |
10,44 |
6—8 |
22 |
7 |
1,4 |
30,8 |
43,12 |
8—10 |
12 |
9 |
3,4 |
40,8 |
138,72 |
10 і більше |
9 |
11 |
5,4 |
48,6 |
262,44 |
Разом |
100 |
X |
X |
240,4 |
860,00 |
Середній
термін обертання облігацій 5,6
міс;
середнє
лінійне відхилення становить
=
240,4:100 -= 2,4 міс;
дисперсія —
=
860:100 = 8,6; середнє
квадратичне відхилення —
= 2,9 міс
Частка облігацій з терміном обертання менше 2 міс становить d1 = 0,15. Дисперсія частки 2 = 0,15(1-0,15) = 0,1275.
Порівнюючи
варіації різних ознак або однієї ознаки
у різних сукупностях, використовують
відносні характеристики варіації.
Коефіцієнти варіації розраховуються
як відношення абсолютних, іменованих
характеристик варіації (
)
до
центру розподілу і часто виражаються
процентами, отже:
1)
лінійний
коефіцієнт варіації
V
l
=
*
100;
2)
квадратичний
коефіцієнт варіації
*
100;
3)
коефіцієнт
осциляції
VR
=
*100.
Наприклад , за даними вибіркових обстежень домогосподарств, середньодушові витрати на харчування становили 80 гр.од.; на придбання промислових товарів — 35; дисперсії відповідно — 256 та 196. Порівняти ступінь варіації витрат домогосподарств на харчування та придбання промислових товарів можна за допомогою квадратичного коефіцієнта варіації:
витрати
на харчування
*
100
= 20%;
витрати
на придбання промислових товарів
*
100
= 40%.
Існує певне обмеження варіації ознаки у сукупності.
Якщо оцінку варіації
використовують, наприклад, для оцінки
ризику (нестабільності) ситуації, то у
випадку 0<
<30%
- варіацію
вважають прийнятною (тобто в допустимих
межах); 30%<
<60%
- варіація
є значною (надмірна);
>60%
- варіація
є неприйнятною.
Отже, рекомендують обмежувати варіацію ознаки у сукупності при оцінці соціально-економічних явищ на рівні <30%.
