
- •2. Варіаційні ряди і їхні характеристики
- •2.1. Види варіаційних рядів
- •2.2. Графічне зображення варіаційних рядів
- •2.3. Емпірична функція розподілу
- •2.4. Числові характеристики варіаційних рядів
- •2.4.1. Середні величини
- •2.4.2. Характеристики варіації
- •2.4.3. Моменти розподілу
- •2.4.4. Характеристики форми розподілу
- •2.4.5. Характеристики положення окремого спостереження в ряді розподілу
2. Варіаційні ряди і їхні характеристики
2.1. Види варіаційних рядів
Більшість досліджуваних у статистичних дослідженнях величин приймають неоднакові значення в різних елементів досліджуваної статистичної сукупності, тобто варіюють. З метою вивчення варіювання й установлення закономірностей, яким підкоряється досліджуване явище, проводять спостереження й одержують значення ознаки в кожного елемента сукупності.
Позначимо
через
досліджувану ознаку, через
– спостережувані значення ознаки,
де
- об'єм досліджуваної сукупності.
Різні
значення ознаки, що спостерігаються в
елементів сукупності, називаються
варіантами
,
а числа, що показують, скільки разів
зустрічається кожний варіант, називаються
частотами
варіантів
.
Ясно, що завжди виконується умова
.
Невпорядкованість інформації, що міститься в наведених статистичних даних, утрудняє їхнє використання для подальшого аналізу. Тому дані спостережень піддають первинній обробці, що складається в групуванні сукупності по варіантах.
Статистичний ряд розподілу - це впорядкований розподіл одиниць сукупності на групи за певною ознакою, що варіює.
Розташуємо значення варіант ознаки, що спостерігалися, в порядку їхнього зростання або убування. Ця операція називається ранжируванням даних спостережень.
Варіаційним рядом частот або рядом розподілу частот називається ранжируваний ряд варіантів і відповідних їм частот.
Варіаційний ряд називається дискретним, якщо будь-які його варіанти відрізняються на деяку величину, і – інтервальним (неперервним), якщо варіанти можуть відрізнятися один від іншого на як завгодно малу величину.
Кожному варіанту можна поставити у відповідність не частоту, а одну з наступних величин: відносну частоту, накопичену частоту, накопичену відносну частоту, побудувавши при цьому відповідний варіаційний ряд.
Відносною
частотою (частостью)
варіанта
називається
відношення його частоти до об'єму
сукупності, тобто величина
,
.
Відносна частота варіанта визначає частку (питому вагу) елементів у сукупності, значення ознаки в яких дорівнюють значенню .
Для частот і відносних частот виконуються рівності:
=
n,
=1.
Накопиченою
частотою
варіанта
називається
сума частоти даного варіанта й частот
всіх попередніх йому варіантів:
.
Накопичена частота варіанта показує, скільки елементів вибіркової сукупності мають значення ознаки, менше або рівне значенню цього варіанта.
Накопиченою
відносною
частотою
варіанта
називається
сума відносних частот всіх попередніх
йому варіантів і відносної частоти
даного варіанта:
.
Накопичена відносна частота варіанта показує частку тих елементів сукупності, у яких значення досліджуваної ознаки менше або дорівнює значенню цього варіанта.
Накопичена
відносна частота може також визначатися
як відношення накопиченої частоти до
загального числа спостережень, тобто
.
Результати побудови дискретних варіаційних рядів можна представити у вигляді таблиці 1.1.
Таблиця 1.1
Дискретні варіаційні ряди
№ |
Варіант
|
Частота
|
Відносна частота
|
Накопичена частота
|
Накопичена відносна частота
|
1 |
|
|
|
f1 |
w1 |
2 |
|
|
|
f1+ f2 |
w1+ w2 |
… |
… |
… |
… |
… |
… |
s |
|
|
|
f1+ f2+…+fs |
w1+w2+…+ws |
… |
… |
… |
… |
… |
… |
k |
|
|
|
|
|
Якщо кількість варіантів k занадто велика або близька до об'єму вибірки, то дискретний варіаційний ряд виявляється малозручним для проведення аналізу варіації ознаки. У цьому випадку доцільно скласти варіаційний ряд по інтервалах значень досліджуваної ознаки, тобто інтервальний варіаційний ряд (табл. 1.2).
Інтервальний варіаційний ряд Таблиця 1.2
№ |
Нижня межа інтервалу |
Верхня межа інтервалу |
Середина інтервалу
|
Частота
|
Відносна частота
|
Накопичена частота
|
Накопичена відносна частота
|
1 |
|
|
|
|
|
f1 |
w1 |
2 |
|
|
|
|
|
f1+ f2 |
w1+ w2 |
… |
… |
… |
… |
… |
… |
… |
… |
s |
|
|
|
|
|
f1+ f2+…+fs |
w1+w2+…+ws |
… |
… |
… |
… |
… |
… |
… |
… |
k |
|
|
|
|
|
|
|
Для
побудови інтервального варіаційного
ряду весь діапазон зміни ознаки, від
мінімального
до максимального
,
розбивають на певне число рівних або
нерівних інтервалів. Потім підраховують
число елементів сукупності, значення
ознаки яких попадає в той або інший
інтервал, тобто обчислюють частоти
влучень значень ознаки в інтервал. Число
інтервалів, як правило, вибирають від
7 до 16, так, щоб у кожний інтервал попадало
не менш 5 % всіх спостережень
Якщо число інтервалів важко визначити заздалегідь, то для розрахунку величини рівних інтервалів при достатньому об'ємі сукупності може бути використана формула Стерджесса1 (Sturges, Herbert A. The Choice of a Class Interval // Journal of the American Statistical Association, 1926, vol. 21, no. 153. – P. 65–66):
.
Якщо h виявляється дробовим числом, то за величину інтервалу варто взяти або найближче ціле число, або найближчий "гарний" дріб.
За
початок першого інтервалу рекомендується
приймати величину, приблизно рівну
.
Побудову інтервалів продовжують доти,
поки початок наступного інтервалу не
буде рівним або більшим
.
Оскільки деякі значення ознаки можуть збігатися із межами інтервалів, то в кожний інтервал включаються варіанти більші, ніж нижня границя інтервалу й менші або рівні верхній границі інтервалу. Інакше кажучи, граничне значення варто відносити до інтервалу, у якого дане значення є верхньою границею.
Як і для дискретного розподілу, інтервальний варіаційний ряд можна перетворити в інтервальні ряди відносних частот, накопичених частот і накопичених відносних частот. Крім того, інтервальний ряд може бути умовно перебудований у дискретний шляхом заміни кожного інтервалу його серединою.
У загальному виді інтервальний варіаційний ряд можна представити у вигляді таблиці 1.2.