- •Національний аграрний університет
- •1. Розподіл навчального годин по темах (можуть вноситись деякі зміни)
- •Тема 1. Предмет і метод статистики
- •Загальне поняття про статистику
- •Предмет статистики
- •Метод статистики
- •Тема 2. Статистичне спостереження
- •Поняття статистичного спостереження
- •2. Програма статистичного спостереження
- •З'ясовують питання, що собою являє продукція підприємств і показники, якими визначається її обсяг. Відомо:
- •4. Форми, види і способи статистичного спостереження
- •5. Помилки статистичного спостереження
- •Тема 3. Зведення і групування статистичних даних. Статистичні таблиці
- •1. Поняття про статистичного зведення
- •4. Система статистичних показників
- •5. Статистичні ряди розподілу, їх виді складові елементи
- •6. Статистичні таблиці, їх види і правила оформлення
Тема 3. Зведення і групування статистичних даних. Статистичні таблиці
ТЕОРЕТИЧНІ ОСНОВИ ТЕМИ
1. Поняття про статистичного зведення
Статистичне спостереження, даючи об'ємний, але різноманітний матеріал про окремі явища досліджуваної сукупності, ще не дозволяє зробити будь-які висновки про цю сукупність. Адже в результаті збирання фактів дійсність стає відомою, але ще не пізнаною. Щоб за науково зібраними фактами зробити об'єктивні висновки, глибоко пізнати дійсність, ці фактори необхідно узагальнити, теоретично обміркувати.
Як відомо з викладеного раніше, статистичне спостереження збігається з першим ступенем людського пізнання дійсності емпіричним пізнанням. Теоретичне узагальнення фактів є другим ступенем складнішого процесу пізнання світу, адже на цьому етапі здійснюється наукове узагальнення статистичних даних. Таке узагальнення дає можливість встановити внутрішні зв'язки між явищами, їх кількісно-якісні перетворення. Але було б помилковим вважати, що теоретичне обміркування і узагальнення фактів здійснюється тільки після того, як зібрані факти. Обміркування матеріалів починається уже в процесі їх збирання, але процес теоретичного узагальнення здійснюється лише після того, коли зібрані всі факти, які цікавлять дослідника.
Процес теоретичного узагальнення статистичних даних, зведення фактів у єдине ціле в статистиці називають зведенням статистичних даних.
Статистичне зведення являє собою сукупність прийомів, які дозволяють одержати узагальнюючі статистичні показники як зведені ознаки масових явищ, що характеризують стан, взаємозв0'язки і закономірності розвитку явищ в цілому.
Не треба змішувати поняття “статистичне зведення” і “зведення” у вузькому розумінні слова. Під останнім розуміють підсумовування даних про число одиниць сукупності і значень їх ознак. Тобто, це один з етапів статистичного зведення. В цілому статистичне зведення включає такі етапи: 1) статистичне групування; 2) підсумовування даних (зведення у вузькому розумінні слова); 3) табличне і графічне оформлення одержаних даних. Одержана в процеси зведення система статистичних показників підлягає подальшому аналізу в наукових і практичних цілях.
Таким чином, статистичне зведення це первинна наукова обробка даних спостереження для характеристики суспільного явища узагальнюючими показниками.
Зведення являє собою другий ступінь статистичного дослідження і від його якості значною мірою залежить результат всієї статистичної роботи.
За допомогою статистичного зведення розв'язують такі завдання: 1) групування даних; 2) розробка системи показників для характеристики груп і всієї статистичної сукупності; 3) обчислення групових і загальних показників; 4) зведення результатів обчислення у статистичних таблицях.
Відповідно до цих завдань статистичне зведення передбачає виконання таких операцій: 1) вторинний контроль (логічний і арифметичний) якості матеріалів статистичного спостереження; 2) шифрування, тобто присвоєння певних номерів (або літер) значенням окремих ознак, за якими здійснюється групування матеріалів; 3) розкладання матеріалів на якісно однорідні групи; 4) підрахунок підсумовуючих даних, занесення підсумків у спеціальні зведені формуляри.
Статистичне зведення здійснюють за спеціальною заздалегідь розробленою програмою. Залежно від мети і завдань дослідження програма встановлює групувальні ознаки для утворення однорідних у певному відношенні груп, їх число, макети розробних таблиць, які містять об'єкти дослідження і показники, що їх характеризують.
Оскільки суспільні явища досить різноманітні, програма повинна бути складена так, щоб одержаний в результаті зведення матеріал характеризував досліджуване явище з різних боків.
Крім програми зведення, ще складають план його проведення, у ньому дають вказівки про послідовність і строки виконання окремих частин зведення і викладення його матеріалів, передбачають виконавців, вид зведення і способи контролю узагальнюючих даних тощо.
Таким чином, поняття статистичного зведення у широкому розумінні слова охоплює цілий комплекс статистичних операцій, спрямованих на об'єднання зареєстрованих при спостереженні поодиноких випадків у групи, подібні у тому чи іншому відношенні; підрахунок підсумків по виділених групах і по всій сукупності в цілому; оформлення результатів групувань і зведення у вигляді статистичних таблиць.
З погляду організації розрізняють два види статистичного зведення: централізоване і децентралізоване.
Централізоване зведення проводять в одному центральному органі, наприклад, Міністерстві статистики України куди заздалегідь надсилають усі матеріали статистично спостереження.
Децентралізоване зведення здійснюють поступово в різних ланках системи статистичних органів: на рівні району області, Міністерства статистики. Централізований вид зведення має свої переваги перед децентралізованим у том що є можливість проведення його за єдиною методологією при значно менших затратах праці і високій точності розрахунків. До його недоліків слід віднести низьку оперативність використання результатів зведень на місцях і складність виправленні виявлених помилок спостереження. Централізоване зведення має місце, як правило, у великих спеціально організованих статистичних спостереженнях (наприклад переписи).
У статистичній практиці найчастіше застосовують децентралізоване зведення; інколи ці два види поєднують. Розрізняють зведення первинне і вторинне.
Первинне зведення це таке, при якому обробка і підрахунок даних здійснюються безпосередньо в процесі статистичного спостереження. При вторинному зведенні обробка і підрахунок матеріалів відбуваються за результатами первинного зведення. Як правило, це стосується децентралізованого зведення.
Якщо процес зведення зводиться до звичайного підсумовування даних, тобто до одержання підсумовуючих показників, його називають простим зведенням. Але ним обмежуються лише у випадках, коли немає істотної різниці між досліджуваними явищами, що на практиці зустрічається дуже рідко. Як правило, досліджувані статистикою соціально-економічні явища за своїм складом неоднорідні й істотно різняться між собою. Тому завдання статистичного зведення не обмежуються простим підрахунком показників, адже в такому випадку ігноруються існуючі істотні різниці між явищами. Статистика повинна виявляти ці різниці і досконало вивчати їх. У такому разі зведення статистичних даних здійснюють шляхом їх групувань за певними ознаками з подальшим розрахунком системи показників по кожній групі з підрахунком групових і загальних підсумовуючих показників. Зведення, що включає групування даних, називається груповим. Тільки методом групувань можна обробити зібрані матеріали, щоб одержати зведені узагальнюючі показники, які б об'єктивно відображували існуй реалії у досліджуваній сукупності явищ.
0тже, статистичне групування даних спостереження є методологічною основою наукового зведення.
2. СТАТИСТИЧНІ ГРУПУВАННЯ
Як відомо, масові суспільні явища або сукупності складаються з одиниць, які різняться між собою як якісно, так кількісно. Ці різниці можуть бути істотними, тобто викликаними певними істотними факторами, і неістотними, що являють собою випадкові відхилення. Але і в сукупностях, якісно однорідних, які мають незначну кількісну варіацію, у процесі розвитку спочатку збільшуються кількісні відмінності, а потім кількісні відмінності переходять у якісні з властивою їм уже другою мірою. Самі якісні відмінності в даних випадках виступають явно, видимо, в інших приховано за кількісними змінами.
Тому одне з головних завдань статистики полягає в тому, щоб розділити складну, неоднорідну сукупність одиниць спостереження на однорідні всередині, але істотно різні між собою групи, своєчасно виявити за зростанням кількісних різниць якісні переходи. Таке завдання в статистиці вирішується за допомогою методу статистичних групувань.
Статистичне групування являє собою процес утворенні подібних в тому чи іншому відношенні груп, який здійснюється за наявними статистичними даними. Причому процес утворення груп слід розглядати з різних боків. Якщо дослідник зустрічається з єдиною множиною різних суспільних явищ, то групування треба розглядати як уявне розчленування такої множини явищ на подібні групи (логічна операцій аналізу). Якщо ж виходити з того, що, безпосередньо приступаючи до групувань, дослідник уже має дані про окремі одиниці спостереження, то групування можна розглядати як уявне об'єднання окремих одиниць у схожі групи (логічна операція синтезу). Отже, групування це єдиний аналітико-синтетичний процес і розчленування, і об'єднання суспільних явищ, у результаті якого утворюються відповідні групи. У ньому практично знаходить свій прояв закон великих чисел, адже у показниках, обчислених на достатньо великій кількості одиниць сукупності в групах, взаємопогашається випадковість і лишається істотне, необхідне.
Таким чином, метод статистичних групувань, крім характеристики механізму взаємодії всієї різноманітності типів і форм тих чи інших явищ, доводить істотність показників, які повинні дати характеристику стану і розвитку сукупності. А з цього випливає, що цілий ряд статистичних методів (метод середніх величин, вибірковий, кореляційно-регресійний та інші) певною мірою спирається на метод статистичних групувань як на свою основу. Як не можна проводити статистичного групування без попереднього науково обгґрунтованого статистичного спостереження, так само не можна ефективно використовувати методи середніх і відносних величин, аналізу зв'язків і т. ін., не проводячи попередньо статистичних групувань (безумовно, якщо воно не закладено в самій схемі статистичного спостереження).
Що ж становить основу статистичного групування, в чому його суть?
Групування невід’ємний елемент зведення, його найважливіший етап. Це процес утворення груп одиниць сукупності, однорідних у певному істотному відношенні, а також тих, що мають однакові або близькі значення групувальної ознаки. Групуванням називають розподіл статистичної сукупності на групи (частини) за рядом характерних для них ознак. Це статистичний метод розчленування складного масового явища на істотно різні групи з метою всебічної характеристики його стану, розвитку і взаємозв'язків.
Із наведеного визначення випливає, що суть методу статистичних групувань полягає у тому, що складне масове явище розглядається не як єдине нероздільне ціле, а у ньому виділяються окремі групи одиниць із статистичними показниками, які дають кількісну характеристику якісно своєрідній частині одиниць усієї сукупності. Тобто кожна з одержаних груп об'єднує однорідні одиниці сукупності. Групи встановлюють на підставі аналізу суті досліджуваного явища. У результаті внутрішньогрупових підрахунків одержують характеристику у вигляді системи статистичних показників. Необхідність такого підходу до вивчення масових явищ зумовлюється тим, що в складних масових явищах існують якісні відмінності між окремими одиницями, адже кожна з них має свої індивідуальні риси. У цілому ж всі такі одиниці мають загальні риси, які формують дане явище. Наприклад, розглянемо урожайність зернових культур у господарствах району. Щоб мати уявлення про урожайність, недостатньо знань лише про загальний її рівень, адже всередині даної статистичної сукупності (господарства, району) містяться одиниці спостереження зі своїми індивідуальними властивостями. Це господарства з конкретними природними умовами, специфікою технологій вирощування, різним рівнем забезпеченості матеріальними і трудовими ресурсами і т. ін.
Використання методу статистичних групувань знаходить місце і при вивченні якісно однорідних сукупностей, де ще не спостерігається якісних перетворень, але є кількісні відмінності. У таких випадках важливо відокремити групи з різними значеннями ознак і вивчити взаємозв'язки досліджуваних ознак з іншими ознаками даного явища. Наприклад, явище продуктивності молочного стада корів у господарствах району розглядається як середній надій від однієї корови (за добу, декаду, місяць, рік) без врахування породного складу, року лактації, віку тварин тощо. Виділення груп господарств за рівнем продуктивності корів дає змогу вивчати взаємозв'язки даної ознаки, тобто продуктивності корів, з іншими ознаками, такими як рівень годівлі, навантаження тварин на одного працюючого, продуктивність праці та ін.
Особливого значення метод статистичних групувань набуває у вивченні соціально-економічних явищ. Останні мають досить складний характер розвитку якісних перетворень. До речі, сам метод групувань було розроблено стосовно до вивчення суспільних явищ і тому він знаходить широке застосування в аналізі саме соціально-економічних процесів, що відбуваються у суспільстві.
У цілому мета групувань зводиться до встановлення чисельності кожної окремо взятої групи (категорії) і вивчення впливу причин і залежностей явищ.
Метод статистичних групувань робить статистику одним з наймогутніших знарядь соціального пізнання і використовується для вирішення різних завдань, які виникають у процесі наукового статистичного дослідження, їх можна звести до трьох основних: 1) виділення соціально-економічних типів явищ; 2) вивчення (характеристика) структури досліджуваного явища; 3) вивчення зв'язків і взаємозалежностей між явищами (характеристика взаємозв'язків між варіюючими ознаками).
Відповідно до вирішуваних завдань розрізняють такі види групувань: типологічні, структурні й аналітичні.
Із теорії групувань випливає, що зведені статистичні характеристики можна використовувати лише до якісно однорідних сукупностей. Отже, перше завдання методу групувань полягає у тому, щоб на підставі економічної теорії розподілити масу досліджуваних явищ на однорідні в соціально-економічному відношенні групи, виділити соціально-економічні типи явищ і процесів.
Таким чином, типологічне групування це групування, за допомогою якого у досліджуваній сукупності явищ відокремлюються одноякісні в істотному відношенні групи, перш за все класи і соціально-економічні типи. Наприклад, групування населення за соціальною ознакою, підприємств.
Таблиця 3.1. Групування господарств району за формою власності
Тип господарства |
Рік |
||
|
2005 |
2006 |
2007 |
Колективні сільськогосподарські підприємства Державні сільськогосподарські підприємства Фермерські господарства |
30 6 36 |
31 5 42 |
31 5 46 |
і господарств за формою власності, продукції за економічним призначенням і т. д.
Необхідність проведення типологічних групувань випливає з характеру суспільних відносин і законів, що діють у об'єктивній реальності. Якщо не проведене типологічне групування, тобто чітке розмежування соціально-економічних типів явищ, то ніякі найтонкіші прийоми наступної статистичної обробки даних досліджуваної сукупності не в змозі дати об'єктивні результати дослідження.
Прикладом типологічних групувань можуть бути дані таблиці 3.1.
Другим важливим завданням статистичних групувань є дослідження структури типових однорідних груп. Виділення якісно однотипної сукупності ще не значить, що в ній всі одиниці за всіма ознаками однакові. Наприклад, всі фермерські господарства як тип господарств однорідні, але вони істотно різняться за розмірами угідь, наявністю техніки і знарядь, чисельністю худоби і рядом інших ознак. Виявити і дати характеристику цим відмінам завдання статистики.
Отже, структурне групування (інколи його називають варіаційним) це групування, яке характеризує розподіл одиниць однотипних (однорідних) сукупностей за будь-якими ознаками. Тобто групування, яке дозволяє виявити склад (внутрішню будову) однорідної у якісному відношенні сукупності за певними ознаками. Цей вид групувань знаходить винятково широке застосування при дослідженні соціально-економічних явищ.
Таке групування дає інформацію про те, з яких частин складається досліджувана множина явищ, яка будова типів явищ і якими показниками характеризуються окремі частини.
За допомогою структурних групувань вивчається перш за все внутрішня структура типів статистичних сукупностей. Таке групування здійснюється після і на основі типологічних групувань. Але інколи вивчається структура загальних сукупностей, які включають неоднорідні в певному відношенні явища. Так, досліджується структура всіх сільськогосподарських підприємств області, структура працівників тваринницької галузі і т. ін.
Якщо структурне групування здійснюється в територіальному розрізі, його називають територіальним.
Типологічні і структурні групування, виконані на базі показників за кілька періодів, дають уявлення про відповідні зміни досліджуваних явищ у часі.
За допомогою структурних групувань вивчають склад населення за віком, статтю, місцем проживаннях, національністю і т. ін., склад робітників за стажем роботи, віком тощо; склад господарств за видами земельних угідь тощо.
Наступне завдання, яке вирішується за допомогою статистичних групувань це дослідження взаємозв'язків варіюючих ознак у межах одноякісної сукупності. Такі групування називають аналітичними. Аналітичне групування дає змогу встановлювати і вивчати причинно-наслідкові зв'язки між досліджуваними явищами та їх ознаками (при цьому слід пам'ятати, що аналітичні функції притаманні всім видам групувань, і перш за все типологічним). Взаємопов'язані ознаки поділяють на факторні і результативні. При цьому групи утворюють, як правило, за факторною ознакою, а для кожної виділеної групи розраховується або середнє значення результативної ознаки, якщо вона кількісна, або відносні величини, якщо вона якісна. Взаємозв'язок проявляється у систематичній зміні результативної ознаки у зв'язку зі зміною факторної ознаки. Прикладом аналітич-
Таблиця 3.2. Вплив продуктивності праці на собівартість виробництва молока в господарствах району
Групи господарств за рівнем затрат праці на виробництво 1 ц молока, люд.-год |
Кількість господарств |
Собівартість 1 ц молока, крб. |
7 10 10 І3 13 15 Всього |
10 20 6 36 |
12,69 16,18 19,36 17,26 |
ного групування може бути групування господарств за рівнем продуктивності праці, за рівнем урожайності тощо, коли вивчається вплив цих факторних ознак на собівартість продукції результативну ознаку.
Таблиця 3.2 являє собою аналітичне групування господарств району за рівнем затрат праці на виробництво 1 ц молока. Тут показник затрат праці є факторною ознакою, а собівартість центнера молока результативною. Як бачимо, між продуктивністю праці (затратами праці) і собівартістю існує пряма залежність, адже збільшення затрат праці зумовлює зростання собівартості, і навпаки.
Притаманним для аналітичних групувань є те, що кожна група факторної ознаки характеризується середніми величинами результативної ознаки.
Таким чином, аналітичне групування відіграє важливу роль у вивченні зв'язків між ознаками, виявляючи цей зв'язок і створюючи можливість його кількісної характеристики.
Основні завдання, які вирішують статистичні групування, тісно пов'язані між собою, взаємно переплітаються і доповнюють одне одного. Тому розмежування трьох видів групувань (типологічні, структурні і аналітичні), коротка характеристика яких наведена вище, є певною мірою умовним. В окремих випадках одне й те саме групування дає можливість виявити типи явищ, охарактеризувати їх структуру і констатувати наявність певних взаємозв'язків між ознаками.
Складні явища, які мають багато істотних сторін (наприклад, сільськогосподарське виробництво), не можна всебічно охарактеризувати одним групуванням; необхідна, як правило, система їх (наприклад, групування за виробничим напрямом, за продуктивністю праці, за рівнем її фондоозброєності і т. д.).
У зв'язку із зазначеним вище, назва “аналітичні групування” не зовсім вдала, адже таке визначення рівною мірою стосується типологічних і структурних групувань, оскільки вони несуть в собі також пізнавальні, тобто аналітичні функції. Більш вдало, на наш погляд, їх суть відображує назва “факторно-результативні групування”, адже їх призначення виявляти зв'язки між факторними і результативними ознаками. Основою такого виду групувань є вивчення дії зміни однієї або кількох факторних ознак на зміну результативної ознаки.
Розрізняють групування за однією ознакою просте групування і групування за двома і більше ознаками комбінаційне групування. При комбінаційному групуванні групи, виділені за однією ознакою (наприклад, за виробничим напрямом), розбивають на підгрупи за другою ознакою (наприклад, за рівнем продуктивності праці). Комбінаційне групування має більш широкі аналітичні можливості, ніж просте. Його використовують переважно для вивчення взаємозв'язків між ознаками. Порядок комбінації ознак обґгрунтовується економічно і може бути легко змінений (при необхідності). Якщо по кожній з ознак є підсумкова група, комбінаційне групування можна “згорнути” у будь-якому напрямі в просте.
Наведемо приклад (схему) комбінаційного групування сільськогосподарських підприємств за трьома ознаками: за розміром площ сільськогосподарських угідь, якістю та рівнем удобреності грунтів (табл. 3.3).
В останньому підсумковому розділі, який об'єднує підприємства незалежно від розмірів площ сільськогосподарських угідь, знаходяться дані по підприємствах, згрупованих лише за двома ознаками: за якістю грунтів і рівнем їх удобреності. Вибираючи три підсумкових рядки в кожному розділі, знайдемо групи за розміром площ сільськогосподарських угідь і рівнем удобреності у колонках, об'єднаних у вертикальну рубрику “всього”, комбінацію розміру угідь і удобреності площ. Просте групування за розміром площ сільськогосподарських угідь знаходимо по горизонтальних рядках “всього” у тій же вертикальній рубриці; просте групування за якістю грунтів тій самій вертикальній рубриці у її нижньому розділі (останніх чотирьох рядках); просте групування за рівнем внесених добрив на одиницю площі у останньому рядку таблиці.
У кінці таблиці праворуч внизу дається загальний підсумок по всій сукупності сільськогосподарських підприємств (2).
За групувальні ознаки можна брати синтетичні результативні показники господарської діяльності (наприклад, собівартість 1 ц продукці, рівень
Таблиця 3.3. Макет таблиці комбінаційного групування за трьома ознаками
Групи господарств за площею с.-г. Угідь, га |
Підгрупи господарств за якістю |
Підгрупи господарств за кількістю внесених мінеральних добрив на 1 га, ц діючої речовини |
|||
Грунту, балів |
С1до 2,0 |
С22,02,5 |
С3понад 2,5 |
Всього |
|
|
В1до 60 |
|
|
|
|
А1до4600 |
В26070 |
|
|
|
|
|
В3понад |
|
|
|
|
|
70 |
|
|
|
|
|
Всього |
|
|
|
|
|
В1до 60 |
|
|
|
|
А2 |
В2 60 |
|
|
|
|
46005000 |
70 |
|
|
|
|
|
В3 понад |
|
|
|
|
|
70 |
|
|
|
|
|
Всього |
|
|
|
|
|
В1до 60 |
|
|
|
|
А3 понад |
В2 60 |
|
|
|
|
5000 |
70 |
|
|
|
|
|
В3 понад |
|
|
|
|
|
70 |
|
|
|
|
|
Всього |
|
|
|
|
|
В1до 60 |
|
|
|
|
- |
В2 6070 |
|
|
|
|
Всього |
В3понад |
|
|
|
|
|
70 |
|
|
|
|
|
Всього |
|
|
|
|
бельності і т. ін.) і ознаки, які є факторами виробництва. У першому випадку групування називають результативним, у другому факторним.
Групування за результативними ознаками дозволяють досить надійно виділити виробничі типи і дати в середньому характеристику їх особливостям. Але вони не дають можливості виділити всю різноманітність форм і показати ступінь впливу того чи іншого фактора на результат виробництва. Групування за факторами дає змогу показати різноманітність виникаючих форм і ступінь впливу того чи іншого фактора на результативні показники.
За допомогою факторних групувань встановлюються і вивчаються причинно-наслідкові зв’язки між ознаками однорідних явищ, виявляються фактори розвитку сукупності. Зокрема, це стосується аналітичних групувань, хоча аналітичні функції (як вже було сказано раніше) притаманні типологічним і структурним групуванням.
Факторні групування основані на вивченні того, як у масових явищах зі зміною одного або кількох факторних ознак змінюється результативна ознака.
При вивченні соціально-економічних зв'язків за допомогою факторних групувань треба дотримувати певних правил. На думку І. П. Суслова, їх можна звести до таких.
1. Факторні ознаки служать основою групувань; з метою зручності і можливості зіставлення їх зображують, як правило, у вигляді рівних закритих інтервалів; число інтервалів беруть від 3 до 6-8, встановлюють його шляхом проб різних варіантів (методичні підходи щодо встановлення числа груп розглянуто в наступному параграфі).
2. Результативну ознаку дають у вигляді інтенсивних статистичних показників. Для більшої визначеності і наочності ці ознаки часто підлягають деяким перетворенням.
3. Оскільки найважливішою підставою вивчення зв'язків за допомогою факторних групувань є положення про можливість погашення впливу інших причин, то правильні висновки можуть бути зроблені лише на підставі груп і підгруп досить великого обсягу.
Далі автор відмічає, що факторні групування дають можливість робити висновки про наявність зв'язку, про його форму (прямий, обернений) і наближено характеризувати тісноту зв'язку.
Результати аналітичних групувань треба по можливості оцінювати з погляду їх істотності. Це завдання вирішується за допомогою розрахунків тих чи інших математичних критер
іїв. Питання про їх застосування розглянуто далі.
3. МЕТОДОЛОГІЯ СТАТИСТИЧНИХ ГРУПУВАНЬ
Науковому статистичному групуванню передує теоретико-економічний аналіз досліджуваного явища. І разом з тим використання сучасних статистичних методів дозволяє кількісно оцінити ступінь однорідності виділених груп, здійснити відбір істотних групувальних ознак, удосконалювати методику визначення величини інтервалів групувань,
Групування статистичної сукупності починають з вибору групувальних ознак. Але процедурі відбору ознак передує досить важливий етап дослідницької роботи, пов'язаний із з'ясуванням тенденцій розвитку явища, специфіки розвитку досліджуваних об'єктів та ін.
Від вибору групувальної ознаки залежить розв'язання питання про утворення груп. Групування за атрибутивною ознакою обмежується кількістю значень ознаки. Наприклад, поголів'я спортивних коней можна поділити лише на таку кількість груп за породним складом, скільки фактично є таких порід.
Після відбору групувальної ознаки постає питання про кількість груп, на які буде розподілена досліджувана сукупність, і про межі груп. Розв'язання даного питання залежить від конкретних умов і завдань.
На цьому етапі встановлюють величину і границі кожного інтервалу. Оскільки характер реально існуючих сукупностей та їх розподіл досить різноманітні, то існують різні методичні підходи у вирішенні питання про кількість груп. Загальним принципом, з якого треба виходити, є характер 'матеріалу і чисельність досліджуваної сукупності.
Орієнтовно число інтервалів (груп) можна визначити шляхом добування квадратного кореня з обсягу досліджуваної сукупності. При цьому число інтервалів не повинно бути меншим 5 і більшим 20. Так, при чисельності вибірки 50 одиниць спостереження число інтервалів дорівнює 7 (50).
Якщо сукупність невелика за обсягом, інтервальний ряд будують таким чином, щоб у крайні групи (першу і третю) потрапило по 25% одиниць сукупності, а в середню 50%. У цьому випадку групування складається з трьох нерівних інтервалів. Наприклад, сукупність з 28 господарств матиме розподіл: 1 група 7 одиниць, II 14, ²²² 7 одиниць. Визначення числа груп, запропоноване Стерджессом, полягає у розрахунку формули: пінт= 1+3,322 lgn, де пінт число груп (інтервалів); п чисельність сукупності. Застосовуючи цю формулу, будемо мати сукупності розміром 10100 одиниць 4-7 груп: 1001000 одиниць 710; 100010000 II14 груп. Як бачимо, відносне зростання числа груп із збільшенням сукупності відбувається досить інтенсивно в інтервалі 10100 одиниць і уповільнюється в інтервалі 1001000 одиниць. Майже зовсім відсутнє таке зростання у інтервалі 100010000 одиниць сукупності.
Слід пам'ятати, що кількість обраних інтервалів (груп) залежить від коливності групувальної ознаки: чим вона більша, тим більше треба утворювати груп. Треба також намагатися, щоб виділені групи були достатньо заповнені одиницями спостереження. Наявність незаповнених інтервалів або потрапляння в них лише окремих одиниць сукупності результат того, що невдало обрано інтервали, кількість їх взята, ймовірно, зайва. Наявність малонаповнених інтервалів (груп) має право на існування лише по краях групування, де концентруються характеристики як передових, так і відстаючих показників за розміром відносно середнього рівня. Особливо це стосується структурних групувань. Кількість груп тут не повинна бути досить великою чи досить малою. У першому випадку є ризик загубитися у дрібницях, у другому не виявити досить важливі властивості досліджуваної сукупності. Оптимальна кількість інтервалів дозволяє викрити всі істотні особливості досліджуваної сукупності.
Отже, якщо вирішено питання про визначення числа груп, на яке буде поділена сукупність, вихідні варіанти розташовують у ранжирований ряд за групувальною ознакою. В умовах відсутності ускладнюючих обставин, тобто наявності порівняльно поступових змін факторної ознаки, найпростішим способом визначення величини інтервалу при побудові рівновеликих інтервалів буде відношення:
,
де і величина інтервалу; хмах і хтіп відповідно максимальна і мінімальна варіанти; п задане число груп (інтервалів).
У випадках, коли невелика частина сукупності значно віддалена за розміром групувальної ознаки від сукупності основного масиву, за хмах приймається максимальна варіанта основного масиву.
Існують рекомендації щодо встановлення величини інтервалу групувань з деякими поправками до попередньої формули. У цьому випадку формула набуває вигляду:
,
У випадках, коли максимальне і мінімальне значення у ранжированному ряду групувальних ознак значно відрізняється від решти показників, за хмах приймається суміжне попереднє значення ознаки хmах-1, а за хтіп суміжне наступне її значення хтіп+1.
У ряді випадків вихідна величина інтервалу групувань задається дослідником, а число груп у такому разі є похідним, тобто:
.
Якщо розрахована величина рівного інтервалу становить дробове число, його заокруглюють до цілого, цим самим розширюючи границі, якими охоплює інтервал розмаху коливності значень групувальної ознаки.
Маючи встановлене число інтервалів і величину інтервалу, визначають границі інтервалів (груп). Так, нижня границя першого інтервалу (х1) встановлюється за мінімальною варіантою (хmin). Верхня границя цього інтервалу (х2) дорівнюватиме (хmin+i). Нижня границя другого інтервалу відповідає (умовно) верхній границі першого інтервалу (х2), а верхня границя другого інтервалу (х3) дорівнюватиме (х2+i) і т. д. При встановленні границь інтервалів (груп) необхідно пам'ятати, що верхня границя завжди менша від нижньої границі наступного інтервалу на ціну поділки, тобто одиницю виміру.