
- •О статистике
- •Тема 1. Введение в статистику
- •1.1. Базовые понятия статистики
- •1.2. Предмет и метод статистики
- •1.3. Статистические признаки
- •Тема 2. Статистическое наблюдение
- •2.1. Виды статистических наблюдений
- •2.2. Организация статистического наблюдения
- •Тема 3. Сводка и группировка статистических данных
- •3.1. Сводка и группировка данных наблюдения. Виды группировок
- •3.2. Статистические таблицы и графики
- •Правила отображения данных в статистических таблицах
Тема 3. Сводка и группировка статистических данных
Изучая тему, вы узнаете, как обработать полученный в ходе статистического наблюдения материал таким образом, чтобы с данными было удобно работать и принимать на их основе эффективные решения.
1. Сводка и группировка данных наблюдения. Виды группировок.
2. Статистические таблицы и графики.
3.1. Сводка и группировка данных наблюдения. Виды группировок
Итак, статистическое наблюдение проведено, информация собрана. Выполнена большая работа, но в результате перед вами груда данных – как правило, это заполненные анкеты или опросные листы – понять и воспринять которые без предварительной обработки практически невозможно.
Первая операция по подготовке данных к дальнейшей обработке – это простая сводка.
Простая сводка – операция первичной обработки данных, представляющая собой перенесение всех данных статистического наблюдения из опросных формуляров в единый документ без какой-либо сортировки или группировки.
Для первичного анализа данных и получения представления об их структуре строят сложные сводки (или группировки).
Группировка (сложная сводка) – разделение изучаемой совокупности на группы и подгруппы по каким-либо существенным для анализа признакам с целью всестороннего изучения явления. Для того чтобы подобрать группировку в наибольшей степени соответствующую цели анализа, надо хорошо знать существующие виды группировок (рис. 3.1).
Простая группировка – это группировка по одному признаку. Пример простой группировки представлен в табл. 3.1. Единственным признаком, по которому предприятия разделены на группы, является объем производства.
Таблица 3.1
Группировка машиностроительных предприятий региона
по объему производства
Объем товарной продукции, млн руб./год |
Количество предприятий |
Менее 1000 |
13 |
1000 – 2000 |
14 |
Более 2000 |
13 |
Итого |
40 |
Сложная группировка – это группировка единиц совокупности по двум и более признакам. Примеры сложных группировок представлены в табл. 3.2 и 3.3. В табл. 3.2 предприятия разделены на группы по двум признакам – «объем товарной продукции» и «численность работающих», в табл. 3.3 рабочие предприятия разделены на группы также по двум признакам – «стаж работы» и «заработная плата».
Рис. 3.1. Виды группировок статистических данных
Комбинационная группировка – последовательная группировка единиц совокупности по некоторому набору признаков (сначала – по первому признаку, затем – по второму и т. д.). Обе группировки (табл. 3.2 и табл. 3.3) являются комбинационными по структуре, так как единицы совокупности последовательно делятся на группы: сначала, по объему продукции, затем – по численности (табл. 3.2) или сначала, по стажу работы, затем – по заработной плате (табл. 3.3).
Таблица 3.2
Группировка предприятий региона по размеру
Объем товарной продукции, млн руб. |
Численность работающих, чел. |
Номера предприятий |
Менее 1000 |
Менее 50 50 – 250 Более 250 |
2, 10, 11, 12, 22, 23 3, 14, 21, 35 2, 13, 36 |
1000 – 2000 |
Менее 50 50 – 250 Более 250 |
7, 15, 26, 27, 37 8, 16, 17, 18, 24, 38 4, 19, 25 |
Более 2000 |
Менее 50 50 – 250 Боле 250 |
5, 28, 39 9, 20, 29, 40 6, 30, 31, 32, 33, 34 |
Чтобы группировка имела однозначную трактовку принято следующее правило: «Если в группировке используются интервалы с повторяющимися границами, то единицы совокупности, имеющие значение признака равное верхней границе интервала, учитываются в следующей группе». Например, согласно данным табл. 3.3 в изучаемой группе из 50 рабочих нет ни одного, кто бы имел стаж работы до 5 лет и заработную плату 7,5 тыс. руб., так как данный рабочий был бы представлен в первой строке (стаж до 5 лет) и третьей графе (заработная плата от 7,5 до 10,0 тыс. руб.).
Таблица 3.3
Зависимость заработной платы рабочих от стажа работы
Стаж, лет |
Заработная плата, тыс. руб./мес |
Итого |
|||||
До 5,0 |
5,0…7,5 |
7,5…10,0 |
10,0…12,5 |
12,5…15,0 |
Свыше 15,0 |
||
До 5 |
4 |
1 |
– |
– |
– |
– |
5 |
5 – 10 |
4 |
3 |
1 |
2 |
– |
– |
10 |
10 –15 |
– |
– |
– |
2 |
4 |
6 |
12 |
15 – 20 |
– |
1 |
2 |
3 |
3 |
2 |
11 |
Свыше 20 |
– |
– |
– |
2 |
4 |
6 |
12 |
Итого |
8 |
5 |
3 |
9 |
11 |
14 |
50 |
Многомерная группировка – группировка по одному обобщенному признаку, объединяющему в себе характеристики целого набора признаков.
Например, можно построить некоторый обобщенный признак размера предприятия, который бы учитывал частные признаки, так или иначе характеризующие размер предприятия (численность работающих, объемы производства, стоимость фондов и т.п.), и разделить изучаемую совокупность на группы в соответствии со значением этого обобщенного признака. Одним из методов построения такого обобщенного признака является метод многомерной средней величины (тема 5, п. 5.3).
Типологическая группировка – разделение совокупности на качественно однородные группы. Примеры: группировка предприятий Челябинской области по отраслям, группировка населения Российской Федерации по регионам.
Структурная группировка – разделение совокупности на группы в соответствии с величиной какого-либо количественного признака. Пример: группировка машиностроительных предприятий региона по объему производства (табл. 3.1).
Аналитическая группировка – группировка, характеризующая взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, а другие – как факторы.
Пример: группировка рабочих по стажу и заработной плате (табл. 3.3). В данном случае в качестве факторного признака выступает «стаж работы», в качестве результативного признака – «заработная плата». Распределение единиц совокупности по полю таблицы позволяет получить информацию о наличии, направлении и тесноте связи между признаками. Так, расположение единиц по нарастающей диагонали позволяет сделать предположение о прямой зависимости между стажем и заработной платой в изучаемой группе (чем больше стаж, тем выше заработная плата). Однако очевидно неконцентрированное, распределенное расположение единиц на данной диагонали говорит о том, что зависимость не слишком тесная, и для более точного заключения о связи между признаками требуется проведение полного корреляционного анализа. Более подробно анализ взаимосвязей по аналитическим группировкам как элемент корреляционного метода рассмотрен в теме 8 «Статистические методы анализа связи».