- •Глава 3. Сводка и группировка данных статистического наблюдения
- •3.1. Понятия сводки и группировки статистических данных
- •Группировочная таблица
- •Равноинтервальная группировка студентов по признаку посещаемости
- •Равнонаполненная группировка студентов по признаку посещаемости
- •3.2. Виды группировок
- •Аналитическая группировка
- •3.3. Статистические таблицы и графики
- •Макет таблицы
Глава 3. Сводка и группировка данных статистического наблюдения
3.1. Понятия сводки и группировки статистических данных
Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведение разрозненных данных воедино. Это происходит в процессе выполнения второго этапа статистического исследования, который носит название «статистическая сводка». Она состоит из подсчёта первичного статистического материала (сводка в узком смысле слова), его группировки, а также представления результатов сводки в виде статистических рядов, таблиц и графиков.
Статистическая сводка ведётся по программе, которая составляется заранее. Программа определяет подлежащее и сказуемое сводки. Подлежащее сводки составляют группы, на которые разбивается совокупность явлений. Сказуемое сводки составляют показатели, характеризующие каждую группу и совокупность в целом. Успех сводки во многом зависит от плана её проведения, который содержит указания о последовательности и сроках выполнения отдельных частей сводки и изложения её результатов.
Группировкой называется объединение единиц объекта наблюдения в однородные по существенным для них признакам группы.
В зависимости от числа признаков в основании группировки выделяют группировки по одному признаку – простые – и группировки по нескольким признакам – сложные.
Алгоритм простой группировки.
Совокупность упорядочивается по значению группировочного признака.
Определяется число групп (m).
Единицы с одинаковыми или близкими значениями признака объединяются в группы.
Подсчитываются итоги по группам (число единиц совокупности и значения обобщающих показателей).
Результаты группировки представляются в виде группировочной таблицы (табл.3)
Таблица 3
Группировочная таблица
№ группы
|
Значение группировочного признака |
Число единиц совокупности в группе |
Обобщающий показатель 1 |
Обобщающий показатель 2 |
|
1 2 … m Итого |
|
|
|
|
|
Под группировочным признаком понимают признак, по которому происходит объединение отдельных единиц совокупности в однородные группы (признаки могут быть атрибутивными, т.е. смысловыми, качественными, не имеющими количественного выражения – пол, профессия, специализация; и количественными – размер территории, объем продаж и т.п.).
Если группировка выполняется по атрибутному признаку, то число групп, в которые объединяются единицы объекта наблюдения, определяется числом разновидностей атрибутивного признака. Так, группировка населения по полу даёт две группы, а группировка его по национальности образует столько групп, сколько различных национальностей имеется среди изучаемого населения.
При группировке по количественным признакам возникает вопрос о выборе размера интервала, т.е. разности между наибольшим и наименьшим значениями признака в данной группе. Размер интервала должен быть таким, чтобы полученные группы чётко отличались друг от друга. Интервалы групп могут быть равные и неравные. Разные интервалы целесообразно применять в тех случаях, когда признак изменяется равномерно.
При исследовании экономических явлений чаще применяются неравные, прогрессивно увеличивающиеся интервалы. Это объясняется тем, что здесь количественные изменения размера признака имеют неодинаковое значение в низших и высших группах. Например, если разница в числе работников в 50 человек имеет существенное значение для мелкого предприятия, то для крупного такая разница существенного значения не имеет.
Интервалы могут быть закрытые (с указанием нижней, так и верхней границ) или открытые (с указанием только одной границы).
Для придания группировке строгой определённости верхняя граница предыдущей и нижняя граница последующей группы должны обозначаться различно.
Алгоритм построения группировки с равными интервалами включает следующие шаги.
Определяется оптимальное количество групп – m. Для больших совокупностей можно воспользоваться формулой американского учёного Стерджесса:
m=1+3,322*lgN,
где N – число единиц совокупности.
Определяется величина интервала:
,
где числитель – размах вариации;
максимальное значение признака в исследуемой совокупности;
минимальное значение признака в исследуемой совокупности;
m – число групп.
Если в результате деления получится нецелое число, то округлять нужно в большую сторону, а не в меньшую.
Определяются границы каждого интервала:
Для первого интервала: от до.
Для второго интервала: от до.
Для m-го интервала: от до.
Подсчитывают число единиц, попавших в интервал. Причём единицы, имеющие значение признака, равное граничному, относят только к одному из интервалов.
Результаты заносят в таблицу.
Рассмотрим пример построения равноинтервального ряда. Пусть по совокупности из 20 студентов изучается посещаемость ими практических занятий по статистике за семестр.
(Х – число практических занятий по статистике, на которых студент присутствовал в семестре):
16 14 15 10 7 10 3 16 12 5 16 0 15 16 12 4 7 6 10 9.
Число групп для удобства возьмем равным 3, тогда величина интервала будет равна:
.
Границы групп будут следующими:
[0;5,4) [5,4;10,8) [10,8;16,2).
Численность групп будет:
7 11
Результаты группировки оформим в виде таблицы (табл.4).
Таблица 4