- •3. Статистическая сводка и группировка
- •3.1 Основное содержание и задачи статистической сводки
- •3.2 Сущность и классификация группировок
- •3.3 Принципы построения группировок
- •3.1 Основное содержание и задачи статистической сводки
- •3.2 Сущность и классификация группировок
- •3.3 Принципы построения группировок
- •1. Равными
3.3 Принципы построения группировок
Для построения любой группировки нужно:
1. Выбрать группировочный признак,
2. Определить количество групп, на которые разбивают изучаемую статистическую совокупность,
3. Зафиксировать границы интервалов группировки.
Для каждой группировки нужно находить конкретные показатели или их систему, которые должны охарактеризовать изучаемые группы.
Выбор группировочного признака – сложный вопрос в теории статистической группировки и статистического исследования в целом.
Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы. От степени точности группировочного признака зависит правильность выводов статистического исследования. В качестве основания группировки нужно отобрать самые значимые и существенные признаки.
В группировку входят количественные и атрибутивные (качественные) признаки.
Количественные признаки обычно имеют числовое выражение (например, объем выпускаемой продукции, возраст человека, доход семьи и т. д.).
Количественные признаки могут быть дискретными (целые числа) и непрерывно изменяющимися (могут принимать любое значение в некотором диапазоне). Если в основании группировки лежит дискретный признак, то нижняя граница i – го интервала равна верхней границе i – го интервала, увеличенной на 1.
Качественные (атрибутивные) признаки дают качественную характеристику единицы совокупности (например, пол, семейное положение, политическая ориентация человека и т. д.). Выделенные группы по атрибутивному признаку в группировке должны отличаться друг от друга по качественной характеристике признака.
Построение группировки по атрибутивному признаку
Если с точки зрения составителя группировки количество разновидностей атрибутивного признака сравнительно невелико, то количество групп берется равным количеству разновидностей. В противном случае часть разновидностей объединяется в одну группу.
Построение группировки по количественному признаку
При составлении структурных группировок на основе количественных признаков определяют количество групп и интервалы группировки.
Интервал – количественное значение, определяющее и отделяющее одну группу от другой, т.е. он очерчивает количественные границы групп.
Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы.
Нижняя граница интервала – это наименьшее значение признака в интервале, а верхняя граница интервала – его наибольшее значение. За нижнюю границу первого интервала принимают наименьшее значение признака в совокупности единиц наблюдения. Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.
Ширина интервала – это разность между верхней и нижней границами.
Интервалы группировки в зависимости от их ширины бывают:
1. Равными
2. Неравными. Неравные делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
1. Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами.
Для группировок с равными интервалами величина (длина, шаг) интервала определяется по формуле:
i
=
,
где
,
–
наибольшее
и наименьшее значение признака;
k – число групп (интервалов), определяемое по формуле Стерджесса:
,
где N – число единиц совокупности.
Округление полученных в расчетах нецелых чисел производится в большую сторону.
Значение k для формулы Стерджесса:
N |
15-24 |
25-44 |
45-89 |
90-179 |
180-359 |
360-719 |
720-1439 |
k |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
Например: необходимо произвести группировку с равными интервалами 20 рабочих цеха по производительности их труда. Наибольшая производительность 180 деталей за смену, наименьшая – 60.
Количество
групп:
Длина
интервала:
дет.
Нижняя граница 1-ой группы 60 деталей, верхняя 60+20=80 деталей. Вторая группа: нижняя граница 80, верхняя 80+20=100 и т.д. В результате получаем такой интервальный ряд (или такие группы рабочих), деталей:
1 группа: 60-80
2 группа: 80-100
3 группа: 100-120
4 группа: 120-140
5 группа: 140-160
6 группа: 160-180
В этом распределении имеется неопределенность, к какой группе отнести единицу совокупности, значение признака которой равно граничному значению интервала (рабочих с производительностью 80, 100, 200 и т. д. дет/см). Для устранения неопределенности используют принцип единообразия: левая, нижняя граница интервала включает в себя указанное значение, а верхняя – нет. Значит, рабочего, производящего 100 дет/см, относят к 3 группе.
Интервалы групп могут быть закрытыми, когда указаны верхняя и нижняя границы (как в примере), и открытыми, когда указана лишь одна из границ. Например, интервалы «менее 60» или «180 и выше» - открытые интервалы. Для расчета показателей статистической совокупности открытые интервалы необходимо «закрыть». Для этого используют величину интервала, соседнего с «открытым». В примере получим: 40-60 и 180-200.
2. Если размах вариации признака в совокупности велик и значения признака варьируются неравномерно, то используют группировку с неравными интервалами. Неравные интервалы могут быть получены, если построенная группировка с равными интервалами содержит группы, не отражающие определенные типы изучаемого явления или процесса или не содержащие ни одной единицы совокупности, возникает необходимость увеличения – объединения двух или нескольких малочисленных или «пустых» последовательных равных интервалов.
Величина интервала может изменяться как произвольно (по желанию составителя), так и в соответствии с каким-либо законом (по закону прогрессии).
Пример:
Группировка от 500 до 4000 с прогрессивным интервалом
Интервал |
Величина интервала |
500-600 |
100 |
600-900 |
300 |
900-1500 |
600 |
1500-2500 |
1000 |
2500-4000 |
1500 |
Размах вариации |
3500 |
Размах вариации
R = хmax - xmin = 4000 – 500 = 3500
Величина интервала может изменяться по арифметической или геометрической прогрессии.
Пример:
xmin = 500
хmax = 4000
k = 5
Sn = известно = хmax - xmin = 4000 – 500 = 3500
n = k = 5
Допустим
а1 = 300
Из формулы d = 200
Получим
Интервал |
Величина интервала |
500-800 |
300 |
800-1300 |
500 |
1300-2000 |
700 |
2000-2900 |
900 |
2900-4000 |
1100 |
Допустим
а1 = 100
Из формулы d = 300
Получим
Интервал |
Величина интервала |
500-600 |
100 |
600-1000 |
400 |
1000-1700 |
700 |
1700-2700 |
1000 |
2700-4000 |
1300 |
В группировках, отражающих качественные особенности и специфику выделяемых групп единиц изучаемой совокупности по определенному признаку, применяются специализированные интервалы.
Специализированные интервалы – это интервалы, которые применяются для выделения из совокупности одних и тех же типов по одному и тому же признаку у явлений, находящихся в различных условиях.
Сказанное выше относится к группировкам, которые производятся на основе анализа первичного статистического материала. Но довольно часто приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Например, группировки могут быть не сопоставимы из-за различного числа групп или неодинаковых границ интервалов.
Для приведения группировок к сопоставимому виду используется метод вторичной группировки, который заключается в образовании новых групп на основе ранее осуществленной группировки. Эта перегруппировка возможна двумя способами:
1) объединением первоначальных интервалов (т.е. их укрупнением);
2) долевой перегруппировкой.
