- •Лекция 3 сводка и группировка материалов статистического наблюдения
- •1. Сводка статистических данных, ее задачи и содержание
- •Глубина
- •Техника
- •2. Метод группировки и его место в системе статистических методов. Задачи, решаемые с помощью метода группировок
- •2.1. Виды статистических группировок
- •3. Принципы построения статистических группировок и классификаций
- •Сравнимость статистических группировок
- •4. Ряд распределения.
- •4.1. Общие понятия
- •4.2. Графическое изображение рядов распределения
3. Принципы построения статистических группировок и классификаций
Построение статистических группировок предполагает решение следующих задач:
необходимо выбрать группировочный признак;
определить число групп, на которые нужно разбить изучаемую совокупность;
зафиксировать границы интервалов группировки;
для каждой группировки найти конкретные показатели или их систему, которые должны характеризовать выделенные группы.
Рассмотрим эти задачи.
1. (см. п. 2).
2. Число групп зависит от задачи исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
а) при построении группировки по качественному (атрибутивному) признаку групп (как правило) будет столько, сколько имеется градаций, видов, состояний у этого признака (например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины).
б) при построении группировки по количественному признаку необходимо соблюдать определенные правила:
– необходимо тщательно изучить экономическую (социальную) сущность изучаемого явления, лишь после этого в соответствии с задачами исследования можно решать вопрос о числе групп, близких по значению к варьирующему признаку единиц совокупности;
– при небольшом объеме совокупности не следует образовать большое число групп, так как группы малочисленными (поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику для изучаемого явления);
– количество групп зависит в первую очередь от степени колеблемости группировочного признака (чем она больше, тем больше должно быть групп);
– оптимальное число групп можно определить по формуле Стерджесса:
Где n – число групп;
N – число единиц совокупности;
недостаток этого способа заключается в том, что совокупность должна состоять из большого числа единиц, распределение единиц по признаку, положенному в основание группировки, должно быть близко к нормальному и можно получить «пустые» или малочисленные группы;
– число групп определяется по показателю среднего квадратического отклонения : если величина интервала равна 0,5, то совокупность разбивается на 12 групп, если равна 2/3 – на 9 и если равна – на 9 групп; недостаток: можно получить «пустые» или малочисленные группы;
3. Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы.
Каждый интервал имеет
ширину;
верхнюю границу;
нижнюю границу
или хотя бы одну из них.
Ширина интервала – разность между верхней и нижней границами.
а) равные интервалы.
Ширина определяется по следующей формуле:
h = R/n, где R = Xmax–Xmin – размах варьирования
(h называют еще шагом интервала).
Правила определения шага: если 1 знак до запятой, то округляют до десятых долей; если 2 знака – то до целого числа, если 3 знака – то до ближайшего числа, кратного 100 или 50.
Если у интервалов обозначены границы, то такие интервалы называются закрытыми, и границы групп обозначают так: 290–540; 540–790 и т.д.
Открытые это те интервалы, у которых указана только одна граница: верхняя – у первого, нижняя у последнего; ширина открытого интервала принимается равной ширине смежного с ним интервала
(обозначаются так: До 540; 540–790; …; 1790 и более).
Если основанием группировки служит непрерывный признак, то верхняя граница j-го интервала равна нижней границе j+1-го интервала (заметим, если нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно», то единицу объекта, значения признака, у которого совпадают с верхней границей интервала, то единицу включают в следующую группу).
Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i + 1-го интервала, увеличенной на 1.
Неравные интервалы применяются в статистике в том случае, если значения признака варьируют неравномерно и в значительных размерах
(например, при анализе макроэкономических показателей).
Нравные интервалы могут быть прогрессивно возрастающие или убывающие в арифметической или геометрической прогрессии.
Величина интервалов, изменяющихся в арифметической прогрессии, определяются так: , где а - число (константа), которое будет положительным при прогрессивно возрастающих интервалах и отрицательным при прогрессивно убывающих интервалах.
В геометрической прогрессии: где q – положительное число (константа), которое при прогрессивно возрастающих интервалах будут больше 1, а при прогрессивно убывающих – меньше 1.
Пример построения групп с неравными интервалами:
-
Группа
Интервал
I
500-800
II
800-1300
III
1300-2000
IV
2000-2900
V
2900-4000
Величина каждого последующего интервала у этой группировки больше предыдущего на 200, т.е. увеличивается в арифметической прогрессии.
При определении границ интервалов группировок исходят из того, что изменение количественного признака приводит к появлению нового качества, т.е. в этом случае граница интервала устанавливается там, где происходит переход от одного качества к другому.
Рамка границ зависит от условий места и времени (например, группировка предприятий по числу занятых показывает, что в промышленности и строительстве предприятия со среднесписочной численностью работающих 75-100 человек относятся к группе малых предприятий, а в отраслях непроизводственной сферы и в розничной торговле – к крупным). Поэтому строя такую группировку, следует дифференцированно устанавливать границы для разных отраслей народного хозяйства (используя группировки со специализированными интервалами).
Специализированными называются интервалы, применяющиеся для выделения из совокупности одних и тех же типов по одному и тому же признаку для явлений, находящихся в различных условиях (см. последний пример).
Произвольными называются интервалы, ни прогрессивно возрастающие, ни прогрессивно убывающие. Применяются в группировках при изучении социально-экономический явлений на макроуровне (например, при группировке рабочих по выработке продукции, предприятий по уровню рентабельности, прибыльности и др.).