
- •2. Методы формирования информационной базы статистики
- •2.1. Формирование информационной базы статистического исследования
- •2.2. Определение статистического наблюдения. Организационные вопросы статистического наблюдения
- •2.3. Программно-методологическое обеспечение статистического наблюдения
- •2.4. Формы, виды и способы наблюдения
- •Формы, виды и способы статистического наблюдения
- •3. Сводка и группировка статистических материалов
- •3.1. Задачи сводки и ее содержание
- •3.2. Метод группировки и его место в системе статистических методов. Виды статистических группировок
- •Группировка населения России по размеру среднедушевого дохода в декабре 1998 г.
- •Группировка коммерческих банков России по сумме активов баланса (данные условные)
- •3.3. Принципы построения статистических группировок
- •Группировка семей России по месту проживания и числу детей в 1989 г. (по материалам переписи населения)
- •Варианты построения групп
- •Варианты построения групп
- •3.4. Ряды распределения и группировки
- •Распределение видов юридической помощи, оказанной адвокатами гражданам одного из регионов рф в 2000 г. (цифры условные)
- •Распределение семей по числу занимаемых комнат в отдельных квартирах в 1989 г. В рф (по данным переписи населения)
3.3. Принципы построения статистических группировок
Приемы проведения статистических группировок весьма разнообразны. Это связано с разными задачами, которые в соответствии с пью исследования ставятся перед группировками.
Группировочным признаком называется признак, по которому проводится разбивка единиц совокупности на отдельные группы. Его часто называют основанием группировки.
В качестве основания группировки следует использовать существенные признаки. В основание группировки могут быть положены как количественные, так и качественные признаки. Первые имеют числовое выражение (объем торгов, курс доллара в рублях, возраст человека, денежный доход семьи и т.д.), а вторые отражают состояние единицы совокупности (пол человека, его национальность, семейное положение, отраслевая принадлежность предприятия, его форма собственности и организационно-правовая форма и т.д.).
Таблица 3.4
Группировка семей России по месту проживания и числу детей в 1989 г. (по материалам переписи населения)
№ п/п |
Группа семей по месту проживания |
В том числе подгруппа семей по числу детей |
Число семей, тыс. |
1 |
Городское население |
1 ребенок |
9605 |
2 детей |
6936 |
||
3 - « - |
971 |
||
4 - « - |
153 |
||
5 и более детей |
76 |
||
Итого по группе |
|
17741 |
|
2 |
Сельское население |
1 ребенок |
2328 |
2 детей |
2306 |
||
3 - « - |
757 |
||
4 - « - |
213 |
||
5 и более детей |
141 |
||
Итого по группе |
|
5745 |
|
3 |
Итого по подгруппам |
1 ребенок |
11933 |
2 детей |
9242 |
||
3 - « - |
1 728 |
||
4 - « - |
366 |
||
5 и более детей |
217 |
||
Итого по группе |
|
23486 |
После определения основания группировки следует решить вопрос о количестве групп, на которые надо разбить исследуемую совокупность.
Число групп зависит от задач исследования и вида признака, положенного в основание группировки, численности совокупности, степени вариации признака.
Единицы анализируемого объекта могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население в практической статистике делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются пятигодичные группы.
При построении группировки по качественному признаку групп, как правило, будет столько, сколько имеется градаций, видов, состояний у этого признака. Например, в случае проведения группировки населения по полу можно образовать только две группы: мужчины и женщины. Если проводится группировка производства товаров народного потребления по экономическим районам, то вся исследуемая совокупность делится на 11 групп: именно на столько экономических районов поделена территория страны.
Если группировка проводится по количественному признаку, то необходимо обратить особое внимание на число единиц исследуемого объекта и степень колеблемости группировочного признака.
При небольшом объеме совокупности не следует образовывать большое число групп, так как группы будут малочисленными. Поэтому показатели, рассчитанные для таких групп, не будут представительными и не позволят получить адекватную характеристику исследуемого явления.
Часто группировка по количественному признаку имеет задачу отразить распределение единиц совокупности по этому признаку. В данном случае количество групп зависит в первую очередь от степени колеблемости группировочного признака: чем больше его колеблемость, тем больше следует образовать групп, (степень колеблемости признака измеряется показателями вариации, которые подробно рассмотрены в разделе 6.).
При использовании электронно-вычислительных машин и персональных компьютеров для обработки статистических данных группировка единиц объекта проводится с помощью стандартных процедур.
Одна из таких процедур основана на использовании следующей формулы Стерджесса для определения оптимального числа групп:
n = 1 + 3,322∙lgN (3.1.)
где n - число групп;
N - число единиц совокупности.
Получаем следующее соотношение:
N |
15-24 |
25-44 |
45-89 |
90-179 |
180-359 |
360-719
|
n
|
5
|
6
|
7
|
8
|
9
|
10
|
После определения числа групп следует определить интервалы группировки.
Интервал - это значения варьирующего признака, лежащие в определенных границах. Каждый интервал имеет свою величину, верхнюю и нижнюю границы или хотя бы одну из них. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей - наибольшее значение признака в нем. Величина интервала (ее еще часто называют интервальной разностью) представляет собой разность между верхней и нижней границами интервала.
Интервалы группировки в зависимости от их величины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами.
Величина равного интервала определяется по следующей формуле:
h
=
(3.2)
где R = xmax – xmin, т.е. размах вариации;
xmax, xmin - максимальное и минимальное значение признака в совокупности.
Прежде чем определять размах вариации, из совокупности рекомендуется исключить аномальные наблюдения.
Если максимальные или минимальные значения сильно отличаются от смежных с ними значений вариантов в упорядоченном ряду значений группировочного признака, для определения величины интервала следует использовать не максимальное и минимальное значения, а значения, несколько превышающие минимум и несколько меньшие, чем максимум.
Полученную по формуле (3.2) величину округляют. Она является шагом интервала.
Существуют следующие правила определения шага интервала.
Если величина интервала, рассчитанная по формуле (3.2), представляет собой величину, имеющую один знак до запятой (например, 0,66; 1,372; 5,8), то полученные значения целесообразно округлить до десятых и их использовать в качестве шага интервала. В приведенном выше примере шагом интервала будут соответственно значения 0,7; 1,4; 5,8.
Когда рассчитанная величина интервала имеет две значащие цифры до запятой и несколько знаков после запятой; то это значение надо округлить до целого числа. Пусть величина интервала, исчисленная по формуле (3.2), равна 12,785. Тогда это значение следует округлить до целого числа, т. е. до 13.
В случае когда рассчитанная величина интервала представляет собой трехзначное, четырехзначное и так далее число, эту величину необходимо округлить до ближайшего числа, кратного 100 или 50. Например, 248 следует округлить до 250.
Рассмотрим пример. Пусть требуется произвести группировку с равными интервалами предприятий по стоимости основных фондов, при этом максимальное значение признака равно 2040 млн. руб., а минимальное его значение - 290 млн. руб. Совокупность включает 80 единиц. Согласно формуле (3.1) она должна быть разбита на 7 групп. Сначала следует найти:
R = 2040 – 290 = 1750 млн. руб.
Затем определим величину интервала:
h = 1750 : 7= 250 млн. руб.
После этого построим интервалы групп (табл. 3.5).
Таблица 3.5