Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика.docx
Скачиваний:
435
Добавлен:
03.05.2015
Размер:
1.08 Mб
Скачать

5.3. Определение числа групп и величины интервалов

Вместе с выбором группировочного признака возникает задача определения количества групп, на которые следует подразделить изучаемое явление.

Число групп зависит от:

  1. задач исследования

  2. вида признака, положенного в основу группировки

  3. численности совокупности

  4. степени вариации признака

Единицы анализируемой совокупности могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются группы по 5 лет.

При группировке по атрибутивному (описательному) признаку вопрос о количестве групп решается сравнительно просто – по количеству градаций, видов состояния этого признака.

Например, группировка населения по полу образует две группы, организаций связи по федеральным округам – 7 групп, по формам собственности – на пять групп: государственная, муниципальная, частная, смешанная, собственность иностранных юридических лиц.

Если атрибутивный (описательный) признак имеет множество наименований (например, профессия – в отрасли связи насчитывается несколько десятков их наименований), то для статистической характеристики состава работников образуют укрупненные группы (руководители, специалисты, рабочие, прочие). Такое объединение основано на изучении сущности производственных процессов.

Характеристика типов предприятий по их величине часто ограничивается тремя группами: мелкие, средние и крупные, а при изучении рентабельности – группы нерентабельных, рентабельных и высокорентабельных.

Группировки по количественному признаку очень разнообразны. При выборе числа групп в совокупности с количественным признаком необходимо, чтобы в каждую группу попало достаточное количество единиц совокупности. Только в этом случае обобщающие характеристики каждой группы (средние, относительные показатели) будут устойчивыми, неслучайными, характерными.

Сравнительно просто образуются группы по количественным признакам, имеющим дискретную (прерывную) вариацию и принимающим целые значения.

Если количественный признак изменяется в широких пределах и имеет множество различных значений, то каждая группа образуется в виде интервалов.

Группировка может быть выполнена с равными и неравными интервалами.

Равные интервалы употребляются в тех случаях, когда признак изменяется более или менее равномерно в ограниченных пределах, например масса письма, посылки, заработная плата определенной категории работников.

Величина интервала зависит от размаха варьирования признака и численности изучаемой совокупности и в случае равных интервалов может определятся по формуле Стерджесса.

Формула Стерджесса служит для определения величины интервала:

где i – интервал, т.е. разница между максимальным xmax и минимальным xmin значениями признака в каждой группе; N – численность единиц совокупности; k – число групп, которое оптимально при величине 1+3,322 lg N.

Недостаток формулы Стерджесса состоит в том, что её применение дает хорошие результаты для большой совокупности единиц и когда распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Число групп можно определить также по следующей номограмме:

Численность единиц совокупности

15..24

25..44

45..89

90..179

180..359

360..719

720..1439

Число групп

5

6

7

8

9

10

11

Другим способом выполнения группировки является использование среднего квадратического отклонения . Если величина интервала равна 0,5, то совокупность разбивается на 12 групп, если 2/3 или, то совокупность делится на 9 или 6 групп.

При ,интервалы групп выглядят следующим образом:

от до

от до

от до

от до

от до

от до

Однако при определении групп данными методами возможно получение пустых или малочисленных групп. Если размах вариации признака совокупности велик и его значения варьируют неравномерно, то используют группировку с неравными интервалами.

Неравные интервалы употребляются в тех случаях, когда признак изменяется неравномерно. Из неравных интервалов чаще всего употребляются прогрессивно возрастающие или убывающие интервалы.

Величина интервалов, изменяющихся в арифметической прогрессии, определяется по формуле: ,

в геометрической прогрессии:

где a – постоянная величина (положительная для прогрессивно-возрастающих интервалов, отрицательная – для прогрессивно-убывающих);

q – константа – положительное число (для прогрессивно-возрастающих интервалов q > 1, для прогрессивно-убывающих – q < 1).

Например, необходимо построить группировку предприятий отрасли по показателю выручки от реализации продукции, который варьирует от 500 млн. руб. до 4000 млн. руб. в год, то строить группировку с равными интервалами нецелесообразно, т.к. как правило, совокупность предприятий любой отрасли промышленности и торговли включает большое число малых предприятий, имеющих небольшую выручку. С ростом выручки от реализации продукции значительно снижается число предприятий. Т.о. распределение числа предприятий по величине выручки является неравномерным. Поэтому следует построить группировку с неравными интервалами.

Таблица

Группировка предприятий с неравными интервалами

№ группы

Интервал

I

II

III

IV

V

500-800

800-1300

1300-2000

2000-2900

2900-4000

Величина каждого последующего интервала у этой группировки больше предыдущего на 200 млн. руб., т.е. увеличивается в арифметической прогрессии.

При образовании интервалов важное значение имеет точное обозначение границ.

Например, группы предприятий по численности работников: 200 – 600, 600 – 1000. Такая запись предполагает, что единица, у которой значение признака совпадает с верхней границей интервала, относится к следующей группе.

Обычно границы интервалов обозначаются указанием значений признака «от» и «до» (в нашем примере – 200 – 599, 600 -999). Характер такого обозначения говорит, что в группу включаются все значения признака в указанных границах.

После определения группировочного признака и границ групп строится ряд распределения.

Статистический ряд распределения – это упорядоченное распределение единиц совокупности на группы по определенному варьирующему признаку. В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные и вариационные ряды распределения.

Атрибутивными называют ряды распределения, построенные по описательным (качественным) признакам. Вариационными называют ряды распределения, построенные по количественному признаку.