Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Методичка 2 курс / статистика / Статистика.общая теория статистики.doc
Скачиваний:
230
Добавлен:
20.04.2015
Размер:
2.22 Mб
Скачать
    1. 2.3. Механизм проведения группировки данных

При разделении исходных данных на группы необходимо придерживаться определенной последовательности действий или механизма.

Прежде всего, необходимо выделить группировочный признак, который будет положен в основание группировки.

Во-вторых, необходимо определить количество групп и величину интервала группировки. Вопрос о числе групп следует решать с учетом множества обстоятельств.

Если в основание группировки положен качественный признак, то групп будет столько, сколько существует градаций этого признака. Например, если в основание группировки рабочих предприятия положен группировочный признак – пол, то групп будет всего две: мужчины и женщины.

Если группировка проводится по количественному признаку, то следует учитывать численность изучаемой совокупности и степень колеблемости группировочного признака.

В случае малой численности, когда статистическая совокупность включает менее 30 единиц, то целесообразно выделить три группы, характеризующие передовую, отстающую части и «золотую середину». Это объясняется тем, что при небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными, что не отвечает требованию закона больших чисел.

Если изучаемая совокупность велика, то число групп определяется по формуле Стерджесса:

,

где N – количество единиц в изучаемой статистической совокупности.

Величина интервалов в этом случае принимается равной для всех групп и определяется по формуле:

,

где xmax и xmin – это максимальное и минимальное значения признака в совокупности;

m – число групп.

Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот.

Пусть произведена группировка рабочих предприятия по величине производительности труда (деталей за смену) и выделено 5 групп с равными интервалами: 10  15; 15  20; 20  25; 25  30; 30  35.

На практике может возникнуть случай, когда производительность труда рабочего составляет 20 деталей за смену. Возникает неопределенность: к какой группе его отнести, ко второй или третьей? Для устранения подобного рода неопределенности используют принцип единообразия — левая граница интервала включает в себя обозначенное значение, а правая — не включает. Таким образом, работник, производительность труда которого составляет 20 деталей, должен быть отнесен к третьей группе.

В случае если в основание группировки положено несколько признаков, то необходимо привести описание того, как они комбинируются между собой.

    1. 2.4. Статистические ряды распределения

Ряды распределения обычно выступают в качестве составной части сводки статистических данных, т.к. являются разновидностью простой группировки. Однако в ряде случаев ряды распределения приобретают самостоятельное значение. Они строятся с целью изучения состава исследуемой совокупности, ее однородности, колеблемости значений признаков и границ их изменения. На основе рядов распределения рассчитываются относительные величины структуры и средние показатели.

Ряд распределения в статистике  это ряд цифровых показателей, представляющих распределение единиц совокупности по одному существенному признаку, значения которого расположены в определенной последовательности.

Ряд распределения включает два элемента:

1. варианты значения признака;

2. частоты – это численность отдельных групп, т.е. числа, которые показывают, сколько раз данное значение признака встречается в исследуемой совокупности.

Частоты, выраженные в виде относительных величин (долях единиц, процентах), называются частостями. Замена частот частостями позволяет сопоставлять ряды распределения с разным числом наблюдений.

Сумма всех частот ряда называется его численностью или объемом распределения.

Ряды распределения, построенные по атрибутивным признакам (в порядке возрастания или убывания наблюдаемых знаний), называются атрибутивными. Примером атрибутивных рядов могут служить распределения населения по полу, занятости, национальности, профессии и т.д.

Ряды распределения, построенные по количественному признаку, называются вариационными. Например, распределение населения по возрасту, рабочих — по стажу работы, заработной плате и т.д.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных признаках, принимающих только целые значения (например, тарифный разряд рабочих, число детей в семье), а интервальные — на непрерывных признаках (имеющих любые значения, в том числе и дробные).

Правила построения ряда распределения аналогичны правилам построения группировки. Но иногда при наличии достаточно большого количества вариантов значений признака ряд распределения является трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование, т. е. расположение всех вариантов в возрастающем (или убывающем) порядке.

Для анализа рядов распределения чаще всего используют их графическое изображение, позволяет судить о форме распределений единиц совокупности по значениям группировочного признака.