Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Кувалкин А.В. Курс лекциий ч 2.DOC
Скачиваний:
2
Добавлен:
01.05.2025
Размер:
3.07 Mб
Скачать

2.3. Техника и правила проведения группировки.

В процессе формирования группировки следует решить несколько вопросов. Во-первых, необходимо выделить группировочный признак или основание группировки. Группировочный признак при анализе выбирается из условия выполнения цели группировки.

Так, если имеются статистические данные о промышленных предприятиях отрасли, то можно в качестве группировочного признака выбрать такие величины:

  • число рабочих на предприятии;

  • число всех работающих;

  • мощность энергоустановок;

  • объем выпуска продукции;

  • стоимость ОПФ и т.д.

Таким образом, по каждому из этих признаков, множество предприятий отрасли можно разбить на группы.

Следующим этапом группировки является определение числа групп, а затем необходимо определить интервалы в группах и их границы.

В группировках с атрибутивным признаком в основании, число групп зависит от количества значений, которые принимает атрибутивный признак, а интервал (если он имеет в данном случае смысл) соответствует переходу явления из одного качества в другое.

В группировках с количественным признаком в основании число групп рекомендуется брать с таким расчетом, чтобы в каждую группу попало достаточно большое число единиц совокупности. Интервалы таких группировок могут быть равными и неравными, а неравные в свою очередь - возрастающими и убывающими.

Равные интервалы используются, когда изменение признака внутри совокупности происходит равномерно, либо если далее планируется последующая математическая обработка сгруппированных данных.

Неравные интервалы обычно используются как прогрессивно увеличивающиеся. В экономической статистике чаще всего устанавливаются границы интервалов, основанные именно на таком принципе.

Применение неравных интервалов обусловлено тем, что в первых группах небольшая разница в показателях имеет большое значение, а в последних группах эта разница не существенна. Возрастающий интервал может возрастать в арифметической прогрессии, а может - в геометрической. Использование неравного интервала более обосновано, но представляет большую трудность. Такую группировку можно составить только на основе знания исходного материала, его анализа и личного опыта специалиста. Главное условие и в этом случае, чтобы не было “пустых” или малочисленных групп.

Число групп в группировке выбирается в этом случае из таких предпосылок: изменчивость признака, число наблюдений, однородность групп. Если размах вариации группировочного признака (разность между максимальным и минимальным его значениями в совокупности) велик и значения признака изменяются (варьируют) неравномерно, то надо использовать группировку с неравным интервалом (табл. 7).

В группировках с равным интервалом число групп можно рассчитать математическим путем с использованием, например, формулы Стерджесса:

n = 1+3.322lgN,

где n - число групп, а N - число единиц совокупности, lg – знак десятичного логарифма.

Согласно этой формуле выбор числа групп зависит от объема совокупности. Недостаток этой формулы состоит в том, что ее применение дает хорошие результаты, если совокупность состоит из большого числа единиц и если распределение единиц по группировочному признаку относительно равномерное (т.е. можно применить равные интервалы). Поэтому есть ряд других формул, но каждая имеет свои недостатки.

Когда определено число групп, то следует определить интервалы группировки. Величина интервала - это разность между верхними или нижними его границами. Величину равновеликого интервала можно определить по формуле

,

где xmax - максимальное значение группировочного признака в совокупности, а xmin- минимальное.

При образовании интервалов необходимо точно обозначить границы групп. По непрерывно варьирующим признакам образуют непрерывный интервал, т.е. такой, в котором верхняя граница предыдущего интервала равна нижней границе последующего интервала (таблица 7). По прерывно варьирующим признакам образуют прерывный интервал, где верхняя граница предыдущего интервала не равна нижней границе последующего интервала (таблица 6.).

Интервалы группировки могут быть закрытыми и открытыми. Закрытые интервалы имеют обе (верхнюю и нижнюю) границы (таблица 6 по основному признаку). Открытые - только одну из них (таблица 7 и таблица 6. по второму признаку).

Таблица 7

Распределение персонала строительной фирмы по уровню среднемесячного дохода.

Группы работающих по уровню среднемесячного дохода, руб.

Число работающих, чел.

В % к итогу

А

1

2

До 500

500-1000

16

20

14,5

18,2

1000-2000

2000-4000

4000 и более

44

21

9

40,0

19,1

8,2

Итого

110

100,0

При непрерывном интервале встает вопрос в какую группу, например в таблице 7. включить работников с уровнем дохода в 1000 рублей во вторую или первую?

Это зависит от применяемого принципа включения. Можно по принципу "до" - тогда во вторую группу, если же по принципу "включительно" - то в первую. Главное чтобы это соблюдалось во всех группах без исключения. Однако, принято в случае "включительно" оговариваться, т.е. указывать на это в примечании.

Величину интервала в расчетах можно, а порою и нужно, округлять. При этом следует помнить, что по непрерывно варьирующим признакам, если величина интервала получилась целой без округления или округление произведено в меньшую сторону, последнюю группу необходимо делать с открытым интервалом, иначе максимальное значение (по принципу "до") не войдет в группу.

Группировка, в которой известна только численность групп или удельный вес группы в общем итоге называется рядом распределения.

От группировок следует отличать классификации. Классификация - это систематизированное распределение явлений и объектов на определенные группы, классы, разряды на основе их сходства и различия. В основе классификации всегда атрибутивный (качественный) признак. Классификации стандартны, устойчивы и неизменны в течение длительного периода времени. Например, классификация отраслей народного хозяйства, классификация затрат на производство по экономическим элементам, классификация основных фондов и т.д.

Приемы вторичной группировки.

Перегруппировка ранее сгруппированных статистических данных называется вторичной группировкой. К этому методу прибегают в тех случаях, когда в результате первоначальной группировки нечетко проявился характер распределения изучаемой совокупности.

В этом случае производят укрупнение или уменьшение интервалов. Также вторичная группировка используется для приведения к сопоставимому виду группировок с различными интервалами с целью их сравнения. Рассмотрим приемы вторичной группировки на примерах.

Произведем укрупнение интервалов на основе данных таблицы 8:

Таблица 8.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот за IV квартал, тыс.руб.

До 10

15

93

10 — 15

8

112

15 — 20

13

200

20 — 30

3

68

30 — 50

9

378

50 — 60

7

385

60 — 70

3

180

70 — 100

8

600

100 — 200

22

2400

Свыше 200

12

3744

Итого

100

8160

Приведенная группировка недостаточно наглядна, потому что не показывает четкой и строгой закономерности в изменении товарооборота по группам.

Уплотним ряды распределения, образовав шесть групп. Новые группы образованы путем суммирования первоначальных групп (табл. 9).

Таблица 9.

Группы магазинов по размеру товарооборота за IV квартал, тыс.руб.

Число магазинов

Товарооборот за IV квартал, тыс.руб.

Товарооборот в среднем на 1 магазин, тыс.руб.

До 10

15

93

6,2

10 — 20

21

312

14,8

20 — 50

12

446

37,1

50 — 100

18

1165

64,8

100 — 200

22

2400

109,0

Свыше 200

12

3744

312,0

Итого

100

8160

81,6

Из новой группировки совершенно отчетливо видно, чем крупнее магазины, тем выше уровень товарооборота.

Рассмотрим другой пример. Имеются следующие данные о распределении хозяйств по числу дворов для двух районов области (табл. 10).

Таблица 10.

п/п

I -район

II - район

Группы хозяйств по числу дворов

Удельный вес хозяйств группы в процентах к итогу

Группы хозяйств по числу дворов

Удельный вес хозяйств группы в % к итогу

1

До 100

4,3

до 50

1,0

2

100 — 200

18,4

50 - 70

1,0

3

200 — 300

19,5

70 - 100

2,0

4

300 — 500

28,1

100 - 150

10,0

5

Свыше 500

29,7

150 - 250

18

250 - 400

21

400 - 500

23

свыше 500

24

Итого

100

Итого

100

Эти данные не позволяют провести сравнение распределения хозяйств в 2-х районах по числу дворов, так как в этих районах имеется различное число групп хозяйств. Необходимо ряды распределения привести к сопоставимому виду.

За основу сравнения необходимо взять распределение хозяйств 1 района. Следовательно, по второму району надо произвести вторичную группировку, чтобы образовать такое же число групп и с теми же интервалами, как и в первом районе. Получим следующие данные (табл.11).

Таблица 11.

Группы хозяйств по числу дворов

Удельный вес хозяйств группы в % к итогу

Расчеты

I район

II район

до 100

4,3

4,0

1+1+2=4

100 - 200

18,4

19,0

10+9=19

200 - 300

19,5

16,0

9+7=16

300 - 500

28,1

37,0

21-7=14, 14+23=37

свыше 500

29,7

24,0

24

Итого

100,0

100,0

Для определения числа хозяйств, которые надо взять из пятой группы во вновь образованную, условно примем, что это число хозяйств должно быть пропорционально удельному весу отобранных дворов в группе.

Определяем удельный вес 50 дворов в пятой группе.

(50 * 18) / (250 - 150) = 9

Определяем удельный вес 50 дворов в шестой группе.

(50 * 21) / (400 - 250) = 7 и т.д.