Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ИСМ: Путеводитель.doc
Скачиваний:
8
Добавлен:
12.11.2018
Размер:
1.11 Mб
Скачать

2. Сводка и группировка статистических данных

Статистическая сводка — второй этап исследования массовых общественных явлений. Суть ее заключается в классификации и агрегировании первичных статистических данных. На этапе сводки элементы совокупности по принципу сходства и различия определенных признаков объединяются в группы; для характеристики выделенных групп используют систему показателей. Результаты сводки оформляются в виде статистических таблиц.

Существуют общепринятые методологические стандарты распределения совокупностей на группы — четко определенные группировочные признаки и сформулированные требования относительно условий формирования групп. Это классификации. Например, классификация отраслей промышленности, форм собственности, организационно-правовых форм субъектов хозяйствования.

Для решения конкретных аналитических задач проводятся нестандартные группировки по определенным признакам, которые легко распознаются. В зависимости от цели исследования и сложности массового процесса используются один, два и более группировочных признаков. Группировка по одному признаку называется простой, в случае сочетания двух и более признаков — комбинационной.

Группировка в статистическом анализе выполняет определенные функции, в частности:

а) изучение структуры и структурных сдвигов;

б) типология социально-экономических явлений;

в) анализ взаимосвязей между явлениями.

В соответствии с этими функциями различают структурные, типологические и аналитические группировки.

Структурная группировка характеризует состав однородной совокупности по определенным признакам, объемы явления и значимость отдельных групп. Разновидностью структурной группировки является ряд распределения, элементами которого выступают варианты и частоты или частости. Варианты — это конкретные значения группировочного признака, частоты — количества единиц совокупности, которым свойственны отдельные варианты. Относительные частоты (% к итогу) называются частностями.

Типологическая группировка — это распределение качественно неоднородной совокупности на классы, социально экономические типы, однородные группы. Основная задача такой группировки — идентификация типов, поэтому первоочередное значение имеет выбор группировочного признака. И структурные, и типологические группировки — описательные, они характеризуют структуру совокупности, выделяя ее характерные черты и особенности, но отличаются по уровню качественных различий между группами.

С помощью аналитической группировки определяют наличие и направление связи между двумя признаками, один из которых представляет результат другой — фактор, влияющий на результат. В классическом варианте аналитической группировки совокупность делится на группы по факторному признаку, и в каждой группе определяется средний уровень результативного признака. При наличии связи между факторным и результативным признаком групповые средние от группы к группе постепенно изменяются — увеличиваются или уменьшаются.

При формировании групп возникает вопрос об их количестве и границах каждой из них. Количество групп зависит от степени вариации группировочного признака и объема совокупности, в каждом отдельном случае его необходимо обосновать. Если группировочный признак атрибутивный, количество групп чаще всего определяется количеством наименований признака. В табл. 2.1 показано распределение городских земель по видам застройки. Первые три группы представляют основные виды застройки, четвертая — объединяет остальные менее значительные виды. По аналитической функции — это структурная группировка, характеризующая масштабы и значительность отдельных видов застройки в пределах территории города.

Таблица 2.1

Вид городской застройки

Площадь, га

% к итогу

Площадь под застройкой

в том числе

3025

100,0

промышленная

670

22,1

жилищная

1920

63,5

общественная

315

10,4

другая

120

4,0

В процессе формирования групп по вариационному признаку — непрерывному или дискретному, с широким диапазоном вариации — необходимо установить интервалы групп и определить границы каждого из них с такой точностью, чтобы распределение совокупности было однозначным. Интервалы бывают равные и неравные, открытые и закрытые.

Равные интервалы используют при условии, что значения признака х в диапазоне вариации изменяются равномерно. Величина такого интервала определяется отношением

где т — количество групп.

Например, прибыльность активов коммерческих банков колеблется от 5 до 45%. При т = 4 величина интервала составляет

а границы интервалов соответственно 5—15; 15—25; 25—35; 35 и более. Поскольку границы интервалов совпадают, то порядок отнесения к группам пограничных значений признака определяют слова последнего открытого интервала "35 и более", т. е. нижнюю границу закрытого интервала следует считать "включительно", а верхнюю — "исключая".

В случае, когда диапазон значений признака слишком широк и распределение совокупности по этому признаку неравномерно, используют неравные интервалы. Например, распределение поселков городского типа по количеству жителей, тыс. чел.: до 3; 3—4,9; 5—9,9; 10—19,9; 20—49,9. Поскольку границы интервалов не совпадают, то обе границы (верхнюю и нижнюю) следует считать "включительно".

Неотъемлемым элементом сводки и группировки является статистическая таблица, в которой сводная информация излагается компактно, в удобной для сравнения и анализа форме. В практике статистико-экономических исследований используются таблицы разной сложности, в зависимости от цели и особенностей объекта исследования, объема имеющейся информации. По логическому содержанию статистическая таблица рассматривается как "статистическое предложение", подлежащим которого является объект исследования, а сказуемым — система показателей, характеризующих объект. В зависимости от структуры подлежащего статистические таблицы делят на простые, групповые и комбинационные. Подлежащим простой таблицы является перечень элементов совокупности, территориальный или хронологический ряд. В групповой таблице подлежащим является группировка по одному признаку, в комбинационной — по двум и более признакам.

Статистическая таблица составляется в два этапа. На первом этапе проектируется макет таблицы, на втором — таблица заполняется статистическими данными. Макет статистической таблицы — это комбинация горизонтальных строк и вертикальных граф, на пересечении которых образуются клетки. Левые боковые и верхние клетки Предназначены для словесных заголовков — перечня составляющих подлежащего и системы показателей сказуемого» остальные — для числовых данных. Основное содержание таблицы указывается в названии. Макет таблицы, характеризующей объемы и результаты внешнеторговой деятельности страны, показан в табл. 2.2. Подлежащим таблицы является хронологический ряд, сказуемым — показатели.

Таблица 2.2. Динамика объемов внешней торговли (в дол. США)

Годы

Экспорт

Импорт

Внешнеторговый оборот

Торговый баланс

(гр. 1 + гр. 2)

(гр. 1 - гр. 2)

А

1

2

3

4

При оформлении таблицы необходимо придерживаться определенных правил. Так, название таблицы, заголовки строк и граф должны быть четкими, лаконичными, без сокращений. В названии таблицы указывается объект, его временной и географический признаки. Если названия отдельных граф (строк) повторяются, имеют одинаковые термины или одинаковое содержание, то их целесообразно объединять общим заголовком. В верхних или боковых заголовках указываются единицы измерения с использованием общепринятых сокращений (т, кВт, м3 и т. п.); иногда для них выделяется отдельная графа. Общую единицу измерения указывают над таблицей.

Строки и графы целесообразно нумеровать (название подлежащего — буквой алфавита, другие графы — цифрами), это дает возможность раскрыть методику расчета показателей сказуемого таблицы. Например, в табл. 2.2 внешнеторговый оборот — это сумма экспорта (гр. 1) и импорта (гр. 2), торговый баланс — разность экспорта и импорта. Информация, находящаяся в строках (графах) таблицы, обобщается итоговой строкой (графой) "Итого" или "В целом по совокупности". Если итоговая строка располагается первой, как в табл. 2.1, то детализация приводится "в том числе".

Значения показателей в клетках таблицы по возможности следует округлять в пределах одной и той же строки или графы обязательно с одинаковой степенью точности. Если цифры слишком малы, записывают 0,0 или 0,00. Отсутствие информации обозначают троеточием (...) или (н/д), если отсутствует само явление, используют тире (—). Значок х указывает, что клетка не подлежит заполнению.

Пример. Методику построения группировок рассмотрим по данным бюджетных обследований 20 домохозяйств. В табл. 2.3 приводятся данные о количестве членов домохозяйств, общем денежном и среднедушевом месячном доходе, включая трансферты. По этим данным сгруппируем домохозяйства по первым двум признакам отдельно и в комбинации.

Порядковый номер домохозяйства

Количество членов домохозяйства

Общий денежный доход, включая трансферты, ден. ед.

Среднедушевой доход, ден. ед.

1

2

3

4

1

2

185

92,5

2

3

268

89,3

3

4

539

134,7

4

2

193

96,5

5

3

473

157,6

6

3

324

108,0

7

4

710

177,5

8

3

172

57,3

9

4

248

62,0

10

2

350

175,0

11

3

516

172,0

12

3

374

124,7

13

4

450

112,5

14

3

603

201,0

15

3

229

76,3

16

2

368

184,0

17

4

313

78,3

18

3

346

115,3

19

3

447

149,0

20

4

392

98,0

Количество членов домохозяйства является дискретным признаком, и группировка сводится к подсчету числа домохозяйств для каждого значения признака (табл. 2.4). Денежный месячный доход домохозяйства — признак непрерывный, границы его вариации достаточно широкие — от 172 до 710 ден. ед., поэтому целесообразно строить интервальный ряд распределения, учитывая характер распределения. Сформируем четыре интервала: менее 200; 200—400; 400—600; 600 и более. Интервальный ряд распределения домохозяйств по общему месячному доходу приведен в табл. 2.5.Таблица 2.3

Таблица 2.4

Количество членов домохозяйства

Число домохозяйств

2

4

3

10

4

6

Итого

20

Таблица 2.5

Общий денежный доход домохозяйства, ден. ед.

Число домохозяйств

Менее 200

3

200—400

10

400—600

5

600 и больше

2

Итого

20

Группировка домохозяйств одновременно по двум признакам дает комбинационное распределение (табл. 2.6). Размещение частот таблицы в направлении от верхнего левого угла к нижнему правому указывает на наличие прямой связи между количеством членов и общим денежным доходом домохозяйств.

Таблица 2.6

Количество членов домохозяйства

Общий денежный доход домохозяйства, ден. ед.

Итого

До 200

200—400

400—600

600 и более

2

2

2

4

3

1

5

3

1

10

4

3

2

1

6

Итого

3

10

5

2

20

Суммирование и усреднение признаков в каждой группе усугубляет анализ данных. Так, на основе итоговых данных о количестве членов домохозяйств и денежном доходе в каждой группе можно определить средний доход на одно домохозяйство и на одного члена домохозяйства (среднедушевой доход). Результаты такого обобщения приведены в табл. 2.7.

Таблица 2.7

Количество членов домохозяйства

Число домохозяйств

Суммарное количество членов домохозяйства

Доход за месяц, ден. ед.

Общий денежный доход

В среднем

на одно домохозяйство

на одного члена домохозяйства

2

4

8

1096

274,0

137,0

3

10

30

3752

375,2

125,1

4

6

24

2652

442,0

110,5

По совокупности в целом

20

62

7500

375,0

121,0

По данным таблицы с увеличением количества членов домохозяйства возрастает средний доход на одно домохозяйство, но среднедушевой доход уменьшается. Зависимость среднедушевого дохода от количества членов домо­хозяйства более выразительно описывает аналитическая группировка (табл. 2.8). Параллельное сопоставление групповых значений факторного и результа­тивного признаков дает возможность определить не только направление, но и интенсивность изменения результативного признака. При условии равномер­ного наращивания значений факторного признака разность между групповыми средними результативного признака используется для оценки эффекта влияния фактора на результат. По данным табл. 2.8, эффект влияния второй группы составляет: 125,1 - 137,0 = -11,9 ден. ед.; третьей группы: 110,5 - 125,1 = -14,6 ден. ед., т. е. интенсивность влияния фактора на результат возрастает.

Таблица 2.8

Количество членов домохозяйства

Число домохозяйств

Среднедушевой доход, ден. ед.

2

4

137,0

3

10

125,1

4

6

110,5

По совокупности в целом

20

121,0

По первичным данным об уровне среднедушевого дохода (табл. 2.3) составим типологическую группировку, выделив группы бедных, средних и состоятельных домохозяйств. По методике Европейской комиссии ООН к бедным отнесем домохозяйства, Среднедушевой доход которых не превышает 2/3 среднего уровня по совокупности в целом. Таким образом, в нашем примере чертой бедности является 2/3 • 121 = 81 ден. ед. К среднему слою отнесем домохозяйства, Среднедушевой доход которых попадает в интервал 121 ± 121/3, т. е. от 81 до 161 ден. ед. Домохозяйства со среднедушевым доходом 161 ден. ед. и более идентифицируются как состоятельные.

Результаты типологической группировки приведены в табл. 2.9. Состоятельных домохозяйств оказалось 5, среднего достатка — 11, за чертой бедности — 4, или 20% домохозяйств. Среднедушевой доход в группах соответственно составляет 181,9; 117,4; 68,7 ден. ед., т. е. доход зажиточных домохозяйств в 2,6 раза превышает доход бедных.

Таблица 2.9

Среднедушевой доход, ден. ед.

Количество

Общий денежный доход домохозяйств, ден. ед.

Среднедушевой доход, ден. ед.

домохозяйств

членов домохозяйства

До 81

4

14

962

68,7

81—161

11

34

3991

117,4

161 и более

5

14

2547

181,9

По совокупности в целом

20

62

7500

121,0

Иногда возникает потребность в перегруппировке данных с целью сравнения структур двух группировок, выделения типов и т.п. Перегруппировка осуществляется путем или объединения, или расщепления интервалов первичной группировки. Результаты перегруппировки называют вторичной группировкой. Если границы интервалов первичной и вторичной группировок совпадают, частоты (частости) объединяющихся интервалов просто суммируются. В случае расщепления интервала первичной группировки частоты (частости) распределяются в той же пропорции, что и величина расщепленного интервала. Например, на основе первичной группировки предприятий региона по количеству занятых (т == 6) необходимо создать новые группы (т = 5) с другими интервалами. Техника перегруппировки показана в табл. 2.10.

Таблица 2.10

Первичная группировка

Вторичная группировка

Количество занятых, тыс. чел.

Число предприятий

Количество занятых, тыс. чел.

Число предприятий

100 и менее

4

200 и менее

4+1/2•16=12

101—300

16

201—500

1/2-16+2/7•35 =18

301—1000

35

501—1000

5/7•35 ==25

1001—2000

28

1001—3000

28+1/3•12 =32

2001—5000

12

3001 и более

2/3•12+5=13

5001 и более

5

Итого

100

Итого

100